JP2023547366A - 複数のインサートを含む配列決定鋳型、並びに配列決定スループットを改善するための組成物及び方法 - Google Patents
複数のインサートを含む配列決定鋳型、並びに配列決定スループットを改善するための組成物及び方法 Download PDFInfo
- Publication number
- JP2023547366A JP2023547366A JP2023524116A JP2023524116A JP2023547366A JP 2023547366 A JP2023547366 A JP 2023547366A JP 2023524116 A JP2023524116 A JP 2023524116A JP 2023524116 A JP2023524116 A JP 2023524116A JP 2023547366 A JP2023547366 A JP 2023547366A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- insert
- nucleic acid
- sequencing
- stranded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 694
- 238000000034 method Methods 0.000 title claims abstract description 443
- 239000000203 mixture Substances 0.000 title claims description 101
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 528
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 482
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 482
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 468
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 468
- 239000002157 polynucleotide Substances 0.000 claims abstract description 466
- 239000012634 fragment Substances 0.000 claims description 670
- 230000000295 complement effect Effects 0.000 claims description 534
- 238000009396 hybridization Methods 0.000 claims description 516
- 239000007787 solid Substances 0.000 claims description 224
- 108091034117 Oligonucleotide Proteins 0.000 claims description 156
- 125000003729 nucleotide group Chemical group 0.000 claims description 110
- 239000002773 nucleotide Substances 0.000 claims description 106
- 108020004414 DNA Proteins 0.000 claims description 104
- 230000000903 blocking effect Effects 0.000 claims description 96
- 108010020764 Transposases Proteins 0.000 claims description 88
- 102000008579 Transposases Human genes 0.000 claims description 88
- 239000011324 bead Substances 0.000 claims description 79
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 75
- 238000003752 polymerase chain reaction Methods 0.000 claims description 59
- 238000006243 chemical reaction Methods 0.000 claims description 48
- 108091093088 Amplicon Proteins 0.000 claims description 46
- 238000003776 cleavage reaction Methods 0.000 claims description 45
- 230000007017 scission Effects 0.000 claims description 45
- 102000054766 genetic haplotypes Human genes 0.000 claims description 26
- 108091008146 restriction endonucleases Proteins 0.000 claims description 26
- 238000000137 annealing Methods 0.000 claims description 17
- 102000004190 Enzymes Human genes 0.000 claims description 16
- 108090000790 Enzymes Proteins 0.000 claims description 16
- ALACEDPNJIAQMY-UHFFFAOYSA-N 1,3-dihydroxypyrimidine-2,4-dione Chemical compound ON1C=CC(=O)N(O)C1=O ALACEDPNJIAQMY-UHFFFAOYSA-N 0.000 claims description 12
- 229910052799 carbon Inorganic materials 0.000 claims description 12
- 230000003100 immobilizing effect Effects 0.000 claims description 10
- 230000000977 initiatory effect Effects 0.000 claims description 9
- 230000002194 synthesizing effect Effects 0.000 claims description 9
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical class O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims description 7
- 229930024421 Adenine Natural products 0.000 claims description 6
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 6
- 229960000643 adenine Drugs 0.000 claims description 6
- 238000005562 fading Methods 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 6
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 claims description 5
- 238000010008 shearing Methods 0.000 claims description 5
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 claims description 5
- 108091000080 Phosphotransferase Proteins 0.000 claims description 4
- 102000020233 phosphotransferase Human genes 0.000 claims description 4
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 4
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- NNTOJPXOCKCMKR-UHFFFAOYSA-N boron;pyridine Chemical compound [B].C1=CC=NC=C1 NNTOJPXOCKCMKR-UHFFFAOYSA-N 0.000 claims description 3
- 238000002156 mixing Methods 0.000 claims description 3
- 229920001184 polypeptide Polymers 0.000 claims description 3
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 3
- 108060004795 Methyltransferase Proteins 0.000 claims description 2
- 102000016397 Methyltransferase Human genes 0.000 claims description 2
- 230000000865 phosphorylative effect Effects 0.000 claims 1
- 230000003321 amplification Effects 0.000 abstract description 50
- 238000003199 nucleic acid amplification method Methods 0.000 abstract description 50
- 238000004458 analytical method Methods 0.000 abstract description 47
- 230000011987 methylation Effects 0.000 abstract description 24
- 238000007069 methylation reaction Methods 0.000 abstract description 24
- 230000035772 mutation Effects 0.000 abstract description 17
- 239000000523 sample Substances 0.000 description 106
- 239000000047 product Substances 0.000 description 85
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 52
- 239000000243 solution Substances 0.000 description 45
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 39
- 210000004027 cell Anatomy 0.000 description 36
- 239000011616 biotin Substances 0.000 description 27
- 229960002685 biotin Drugs 0.000 description 27
- 235000020958 biotin Nutrition 0.000 description 27
- 238000002360 preparation method Methods 0.000 description 25
- 108010090804 Streptavidin Proteins 0.000 description 24
- 108010012306 Tn5 transposase Proteins 0.000 description 22
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical class O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 21
- 238000004132 cross linking Methods 0.000 description 18
- 238000004925 denaturation Methods 0.000 description 17
- 230000036425 denaturation Effects 0.000 description 17
- 230000017105 transposition Effects 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 16
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 15
- 210000000349 chromosome Anatomy 0.000 description 15
- 102000053602 DNA Human genes 0.000 description 13
- 239000000126 substance Substances 0.000 description 13
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical class CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 13
- 239000000872 buffer Substances 0.000 description 12
- 239000003795 chemical substances by application Substances 0.000 description 12
- 230000000692 anti-sense effect Effects 0.000 description 11
- 108090001008 Avidin Proteins 0.000 description 10
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- 230000003196 chaotropic effect Effects 0.000 description 10
- 238000010790 dilution Methods 0.000 description 10
- 239000012895 dilution Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 230000009977 dual effect Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 9
- 238000013467 fragmentation Methods 0.000 description 9
- 238000006062 fragmentation reaction Methods 0.000 description 9
- 230000005291 magnetic effect Effects 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- -1 Tn/O and IS10 Proteins 0.000 description 8
- 239000000710 homodimer Substances 0.000 description 8
- 241000588724 Escherichia coli Species 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 238000012937 correction Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 239000012530 fluid Substances 0.000 description 7
- 239000000178 monomer Substances 0.000 description 7
- 230000005298 paramagnetic effect Effects 0.000 description 7
- 239000013592 cell lysate Substances 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 239000011521 glass Substances 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 229940113082 thymine Drugs 0.000 description 6
- 108010077544 Chromatin Proteins 0.000 description 5
- 102000012330 Integrases Human genes 0.000 description 5
- 108010061833 Integrases Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- 230000002255 enzymatic effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 239000007790 solid phase Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical group NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 4
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 4
- 206010028980 Neoplasm Diseases 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 108091081021 Sense strand Proteins 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 238000001816 cooling Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 239000000539 dimer Substances 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 238000005304 joining Methods 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 108700028369 Alleles Proteins 0.000 description 3
- 108091092584 GDNA Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000007865 diluting Methods 0.000 description 3
- 230000006862 enzymatic digestion Effects 0.000 description 3
- 239000000017 hydrogel Substances 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 229920003023 plastic Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical group CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 102100033072 DNA replication ATP-dependent helicase DNA2 Human genes 0.000 description 2
- 101000927313 Homo sapiens DNA replication ATP-dependent helicase DNA2 Proteins 0.000 description 2
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 2
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 240000007019 Oxalis corniculata Species 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- 239000004809 Teflon Substances 0.000 description 2
- 229920006362 Teflon® Polymers 0.000 description 2
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- 241000607618 Vibrio harveyi Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 150000001345 alkine derivatives Chemical group 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 239000012298 atmosphere Substances 0.000 description 2
- 238000001369 bisulfite sequencing Methods 0.000 description 2
- UORVGPXVDQYIDP-UHFFFAOYSA-N borane Chemical compound B UORVGPXVDQYIDP-UHFFFAOYSA-N 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000001311 chemical methods and process Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000001351 cycling effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 108010063460 elongation factor T Proteins 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 239000004005 microsphere Substances 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 229920001296 polysiloxane Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 241001430294 unidentified retrovirus Species 0.000 description 2
- JLBJTVDPSNHSKJ-UHFFFAOYSA-N 4-Methylstyrene Chemical compound CC1=CC=C(C=C)C=C1 JLBJTVDPSNHSKJ-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000269350 Anura Species 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 241000209763 Avena sativa Species 0.000 description 1
- 235000007558 Avena sp Nutrition 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 241000244203 Caenorhabditis elegans Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 208000027205 Congenital disease Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 1
- 241000252212 Danio rerio Species 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000168726 Dictyostelium discoideum Species 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 241000711549 Hepacivirus C Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 241000257303 Hymenoptera Species 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 241000202934 Mycoplasma pneumoniae Species 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 102100030569 Nuclear receptor corepressor 2 Human genes 0.000 description 1
- 101710153660 Nuclear receptor corepressor 2 Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000223960 Plasmodium falciparum Species 0.000 description 1
- 241000233872 Pneumocystis carinii Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000295644 Staphylococcaceae Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241001441722 Takifugu rubripes Species 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 102220483600 Troponin I, cardiac muscle_E54V_mutation Human genes 0.000 description 1
- 102220483626 Troponin I, cardiac muscle_M56A_mutation Human genes 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269368 Xenopus laevis Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 229920006397 acrylic thermoplastic Polymers 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 238000000889 atomisation Methods 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- 229910000085 borane Inorganic materials 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 125000002228 disulfide group Chemical group 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 201000003373 familial cold autoinflammatory syndrome 3 Diseases 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical group O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000005017 genetic modification Effects 0.000 description 1
- 235000013617 genetically modified food Nutrition 0.000 description 1
- 239000010439 graphite Substances 0.000 description 1
- 229910002804 graphite Inorganic materials 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical class O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 102000016470 mariner transposase Human genes 0.000 description 1
- 108060004631 mariner transposase Proteins 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 108010009127 mu transposase Proteins 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 230000000269 nucleophilic effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 239000002907 paramagnetic material Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007918 pathogenicity Effects 0.000 description 1
- 238000005897 peptide coupling reaction Methods 0.000 description 1
- KHIWWQKSHDUIBK-UHFFFAOYSA-N periodic acid Chemical compound OI(=O)(=O)=O KHIWWQKSHDUIBK-UHFFFAOYSA-N 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 238000006303 photolysis reaction Methods 0.000 description 1
- 230000015843 photosynthesis, light reaction Effects 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920001748 polybutylene Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 238000009598 prenatal testing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000011451 sequencing strategy Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000008279 sol Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- ISXSCDLOGDJUNJ-UHFFFAOYSA-N tert-butyl prop-2-enoate Chemical compound CC(C)(C)OC(=O)C=C ISXSCDLOGDJUNJ-UHFFFAOYSA-N 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000004408 titanium dioxide Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000007482 whole exome sequencing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2523/00—Reactions characterised by treatment of reaction samples
- C12Q2523/10—Characterised by chemical treatment
- C12Q2523/101—Crosslinking agents, e.g. psoralen
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2535/00—Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
- C12Q2535/122—Massive parallel sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/143—Multiplexing, i.e. use of multiple primers or probes in a single reaction, usually for simultaneously analyse of multiple analysis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/149—Particles, e.g. beads
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/159—Microreactors, e.g. emulsion PCR or sequencing, droplet PCR, microcapsules, i.e. non-liquid containers with a range of different permeability's for different reaction components
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
複数のインサートを含む配列決定鋳型として使用するためのポリヌクレオチドが本明細書に記載される。また、これらのポリヌクレオチドを生成及び使用する方法、並びに連続性情報の分析を含むそのような鋳型の使用方法も本明細書に記載される。更に、インサート配列及びインサート配列のコピーを含む配列決定鋳型を使用して、配列決定若しくは増幅中に生じるランダムエラーを修正するか、又は二本鎖核酸において非標準塩基対形成をもたらす核酸塩基損傷若しくは他の変異を同定することができる。メチル化分析を行う方法も本明細書に記載されている。
Description
関連出願の相互参照
本出願は、2020年10月21日に出願された米国特許仮出願第63/094,422号及び2021年10月15日に出願された同第63/256,040号の優先権の利益を主張するものであり、これらの内容はそれぞれ、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
説明
本出願は、2020年10月21日に出願された米国特許仮出願第63/094,422号及び2021年10月15日に出願された同第63/256,040号の優先権の利益を主張するものであり、これらの内容はそれぞれ、あらゆる目的のためにその全体が参照により本明細書に組み込まれる。
説明
本出願は、リードプライマー結合配列、標的核酸に由来するインサート配列、連結配列、及び付着配列を含むポリヌクレオチドに関する。これらのポリヌクレオチドを含む組成物、並びに連結された核酸配列決定鋳型を生成及び配列決定する方法も記載される。加えて、本開示は、複数のインサートを含む配列決定鋳型を調製する方法に関する。本開示はまた、連続性情報の分析を含む、そのような鋳型の使用方法に関する。更に、同じインサート配列の2つのコピー(すなわち、インサート配列及びインサート配列のコピー)を含む配列決定鋳型を使用して、配列決定若しくは増幅中に生じるランダムエラーを修正するか、又は二本鎖核酸において非標準塩基対形成をもたらす核酸塩基の損傷若しくは他の変異を同定することができる。インサート配列及びインサート配列のコピーを含むこれらの配列決定鋳型は、メチル化分析にも使用することができる。
典型的には、合成による配列決定(SBS)プラットフォームにおけるリード長は、フェージング/プレフェージングのために250~300塩基対に制限される。このリード長は、SBSプラットフォームのスループットを制限する。
以前は、複数のインサートを含むポリヌクレオチドを使用してSBSスループットを改善する方法が説明された。多くの場合、これらの方法は、例えば、異なるポリメラーゼ若しくは基質の組み合わせ、又はプライマーブロッキングを用いた直交的なSBS反応に依存していた(国際公開第2015/0002789号及び米国特許出願公開第20180312917号参照)。しかしながら、非標準試薬を必要とすることなくフローセルからの配列決定出力を増加させて、配列決定出力を増加させる費用効率が高く使い勝手のよい手段を可能にする簡単な手段が必要とされている。
本開示は、1つ以上の標的核酸に由来する複数のインサート配列を含むポリヌクレオチドを記載する。これらのポリヌクレオチドは、複数のDNAライブラリーから生成され得る。その後、1つのライブラリー産物中のハイブリダイゼーション配列を別のライブラリー産物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することにより、伸長が可能になり、複数のインサート配列を含むポリヌクレオチドを形成する。これらの複数のインサート配列の配列決定は、ポリヌクレオチドに含まれる複数の異なるリードプライマー結合配列に基づく逐次的なSBS伸長反応によって行うことができる。
加えて、従来のショートリード配列決定法は、インタクトなゲノムDNA又はRNA由来の短い別個の断片の初期生成を含む。これらの断片は、物理的剪断、酵素消化、又は1つ以上のプライマーからのポリメラーゼ伸長といったいくつかの方法で生成される。次いで、鋳型調製物は、これらの断片を改変し、合成アダプターを付加して、配列決定を可能にする。これらの配列決定鋳型は、多くの場合、インタクトなゲノムと同じ順序及び並置で塩基配列を含む元の試料由来の単一の断片を常に含む。鋳型が二本鎖である場合、配列の相補体は、2つの鎖のハイブリダイゼーションによって会合される。しかし、二本鎖鋳型が変性されると、2つの相補鎖が分離し、鋳型は、元の試料由来の単一配列断片を含む一本鎖になる。このプロセスにおいて、2つの相補鎖の間のあらゆる会合が失われる。更に、この断片化及び鋳型調製のプロセスにおいて、元の断片化されていないゲノムにおいて隣接していた2つ以上の断片間のあらゆる会合も失われる。
連続性情報の喪失というこの規則の例外は、配列決定アダプターを付加する前に2つ以上の遠位断片を一緒に連結するためのライゲーションを使用する鋳型調製方法において見出される。1つの例は、「メイトペア」ライブラリーであり、ここで、大きなDNA断片の末端が一緒に連結されて環を形成し、その後更に断片化され、続いて、一緒に連結された末端にまたがる小断片が回収される。これによる鋳型は、タンデムに連結された元の大きな断片由来の2つの配列を含む。別の例は、ゲノム中のDNAの遠位断片が、インビボでクロマチンと複合体化されたDNAの構造的配置により非常に近接して空間的に組織化される、クロマチンベースの立体構造捕捉である。互いに近接した断片のライゲーション及びその後のプロセシングは、空間的関連性と、推論により、個々のインサートの機能的関連性についての情報を与えるタンデムインサートを有する配列決定鋳型を生成する。
多くの異なる方法、例えば、Duplex Sequencing(Schmitt,et al.Proc.Natl.Acad.Sci.U.S.A.109:14508-14513(2012)、Duplex Proximity Sequencing(Pro-Seq、Pel et al.PLoS One 13:1-19(2018)に記載)、CypherSeq(Gregory et al.Nucleic Acids Res.44:e22(2016))、o2n-seq(Wang et al.Nat.Commun.8,15335(2017))、Circle Sequencing(Lou et al.,Proc.Natl.Acad.Sci.U.S.A.110:19872-19877(2013))、及びBot Sequencing(Hoang et al.Proc.Natl.Acad.Sci.U.S.A.113:9846-9851(2016)及びAbascal et al.Nature 593,405-410(2021))が、複数のインサートを有する配列決定鋳型の調製を改善する可能性のある手段として開発されている。しかしながら、これらの方法は全て欠点を示しており、いずれも汎用性がない。
2021年6月12日投稿のBae et al.,bioRxiv,10.1101/2021.06.11.448110に最近記載された、Concatenating Original Duplex for Error Correction(CODEC)法は、特殊なCODECアダプター複合体を使用して単一のリード対を有する単一の二本鎖の配列決定のため、二本鎖DNAの両方の鎖を物理的に連結することを含む。CODEC法を使用して、核酸塩基損傷又は二本鎖核酸の一方の鎖のみに含まれる変化、並びにPCR増幅又は配列決定の間に導入された可能性があるエラーに起因し得る、非標準塩基対形成を同定することができる。しかしながら、CODEC法は、変換効率を制限し得る2回の連続したライゲーションを必要とし、副産物もまた、望ましくないライゲーションによって形成され得る。
ゲノム中の配列間の固有の構造的関係が存在しない場合、バーコードの形態の代理「関連マーカー」が使用され得る。例えば、DNAの大きな、例えば、1000塩基対超、又は更に5000塩基対超の断片は、希釈、区画化、又は表面上への固定化によって単離され得、更に断片化され、ここで、各小断片は、その後、共通のバーコード配列を付加する。したがって、多くの断片が並行して処理され、各単離された断片が後続のサブ配列に付加された固有のバーコード配列を受け取る場合、全ての断片由来の全ての小断片のプールを、1回の実験において配列決定でき、小断片は、それらのバーコード配列を同定及び照合することによって明確にされ得る。このアプローチは、ゲノム内の隣接配列が互いに関連付けられることを可能にし、はるかに大きなインシリコ断片への多数の小断片のインシリコアセンブリを可能にし、ゲノムにおける変異体のフェージングに役立ち得る。
別のタイプのバーコード化では、固有分子識別子(UMI)を使用して、鋳型調製及び配列決定の間に物理的に分離するゲノム内の配列間の関連性を保存する。UMIは、個々の単一分子がそれぞれ固有のバーコードを受け取るように、鋳型調製中にDNA又はRNAの断片に付加された短いバーコード配列を含む。配列決定によるUMIの読み取りは、元の試料が長さ及び配列において2つ以上の同一の断片を含有していた場合であっても、個々の分子(鋳型調製物内の断片など)を識別することができる。UMIはまた、PCR又は元の鋳型のコピーを作製する他のそのような方法の間に生成及び伝播されたエラー(例えば、自然ゲノム配列に対する改変)を同定するのにも役立つ。これは、この方法以外ではPCRによって作製された人工変異体のバックグラウンドにおいて同定することが潜在的に困難である低頻度の自然な変異体を含有する試料を配列決定するための実験において有用である。UMIの別の用途では、二本鎖断片を、二本鎖UMI(すなわち、ゲノム断片の第1及び第2の鎖がそれぞれ共通のUMIバーコードを付加するように、二本鎖アダプター中のその相補体にハイブリダイズしたUMIバーコード)を含有する二本鎖アダプターに付加してライゲーションすることができる。このようにして、変性による分離後、第1の鎖及び第2の鎖を同定し、UMIによって再会合させることができる。そのようなUMIの使用は、ゲノム中の配列の2種類の「リード」を与えることによって、言い換えれば、断片由来の鋳型の「センス」及び「アンチセンス」対を同定して使用し、いずれかの鋳型の配列決定リード中のベースコールの妥当性を推測することによって、シーケンシングの精度を改善するのに役立ち得る。
ゲノム内の遠位又は相補のいずれかの配列を関連付けるためのバーコードの使用は、アダプター及び配列決定反応中のバーコードの設計及び組み込みに関する制約のために、実際には複雑である。例えば、バーコードの所与の長さに対して有限個の順列が存在する。一例では、4塩基バーコードは256個の順列のみを有し、自己相補性及び他の配列を考慮すると、実際には全てが機能的であるわけではない。同様の問題は、バーコードがより長いが、バーコードを読み取るためにより多くの配列決定サイクルを必要とする追加のペナルティを伴う場合に現れる。
アダプターにバーコードを追加することは、アダプター自体に複雑さを加える。例えば、あるアダプターから別のアダプターへの性能の変化を付加することは、ライブラリプール中の正規化に関する課題をもたらす。複雑なバーコードはまた、特にバーコード及びその相補体が二本鎖アダプターにおいてハイブリダイズする場合、複雑な製造を必要とする。
メイトペア又はクロマチン立体構造捕捉などのインビボ構造的会合の使用もまた、複雑なワークフローを必要とし、それが同定できる会合が限定される。例えば、メイトペアの課題は、極端なサイズの巨大断片であり、一方、クロマチン立体構造捕捉の課題は、クロマチン誘導性会合である。
ゲノム内の隣接配列及び相補配列に関する関連情報を提供できるバーコードを用いない方法が、本明細書に開示される。これらの方法は、単一の鋳型内でタンデムに配列を連結するための表面を利用し得る。方法はまた、近接性又はハプロタイプデータについての鋳型を生成するために区画化を使用し得る。配列決定されると、得られた鋳型は、配列決定におけるエラーを修正するため、又は非標準塩基対形成を同定するための情報を提供することができ、アセンブリ及びゲノム情報のフェージングのための連続性情報も提供することができる。
メチル化状態を検出する方法も本明細書に開示される。ゲノムDNA中のメチル化状態を検出するための従来の方法は、一般に、目的の塩基を異なる塩基に変換するために化学的又は生化学的反応を使用する。この変換の検出は、塩基がメチル化されたか否かを推測するために使用される。これらの方法は、試料を2つのアリコートに分割することを必要とする。一方のアリコートは化学的/生化学的に処理され、他方のアリコートは未処理のままである。次いで、両方を配列決定し、互いに比較してメチル化状態を推定する。このような化学的法の一例は、バイサルファイトシークエンシングであり、これは、亜硫酸水素ナトリウムによる非メチル化C塩基のU塩基への変換を使用する。次いで、ウラシルヌクレオチドを、PCRなどの増幅工程の間にチミンヌクレオチドに変換する。処理試料及び未処理試料の両方の配列決定後、リードを比較し、未処理試料中のC塩基が処理試料中のTとして読み取られる場合、このC塩基が元の試料中でメチル化されていなかったことを示す。しかしながら、未処理試料中のC塩基が依然として処理試料中のC塩基として読み取られる場合、理論的に、C塩基は元の試料中でメチル化されていた。
Vaisvilas et al.,Genome Res.31(7):1280-1289(2021)に記載されているように、同様の戦略をEM-Seqアッセイで使用するが、非メチル化Cを変換するために化学反応ではなく酵素反応が使用されることが例外である。最近の刊行物(Liu et al.,Nature Biotechnology 37(4):424-429(2019))では、メチル化Cヌクレオチドを変換し、非メチル化Cヌクレオチドを変換しないボラン系の代替的な化学法を導入した。これは、バイサルファイトシークエンシングなどの通常のC変換化学法よりも有利であると報告されているが、なぜならば、(変換されたゲノムがほとんどA、G及びTであるバイサルファイト化学法とは対照的に)ゲノムのわずかな割合しかメチル化されていないため、変換されたゲノムはほとんどが依然としてA、C、G及びTを含む4塩基ゲノムであるからである。
メチル化分析の現在の方法の共通の特徴は、試料を2つのアリコートに分割する必要があり、これらのアリコートを並行して処理及び配列決定することである。試料を分割する必要なく塩基のメチル化状態を直接検出する技術が存在する。これらの方法は、元の試料中のメチル化塩基と非メチル化塩基を区別することができる配列決定戦略を使用する、単一分子配列決定技術に依存する。そのような技術の例としては、ナノ細孔配列決定(例えば、「Epigenetics and methylation analysis」,Oxford Nanopore Technologies,downloaded on October 7,2021、nanoporetech.com/applications/investigation/epigenetics-and-methylation-analysis参照)及びSMRT配列決定(Flusberg et al.,Nat Methods.7(6):461-465(2010)に記載)が挙げられる。しかし、これらの戦略は、ハイスループット配列決定が必要であるか、又は目的のゲノムが無細胞DNAなどの断片サイズが小さい方法には不利である。
ゲノムのメチル化状態を識別するために、単一のアリコートのメチル化試料を処理し、配列決定する方法が、本明細書に記載される。この方法は、ヒドロキシメチル化シトシンをメチル化シトシンから識別できる方法を含む。本発明の方法は、試料調製及び配列決定における労力を低減することができ、メチル化分析に必要とされる出発材料の量を潜在的に減少させ得る。
ゲノムのメチル化状態を識別するために、単一のアリコートのメチル化試料を処理し、配列決定する方法が、本明細書に記載される。この方法は、ヒドロキシメチル化シトシンをメチル化シトシンから識別できる方法を含む。本発明の方法は、試料調製及び配列決定における労力を低減することができ、メチル化分析に必要とされる出発材料の量を潜在的に減少させ得る。
Schmitt,et al.Proc.Natl.Acad.Sci.U.S.A.109:14508-14513(2012)
Pel et al.PLoS One 13:1-19(2018)
Gregory et al.Nucleic Acids Res.44:e22(2016)
Wang et al.Nat.Commun.8,15335(2017)
Lou et al.,Proc.Natl.Acad.Sci.U.S.A.110:19872-19877(2013)
Hoang et al.Proc.Natl.Acad.Sci.U.S.A.113:9846-9851(2016)
Abascal et al.Nature 593,405-410(2021)
Bae et al.,bioRxiv,10.1101/2021.06.11.448110
Vaisvilas et al.,Genome Res.31(7):1280-1289(2021)
Liu et al.,Nature Biotechnology 37(4):424-429(2019)
Flusberg et al.,Nat Methods.7(6):461-465(2010)
複数のインサート配列を含むポリヌクレオチドが本明細書に記載される。これらのポリヌクレオチドは、標的核酸由来の複数のインサート配列の配列決定を可能にする方法において使用され得る。また、本明細書に記載されるのは、エラー訂正及び非標準塩基対形成の同定、連続性データの決定、並びにメチル化分析の方法における配列決定鋳型として使用するための複数のインサートを含むポリヌクレオチドである。
実施形態1は、(a)第1のリードプライマー結合配列を含む5’末端ポリヌクレオチドと、(b)5’末端ポリヌクレオチドの3’側に位置する第1のインサート配列であって、標的核酸に由来する第1のインサート配列と、(c)第2のリードプライマー結合配列及びハイブリダイゼーション配列を含む、第1のインサート配列の3’側に位置する連結配列と、(d)連結配列の3’側に位置する第2のインサート配列であって、標的核酸の非隣接配列に由来するか、又は第1のインサート配列とは異なる標的核酸に由来する、第2のインサート配列と、(e)3’末端ポリヌクレオチド配列と、を含む、ポリヌクレオチドである。
実施形態2は、第1のリードプライマー結合配列を含む3’末端ポリヌクレオチドと、標的核酸に由来する3’末端ポリヌクレオチドの5’側の第1のインサート配列と、第1のリードプライマー結合配列に直交する第2のリードプライマー結合配列を含む連結配列であって、第2のリードプライマー結合配列がハイブリダイゼーション配列を含む、連結配列と、連結配列の5’側にあり、標的核酸の非隣接配列に由来するか、又は第1のインサート配列とは異なる標的核酸に由来する、第2のインサート配列と、ポリヌクレオチドの5’末端にあり、付着配列を含む、付着ポリヌクレオチドと、を含み、3’末端ポリヌクレオチド、連結配列、及び付着ポリヌクレオチドが標的核酸に由来しない、ポリヌクレオチドである。
実施形態3は、2つのインサート配列が異なる標的核酸に由来する、実施形態1又は2に記載のポリヌクレオチドである。
実施形態4は、第1のインサート配列及び第2のインサート配列がそれぞれ独立して、40~400ヌクレオチド、100~200ヌクレオチド、又は150ヌクレオチドを含む、実施形態1~3のいずれかに記載のポリヌクレオチドである。
実施形態5は、第1のリードプライマー結合配列が、第1のアダプター配列を含む、実施形態1~4のいずれかに記載のポリヌクレオチドである。
実施形態6は、第1のリードプライマー結合配列が、トランスポゾン末端配列の相補体を更に含む、実施形態1~5のいずれかに記載のポリヌクレオチドである。
実施形態7は、第1のアダプター配列が、A14プライマー配列の相補体(A14’)又はB15プライマー配列の相補体(B15’)である、実施形態5又は6に記載のポリヌクレオチドである。
実施形態8は、3’末端ポリヌクレオチドが、P7プライマー配列の相補体(P7’)又はP5プライマー配列の相補体(P5’である、実施形態及び3~7のいずれか1つに記載のポリヌクレオチドである。
実施形態9は、3’末端ポリヌクレオチドがP5プライマー配列の相補体(P5’)を含み、付着ポリヌクレオチドがP7プライマー配列(P7)を含む、又は、3’末端ポリヌクレオチドがP7プライマー配列の相補体(P7’)を含み、付着ポリヌクレオチドがP5プライマー配列(P5)を含む、実施形態2~7のいずれか1つに記載のポリヌクレオチドである。
実施形態10は、連結配列が、(a)ハイブリダイゼーション配列を含み、任意選択的に(b)ハイブリダイゼーション単位の3’側のトランスポゾン末端配列及びハイブリダイゼーション単位の5’側のトランスポゾン末端配列の相補体を含む、実施形態2~9のいずれか1つに記載のポリヌクレオチドである。
実施形態11は、第2のリードプライマー結合配列が、ハイブリダイゼーション配列及びトランスポゾン末端配列の相補体を含む、実施形態10に記載のポリヌクレオチドである。
実施形態12は、付着ポリヌクレオチドが、第2のアダプター配列と、任意選択的にトランスポゾン末端配列と、を含む、実施形態2~11のいずれか1つに記載のポリヌクレオチドである。
実施形態13は、第2のアダプター配列が、A14配列又はB15配列である、実施形態12に記載のポリヌクレオチドである。
実施形態14は、第1のアダプター配列がA14配列の相補体(A14’)であり、第2のアダプター配列がB15配列である、又は、第1のアダプター配列がB15配列の相補体(B15’)であり、第2のアダプター配列がA14配列である、実施形態13に記載のポリヌクレオチドである。
実施形態15は、3’末端ポリヌクレオチド及び/又は付着ポリヌクレオチドが、それぞれ独立して、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む、実施形態2~7又は9~14のいずれか1つに記載のポリヌクレオチドである。
実施形態16は、ポリヌクレオチドが、固体支持体上に固定されている、実施形態2~7及び9~14のいずれか1つに記載のポリヌクレオチドである。
実施形態17は、ポリヌクレオチドが、付着ポリヌクレオチドを介して固体支持体上に固定されている、実施形態16に記載のポリヌクレオチドである。
実施形態18は、ポリヌクレオチドが、固体支持体の表面上の付着ポリヌクレオチド相補体への付着ポリヌクレオチドのハイブリダイゼーションを介して固体支持体上に固定されている、実施形態17に記載のポリヌクレオチドである。
実施形態19は、ポリヌクレオチドが、付着ポリヌクレオチド上の親和性部分の固体支持体の表面上の結合部分への結合を介して固体支持体に固定されている、実施形態17に記載のポリヌクレオチドである。
実施形態20は、固体支持体が、フローセル又はビーズである、実施形態16~19のいずれか1つに記載のポリヌクレオチドである。
実施形態21は、ポリヌクレオチドが、第2のインサート配列と付着ポリヌクレオチドとの間に、標的核酸の非隣接配列に由来するか、又は他のインサート配列とは異なる標的核酸に由来する、5’末端のインサート配列と、リードプライマー結合配列を含む3’末端の連結配列と、を含む、少なくとも1つの挿入単位を含み、リードプライマー結合配列は、他のリードプライマー結合配列と直交している、実施形態2~7又は9~20のいずれか1つに記載のポリヌクレオチドである。
実施形態22は、ポリヌクレオチドが、その相補体にハイブリダイズしている、実施形態21に記載のポリヌクレオチドである。
実施形態23は、実施形態1、3~8、又は22のいずれか1つに記載のポリヌクレオチドと、その相補体と、を含む組成物であって、相補体は、(a)第1の相補リードプライマー結合配列を含む5’末端相補体と、(b)5’末端相補体の3’側に位置する第2のインサート配列の相補配列と、(c)第2のインサート配列の相補配列の3’側に位置する相補連結配列であって、第2のインサート配列が、(i)第2の相補リードプライマー結合配列と、(ii)相補ハイブリダイゼーション配列と、を含む、相補連結配列と、(d)相補連結配列の3’側に位置する第1のインサート配列の相補配列と、(e)3’末端相補体と、を含む、組成物である。
実施形態24は、実施形態2~7又は9~22のいずれか1つに記載のポリヌクレオチドと、その相補体と、を含む組成物であって、相補体は、第1の相補リードプライマー結合配列を含む3’末端相補体であって、第1の相補リードプライマー結合配列は、第1及び第2のリードプライマー結合配列に直交している、3’末端相補体と、3’末端相補体の5’側にある第2のインサート配列の相補体と、第2のインサート配列の相補体の5’側にあり、3’から5’への第2の相補リードプライマー結合配列を含む相補連結配列であって、第2の相補リードプライマー結合配列は、第1及び第2のリードプライマー結合配列、並びに第1の相補リードプライマー結合配列に直交している、相補連結配列と、相補連結配列の5’側の第1のインサート配列の相補体と、5’末端に相補付着配列を含む相補付着ポリヌクレオチドと、を含む、組成物である。
実施形態25は、第1の相補リードプライマー結合配列が、第2のアダプター配列、及び存在する場合、付着ポリヌクレオチドのトランスポゾン末端配列に相補的であり、相補連結配列が、連結配列に相補的であり、相補付着ポリヌクレオチドが、第1のアダプター配列、及び存在する場合、トランスポゾン末端配列の相補体に相補的である、実施形態24に記載の組成物である。
実施形態26は、ポリヌクレオチドが、第1の付着ポリヌクレオチドを介して固体支持体上に固定されている、実施形態24又は25に記載の組成物である。
実施形態27は、相補体が、相補付着ポリヌクレオチドを介して固体支持体上に固定されている、実施形態24又は25に記載の組成物である。
実施形態28は、ポリヌクレオチドが、3’-P7’-B15’-ME’-インサート1-ME-HYB-ME’-インサート2-ME-A14-P5-5’の構造を有し、ME’は、モザイク末端配列(例えば、配列番号3)の相補体である、実施形態2~7若しくは9~22のいずれか1つに記載のポリヌクレオチド、又は実施形態24~27のいずれか1つに記載の組成物である。
実施形態29は、ポリヌクレオチドの相補体が、3’-P5’-A14’-ME’-インサート2-ME-HYB’-ME’-インサート1-ME-B15-P7-5’の構造を有する、実施形態28に記載のポリヌクレオチド又は組成物である。
実施形態30は、トランスポソーム複合体であって、トランスポザーゼと、第1のリードプライマー結合配列の相補体を含む第1のトランスポゾンであって、第1のリードプライマー結合配列の相補体は、トランスポゾン末端配列を含む3’部分を含む、第1のトランスポゾンと、第1のアダプター配列の相補体と、トランスポゾン末端配列の相補体を含む5’部分を含む、第2のトランスポゾンと、ハイブリダイゼーション配列の相補体と、を含む、トランスポソーム複合体である。
実施形態31は、第1のアダプター配列の相補体がB15配列である、実施形態30に記載のトランスポソーム複合体である。
実施形態32は、第2のトランスポゾンが、第1のリードプライマー結合配列の5’側に相補付着配列を含み、任意選択的に、相補付着配列がP7配列を含む、実施形態30又は31に記載のトランスポソーム複合体である。
実施形態33は、トランスポソーム複合体が、
実施形態34は、トランスポソーム複合体が、第1又は第2のトランスポゾンを介してビーズ上に固定されている、実施形態30~33のいずれか1つに記載のトランスポソーム複合体である。
実施形態35は、トランスポザーゼと、付着ポリヌクレオチドを含む第1のトランスポゾンであって、付着ポリヌクレオチドは、付着配列を含む5’部分を含む、第1のトランスポゾンと、第2のリードプライマー結合配列を含む3’部分であって、トランスポゾン末端配列を含む3’部分を含む、3’部分と、アダプターと、トランスポゾン末端配列の相補体を含む5’部分を含む第2のトランスポゾンと、ハイブリダイゼーション配列と、を含む、トランスポソーム複合体である。
実施形態36は、アダプターがA14配列である、実施形態35に記載のトランスポソーム複合体である。
実施形態37は、付着配列がP5配列を含む、実施形態35又は36に記載のトランスポソーム複合体である。
実施形態38は、トランスポソーム複合体が、
実施形態39は、トランスポソーム複合体が、第1又は第2のトランスポゾンを介して固体支持体に固定されている、実施形態35~38のいずれか1つに記載のトランスポソーム複合体である。
実施形態40は、トランスポソーム複合体が、ビーズ上に固定されている、実施形態35~38のいずれか1つに記載のトランスポソーム複合体である。
実施形態41は、トランスポソーム複合体が、第1又は第2のトランスポゾンに付着したリンカーに接続された親和性エレメントを介して固体支持体又はビーズ上の親和性結合パートナーに固定されている、実施形態30~40のいずれか1つに記載のトランスポソーム複合体である。
実施形態42は、実施形態30~41のいずれか1つに記載のトランスポソーム複合体などの2つ以上のトランスポソーム複合体を含む、組成物又はキットである。
実施形態43は、組成物又はキットであって、固体支持体であって、任意選択的に、任意選択の支持体はビーズである、固体支持体と、トランスポソーム複合体を生成するための構成要素であって、トランスポザーゼと、オリゴヌクレオチド二本鎖を生成するためのオリゴヌクレオチドであって、第1のオリゴヌクレオチドは、3’トランスポゾン末端配列と、5’の第1のアダプター配列と、を含み、第2のオリゴヌクレオチドは、5’トランスポゾン末端配列と、3’の第2のアダプター配列と、を含み、5’トランスポゾン末端配列は、3’トランスポゾン末端配列に相補的であり、第1及び第2のアダプター配列は同じでない、オリゴヌクレオチドと、を含む、構成要素と、PCRによって断片に付着配列及びハイブリダイゼーション配列を付加するための第1及び第2のプライマーセットであって、第1のプライマーセットは、断片にハイブリダイゼーション配列及び第1の付着配列を付加するためのプライマーを含み、第2のプライマーセットは、断片に相補ハイブリダイゼーション配列及び第2の付着配列を付加するためのプライマーを含み、第1及び第2の付着配列は同じでない、第1及び第2のプライマーセットと、を含む、組成物又はキットである。
実施形態44は、第1のフォーク型アダプター複合体と、第2のフォーク型アダプター複合体と、を含む、アダプター組成物又はキットであって、第1のフォーク型アダプター複合体は、相補付着ポリヌクレオチドであって、相補付着配列を含む5’部分と、アダプターを含む3’部分と、を含む、相補付着ポリヌクレオチドと、ハイブリダイゼーションポリヌクレオチドであって、(a)アダプターの一部の相補体を含み、それにハイブリダイズする5’部分と、(b)ハイブリダイゼーション配列の相補体であって、ハイブリダイゼーション配列の相補体は、相補付着ポリヌクレオチドに相補的ではない、ハイブリダイゼーション配列の相補体と、を含む、ハイブリダイゼーションポリヌクレオチドと、を含み、第2のフォーク型アダプター複合体は、付着ポリヌクレオチドであって、付着配列を含む5’部分と、アダプターを含む3’部分と、を含む、付着ポリヌクレオチドと、ハイブリダイゼーションポリヌクレオチドであって、(a)アダプターの一部の相補体を含み、それにハイブリダイズする5’部分と、(b)ハイブリダイゼーション配列であって、付着ポリヌクレオチドに相補的ではない、ハイブリダイゼーション配列と、を含む、ハイブリダイゼーションポリヌクレオチドと、を含む、アダプター組成物又はキットである。
実施形態45は、付着配列がP5プライマー配列を含み、相補付着配列がP7プライマー配列を含む、実施形態44に記載のアダプター組成物又はキットである。
実施形態46は、相補付着ポリヌクレオチドがB15配列を含み、ハイブリダイゼーションポリヌクレオチドがA14配列を含む、実施形態44又は45に記載のアダプター組成物又はキットである。
実施形態47は、第1のフォーク型アダプター複合体が、
実施形態48は、アダプター複合体がメチル化ヌクレオチドを含む(例えば、メチル化シトシンを含む)、実施形態44~47のいずれか1つに記載のアダプター組成物又はキットである。
実施形態49は、連結された核酸配列決定鋳型を生成する方法であって、第1のリードプライマー結合配列を、第1の標的核酸に由来する第1のインサート配列の3’末端に付着させることと、第1のインサート配列の5’末端にハイブリダイゼーション配列を付着させることと、ハイブリダイゼーション配列の相補体を、第1の標的核酸の不連続領域又は第2の標的核酸に由来する第2のインサート配列の3’末端に付着させることと、ハイブリダイゼーション配列をハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することと、を含み、第1のインサート配列と第2のインサート配列との間の領域は、第2のリードプライマー結合配列であって、ハイブリダイゼーション配列を含み、第1のリードプライマー結合配列に直交する、第2のリードプライマー結合配列を含み、それにより、連結された核酸配列決定鋳型を生成する、方法である。
実施形態50は、第1のリードプライマー結合配列を付着させること及びハイブリダイゼーション配列を付着させることが、タグメンテーションに適した条件下で、1つ以上の標的核酸をトランスポソーム複合体と接触させることを含む、実施形態48に記載の方法である。
実施形態51は、ハイブリダイゼーション配列の相補体を、第1の標的核酸の不連続領域又は第2の標的核酸に由来する第2のインサート配列の3’末端に付着させることが、タグメンテーションに適した条件下で、1つ以上の標的核酸をトランスポソーム複合体と接触させることを含む、実施形態49又は50に記載の方法である。
実施形態52は、第1のリードプライマー結合配列を第1のインサート配列の3’末端に付着させること及びハイブリダイゼーション配列を第1のインサート配列の5’末端に付着させることが、アダプター複合体の断片の末端へのライゲーションに適した条件下で、1つ以上の標的核酸を実施形態44~48のいずれか1つに記載の第1のフォーク型アダプター複合体と接触させて、両端で第1のアダプター複合体とライゲーションした断片及び両端で第2のアダプター複合体とライゲーションした断片を形成し、ライゲーションした断片を変性させることを含む、実施形態49に記載の方法である。
実施形態53は、ハイブリダイゼーション配列の相補体を第2のインサート配列の3’末端に付着させることが、アダプター複合体の断片の末端へのライゲーションに適した条件下で、1つ以上の標的核酸を第2のフォーク型アダプター複合体と接触させて、両端で第1のアダプター複合体とライゲーションした断片及び両端で第2のアダプター複合体とライゲーションした断片を形成し、ライゲーションした断片を変性させることを含む、実施形態49又は50に記載の方法である。
実施形態54は、連結された核酸配列決定鋳型を生成する方法であって、第1の標的核酸を含む第1の試料を第1のトランスポソーム複合体及び第2のトランスポソーム複合体と接触させることであって、各トランスポソーム複合体は、トランスポザーゼと、トランスポゾン末端配列を含む3’部分と、アダプター配列を含む5’部分と、を含む、第1のトランスポゾンと、トランスポゾン末端配列の相補体を含み、それにハイブリダイズする5’部分を含む、第2のトランスポゾンと、を含み、第1のトランスポソーム複合体中のアダプター配列は、第1のアダプター配列の相補体であり、第2のトランスポソーム複合体中のアダプター配列は、第2のアダプター配列であり、第1の標的核酸を断片化して、一方の末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされ、他方の末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、任意選択的にポリメラーゼ連鎖反応によって、第1のタグ付き生成物の3’末端に相補付着配列を付加し、第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、第2の標的核酸を含む第2の試料をトランスポソーム複合体と接触させることであって、第2の標的核酸を断片化して、一方の末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされ、他方の末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、任意選択的にポリメラーゼ連鎖反応によって、第2のタグ付き生成物の3’末端に付着配列を付加し、第2のタグ付き生成物の5’末端にハイブリダイゼーション配列を付加して、第2の修飾されたタグ付き生成物を形成することと、第1の修飾されたタグ付き生成物のハイブリダイゼーション配列を第2の修飾されたタグ付き生成物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、連結された核酸配列決定鋳型は、(a)第2の標的核酸由来のインサート配列の3’側にある、第1のリードプライマー結合配列であって、第1のアダプター配列と、トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、(b)2つのインサート配列の間にある第2のリードプライマー結合配列であって、トランスポゾン末端配列と、ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、第1のリードプライマー結合配列は、第2のリードプライマー結合配列に直交する、ことと、を含む、方法である。
実施形態55は、連結された核酸配列決定鋳型を生成する方法であって、第1の標的核酸を含む第1の試料を第1のトランスポソーム複合体と接触させることであって、第1のトランスポソーム複合体は、トランスポザーゼと、トランスポゾン末端配列を含む3’部分と、付着配列及び第1のアダプター配列の相補体を含む5’部分と、を含む、第1のトランスポゾンと、トランスポゾン末端配列の相補体を含み、それにハイブリダイズする5’部分を含む、第2のトランスポゾンと、を含み、第1の標的核酸を断片化して、各末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされた、第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、任意選択的にポリメラーゼ連鎖反応によって、第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、第2の標的核酸を含む第2の試料を第2のトランスポソーム複合体と接触させることであって、第2のトランスポソーム複合体は、トランスポザーゼと、トランスポゾン末端配列を含む3’部分と、第2のアダプター配列及び相補付着配列を含む5’部分と、を含む、第1のトランスポゾンと、トランスポゾン末端配列の相補体を含み、それにハイブリダイズする5’部分を含む、第2のトランスポゾンと、を含み、第2の標的核酸を断片化して、各末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、任意選択的にポリメラーゼ連鎖反応によって、第2のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第2の修飾されたタグ付き生成物を形成することと、第1の修飾されたタグ付き生成物のハイブリダイゼーション配列を第2の修飾されたタグ付き生成物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、連結された核酸配列決定鋳型は、(a)第2の標的核酸由来のインサート配列の3’側にある、第1のリードプライマー結合配列であって、第1のアダプター配列と、トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、(b)2つのインサート配列の間にある第2のリードプライマー結合配列であって、トランスポゾン末端配列と、ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、第1のリードプライマー結合配列は、第2のリードプライマー結合配列に直交する、ことと、を含む、方法である。
実施形態56は、トランスポソーム複合体が固体支持体上に固定されている、実施形態54又は55に記載の方法である。
実施形態57は、連結された核酸配列決定鋳型を生成する方法であって、(a)(i)第1の標的核酸を含む第1の二本鎖ポリヌクレオチドを第1の制限酵素と、かつ、(ii)第2の標的核酸を含む第2の二本鎖ポリヌクレオチドを第2の制限酵素と、接触させ、適合性オーバーハングを有する第1及び第2のポリヌクレオチドを産生することであって、制限酵素は、II型、IIS型、IIP型、及びIIT型制限酵素から選択される、ことと、(b)リガーゼを使用して、第1及び第2のポリヌクレオチドの適合性オーバーハングを付着させることと、を含む、方法である。
実施形態58は、接触工程の前に、(a)第1の制限酵素切断部位を、任意選択的にアダプターを使用することによって、第1の標的核酸に付着させ、プライマー伸長によって第1の二本鎖ポリヌクレオチドを生成することと、(b)第2の制限酵素切断部位を、任意選択的にアダプターを使用することによって、第2の標的核酸に付着させ、プライマー伸長によって第2の二本鎖ポリヌクレオチドを生成することと、が行われる、実施形態57に記載の方法である。
実施形態59は、連結された核酸配列決定鋳型を生成する方法であって、(a)第1の核酸供給源及び第2の核酸供給源を剪断又は消化して、核酸断片の第1のライブラリー及び核酸断片の第2のライブラリーをそれぞれ生成することと、(b)第1の核酸供給源由来の各核酸断片に第1のアダプターを付着させ、第2の核酸供給源由来の各核酸断片に第2のアダプターを付着させることであって、(i)核酸断片を第1のポリメラーゼと接触させて、平滑末端を有する核酸断片を生成することと、(ii)キナーゼを用いて核酸断片の5’-ヒドロキシルをリン酸化することと、(iii)第2のポリメラーゼを用いて核酸断片に3’アデニンを付加することと、(iv)第1のアダプターを前記第1のライブラリーの各核酸断片にライゲーションし、第2のアダプターを第2のライブラリーの各核酸断片にライゲーションすることと、を含む、ことと、(c)任意選択的にPCRによって、第1及び第2の核酸ライブラリーを混合かつアニーリングすることであって、(i)核酸が高温で変性し、(ii)A及びA’配列がより低温で互いにハイブリダイズする、ことと、(d)任意選択的にPCRによって、完全二本鎖の連結された核酸配列決定鋳型を合成することと、を含む、方法である。
実施形態60は、方法が、連結された核酸配列決定鋳型を配列決定することを含む、実施形態54~59のいずれか1つに記載の方法である。
実施形態61は、第1のリードプライマー結合配列に相補的な第1のリード配列決定プライマーを用いて配列決定を開始することによって、実施形態1~22のいずれか1つに記載のポリヌクレオチドの第1のインサート配列を配列決定することと、第2のリードプライマー結合配列に相補的な第2のリード配列決定プライマーを用いて配列決定を開始することによって、第2のインサート配列を配列決定することと、を含む、連結された核酸配列決定鋳型を配列決定する方法である。
実施形態62は、方法が、第1の相補リードプライマー結合配列に相補的な第1の相補リード配列決定プライマーを用いて配列決定を開始することによって、第2のインサート配列の相補体を配列決定することと、第2の相補リードプライマー結合配列に相補的な第2の相補リード配列決定プライマーを用いて配列決定を開始することによって、第1のインサート配列の相補体を配列決定することと、を更に含む、実施形態61に記載の方法である。
実施形態63は、標的二本鎖核酸を含む試料を複数の異なる区画に区画化することが行われ、連結された核酸配列決定鋳型を生成することが異なる区画内で行われる、実施形態49~59のいずれか1つに記載の方法である。
実施形態64は、ポリヌクレオチドであって、(a)第1のリード配列決定プライマー配列を含む5’末端ポリヌクレオチドと、(b)標的核酸に由来するインサート配列であって、5’末端ポリヌクレオチドの3’側にある、インサート配列と、(c)インサート配列の3’側にあるハイブリダイゼーション配列と、(d)ハイブリダイゼーション配列の3’側にあるインサート配列のコピーと、(e)第2のリード配列決定プライマー配列の相補体を含む3’末端ポリヌクレオチドと、を含む、ポリヌクレオチドである。
実施形態65は、ポリヌクレオチドであって、(a)第1のリード配列決定プライマー配列を含む5’末端ポリヌクレオチドと、(b)標的核酸に由来するインサート配列であって、5’末端ポリヌクレオチドの3’側にある、第1のインサート配列と、(c)インサート配列の3’側にあるハイブリダイゼーション配列と、(d)ハイブリダイゼーション配列の3’側にある第2のインサート配列と、(e)第2のリード配列決定プライマー配列の相補体を含む3’末端ポリヌクレオチドと、を含む、ポリヌクレオチドである。
実施形態66は、インサート配列が40~400ヌクレオチドを含み、任意選択的に、インサート配列が1000以下のヌクレオチドを含む、実施形態64又は65に記載のポリヌクレオチドである。
実施形態67は、ハイブリダイゼーション配列が10~30ヌクレオチドを含み、任意選択的に、ハイブリダイゼーション配列中の1つ以上のヌクレオチドがロック核酸である、実施形態64~66のいずれか1つに記載のポリヌクレオチドである。
実施形態68は、第1のリード配列決定プライマー配列及び第2のリード配列決定プライマー配列が異なっている、実施形態64~67のいずれか1つに記載のポリヌクレオチドである。
実施形態69は、第1のリード配列決定プライマー配列及び第2のリード配列決定プライマー配列がそれぞれ、A14配列若しくはB15配列、又はそれらの相補体を含む、実施形態64~68のいずれか1つに記載のポリヌクレオチドである。
実施形態70は、3’末端ポリヌクレオチドがP5プライマー配列の相補体(P5’)を含み、5’末端ポリヌクレオチドがP7プライマー配列(P7(配列番号8))を含む、又は、3’末端ポリヌクレオチドがP7プライマー配列の相補体(P7’)を含み、5’末端ポリヌクレオチドがP5プライマー配列(P5(配列番号7))を含む、実施形態64~69のいずれか1つに記載のポリヌクレオチドである。
実施形態71は、3’末端ポリヌクレオチド及び/又は5’末端ポリヌクレオチドが、それぞれ独立して、アダプター、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む、実施形態64~70のいずれか1つに記載のポリヌクレオチドである。
実施形態72は、ポリヌクレオチドが、固体支持体上に固定されている、実施形態及び64~71のいずれか1つに記載のポリヌクレオチドである。
実施形態73は、ポリヌクレオチドが、5’末端ポリヌクレオチドを介して固体支持体上に固定されている、実施形態72に記載のポリヌクレオチドである。
実施形態74は、ポリヌクレオチドが、5’末端ポリヌクレオチド上の親和性部分の固体支持体の表面上の結合部分への結合を介して固体支持体に固定されている、実施形態73に記載のポリヌクレオチドである。
実施形態75は、親和性部分が、リンカーを介して5’末端ポリヌクレオチドに付着している、実施形態64~74のいずれか1つに記載のポリヌクレオチドである。
実施形態76は、親和性部分が、ビオチン、デスチオビオチン、又はデュアルビオチンである、実施形態64~75のいずれか1つに記載のポリヌクレオチドである。
実施形態77は、ポリヌクレオチドが、5’-P5-A14-インサート-HYB-インサート-B15’-P7’-3’又は5’-P7-B15-インサート-HYB’-インサート-A14’-P5’-3’の構造を有し、HYBは、ハイブリダイゼーション配列であり、HYB’は、ハイブリダイゼーション配列の相補体である、実施形態64又は66~76のいずれか1つに記載のポリヌクレオチドである。
実施形態78は、ポリヌクレオチドが、5’-P5-A14-インサート1-HYB-インサート2-B15’-P7’-3’又は5’-P7-B15-インサート1-HYB’-インサート2-A14’-P5’-3’の構造を有し、HYBはハイブリダイゼーション配列であり、HYB’はハイブリダイゼーション配列の相補体である、実施形態65~77のいずれか1つに記載のポリヌクレオチドである。
実施形態79は、その相補体にハイブリダイズしている、実施形態64~78のいずれか1つに記載のポリヌクレオチドを含む組成物である。
実施形態80は、親和性部分が、ビオチン、デスチオビオチン又はデュアルビオチンであり、結合部分が、アビジン又はストレプトアビジンである、固体支持体の表面に固定されている実施形態64~78のいずれか1つに記載のポリヌクレオチドを含む組成物又は実施形態79に記載の組成物である。
実施形態81は、固体支持体が、ビーズ、スライド、容器の壁、フローセル、又はフローセルに含まれるナノウェルである、実施形態80に記載の組成物である。
実施形態82は、(a)配列決定プライマー配列を含む第1の鎖と、(b)3’ハイブリダイゼーション配列又はその相補体を含む第2の鎖と、を含み、第1の鎖の3’末端は、第2の鎖の5’末端に完全に又は部分的に相補的である、2つのポリヌクレオチド鎖を含むフォーク型アダプターである。
実施形態83は、ハイブリダイゼーション配列又はその相補体が、ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合している、実施形態82に記載のフォーク型アダプターである。
実施形態84は、ハイブリダイゼーション配列又はその相補体が、ハイブリダイゼーション配列又はその相補体に完全に相補的であるブロッキングオリゴヌクレオチドに結合している、実施形態83に記載のフォーク型アダプターである。
実施形態85は、第1の鎖及び/又は第2の鎖が、アダプター、バーコード配列、固有分子識別子(UMI)配列、試料インデックス配列、捕捉配列、又は開裂配列のうちの少なくとも1つを更に含む、実施形態82~84のいずれか1つに記載のフォーク型アダプターである。
実施形態86は、第1の鎖及び/又は第2の鎖が、P7若しくはP5プライマー配列、又はそれらの相補体を更に含む、実施形態82~85のいずれか1つに記載のフォーク型アダプターである。
実施形態87は、配列決定プライマー配列が、B15配列(配列番号6)若しくはA14配列(配列番号4)、又はそれらの相補体を含む、実施形態82~86のいずれか1つに記載のフォーク型アダプターである。
実施形態88は、第1の鎖が、固体支持体又はビーズ上の親和性結合パートナーに結合することができる5’親和性エレメントを含む、実施形態82~87のいずれか1つに記載のフォーク型アダプターである。
実施形態89は、親和性エレメントが、第1の鎖に付着したリンカーを介して接続されている、実施形態88に記載のフォーク型アダプターである。
実施形態90は、(a)第1のフォーク型アダプターが、第1のリード配列決定プライマー配列を含む第1の鎖と、ハイブリダイゼーション配列の相補体を含む第2の鎖と、を含み、(b)第2のフォーク型アダプターが、第2のリード配列決定プライマー配列を含む第1の鎖と、ハイブリダイゼーション配列を含む第2の鎖と、を含む、実施形態82~89のいずれか1つに記載の2つのフォーク型アダプターを含む組成物又はキットである。
実施形態91は、一方又は両方のフォーク型アダプターが、ブロッキングオリゴヌクレオチドを含む、実施形態44~48又は90に記載の組成物又はキットである。
実施形態92は、1つ以上の連結された核酸配列決定鋳型を生成する方法であって、(a)標的核酸から調製されたインサートをそれぞれ含む二本鎖核酸断片を含む試料を、2つのフォーク型アダプターを含む組成物又はキットと接触させることであって、一方又は両方のフォーク型アダプターは、ブロッキングオリゴヌクレオチドを含み、任意選択的に、第1のリード配列決定アダプター配列は、第1のリードプライマー結合配列を含む、ことと、(b)フォーク型アダプターを二本鎖断片にライゲーションして、タグ付けされた二本鎖断片を調製することと、(c)タグ付けされた二本鎖断片を固体支持体上に固定することと、(d)(1)固定された一本鎖断片を生成するために固定されたタグ付けされた二本鎖断片を、及び、(2)ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するためにブロッキングオリゴヌクレオチドを、変性させることと、(e)2つの固定された一本鎖断片を互いにハイブリダイズさせて、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、(f)各一本鎖断片の3’末端から伸長させて、両方の固定された一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法である。
実施形態93は、1つ以上の連結された核酸配列決定鋳型を生成する方法であって、(a)二本鎖標的核酸を含む試料を、溶液中のトランスポソーム複合体の2つのプールと接触させることであって、トランスポソーム複合体の第1のプールは、(i)トランスポザーゼと、(ii)3’トランスポゾン末端配列及び第1のリード配列決定アダプター配列を含む第1のトランスポゾンと、(iii)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含み、トランスポソーム複合体の第2のプールは、(i)トランスポザーゼと、(ii)3’トランスポゾン末端配列及び第2のリード配列決定アダプター配列を含む第1のトランスポゾンと、(iii)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含み、一方又は両方の第2のトランスポゾンは、ブロッキングオリゴヌクレオチドを含む、ことと、(b)二本鎖核酸をタグメンテーションして、タグ付けされた二本鎖断片を生成することと、(c)トランスポソーム複合体を二本鎖断片から遊離させることと、(d)二本鎖断片を伸長し、ライゲーションすることと、(e)タグ付けされた二本鎖断片を固体支持体上に固定することと、(f)(1)固定された一本鎖断片を生成するために固定されたタグ付けされた二本鎖断片を、及び、(2)ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するためにブロッキングオリゴヌクレオチドを、変性させることと、(g)2つの固定された一本鎖断片を互いにハイブリダイズさせて、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、(h)各一本鎖断片の3’末端から伸長させて、両方の固定された一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法である。
実施形態94は、変性させることが、温度の上昇、pHの変化、及び/又は1つ以上のカオトロピック剤の添加によって行われる、実施形態92又は93に記載の方法である。
実施形態95は、温度の上昇が、45℃~55℃から85℃~95℃への上昇であり、任意選択的に、温度の上昇が、50℃から90℃への上昇である、実施形態94に記載の方法である。
実施形態96は、1つ以上のカオトロピック剤が、ホルムアミド及び/又はNaOHを含む、実施形態92~95のいずれか1つに記載の方法である。
実施形態97は、固定が、(1)第1及び/若しくは第2のフォーク型アダプターに含まれるか、又は(2)第2のトランスポソーム由来のタグに含まれる、親和性部分の、固体支持体の表面上の1つ以上の結合部分への結合による、実施形態92~96のいずれか1つに記載の方法である。
実施形態98は、親和性部分が、ビオチン、デスチオビオチン、又はデュアルビオチンであり、結合部分が、アビジン又はストレプトアビジンである、実施形態92~97のいずれか1つに記載の方法である。
実施形態99は、1回以上の追加の変性、ハイブリダイズ、及び伸長する工程が行われる、実施形態92~98のいずれか1つに記載の方法である。
実施形態100は、第1の一本鎖断片がインサートを含み、第2の一本鎖断片が、第1の断片に含まれるインサートの相補体であるインサートを含む、実施形態92~99のいずれか1つに記載の方法である。
実施形態101は、第1の一本鎖断片がインサートを含み、第2の断片が、第1の断片に含まれるインサートの相補体ではないインサートを含む、実施形態92~100のいずれか1つに記載の方法である。
実施形態102は、ハイブリダイズすることが、(1)各断片の一方の末端にライゲーションされた第1のフォーク型アダプター及び各断片の他方の末端にライゲーションされた第2のフォーク型アダプター、又は(2)各断片の一方の末端の第1のトランスポソーム複合体の第2のトランスポゾン由来のタグ及び各断片の他方の末端の第2のトランスポソームの第2のトランスポゾン由来のタグ、を含む、二本鎖断片から調製された一本鎖断片間で起こる、実施形態92~101のいずれか1つに記載の方法である。
実施形態103は、2つの固定された一本鎖断片が、第1の断片中のハイブリダイゼーション配列の、第2の断片中のハイブリダイゼーション配列の相補体への結合がない状態で、互いにハイブリダイズして架橋を形成しない、実施形態92~102のいずれか1つに記載の方法である。
実施形態104は、2つの固定された一本鎖断片を互いにハイブリダイズして架橋を形成することが、(1)各断片の両端にライゲーションされた同じフォーク型アダプター、又は(2)各断片の両端にある同じトランスポソーム複合体由来のタグを含む、二本鎖断片から調製された一本鎖断片間で起こらない、実施形態103に記載の方法である。
実施形態105は、1つ以上の連結された核酸配列決定鋳型を生成する方法であって、(a)標的二本鎖核酸を含む試料を、複数の異なる区画内に区画化することと、(b)複数の異なる区画内の二本鎖核酸由来のインサートをそれぞれ含む、断片を調製することと、(c)複数の異なる区画を、実施形態91に記載の2つのフォーク型アダプターを含む組成物又はキットと接触させることであって、一方又は両方のフォーク型アダプターは、ブロッキングオリゴヌクレオチドを含む、ことと、(d)フォーク型アダプターを二本鎖断片にライゲーションして、複数の異なる区画内のタグ付けされた二本鎖断片を調製することと、(e)(1)一本鎖断片を生成するために固定されたタグ付けされた二本鎖断片を、及び、(2)複数の異なる区画内のハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するためにブロッキングオリゴヌクレオチドを、変性させることと、(f)同じ区画内の2つの一本鎖断片を互いにハイブリダイズさせて、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、(g)各一本鎖断片の3’末端から伸長させて、同じ区画内の両方の一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法である。
実施形態106は、標的二本鎖核酸が、二本鎖DNA断片を含み、断片を調製することが、二本鎖DNA断片の小断片を調製する、実施形態105に記載の方法である。
実施形態107は、区画が、ウェル、チューブ、又は液滴である、実施形態63、105、又は107に記載の方法である。
実施形態108は、変性させることが、温度の上昇、pHの変化、及び/又は1つ以上のカオトロピック剤の添加によって行われる、実施形態105~107のいずれか1つに記載の方法である。
実施形態109は、温度の上昇が、45℃~55℃から85℃~95℃への上昇であり、任意選択的に、温度の上昇が、50℃から90℃への上昇である、実施形態108に記載の方法である。
実施形態110は、1つ以上のカオトロピック剤が、ホルムアミド及び/又はNaOHを含む、実施形態108又は109に記載の方法である。
実施形態111は、1回以上の追加の変性、ハイブリダイズ、及び伸長する工程が行われる、実施形態105~110のいずれか1つに記載の方法である。
実施形態112は、第1の一本鎖断片がインサートを含み、第2の一本鎖断片が、第1の断片に含まれるインサートの相補体であるインサートを含む、実施形態105~111のいずれか1つに記載の方法である。
実施形態113は、第1の一本鎖断片がインサートを含み、第2の断片が、第1の断片に含まれるインサートの相補体ではないインサートを含む、実施形態105~111のいずれか1つに記載の方法である。
実施形態114は、ハイブリダイズすることが、各断片の一方の末端にライゲーションされた第1のフォーク型アダプターと、各断片の他方の末端にライゲーションされた第2のフォーク型アダプターと、を含む、二本鎖断片から調製された一本鎖断片間で起こる、実施形態105~113のいずれか1つに記載の方法である。
実施形態115は、一本鎖断片が、第1の断片中のハイブリダイゼーション配列の、第2の断片中のハイブリダイゼーション配列の相補体への結合がない状態で、互いにハイブリダイズしない、実施形態105~114のいずれか1つに記載の方法である。
実施形態116は、2つの一本鎖断片を互いにハイブリダイズすることが、各断片の両端にライゲーションされた同じフォーク型アダプターを含む、二本鎖断片から調製された一本鎖断片間で起こらない、実施形態115に記載の方法である。
実施形態117は、区画化することが、ほとんどの区画が1つの標的二本鎖核酸を含むか又は標的二本鎖核酸を含まないように試料を希釈することを含む、実施形態63又は105~116のいずれか1つに記載の方法である。
実施形態118は、同じ連結された配列決定鋳型に含まれるインサートが、同じ標的核酸から調製されている、実施形態117に記載の方法である。
実施形態119は、区画化することが、最も相違するハプロタイプを異なる区画内に分離し、方法が、ハプロタイプフェージングのために使用される、実施形態63又は105~118のいずれか1つに記載の方法である。
実施形態120は、ハプロタイプフェージングがバーコードを必要としない、実施形態119に記載の方法である。
実施形態121は固定されているトランスポソーム複合体の2つのプールを含む固体支持体であって、(a)トランスポソーム複合体の第1のプールは、(i)トランスポザーゼと、(ii)3’トランスポゾン末端配列と、第1のリード配列決定アダプター配列と、5’親和性部分と、を含む、第1のトランスポゾンと、(iii)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列と、ハイブリダイゼーション配列の3’相補体と、を含む、第2のトランスポゾンと、を含み、(b)トランスポソーム複合体の第2のプールは、(i)トランスポザーゼと、(ii)3’トランスポゾン末端配列と、第2のリード配列決定アダプター配列と、5’親和性部分と、を含む、第1のトランスポゾンと、(iii)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列と、3’ハイブリダイゼーション配列と、を含む、第2のトランスポゾンと、を含み、各第1のトランスポゾンは、固体支持体の表面上の結合部分への5’親和性部分の結合によって固定されている、固体支持体である。
実施形態122は、トランスポソーム複合体の第1又は第2のプールが、実施形態30~42のいずれか1つに記載のトランスポソーム複合体を含み、第1のリード配列決定アダプター配列が、第1のリードプライマー結合配列を含む、実施形態121に記載の固体支持体である。
実施形態123は、トランスポソーム複合体の第1及び/又は第2のプールが、ホモダイマー及び/又はヘテロダイマーを含む、実施形態121又は122に記載の固体支持体である。
実施形態124は、固体支持体が、ビーズ、スライド、容器の壁、フローセル、又はフローセルに含まれるナノウェルである、実施形態122又は123に記載の固体支持体である。
実施形態125は、1つ以上のトランスポゾンがインデックス配列及び/又はUMIを含む、実施形態121~124のいずれか1つに記載の固体支持体である。
実施形態126は、トランスポソーム複合体の第1のプールに含まれる第1のトランスポゾン及び/又はトランスポソーム複合体の第2のプールに含まれる第1のトランスポゾンが、試料インデックスを含む、実施形態125に記載の固体支持体である。
実施形態127は、トランスポソーム複合体の第1のプールに含まれる第1のトランスポゾン及びトランスポソーム複合体の第2のプールに含まれる第1のトランスポゾンの両方が、試料インデックスを含む、実施形態126に記載の固体支持体である。
実施形態128は、トランスポソーム複合体の第1のプールに含まれる第2のトランスポゾン及び/又はトランスポソーム複合体の第2のプールに含まれる第2のトランスポゾンが、試料インデックス及び/又は固有分子識別子(UMI)を含む、実施形態121~127のいずれか1つに記載の固体支持体である。
実施形態129は、トランスポソーム複合体の第1のプールに含まれる第2のトランスポゾン及びトランスポソーム複合体の第2のプールに含まれる第2のトランスポゾンの両方が、試料インデックスを含む、実施形態128に記載の固体支持体である。
実施形態130は、トランスポソーム複合体の第1のプールに含まれる第2のトランスポゾン及びトランスポソーム複合体の第2のプールに含まれる第2のトランスポゾンの両方が、UMIを含む、実施形態128又は実施形態129に記載の固体支持体である。
実施形態131は、1つ以上の二本鎖の連結された核酸配列決定鋳型を生成する方法であって、(a)固体支持体に固定されている二本鎖核酸を含む試料を適用することと、(b)二本鎖核酸をタグメンテーションして、二本鎖核酸由来のインサートを含むタグ付けされた二本鎖断片を生成することであって、二本鎖断片は、固体支持体の表面上の結合部分への5’親和性部分の結合によって固体支持体に固定されている、ことと、(c)トランスポソーム複合体を二本鎖断片から遊離させることと、(d)二本鎖断片を伸長し、ライゲーションすることと、(e)二本鎖断片を一本鎖断片に変性させることであって、5’親和性部分を含む一本鎖断片は、固体支持体上に固定されたままである、ことと、(f)第1の固定された一本鎖断片に含まれるハイブリダイゼーション配列を、第2の固定された一本鎖断片に含まれるハイブリダイゼーション配列の相補体にハイブリダイズさせ、それによって架橋を形成することと、(g)二本鎖の連結された核酸配列決定鋳型を伸長し、生成することと、を含む、方法である。
実施形態132は、トランスポソーム複合体を二本鎖断片から遊離させることが、SDSを用いて実施される、実施形態131に記載の方法である。
実施形態133は、ハイブリダイズさせることが、固体支持体を冷却すること、及び/又はハイブリダイゼーション緩衝液を適用することを含む、実施形態131又は132に記載の方法である。
実施形態134は、冷却することが、固体支持体の温度を60℃以下に低下させることを含む、実施形態133に記載の方法である。
実施形態135は、ハイブリダイゼーション緩衝液が高塩濃度を含み、任意選択的に、高塩濃度は750mM NaClである、実施形態133又は134に記載の方法である。
実施形態136は、変性させることが、固体支持体を加熱すること、又は化学変性剤を適用することを含む、実施形態131~135のいずれか1つに記載の方法である。
実施形態137は、変性させることが、固体支持体の温度を90℃以上に上昇させることを含む、実施形態136に記載の方法である。
実施形態138は、伸長させることが、ポリメラーゼ、dNTP、及び伸長緩衝液を提供することを含む、実施形態131~137のいずれか1つに記載の方法である。
実施形態139は、追加の、ハイブリダイズさせ、二本鎖の連結された核酸配列決定鋳型を伸長し、生成する工程を更に含む、実施形態131~138のいずれか1つに記載の方法である。
実施形態140は、第1の固定された一本鎖断片に含まれるハイブリダイゼーション配列の、第2の固定された一本鎖断片に含まれるハイブリダイゼーション配列の相補体へのハイブリダイゼーションは、第1及び第2の断片が、第1又は第2の断片の長い方の長さよりも近い固体支持体の表面上で互いに近接している場合にのみ起こる、実施形態131~139に記載の方法である。
実施形態141は、第1の固定された断片及び第2の固定された断片が、固体支持体上に近接して固定されており、近接していることにより、第1の固定された断片に含まれるハイブリダイゼーション配列に含まれる4個以上、5個以上、6個以上、7個以上、8個以上、9個以上、又は10個以上のヌクレオチドが、第2の固定された断片に含まれるハイブリダイゼーション配列の相補体に含まれるヌクレオチドに結合することが可能になる、実施形態131~140に記載の方法である。
実施形態142は、第1の固定された断片及び第2の固定された断片が、固体支持体の表面上で互いに20~500ナノメートル以内に固定されている、実施形態131~141のいずれか1つに記載の方法である。
実施形態143は、試料が複数の二本鎖核酸を含む、実施形態93~121又は131~142のいずれか1つに記載の方法である。
実施形態144は、第1及び第2の固定された断片の両方が、同じ二本鎖核酸から調製され、二本鎖の連結された核酸配列決定鋳型が、同じ二本鎖核酸由来の2つのインサートを含む、実施形態143に記載の方法である。
実施形態145は、2つのインサートが、同じ二本鎖核酸に含まれる2つの隣接配列に由来する、実施形態144に記載の方法である。
実施形態146は、2つのインサートが、同じ二本鎖核酸に含まれる2つの近接配列に由来し、近接配列が、二本鎖核酸中の100以下のヌクレオチド、200以下のヌクレオチド、300以下のヌクレオチド、400以下のヌクレオチド、500以下のヌクレオチド、700以下のヌクレオチド、又は1,000以下のヌクレオチドによって隔てられている、実施形態144に記載の方法である。
実施形態147は、固体支持体の領域が、同じ二本鎖核酸に含まれる近接配列由来の共通のインサート配列を共有する複数の二本鎖の連結された核酸配列決定鋳型を含む、実施形態146の方法である。
実施形態148は、実施形態131~147のいずれか1つに記載の方法によって調製された二本鎖の連結された核酸配列決定鋳型であって、鋳型の構造が、(a)5’-P5-i5-A14-ME-インサート1-ME’-HYB-ME-インサート2-ME’-B15’-i7’-P7’-3’、(b)5’-P5-A14-ME-インサート1-ME’-i6-HYB-i8’-ME-インサート2-ME’-B15’-P7’-3’、若しくは(c)5’-P5-i5-A14-ME-インサート1-ME’-i6-HYB-i8’-ME-インサート2-ME’-B15’-i7’-P7’-3’、又はそれらの相補体を含む、二本鎖の連結された核酸配列決定鋳型である。
実施形態149は、(a)固体支持体から二本鎖の連結された核酸配列決定鋳型を遊離させることと、(b)鋳型を配列決定して、鋳型に含まれるインサート配列を決定することと、を更に含む、実施形態131~148のいずれか1つに記載の方法である。
実施形態150は、遊離させることが、酵素消化又は化学的開裂を含む、実施形態149に記載の方法である。
実施形態151は、遊離後かつ配列決定前に、鋳型を増幅することを更に含む、実施形態149又は150に記載の方法である。
実施形態152は、1つ以上の連結された核酸配列決定鋳型を生成する方法であって、(a)標的二本鎖核酸を含む試料を、複数の異なる区画内に区画化することと、(b)二本鎖核酸をタグメンテーションして、複数の異なる区画内の二本鎖核酸由来のインサートを含むタグ付けされた二本鎖断片を生成することであって、タグメンテーションは、トランスポソーム複合体の2つのプールを用いて実施され、トランスポソーム複合体の第1のプールは、(i)トランスポザーゼと、(ii)3’トランスポゾン末端配列及び第1のリード配列決定アダプター配列を含む第1のトランスポゾンと、(iii)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含み、トランスポソーム複合体の第2のプールは、(i)トランスポザーゼと、(ii)3’トランスポゾン末端配列及び第2のリード配列決定アダプター配列を含む第1のトランスポゾンと、(iii)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含む、ことと、(b)タグ付けされた二本鎖断片を変性させて、一本鎖断片を生成することと、(c)第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって、同じ区画内の2つの一本鎖断片を互いにハイブリダイズさせることと、(d)各一本鎖断片の3’末端から伸長させて、両方の一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法である。
実施形態153は、二本鎖の連結された核酸配列決定鋳型が、同じ区画に存在する2つの一本鎖断片のハイブリダイゼーションからのみ生成される、実施形態152に記載の方法である。
実施形態154は、ハイブリダイゼーション配列及び/又はその相補体が、ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合しており、変性させることが、ブロッキングオリゴヌクレオチドを変性させてハイブリダイゼーション配列及び/又はその相補体をブロック解除することを含む、実施形態152又は153に記載の方法である。
実施形態155は、トランスポソーム複合体が溶液中に存在する、実施形態152~154のいずれか1つに記載の方法である。
実施形態156は、区画が、ウェル、チューブ、又は液滴である、実施形態152~155のいずれか1つに記載の方法である。
実施形態157は、変性させることが、温度の上昇、pHの変化、及び/又は1つ以上のカオトロピック剤の添加によって行われる、実施形態152~156のいずれか1つに記載の方法である。
実施形態158は、温度の上昇が、45℃~55℃から85℃~95℃への上昇であり、任意選択的に、温度の上昇が、50℃から90℃への上昇である、実施形態157に記載の方法である。
実施形態159は、1つ以上のカオトロピック剤が、ホルムアミド及び/又はNaOHを含む、実施形態157又は158に記載の方法である。
実施形態160は、1回以上の追加の変性、ハイブリダイズ、及び伸長する工程が行われる、実施形態152~159のいずれか1つに記載の方法である。
実施形態161は、第1の一本鎖断片がインサートを含み、第2の断片が、第1の断片に含まれるインサートの相補体ではないインサートを含む、実施形態152~160のいずれか1つに記載の方法である。
実施形態162は、区画化することが、ほとんどの区画が1つの標的二本鎖核酸を含むか又は標的二本鎖核酸を含まないように試料を希釈することを含む、実施形態105~161のいずれか1つに記載の方法である。
実施形態163は、同じ連結された配列決定鋳型に含まれるインサートが、同じ標的核酸から調製されている、実施形態162に記載の方法である。
実施形態164は、区画化することが、最も相違するハプロタイプを異なる区画内に分離し、方法が、ハプロタイプフェージングのために使用される、実施形態63又は152~163のいずれか1つに記載の方法である。
実施形態165は、ハプロタイプフェージングがバーコードを必要としない、実施形態164に記載の方法である。
実施形態166は、鋳型を増幅することを更に含む、実施形態93~121又は131~165のいずれか1つに記載の方法である。
実施形態167は、鋳型を配列決定することを更に含む、実施形態49~55、57~59、93~121、又は131~166のいずれか1つに記載の方法である。
実施形態168は、配列決定が、A14、B15、及び/又はハイブリダイゼーション配列(HYB)に結合する配列決定プライマーを使用して行われる、実施形態167に記載の方法である。
実施形態169は、配列決定が暗サイクルを含み、データが配列決定の一部について記録されていない、実施形態167又は168に記載の方法である。
実施形態170は、記録されていないデータが、3’トランスポゾン末端配列又はその相補体に関連する配列データである、実施形態169に記載の方法である。
実施形態171は、(a)同じ鋳型に含まれるインサートの配列を評価することと、(b)同じ鋳型に含まれるインサートに基づいて、二本鎖核酸に含まれる配列についての近接データを決定することと、を更に含む、実施形態167~170のいずれか1つに記載の方法である。
実施形態172は、近接データが、インサート配列(又はその相補体)が同じ標的核酸に含まれていたことを決定する、実施形態171に記載の方法である。
実施形態173は、(a)異なる鋳型から調製された所与のインサートの複数の配列由来の配列決定結果を評価することと、(b)(i)同じ連結された配列決定鋳型に含まれるインサート及びその相補体、並びに/又は、(ii)複数の連結された配列決定鋳型に含まれるインサート、由来の配列決定データに基づいて、非標準塩基対形成の事象を決定すること、を更に含む、実施形態167~172のいずれか1つに記載の方法である。
実施形態174は、異なる鋳型から調製された所与のインサートの複数の配列由来の配列決定結果を評価することと、(i)同じ連結された配列決定鋳型に含まれるインサート及びその相補体、並びに/又は、(ii)複数の連結された配列決定鋳型に含まれるインサート、由来の配列決定データに基づいて、このインサートに関する配列決定結果におけるエラーを修正することと、を更に含む、実施形態167~173のいずれか1つに記載の方法である。
実施形態175は、連結された配列決定鋳型に含まれるインサート配列に含まれる修飾シトシンを同定する方法であって、(a)二本鎖の連結された配列決定鋳型を調製することであって、各鎖はインサート配列及びインサート配列のコピーを含み、2つの鎖は互いに相補的である、ことと、(b)二本鎖の連結された配列決定鋳型を、修飾及び/又は非修飾シトシンを改変する条件に供することと、(c)二本鎖の連結された配列決定鋳型の各鎖のアンプリコンを調製することと、(d)アンプリコンを配列決定し、各鎖から生成されたアンプリコン中のインサート配列及びインサート配列のコピーに関する配列決定結果を評価することと、(e)二本鎖の連結された配列決定鋳型の各鎖の配列に基づいて、インサート配列に含まれる修飾シトシンの位置を決定することと、を含む、方法である。
実施形態176は、修飾シトシンが、メチル化又はヒドロキシメチル化シトシンである、実施形態175に記載の方法である。
実施形態177は、連結された配列決定鋳型が、実施形態93~121又は131~165のいずれか1つに記載の方法によって調製される、実施形態175又は176の方法である。
実施形態178は、二本鎖の連結された配列決定鋳型を生成するための伸長が、メチル化dCTPを含む反応溶液を用いて行われる、実施形態177に記載の方法である。
実施形態179は、連結された配列決定鋳型に含まれるウラシルが、アンプリコンを調製するときにチミンに変換される、実施形態175~178のいずれか1つに記載の方法である。
実施形態180は、修飾シトシン又は非修飾シトシンが改変され、任意選択的に、修飾シトシンがTET支援ピリジンボラン配列決定(TAPS)処理によって改変されるか、又は非修飾シトシンが亜硫酸水素ナトリウム若しくは酵素処理によって改変される、実施形態175~179のいずれか1つに記載の方法である。
実施形態181は、修飾シトシンが改変され、修飾シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(T,C)の存在によって決定され、非修飾シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(C,C)の存在によって決定され、修飾シトシン及び非修飾シトシンが、相補鎖中のG’と対形成している、実施形態180に記載の方法である。
実施形態182は、非修飾シトシンが改変され、修飾シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(C,T)の存在によって決定され、非修飾シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(T,T)の存在によって決定され、修飾シトシン及び非修飾シトシンが、相補鎖中のG’と対形成している、実施形態180に記載の方法である。
実施形態183は、方法が、メチル化シトシンの位置をヒドロキシメチル化シトシンから区別する、実施形態180に記載の方法である。
実施形態184は、修飾及び/又は非修飾シトシンを改変するための条件に各鎖を供することが、(a)各鎖を、β-グリコシルトランスフェラーゼと反応させることと、(b)各鎖を、DNAメチルトランスフェラーゼ(DNMT)と反応させることと、(c)各鎖を、非修飾シトシンをウラシルに変換する条件で反応させることと、を含む、実施形態183に記載の方法である。
実施形態185は、(a)メチル化シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(C,C)の存在によって決定され、(b)ヒドロキシメチル化シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(C,T)の存在によって決定され、(c)非修飾シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(T,T)の存在によって決定され、メチル化、ヒドロキシメチル化、及び非修飾シトシンが、相補鎖中のG’と対形成している、実施形態184に記載の方法である。
実施形態186は、修飾シトシン及び/又は非修飾シトシンを改変するための条件に各鎖を供することが、(a)各鎖を、DNMTと反応させること、(b)各鎖を、メチル化シトシンをジヒドロキシウラシル(DHU)に変換する条件で反応させることと、を含む、実施形態183に記載の方法である。
実施形態187は、(a)メチル化シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(T,T)の存在によって決定され、(b)ヒドロキシメチル化シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(T,C)の存在によって決定され、(c)非修飾シトシンの位置が、それぞれインサート配列及びインサート配列のコピー中の(C,C)の存在によって決定され、メチル化、ヒドロキシメチル化、及び非修飾シトシンが、相補鎖中のG’と対形成している、実施形態186に記載の方法である。
追加の目的及び利点は、以下の説明において部分的に記載され、一部は説明から明白であるか、又は実践によって習得され得る。目的及び利点は、添付の特許請求の範囲において特に指摘される要素及び組み合わせによって実現及び達成されるであろう。
前述の一般的な説明及び以下の詳細な説明はいずれも例示的かつ説明的のみであり、特許請求の範囲を限定するものではないことを理解されたい。
本明細書に組み込まれ、本明細書の一部を構成する添付図面は、1つの(いくつかの)実施形態を図解し、明細書とともに本明細書に記載される原理を説明する役割を果たす。
配列の説明
表1は、本明細書中で参照される特定の配列のリストを提供する。
表1は、本明細書中で参照される特定の配列のリストを提供する。
インサート配列が1つ以上の標的核酸に由来する、複数のインサート配列を含むポリヌクレオチドが本明細書に記載される。これらのポリヌクレオチドは、連結配列及び複数のプライマー配列を含み得る。本出願はまた、これらのポリヌクレオチドを生成する方法及びこれらのポリヌクレオチドの使用についても記載する。所与のポリヌクレオチド内の複数のインサート配列の存在は、フローセル当たりに生成されるリードの数を増加させることによって、配列決定プラットフォームの出力を増加させることができる。
別途定義されない限り、本明細書で使用される全ての技術用語及び科学用語は、当該技術分野の当業者によって一般的に理解されるものと同じ意味を有する。本明細書で参照される全ての特許、出願、公開出願、及び他の刊行物は、別途記載のない限り、その全体が参照により組み込まれる。本明細書において用語のための複数の定義が存在する場合、別途記載のない限り、定義のセクション内のものが優先する。本明細書及び添付の特許請求の範囲で使用される場合、単数形「a」、「an」、及び「the」は、文脈がそうでない旨を明確に指示しない限り、複数の指示対象を含む。別途記載のない限り、質量分析法、NMR、HPLC、タンパク質化学、生化学、組み換えDNA技術及び薬理学の従来の方法が採用される。「又は」又は「及び」の使用は、別途記載のない限り、「及び/又は」を意味する。更に、用語「含む(including)」、並びに他の形態、例えば、「含む(include)」、「含む(includes)」、及び「含まれる(included)」などの他の形態の使用は、限定的ではない。本明細書で使用される場合、移行句中か又は請求項の本文中のいずれであっても、用語「含む(comprise)」及び「含む(comprising)」は、オープンエンドの意味を有するものとして解釈されるべきである。すなわち、これらの用語は、語句「少なくとも有する」又は「少なくとも含む」と同義であると解釈されるべきである。プロセスの文脈において使用される場合、用語「含む(comprising)」は、プロセスが少なくとも列挙された工程を含むが、追加の工程を含み得ることを意味する。化合物、構成物、又はデバイスの文脈で使用される場合、用語「含む(comprising)」は、化合物、構成物、又はデバイスが少なくとも列挙された特徴又は構成要素を含むが、追加の特徴又は構成要素も含み得ることを意味する。
本明細書で使用されるセクションの見出しは、構成目的のみのためであり、記載される主題を限定するものとして解釈されるべきではない。
I.定義
本明細書で使用される「ハイブリダイゼーション配列」又は「HYB」は、相補ハイブリダイゼーション配列にハイブリダイズできる配列を指す。1つのライブラリー産物中のHYBの別のライブラリー産物中のHYB’へのハイブリダイゼーションは、ハイブリダイゼーション付加物をもたらすことができ、このとき、2つのライブラリー産物は、HYB/HYB’のハイブリダイゼーションを介して互いにアニールする。
本明細書で使用される「ハイブリダイゼーション配列」又は「HYB」は、相補ハイブリダイゼーション配列にハイブリダイズできる配列を指す。1つのライブラリー産物中のHYBの別のライブラリー産物中のHYB’へのハイブリダイゼーションは、ハイブリダイゼーション付加物をもたらすことができ、このとき、2つのライブラリー産物は、HYB/HYB’のハイブリダイゼーションを介して互いにアニールする。
本明細書中で使用される場合、「連結された核酸配列決定鋳型」とは、ポリヌクレオチド及びその相補体の二本鎖組成物をいう。連結された核酸配列決定鋳型は、HYB/HYB’のハイブリダイゼーションによる2つのライブラリー産物の会合、続く二本鎖鋳型を生成するための伸長によって生成され得る。
本明細書で使用される「インサート配列」は、ポリヌクレオチドに含まれる標的核酸の領域を指す。ポリヌクレオチドは、複数のインサート配列を含み得る。
本明細書で使用される「スタックされたリード」又は「タンデムリード」は、単一のポリヌクレオチドから生成される複数のインサート配列の配列決定リードに関する。これらの配列決定リードは連続的であり得る。例えば、2つ以上のインサート配列及び2つ以上のプライマー配列を含むポリヌクレオチドを使用して、タンデムリードを生成することができる。本明細書で使用される「タンデムリードライブラリー」は、タンデムリードを生成するために使用され得る複数のインサート配列を含むポリヌクレオチドのライブラリーを指す。
本明細書で使用される「SBS」は、リードプライマーの結合を改善するためにポリヌクレオチドに組み込まれる配列を指す。ポリヌクレオチドがタグメンテーションによって産生されるライブラリー産物から作製される実施形態では、SBSはモザイク末端配列であってもよく、SBS’はME及びME’などのモザイク末端配列の相補体であってもよい。ライブラリー産物がTruseq法(Illumina)を使用して産生される場合、SBS及びSBS’配列もアダプターに含まれ得る。
II.複数のインサート配列を含むポリヌクレオチド
各インサートが1つ以上の標的核酸の一部を含む、複数のインサート配列を含むポリヌクレオチドが本明細書に記載される。複数のインサート配列を含む単一のポリヌクレオチドは、フローセルの同じ領域における1つ以上の標的核酸の複数の領域の配列決定を可能にする。このようにして、より大きなフローセルを必要とせずに、1つ以上の標的核酸のより多くの領域を配列決定することができる。
各インサートが1つ以上の標的核酸の一部を含む、複数のインサート配列を含むポリヌクレオチドが本明細書に記載される。複数のインサート配列を含む単一のポリヌクレオチドは、フローセルの同じ領域における1つ以上の標的核酸の複数の領域の配列決定を可能にする。このようにして、より大きなフローセルを必要とせずに、1つ以上の標的核酸のより多くの領域を配列決定することができる。
いくつかの実施形態では、ポリヌクレオチドは、一方のライブラリー産物中のHYBを他方のライブラリー産物中のHYB’配列にハイブリダイズさせてハイブリダイズした付加物を形成し、続いて伸長させて連結された核酸配列決定鋳型を生成することに基づいて、2つの別々のライブラリー産物から生成される。
これらのポリヌクレオチドはまた、追加の配列、例えば、1つ以上のプライマー配列、連結配列、付着ポリヌクレオチドも含み得る。
いくつかの実施形態では、ポリヌクレオチドは、第1のリードプライマー結合配列を含む3’末端ポリヌクレオチドと、標的核酸に由来する3’末端ポリヌクレオチドの5’側の第1のインサート配列と、第1のリードプライマー結合配列に直交する第2のリードプライマー結合配列を含む連結配列であって、第2のリードプライマー結合配列がハイブリダイゼーション配列を含む、連結配列と、連結配列の5’側にあり、標的核酸の非隣接配列に由来するか、又は第1のインサート配列とは異なる標的核酸に由来する、第2のインサート配列と、ポリヌクレオチドの5’末端にあり、付着配列を含む、付着ポリヌクレオチドと、を含み、3’末端ポリヌクレオチド、連結配列、及び付着ポリヌクレオチドは、標的核酸に由来しない。
図1は、4つのプライマー配列を有する例示的なポリヌクレオチドの配列決定により、2つの別個のインサート配列の配列決定を可能にする方法を示す、これらのポリヌクレオチドの概要を提示する。
図2は、連結配列が、ハイブリダイゼーション配列(HYB)を含む第2のリードプライマー結合配列(リード2)と、P5’配列を含む3’ポリヌクレオチドに結合する第1のリードプライマー結合配列(リード1)と、P7配列を含む付着配列と、を含む、例示的なポリヌクレオチドの構造を示す。図3に示されるように、ポリヌクレオチド中の異なるインサートは、異なるライブラリーから生成され得る。
複数のインサート配列を有するポリヌクレオチドは、図4Bに対して図4Aに示されるように、標準的なIlluminaペアエンドライブラリーと比較して、より多くの量の配列がフローセルから生成されることを可能にし得る。図4A及び4Bでは、両方の場合において同じ量のフローセル表面を使用したため、単一のインサートを含むポリヌクレオチドと比較して、2つのインサート配列を含むポリヌクレオチドを使用したフローセル表面の同じ面積について、2倍の配列が生成された。
配列決定鋳型として使用され得るポリヌクレオチドもまた、本明細書中に記載される。これらの配列決定鋳型は、当該技術分野で既知である任意の標準的な配列決定法とともに使用され得る。
いくつかの実施形態では、ポリヌクレオチドは、2つ以上のインサート配列を含む。本明細書で使用される「インサート配列」又は「インサート」は、ポリヌクレオチドに含まれる、二本鎖核酸などの標的核酸の領域を指す。ポリヌクレオチドは、複数のインサート配列を含み得る。いくつかの実施形態では、ポリヌクレオチドは、2つのインサート配列を含む。いくつかの実施形態では、ポリヌクレオチドは、3つ、4つ、又は5つのインサート配列を含む。配列決定鋳型として使用できる2つ以上のインサートを含むポリヌクレオチドは、本明細書において「連結された核酸配列決定鋳型」又は「連結された配列決定鋳型」と称され得る。
いくつかの実施形態では、ポリヌクレオチドは、ハイブリダイゼーション配列又はハイブリダイゼーション配列の相補体を含む。本明細書で使用される「ハイブリダイゼーション配列」又は「HYB」は、相補ハイブリダイゼーション配列にハイブリダイズできる配列を指す。例えば、1つの断片(例えば、ライブラリー産物)中のHYBの別の断片中のHYB’(ハイブリダイゼーション配列の相補体)へのハイブリダイゼーションにより、2つの断片が、HYB/HYB’のハイブリダイゼーションを介して互いにアニールしている、ハイブリダイゼーション付加物又は架橋がもたらされ得る。いくつかの実施形態では、HYBは、HYBがHYB’にハイブリダイズする場合に2つの一本鎖断片を一緒に付着させるのに十分なヌクレオチドを含む。いくつかの実施形態では、連結された配列決定鋳型に含まれるHYB配列は、図47に示されるように、プライマー結合部位として使用され得る。
いくつかの実施形態では、HYB又はHYB’は、10~30のヌクレオチドを含む。いくつかの実施形態では、第1の一本鎖核酸断片中のHYBの第2の一本鎖核酸断片中のHYB’への結合は、2つの断片を「架橋」するのに十分である(図28A及び39に示される例を用いて本明細書中の方法に記載される)。HYB又はHYB’に含まれるヌクレオチドは、天然又は人工又は修飾ヌクレオチドであってもよい。いくつかの実施形態では、人工又は修飾ヌクレオチドを含むHYB又はHYB’は、2つの一本鎖断片間の架橋を可能にするために、これらの配列においてより少ないヌクレオチドを必要とし得る。
いくつかの実施形態では、HYB又はHYB’中の1つ以上のヌクレオチドは、ロック核酸又は架橋核酸である。本明細書で使用される場合、「ロック核酸」又は「LNA」は、リボース部分が2’酸素と4’炭素とを接続する余分な架橋で修飾されている修飾RNAヌクレオチドを指す。いくつかの実施形態では、LNAは、HYB又はHYB’配列において高められた構造安定性を付与し、したがって、HYB/HYB’相互作用のハイブリダイゼーション融解温度(Tm)を上昇させる。例えば、1つ以上のLNAを含むHYB又はHYB’配列は、比較的短い配列(例えば、10~20ヌクレオチド)のみを含む場合があるが、それでもなお、HYBを含む第1の一本鎖断片とHYB’を含む第2の一本鎖断片との間の架橋の形成を可能にするのに十分に強い結合を付与し得る。
いくつかの実施形態では、ポリヌクレオチドは、2つ以上のインサートを含む。本明細書に記載されるように、これらのインサートは、標的核酸由来の同じ配列のコピーであってもよく、又は標的核酸由来の別個の配列であってもよい。本明細書で使用される場合、「キメラ鋳型」は、異なるインサートを含む鋳型を指す。
図29及び図40のものなど、2つのインサートを含む多種多様な異なるポリヌクレオチドが本明細書に記載される。2つ以上のインサート及びハイブリダイゼーション配列(又はその相補体)に加えて、本発明のポリヌクレオチドはまた、種々の他の型のインサートを含み得る。
例えば、ポリヌクレオチドは、1つ以上の配列決定プライマー配列を含み得る。このような配列決定プライマー配列は、ポリヌクレオチドが配列決定鋳型として使用される場合、配列決定を開始するためのプライマー結合のために使用され得る。いくつかの実施形態では、ポリヌクレオチドは、第1のリード配列決定プライマー配列及び/又は第2のリード配列決定プライマー配列を含む。本明細書で使用される場合、「第1のリード配列決定プライマー配列」及び「第2のリード配列決定プライマー配列」は、異なる配列決定リードにおいて使用され得るプライマーに結合できる配列を指す。これらの用語は、任意の特定の配列に限定されず、例えば、第1のリード配列決定プライマー配列は、所与の実験において第2の配列決定リードを開始するために使用されてもよく、第2のリード配列決定プライマーは、所与の実験において第1の配列決定リードを開始するために使用されてもよい。このようなプライマー配列は、ユーザーが利用を計画する配列決定プラットフォームに基づいて変化し得、このようなプライマー配列は、A14(配列番号4)及びB15配列(配列番号5)のように、当該技術分野で周知である。
いくつかの実施形態では、第1のリード配列決定プライマー配列及び第2のリード配列決定プライマー配列は異なる。いくつかの実施形態では、第1のリード配列決定プライマー配列及び第2のリード配列決定プライマー配列はそれぞれ、A14配列若しくはB15配列、又はそれらの相補体を含む。いくつかの実施形態では、3’末端ポリヌクレオチドはP5プライマー配列の相補体(P5’)を含み、5’末端ポリヌクレオチドはP7プライマー配列(P7、配列番号48)を含む、又は、3’末端ポリヌクレオチドはP7プライマー配列の相補体(P7’)を含み、5’末端ポリヌクレオチドはP5プライマー配列(P5、配列番号7)を含む。
いくつかの実施形態では、3’末端ポリヌクレオチド及び/又は5’末端ポリヌクレオチドは、それぞれ独立して、アダプター、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む。言い換えれば、ポリヌクレオチドは、配列決定など、ユーザーが実施したい方法において有用な追加の配列を含んでもよい。
本明細書中に記載される方法を使用して、ポリヌクレオチド中の一方のインサートは、標的核酸のセンス鎖の一部を含む断片から調製され得、他方のインサートは、標的核酸のアンチセンス鎖の一部を含む断片からの伸長によって調製される。本明細書中に記載される方法を使用して、一方のインサートは、標的核酸のアンチセンス鎖の一部を含む断片から調製され得、他方のインサートは、標的核酸の鎖の一部を含む断片からの伸長によって調製される。
いくつかの実施形態では、ポリヌクレオチドは、互いのコピーである2つのインサート配列を含む。いくつかの実施形態では、ポリヌクレオチドは、(a)第1のリード配列決定プライマー配列と、(b)標的核酸に由来するインサート配列であって、5’末端ポリヌクレオチドの3’側にある、インサート配列と、(c)インサート配列の3’側にあるハイブリダイゼーション配列と、(d)ハイブリダイゼーション配列の3’側にあるインサート配列のコピーと、(e)第2のリード配列決定プライマー配列の相補体を含む3’末端ポリヌクレオチドと、を含む、5’末端ポリヌクレオチドを含む。いくつかの実施形態では、このポリヌクレオチドは、配列決定鋳型であり得る。インサートの2つのコピー(すなわち、インサート配列及びインサート配列のコピー)は同一であると予想され得るが、配列決定結果は、それらが同一でないことを示し得る。例えば、インサートの2つのコピーは、標的核酸中のミスマッチ変異に基づいて、又はPCR増幅中のエラーの導入に基づいて異なり得る。
いくつかの実施形態では、ポリヌクレオチドは、互いのコピーではない2つのインサート配列を含む。いくつかの実施形態では、2つのインサート配列は異なっていてもよい。いくつかの実施形態では、ポリヌクレオチドに含まれる2つのインサート配列は、標的核酸の異なる領域から調製された。いくつかの実施形態では、ポリヌクレオチドは、(a)第1のリード配列決定プライマー配列を含む5’末端ポリヌクレオチドと、(b)標的核酸に由来するインサート配列であって、5’末端ポリヌクレオチドの3’側にある、第1のインサート配列と、(c)インサート配列の3’側にあるハイブリダイゼーション配列と、(d)ハイブリダイゼーション配列の3’側にある第2のインサート配列と、(e)第2のリード配列決定プライマー配列の相補体を含む3’末端ポリヌクレオチドと、を含む。固定されたトランスポソームを用いる方法に関して本明細書に記載されるように、2つの異なるインサート配列を有するそのような鋳型を使用して、連続性データを決定することができる。
ポリヌクレオチドに含まれる2つのインサートは、同じであっても異なったサイズであってもよい。いくつかの実施形態では、コピーであるインサートは、同じ数のヌクレオチドを含む。いくつかの実施形態では、インサート配列は40~400ヌクレオチドを含み、任意選択的に、インサート配列は1000以下のヌクレオチドを含む。いくつかの実施形態では、500超のヌクレオチドを含むものなどの、より大きなインサートに対して、ペア配列決定リードプロトコールを実施することができる。
いくつかの実施形態では、ポリヌクレオチドは、固体支持体上に固定されている。いくつかの実施形態では、ポリヌクレオチドは、5’末端ポリヌクレオチドを介して固体支持体上に固定されている(図29に示される実施形態など)。いくつかの実施形態では、ポリヌクレオチドは、5’末端ポリヌクレオチド上の親和性部分の固体支持体の表面上の結合部分への結合を介して固体支持体に固定されている。いくつかの実施形態では、親和性部分は、リンカーを介して5’末端ポリヌクレオチドに付着されている。いくつかの実施形態では、親和性部分は、ビオチン、デスチオビオチン、又はデュアルビオチンである。
いくつかの実施形態では、ポリヌクレオチドは、
5’-P5-A14-インサート-HYB-インサート-B15’-P7’-3’、又は
5’-P5-A14-インサート-HYB-インサート-B15’-P7’-3’、又は
5’-P7-B15-インサート-HYB’-インサート-A14’-P5’-3’の構造を有し、HYBはハイブリダイゼーション配列であり、HYB’はハイブリダイゼーション配列の相補体である。いくつかの実施形態では、2つのインサート配列は、同一である同じ配列のコピー、又は95%超の配列相同性を有する2つの配列である。非標準塩基対形成又は配列決定中に導入されるランダムエラーなど、インサート配列の2つのコピーにおける差異の潜在的な理由は、本明細書に記載されている。図40は、2つの相補的な連結された配列決定鋳型を含む代表的な二本鎖ポリヌクレオチドを示す。一方の鋳型は2つのAインサートを含み、相補鎖は2つのA’インサートを含む。
いくつかの実施形態では、ポリヌクレオチドは、
5’-P5-A14-インサート1-HYB-インサート2-B15’-P7’-3’、又は
5’-P5-A14-インサート1-HYB-インサート2-B15’-P7’-3’、又は
5’-P7-B15-インサート1-HYB’-インサート2-A14’-P5’-3’の構造を有し、HYBはハイブリダイゼーション配列であり、HYB’はハイブリダイゼーション配列の相補体である。いくつかの実施形態では、インサート1及びインサート2は、配列相同性がほとんど又は全くない異なる配列を含む。図45は、各々が2つの異なる配列を含む2つの相補的ポリヌクレオチドを生成するために使用され得る架橋の代表的な手段を示す。
いくつかの実施形態では、組成物は、その相補体にハイブリダイズしたポリヌクレオチドを含む。いくつかの実施形態では、その相補体にハイブリダイズしたポリヌクレオチドは、二本鎖の連結された配列決定鋳型と呼ばれ得る。いくつかの実施形態では、二本鎖の連結された配列決定鋳型は、その5’末端の両方によって固体支持体の表面に固定されている。
いくつかの実施形態では、ポリヌクレオチド又はポリヌクレオチド及びその相補体を含む組成物は、固体支持体の表面上に固定化され、このとき、親和性部分は、ビオチン、デスチオビオチン、又はデュアルビオチンであり、結合部分は、アビジン又はストレプトアビジンである。
広範な異なる固体支持体が固定化のために使用され得る。いくつかの実施形態では、固体支持体は、ビーズ、スライド、容器の壁、フローセル、又はフローセルに含まれるナノウェルである。
いくつかの実施形態では、親和性部分をポリヌクレオチドに付着させるためのリンカーは、開裂可能なリンカーである。いくつかの実施形態では、ユーザーは、この開裂可能なリンカーを開裂することによって、所望の時間に固体支持体からポリヌクレオチドを遊離することができる。
A.標的核酸
本明細書中で使用される標的核酸は、DNA、RNA又はそれらの類似体から構成され得る。標的核酸の供給源は、ゲノムDNA、メッセンジャRNA、又は天然供給源由来の他の核酸であり得る。いくつかの場合では、そのような供給源に由来する標的核酸を、本明細書の方法又は組成物において使用する前に増幅することができる。
本明細書中で使用される標的核酸は、DNA、RNA又はそれらの類似体から構成され得る。標的核酸の供給源は、ゲノムDNA、メッセンジャRNA、又は天然供給源由来の他の核酸であり得る。いくつかの場合では、そのような供給源に由来する標的核酸を、本明細書の方法又は組成物において使用する前に増幅することができる。
標的核酸が由来し得る例示的な生物学的試料としては、例えば、げっ歯類、マウス、ラット、ウサギ、モルモット、有蹄動物、ウマ、ヒツジ、ブタ、ヤギ、ウシ、ネコ、イヌ、霊長類、ヒト又は非ヒト霊長類などの哺乳動物;例えば、シロイヌナズナ、トウモロコシ、ソルガム、オート麦、小麦、米、キャノーラ、若しくは大豆などの植物;Chlamydomonas reinhardtiiなどの藻類;Caenorhabditis elegansなどの線形動物;Drosophila melanogaster、蚊、ショウジョウバエ、ミツバチ、若しくはクモなどの昆虫;ゼブラフィッシュなどの魚;爬虫類;カエル又はXenopus laevisなどの両生類;dictyostelium discoideum;Pneumocystis carinii、Takifugu rubripes、酵母、Saccharamoyces cerevisiae若しくはSchizosaccharomyces pombeなどの真菌;又はPlasmodium falciparum由来のものが挙げられる。標的核酸はまた、原核生物、Escherichia coli、staphylococci若しくはmycoplasma pneumoniaeなどの細菌;古細菌;C型肝炎ウイルス若しくはヒト免疫不全ウイルスなどのウイルス;又はビロイドに由来し得る。標的核酸は、上記の生物の均質な培養物若しくは生物の集団、又は代替的に、例えば、群衆若しくは生態系におけるいくつかの異なる生物のコレクションに由来し得る。核酸は、当該技術分野で既知の方法、例えば、Sambrook et al,Molecular Cloning:A Laboratory Manual,3rd edition,Cold Spring Harbor Laboratory,New York(2001)又はAusubel et al,Current Protocols in Molecular Biology,John Wiley and Sons,Baltimore,Md.(1998)(その各々は参照により本明細書に組み込まれる)に記載されるものを用いて単離することができる。
いくつかの実施形態では、標的核酸は、1つ以上のより大きな核酸の断片として得ることができる。断片化は、例えば、噴霧化、超音波処理、化学的開裂、酵素的開裂、又は物理的剪断を含む、当技術分野で公知の様々な技術のいずれかを用いて行うことができる。断片化はまた、より大きな核酸の一部のみをコピーすることによって、アンプリコンを生成する特定の増幅技術の使用から生じ得る。例えば、PCR増幅は、増幅に使用される隣接プライマー間の断片の長さによって規定されるサイズを有する断片を生成する。
標的核酸又はそのアンプリコンの集団は、本明細書に記載の方法又は組成物の特定の用途に望ましい又は適切な平均鎖長を有し得る。例えば、平均鎖長は、100,000ヌクレオチド、50,000ヌクレオチド、10,000ヌクレオチド、5,000ヌクレオチド、1,000ヌクレオチド、500ヌクレオチド、100ヌクレオチド、又は50ヌクレオチド未満であり得る。代替的に、又は追加的に、平均鎖長は、10ヌクレオチド、50ヌクレオチド、100ヌクレオチド、500ヌクレオチド、1,000ヌクレオチド、5,000ヌクレオチド、10,000ヌクレオチド、50,000ヌクレオチド、又は100,000ヌクレオチド超であり得る。標的核酸又はそのアンプリコンの集団の平均鎖長は、上記の最大値と最小値との間の範囲内であり得る。増幅部位で生成された(又は別の手段で本明細書で作製又は使用された)アンプリコンは、上記に例示されているものから選択される上限と下限との間の範囲の平均鎖長を有し得ることが理解されよう。
いくつかの実施形態では、標的核酸は、200ヌクレオチド未満、150ヌクレオチド未満、100ヌクレオチド未満、75ヌクレオチド未満、50ヌクレオチド未満、又は36ヌクレオチド未満などの比較的短い平均鎖長を有する。比較的短い平均鎖長を有する標的核酸の配列決定は、リード長によって制限されず、リード数の増加は、配列決定出力を顕著に増加させ得る。比較的短い平均鎖長を有する試料タイプの例は、無細胞DNA(cfDNA)及びエクソーム配列決定試料である。
いくつかの実施形態では、標的核酸は、母体血液試料由来の無細胞DNA(cfDNA)である。いくつかの実施形態では、cfDNAは、母体血漿試料から抽出される。いくつかの実施形態では、cfDNAは、非侵襲的出生前検査(NIPT)用である。
いくつかの実施形態では、標的核酸は、エクソームである。いくつかの実施形態では、エクソームは、標的化再配列決定によって調製される。いくつかの実施形態では、エクソームは、全ゲノム濃縮によって調製される。いくつかの実施形態では、エクソームは、ハイブリダイゼーションに基づく濃縮によって調製される。
いくつかの実施形態では、標的核酸は、DNA及びRNAである。RNA及びDNAの別々のライブラリーを調製して、ハイブリッドDNA/RNAポリヌクレオチドを作製することができる。いくつかの実施形態では、ポリヌクレオチドは、RNAを含む1つ以上のインサート及びDNAを含む1つ以上のインサートを含む。RNAインサート及びDNAインサートを含むそのようなポリヌクレオチドは、「ハイブリッドポリヌクレオチド」と呼ぶことができ、1回の配列決定実行から複数の読み出しを生成することを可能にする。いくつかの実施形態では、RNAインサート及びDNAインサートを含むポリヌクレオチドは、自己正規化を可能にする二重試料インデックスを有する。いくつかの実施形態では、出発ライブラリー中の最少量のDNA又はRNAが、生成されるハイブリッドポリヌクレオチドの量を決定する。
任意の種々の既知の増幅技術が、本明細書中に記載される方法における使用のために存在する鋳型配列の量を増加させるために使用され得る。例示的な技術としては、ポリメラーゼ鎖反応(PCR)、ローリングサークル増幅(RCA)、複数置換増幅(MDA)、又は鋳型配列を有する核酸分子のランダムプライマー増幅(RPA)が挙げられるが、これらに限定されない。本明細書に記載される方法又は組成物における使用前の標的核酸の増幅は任意であることが理解されるであろう。したがって、標的核酸は、本明細書に記載される方法及び組成物のいくつかの実施形態において使用前に増幅されない。標的核酸は、任意選択的に、合成ライブラリーに由来し得る。合成核酸は、天然のDNA若しくはRNA組成物を有することができ、又はその類似体であり得る。例えば、クラスター増幅、架橋増幅又はアレイベースの方法の文脈において以下に記載される他の方法を含む、固相増幅法もまた使用され得る。
いくつかの実施形態では、本明細書に開示されるポリヌクレオチドは、任意の好適な核酸配列決定プラットフォームを使用して、標的配列の核酸配列を決定することができる。いくつかの態様では、対象となる配列は、1つ以上の先天性又は遺伝性疾患、病原性、抗生物質耐性、若しくは遺伝子修飾と相関するか、又は関連している。配列決定は、短いタンデムリピート、一塩基多型、遺伝子、エキソン、コード領域、エクソーム、又はそれらの一部の核酸配列を決定するために使用することができる。したがって、本明細書に記載される方法及び組成物は、非限定的に、癌及び疾患診断、予後及び治療法、DNAフィンガープリンティング用途(例えば、DNAデータバンキング、犯罪ケースワーク)、メタゲノム研究及び発見、アグライゲノム用途、並びに病原体同定及びモニタリングにおいて有用な方法に関する。
いくつかの実施形態では、配列決定を調製するために使用される試料は、二本鎖核酸を含む。この二本鎖核酸は、標的核酸と称され得る。いくつかの実施形態では、二本鎖核酸を、固定されたトランスポソームを含む固体支持体に添加してもよい。いくつかの実施形態では、二本鎖核酸を断片化し、フォーク型アダプターの混合物と組み合わせることができる。
いくつかの実施形態では、試料は、複数の二本鎖核酸を含む。
本開示に従って使用される生物学的試料は、標的核酸を含む任意のタイプであり得る。しかしながら、試料は完全に精製される必要はなく、例えば、タンパク質と混合された核酸、他の核酸種、他の細胞成分、及び/又は任意の他の夾雑物を含むことができる。いくつかの実施形態では、生体試料は、核酸、タンパク質、他の核酸種、他の細胞成分、及び/又はインビボで見られるものとほぼ同じ割合で存在する任意の他の夾雑物の混合物を含む。例えば、いくつかの実施形態では、成分は、無傷細胞に見られるものと同じ割合で見出される。いくつかの実施形態では、生体試料は、2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60以下の260/280吸光度比を有する。いくつかの実施形態では、生体試料は、少なくとも2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60の260/280吸光度比を有する。本明細書で提供される方法により、核酸を固形支持体に結合させることができるため、他の夾雑物は、表面結合タグメンテーションが生じた後に固形支持体を洗浄するだけで除去することができる。生体試料は、例えば、粗細胞溶解物又は全細胞を含み得る。例えば、本明細書に記載の方法において固体支持体に適用される粗細胞溶解物は、他の細胞成分から核酸を単離するために従来から使用している分離工程のうちの1つ以上が行われる必要はない。例示的な分離工程は、Maniatis et al.,Molecular Cloning:A Laboratory Manual,2d Edition,1989、及びShort Protocols in Molecular Biology,ed.Ausubel,et alに記載され、参照により本明細書に組み込まれる。
いくつかの実施形態では、固体支持体に適用される試料は、1.7以下である260/280吸光度比を有する。
したがって、いくつかの実施形態では、生体試料は、例えば、血液、血漿、血清、リンパ液、粘液、痰、尿、精液、脳脊髄液、気管支吸引液、糞便、及びそれらの浸軟組織、若しくはそれらの溶解物、又は核酸を含む任意の他の生体標本を含み得る。
いくつかの実施形態では、試料は、血液である。いくつかの実施形態では、試料は、細胞溶解物である。いくつかの実施形態では、細胞溶解物は、粗細胞溶解物である。いくつかの実施形態では、方法は、試料を固体支持体に適用した後に試料中の細胞を溶解して、細胞溶解物を生成する工程を更に含む。
いくつかの実施形態では、試料は、生検試料である。いくつかの実施形態では、生検試料は、液体又は固体試料である。いくつかの実施形態では、がん患者由来の生検試料を使用して、対象が予測遺伝子中に特定の変異又はバリアントを有するかどうかを決定するために、目的の配列を評価する。
いくつかの実施形態では、試料は、標的二本鎖DNAを含む。いくつかの実施形態では、DNAは、ゲノムDNAである。いくつかの実施形態では、DNAは、無細胞DNA(cfDNA)である。いくつかの実施形態では、DNAは、循環腫瘍DNA(ctDNA)である。
いくつかの実施形態では、DNAは、RNAから調製される二本鎖cDNAである。いくつかの実施形態では、RNAは、mRNAである。いくつかの実施形態では、RNAは、コード、非翻訳領域(UTR)配列、イントロン配列、及び/又は遺伝子間配列を含む。
B.3’末端ポリヌクレオチド
いくつかの実施形態では、3’末端ポリヌクレオチドは、第1のリードプライマー結合配列を含む。
いくつかの実施形態では、3’末端ポリヌクレオチドは、第1のリードプライマー結合配列を含む。
いくつかの実施形態では、3’末端ポリヌクレオチドは、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む。いくつかの実施形態では、3’末端ポリヌクレオチド及び/又は付着ポリヌクレオチドは、それぞれ独立して、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む。
いくつかの実施形態では、3’末端ポリヌクレオチドは、ME’、B15’、及び/又はP7’配列を含む。いくつかの実施形態では、3’末端ポリヌクレオチドは、ME’、B15’、及びP7’配列を含む。
いくつかの実施形態では、3’末端ポリヌクレオチドは、P5プライマー配列の相補体(P5’)を含み、付着ポリヌクレオチドは、P7プライマー配列(P7)を含む。いくつかの実施形態では、3’末端ポリヌクレオチドは、P7プライマー配列の相補体(P7’)を含み、付着ポリヌクレオチドは、P5プライマー配列(P5)を含む。
いくつかの実施形態では、3’末端ポリヌクレオチドは、ME’-B15’-P7’配列を含む。
C.インサート配列
ポリヌクレオチドに含まれるインサート配列は、標的核酸に由来する配列を含む。したがって、本明細書に記載されるポリヌクレオチドは、配列決定時にタンデムリードを生成するためなど、いくつかの目的のために使用できる。
ポリヌクレオチドに含まれるインサート配列は、標的核酸に由来する配列を含む。したがって、本明細書に記載されるポリヌクレオチドは、配列決定時にタンデムリードを生成するためなど、いくつかの目的のために使用できる。
本明細書に記載されるポリヌクレオチドは、2つ以上のインサート配列を含む。いくつかの実施形態では、ポリヌクレオチドは、2、3、4、5、6、7、8、9、10、又はそれ以上のインサート配列を含む。いくつかの実施形態では、ポリヌクレオチドは、2つのインサート配列を含む。いくつかの実施形態では、ポリヌクレオチドは、3つのインサート配列を含む。
インサート配列は、1つ以上の標的核酸に由来し得る。
いくつかの実施形態では、ポリヌクレオチドは、複数の標的核酸に由来する複数のインサート配列を含む。
いくつかの実施形態では、ポリヌクレオチドは、全てが同じ標的核酸に由来する複数のインサート配列を含み得る。いくつかの実施形態では、複数のインサート配列は、標的核酸の非隣接配列に由来する。非隣接配列とは、ポリヌクレオチド中の複数のインサート配列が元の標的核酸中で互いに隣接しないことを意味する。いくつかの実施形態では、複数のインサート配列は、標的核酸のランダム領域に由来する。いくつかの実施形態では、本発明のポリヌクレオチドを生成するための方法は、特定のインサート配列について選択しない。
いくつかの実施形態では、複数のインサート配列は、それぞれ40~400ヌクレオチドを含むか、又はそれぞれ100~200ヌクレオチドを含むか、又はそれぞれ150ヌクレオチドを含む。いくつかの実施形態では、第1のインサート配列及び第2のインサート配列は、それぞれ40~400ヌクレオチドを含むか、又はそれぞれ100~200ヌクレオチドを含むか、又はそれぞれ150ヌクレオチドを含む。
いくつかの実施形態では、ポリヌクレオチドは、3つ以上のインサート配列を含む。いくつかの実施形態では、ポリヌクレオチドは、第2のインサート配列と付着ポリヌクレオチドとの間に、標的核酸の非隣接配列に由来するか、又は他のインサート配列とは異なる標的核酸に由来する、5’末端のインサート配列と、リードプライマー結合配列を含む3’末端の連結配列と、を含む、少なくとも1つの挿入単位を含み、リードプライマー結合配列は、他のリードプライマー結合配列と直交している。
ポリヌクレオチドが3つ以上のインサート配列を含む実施形態では、ポリヌクレオチドは複数の異なる連結配列を含むことができ、各連結配列はプライマー配列を含み、異なる連結配列に含まれるプライマー配列は異なる。いくつかの実施形態では、1つ以上のプライマー配列は、ハイブリダイゼーション配列を含み、ハイブリダイゼーション配列は、異なるプライマー配列において異なる。
例えば、3つのインサート配列を含むポリヌクレオチドを生成するために、HYB1/HYB1’及びHYB2/HYB2’などの2つの異なるHYB/HYB’配列対を使用できる。3つのインサートを有するポリヌクレオチドを生成するために、HYB1/HYB1’を用いてインサート1とインサート2を連結することができ、HYB2/HYB2’を用いてインサート2とインサート3を連結することができる。インサート1のフォーク型アダプターは、P5及びHYB1を含むことができ、インサート2のアダプターは、HYB1’及びHYB2を含むことができ、インサート3のアダプターは、HYB2’及びP7’を含むことができる。
インサート配列は、タグメンテーション又は断片化などの核酸断片を生成するためのいくつかの方法によって生成することができる。
D.アダプター配列
いくつかの実施形態では、ポリヌクレオチドは、1つ以上のアダプター配列を含み得る。
いくつかの実施形態では、ポリヌクレオチドは、1つ以上のアダプター配列を含み得る。
アダプター配列は、プライマー配列、アンカー配列、ユニバーサル配列、スペーサ領域、インデックス配列、捕捉配列、バーコード配列、開裂配列、配列決定関連配列、及びこれらの組み合わせからなる群から選択される1つ以上の機能的配列又は構成要素を含んでもよい。いくつかの実施形態では、アダプター配列は、プライマー配列を含む。他の実施形態では、アダプター配列は、プライマー配列とインデックス又はバーコード配列とを含む。プライマー配列はまた、ユニバーサル配列であってもよい。本開示は、使用できるアダプター配列の種類に限定されず、当業者であれば、ライブラリー調製及び次世代配列決定に使用できる追加の配列を認識するであろう。ユニバーサル配列は、2つ以上の核酸断片に共通のヌクレオチド配列の領域である。任意選択的に、2つ以上の核酸断片はまた、配列差の領域を有し得る。複数の核酸断片の異なるメンバーにおいて存在し得るユニバーサル配列は、ユニバーサル配列に相補的である単一のユニバーサルプライマーを使用して、複数の異なる配列の複製又は増幅を可能にすることができる。
いくつかの実施形態では、第1のリードプライマー結合配列は、第1のアダプター配列を含む。いくつかの実施形態では、第1のアダプター配列は、A14プライマー配列の相補体(A14’)又はB15プライマー配列の相補体(B15’)である。
いくつかの実施形態では、アダプター配列は、SBS又はSBS’配列を含む。いくつかの実施形態では、SBS又はSBS’配列は、標準配列プライマーを使用できるように、Truseqワークフローにおいて使用されるオリゴヌクレオチドに含まれる標準配列の全部又は一部を含んでもよい。いくつかの実施形態では、SBSはモザイク末端配列であってもよく、SBS’はME及びME’などのモザイク末端配列の相補体であってもよい。
いくつかの実施形態では、SBS又はSBS’配列は、A14-ME若しくはB15-ME、又はそれらの相補体を含んでもよい。配列番号15~21は、いくつかの例示的なSBS若しくはSBS’配列、又はSBS若しくはSBS’配列を含むアダプターを示す。
いくつかの実施形態では、SBS及びSBS’は、アダプター二本鎖を形成することができる全て又は部分的に相補的な配列である。いくつかの実施形態では、SBS及びSBS’は、部分的に相補的である。いくつかの実施形態では、SBS及びSBS’は、完全に相補的である。いくつかの実施形態では、SBS及び/又はSBS’は、13塩基対配列を含む。いくつかの実施形態では、アダプター二本鎖は、SBS又はSBS’に加えて、P5-HYB’及びP7-HYBを含む。このようにして、例えば、2つのライブラリー断片が一緒に積み重ねられて(すなわち、一緒にタンデムで)、2つのインサートを有するポリヌクレオチドを生成する場合、得られたポリヌクレオチドは、標準的な配列決定プライマーを用いて配列決定され得る。
いくつかの実施形態では、アダプター配列は、配列決定プライマーへの結合について65℃以上の融解温度を有する。いくつかの実施形態では、アダプター配列は、配列決定のために使用される温度で結合が失われないように、配列決定プライマーに結合する。いくつかの実施形態では、アダプター配列は、A、T、C、及びGのそれぞれの相当な量(10%超)を含む。いくつかの実施形態では、アダプター配列のG/C含量は、40%~60%である。いくつかの実施形態では、アダプター配列のG/C含量は、30%以上かつ70%以下である。いくつかの実施形態では、アダプター配列のG/C含量は、40%以上50%以下、又は50%以上若しくは60%以下である。
いくつかの実施形態では、付着ポリヌクレオチドは、第2のアダプター配列を含む。いくつかの実施形態では、第2のアダプター配列は、A14配列又はB15配列である。
いくつかの実施形態では、第1のアダプター配列は、A14配列の相補体(A14’)であり、第2のアダプター配列は、B15配列である。いくつかの実施形態では、第1のアダプター配列は、B15配列の相補体(B15’)であり、第2のアダプター配列は、A14配列である。
いくつかの実施形態では、アダプター配列は、タグメンテーション反応によって核酸断片の5’末端に転写される。
E.連結配列
いくつかの実施形態では、連結配列は、第1のリードプライマー結合配列に直交する第2のリードプライマー結合配列を含み、第2のリードプライマー結合配列は、ハイブリダイゼーション配列を含む。いくつかの実施形態では、ハイブリダイゼーション配列は、HYB’である。いくつかの実施形態では、第2のリードプライマー結合配列は、図4Bに示されるように、ハイブリダイゼーション配列(HYB)及びSBS’配列の相補体(ME’)を含む。いくつかの実施形態では、第4のリードプライマー結合配列は、図4Bに示されるように、ハイブリダイゼーション配列の相補体(HYB’)及びSBS配列の相補体(SBS’)を含む。
いくつかの実施形態では、連結配列は、第1のリードプライマー結合配列に直交する第2のリードプライマー結合配列を含み、第2のリードプライマー結合配列は、ハイブリダイゼーション配列を含む。いくつかの実施形態では、ハイブリダイゼーション配列は、HYB’である。いくつかの実施形態では、第2のリードプライマー結合配列は、図4Bに示されるように、ハイブリダイゼーション配列(HYB)及びSBS’配列の相補体(ME’)を含む。いくつかの実施形態では、第4のリードプライマー結合配列は、図4Bに示されるように、ハイブリダイゼーション配列の相補体(HYB’)及びSBS配列の相補体(SBS’)を含む。
いくつかの実施形態では、連結配列は、ハイブリダイゼーション配列の3’側のトランスポゾン末端配列及びハイブリダイゼーション配列の5’側のトランスポゾン末端配列の相補体を含む。
いくつかの実施形態では、連結配列は、ME’、HYB’、及び/又はMEを含む。いくつかの実施形態では、連結配列は、ME’、HYB’、及びMEを含む。いくつかの実施形態では、連結配列は、ME’-HYB’-MEである。
いくつかの実施形態では、第2のリードプライマー結合配列は、ハイブリダイゼーション配列の相補体及びトランスポゾン末端配列の相補体を含む。いくつかの実施形態では、第2のリードプライマー結合配列は、HYB’又はME’を含む。いくつかの実施形態では、第2のリードプライマー結合配列は、HYB’及びME’を含む。いくつかの実施形態では、第2のリードプライマー結合配列は、HYB’-ME’である。
F.固定化及び付着ポリヌクレオチド
いくつかの実施形態では、ポリヌクレオチドは、固体支持体上に固定されている。
いくつかの実施形態では、ポリヌクレオチドは、固体支持体上に固定されている。
いくつかの実施形態では、ポリヌクレオチドは、付着ポリヌクレオチドを介して固体支持体上に固定されている。いくつかの実施形態では、付着ポリヌクレオチドは、付着配列を含む。
いくつかの実施形態では、付着ポリヌクレオチドは、付着配列を含む。いくつかの実施形態では、付着配列は、トランスポソーム複合体中のトランスポゾンにハイブリダイズし、スライド、フローセル、又はビーズなどの固体支持体上に固定されている核酸配列である。いくつかの実施形態では、付着配列は、トランスポソーム複合体を固体支持体に付着させるように機能する。いくつかの実施形態では、付着配列は、ポリヌクレオチドを固体支持体に付着させるように機能する。いくつかの実施形態では、付着配列は、P5である。
いくつかの実施形態では、ポリヌクレオチドは、固体支持体の表面上の付着ポリヌクレオチド相補体への付着ポリヌクレオチドのハイブリダイゼーションを介して固体支持体上に固定されている。いくつかの実施形態では、ポリヌクレオチドは、付着ポリヌクレオチド上の親和性部分の固体支持体の表面上の結合部分への結合を介して固体支持体に固定されている。
いくつかの実施形態では、固体支持体は、フローセル又はビーズを含む。
いくつかの実施形態では、付着ポリヌクレオチドは、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む。
いくつかの実施形態では、付着ポリヌクレオチドは、第2のアダプター配列を含む。いくつかの実施形態では、第2のアダプター配列は、A14又はB15である。
いくつかの実施形態では、付着ポリヌクレオチドは、トランスポゾン末端配列を含む。いくつかの実施形態では、トランスポゾン末端配列は、MEである。
いくつかの実施形態では、付着配列はP5であり、第2のアダプター配列はA14であり、かつ/又は、トランスポゾン末端配列はMEである。いくつかの実施形態では、付着ポリヌクレオチドは、P5、A14、及び/又はMEを含む。いくつかの実施形態では、付着ポリヌクレオチドは、P5、A14、及びMEを含む。いくつかの実施形態では、付着ポリヌクレオチドは、P5-A14-MEを含む。
G.試料インデックス及びUMI
いくつかの実施形態では、ポリヌクレオチドは、ハイブリダイゼーション配列(又はその相補体)及び少なくとも2つのインサートに加えて、プライマー配列、インデックス配列、バーコード配列、精製タグ、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、ポリヌクレオチドは、試料インデックス及び/又は固有分子識別子(UMI)を含む。いくつかの実施形態では、これらの配列のうちの1つ以上は、二本鎖断片に連結されるフォーク型アダプターを使用して、又はタグメンテーションの間に二本鎖断片に組み込まれるトランスポソーム内に含まれるフォーク型アダプターを使用して、ポリヌクレオチドに組み込まれる。あるいは、PCRなどを用いてポリヌクレオチドを生成した後、追加の配列をポリヌクレオチド(連結された配列決定鋳型など)に付加してもよい。
いくつかの実施形態では、ポリヌクレオチドは、ハイブリダイゼーション配列(又はその相補体)及び少なくとも2つのインサートに加えて、プライマー配列、インデックス配列、バーコード配列、精製タグ、又はそれらの任意の組み合わせを含む。いくつかの実施形態では、ポリヌクレオチドは、試料インデックス及び/又は固有分子識別子(UMI)を含む。いくつかの実施形態では、これらの配列のうちの1つ以上は、二本鎖断片に連結されるフォーク型アダプターを使用して、又はタグメンテーションの間に二本鎖断片に組み込まれるトランスポソーム内に含まれるフォーク型アダプターを使用して、ポリヌクレオチドに組み込まれる。あるいは、PCRなどを用いてポリヌクレオチドを生成した後、追加の配列をポリヌクレオチド(連結された配列決定鋳型など)に付加してもよい。
固有分子識別子(UMI)は、個々の核酸分子を互いに区別するために使用され得る核酸分子に適用されるか、又は同定されるヌクレオチドの配列である。UMIは、リード配列が1つのソース核酸分子又は別のものであるかどうかを決定するために、それらが関連する核酸分子とともに配列決定され得る。「UMI」という用語は、ポリヌクレオチドの配列情報及び物理的ポリヌクレオチド自体の両方を指すために本明細書で使用され得る。UMIは、1つの試料のリードを他の試料のリードから区別するために一般的に使用されるバーコードに類似しているが、UMIは、代わりに、個々の試料からの多くの断片が一緒に配列決定される場合、核酸鋳型断片を別の断片から区別するために使用される。UMIは、参照により本明細書に組み込まれる、国際公開第2019/108972号及び国際公開第2018/136248号に記載されるように、多くの方式で定義することができる。
いくつかの実施形態では、2つの試料インデックスを用いて、固有の二重インデックス(UDI)を調製する。いくつかの実施形態では、試料インデックスは、i5-i8配列である。あるいは、i6及びi8配列をUMIとして使用してもよい。
UMIは、二本鎖核酸中のPCR複製物の除去及び低頻度変異体の検出に有用であるが、UDIは、ライブラリー配列決定及び逆多重化におけるインデックスホッピングに起因する試料の不正確なアサインメントを軽減するのに有用である。固有のi5及びi7インデックス配列などのUDIは、両方の末端がUDIを含むように、標的核酸の末端に付加することができる。UDIは、IlluminaのNovaSeq 6000システムなどのパターン化されたフローセルと共に使用できる(例えば、国際公開第2018/204423号、同第2018/208699号、同第2019/055715号、及び同第2016/176091号参照、それらは、参照によりそれらの全体が本明細書に組み込まれる)。図46A及び46Bに示されるものなどの本明細書に記載されるいくつかの実施形態では、トランスポソーム複合体の異なるプールに含まれるトランスポゾンは、タグメンテーション中にUDI又はUMIを組み込むポリヌクレオチドを調製し、UDI又はUMIを組み込むための別個のPCR工程を不要にするように設計される。UDI(i5及びi7など)又はUMI(i6又はi8など)を含む例示的なポリヌクレオチドを図46A~46Cに示す。
H.ポリヌクレオチド及びその相補体を含む組成物
いくつかの実施形態では、組成物は、ポリヌクレオチド及びその相補体を含む。いくつかの実施形態では、ポリヌクレオチドは、その相補体にハイブリダイズする。いくつかの実施形態では、ポリヌクレオチド及びその相補体は、二本鎖組成物に含まれる。
いくつかの実施形態では、組成物は、ポリヌクレオチド及びその相補体を含む。いくつかの実施形態では、ポリヌクレオチドは、その相補体にハイブリダイズする。いくつかの実施形態では、ポリヌクレオチド及びその相補体は、二本鎖組成物に含まれる。
いくつかの実施形態では、組成物は、ポリヌクレオチド及びその相補体を含み、相補体は、第1の相補リードプライマー結合配列を含む3’末端相補体であって、第1の相補リードプライマー結合配列は、第1及び第2のリードプライマー結合配列に直交している、3’末端相補体と、3’末端相補体の5’側にある第2のインサート配列の相補体と、第2のインサート配列の相補体の5’側にあり、3’から5’への第2の相補リードプライマー結合配列を含む相補連結配列であって、第2の相補リードプライマー結合配列は、第1及び第2のリードプライマー結合配列、並びに第1の相補リードプライマー結合配列に直交している、相補連結配列と、相補連結配列の5’側の第1のインサート配列の相補体と、5’末端に相補付着配列を含む相補付着ポリヌクレオチドと、を含む。
いくつかの実施形態では、組成物は、ポリヌクレオチド及び相補体を含み、ポリヌクレオチド又は相補体のいずれかが固体支持体上に固定されている。いくつかの実施形態では、組成物は、第1の付着ポリヌクレオチドを介して固体支持体上に固定されているポリヌクレオチドを含む。いくつかの実施形態では、相補体は、相補付着ポリヌクレオチドを介して固体支持体に固定されている。
いくつかの実施形態では、相補付着ポリヌクレオチドは、付着配列を含む。いくつかの実施形態では、相補付着ポリヌクレオチドに含まれる相補配列は、P7である。
いくつかの実施形態では、相補付着ポリヌクレオチドは、ME-B15-P7配列を含む。いくつかの実施形態では、相補付着配列は、P7を含む。いくつかの実施形態では、相補連結配列は、ME-HYB-MEを含む。いくつかの実施形態では、第2のリード相補プライマー配列は、HYB-ME’を含む。いくつかの実施形態では、3’末端ポリヌクレオチド相補体は、P5’-A14’-ME’を含む。いくつかの実施形態では、第1のリード相補リードプライマー結合配列は、A14’-ME’を含む。いくつかの実施形態では、相補ハイブリダイゼーション配列は、HYBを含む。
I.ポリヌクレオチド又は組成物の構造
ポリヌクレオチドは、様々な構造を有し得る。いくつかの実施形態では、組成物は、以下の構造のうちの1つのポリヌクレオチド又はその相補体を含む。
ポリヌクレオチドは、様々な構造を有し得る。いくつかの実施形態では、組成物は、以下の構造のうちの1つのポリヌクレオチド又はその相補体を含む。
いくつかの実施形態では、ポリヌクレオチドは、
3’-P7’-B15’-ME’-インサート1-ME-HYB-ME’-インサート2-ME-A14-P5-5’の構造を有する。
3’-P7’-B15’-ME’-インサート1-ME-HYB-ME’-インサート2-ME-A14-P5-5’の構造を有する。
いくつかの実施形態では、ポリヌクレオチドの相補体は、
3’-P5’-A14’-ME’-インサート2-ME-HYB’-ME’-インサート1-ME-B15-P7-5’の構造を有する。
3’-P5’-A14’-ME’-インサート2-ME-HYB’-ME’-インサート1-ME-B15-P7-5’の構造を有する。
J.ポリヌクレオチドを含むキット
いくつかの実施形態では、キット又は組成物は、第1のトランスポソーム複合体及び第2のトランスポソーム複合体を含み、第1のトランスポソーム複合体は、ハイブリダイゼーション配列の相補体を含むトランスポゾンを含み、第2のトランスポソーム複合体は、ハイブリダイゼーション配列を含むトランスポゾンを含む。
いくつかの実施形態では、キット又は組成物は、第1のトランスポソーム複合体及び第2のトランスポソーム複合体を含み、第1のトランスポソーム複合体は、ハイブリダイゼーション配列の相補体を含むトランスポゾンを含み、第2のトランスポソーム複合体は、ハイブリダイゼーション配列を含むトランスポゾンを含む。
いくつかの実施形態では、組成物又はキットは、固体支持体であって、任意選択的に、任意選択の支持体はビーズである、固体支持体と、トランスポソーム複合体を生成するための構成要素であって、トランスポザーゼと、オリゴヌクレオチド二本鎖を生成するためのオリゴヌクレオチドであって、第1のオリゴヌクレオチドは、3’トランスポゾン末端配列と、5’の第1のアダプター配列と、を含み、第2のオリゴヌクレオチドは、5’トランスポゾン末端配列と、3’の第2のアダプター配列と、を含み、5’トランスポゾン末端配列は、3’トランスポゾン末端配列に相補的であり、第1及び第2のアダプター配列は同じでない、オリゴヌクレオチドと、を含む、構成要素と、PCRによって断片に付着配列及びハイブリダイゼーション配列を付加するための第1及び第2のプライマーセットであって、第1のプライマーセットは、断片にハイブリダイゼーション配列及び第1の付着配列を付加するためのプライマーを含み、第2のプライマーセットは、断片に相補ハイブリダイゼーション配列及び第2の付着配列を付加するためのプライマーを含み、第1及び第2の付着配列は同じでない、第1及び第2のプライマーセットと、を含む。
いくつかの実施形態では、キット又は組成物は、1つ以上のフォーク型アダプター複合体を含む。いくつかの実施形態では、キット又は組成物は、第1のフォーク型アダプター複合体及び第2のフォーク型アダプター複合体を含む。
いくつかの実施形態では、キット又は組成物は、1つ以上のアセンブルされたアダプター二本鎖を含む。いくつかの実施形態では、キット又は組成物は、第1のアダプター二本鎖及び第2のアダプター二本鎖を含むアセンブルされたアダプター二本鎖を含む。
いくつかの実施形態では、キット又は組成物は、フォーク型アダプター複合体及びアセンブルされたアダプター二本鎖を含む。
いくつかの実施形態では、キット又は組成物は、アセンブルされた酵素及びトランスポゾンを含む。
いくつかの実施形態では、キット又は組成物は、精製されたオリゴヌクレオチドを含む。
III.複数のインサート配列を含むポリヌクレオチドを調製する方法
様々な方法を使用して、本明細書に記載のポリヌクレオチドを生成することができる。
様々な方法を使用して、本明細書に記載のポリヌクレオチドを生成することができる。
A.転位反応を含む方法
いくつかの実施形態では、ポリヌクレオチドは、転位反応を含む方法によって調製される。
いくつかの実施形態では、ポリヌクレオチドは、転位反応を含む方法によって調製される。
転位反応は、1つ以上のトランスポゾンがランダムな部位又はほぼランダムな部位で標的核酸に挿入される反応である。転移反応の構成要素としては、トランスポザーゼ(又は本明細書に記載の核酸(例えば、インテグラーゼ)を断片化及び標識化することができる他の酵素)、トランスポザーゼ(又は本明細書に記載の他の酵素)に結合する二本鎖トランスポゾン末端配列を含むトランスポゾン要素、2つのトランスポゾン末端配列のうちの1つに付着されたアダプター配列が挙げられる。二本鎖トランスポゾン末端配列の1つの鎖が、標的核酸の1つの鎖に転写され、相補的なトランスポゾン末端配列鎖は(非転写トランスポゾン配列)ではない。アダプター配列は、必要に応じて又は所望に応じて、1つ以上の機能的配列又は構成要素(例えば、プライマー配列、アンカー配列、ユニバーサル配列、スペーサ領域、又はインデックスタグ配列)を含み得る。
トランスポゾンベースの技術は、例えば、NEXTERA(商標)FLEX DNA試料調製キット(Illumina,Inc.)のワークフローに例示されるように、DNAを断片化するために利用することができ、ゲノムDNAなどの標的核酸は、標的を同時に断片化及びタグ付けする(「タグメンテーション」)トランスポソーム複合体で処理され、それによって、断片の末端に特異なアダプター配列でタグ付けされた断片化核酸分子の集団を生成する。
図6A~図9Bは、転位反応を用いてHYB又はHYB’配列を含むライブラリー産物を作製するための種々のアプローチを示す。いくつかの実施形態では、ビーズに連結したトランスポソーム(BLT)が使用される。いくつかの実施形態では、溶液中のトランスポソームが使用される。
「トランスポソーム複合体」は、少なくとも1つのトランスポザーゼ(又は本明細書に記載の他の酵素)及びトランスポゾン認識配列から構成される。いくつかのそのようなシステムでは、トランスポザーゼは、転移反応を触媒することができる機能的複合体を形成するために、トランスポゾン認識配列に結合する。いくつかの態様では、トランスポゾン認識配列は、二本鎖トランスポゾン末端配列である。トランスポザーゼは、標的核酸内のトランスポザーゼ認識部位に結合し、配列トランスポゾン認識配列を標的核酸に挿入する。いくつかのそのような挿入事象では、トランスポゾン認識配列(又は末端配列)の1つの鎖が標的核酸に転写され、開裂事象が生じる。例示的な転位手順及びシステムは、トランスポザーゼでの使用に容易に適合され得る。
本明細書に提供されるある特定の実施形態で使用され得る例示的なトランスポザーゼとしては、Tn5トランスポザーゼ、Sleeping Beauty(SB)トランスポザーゼ、Vibrio harveyi、R1及びR2末端配列を含むMuAトランスポザーゼ及びMuトランスポザーゼ認識部位、Staphylococcus aureus Tn552、Ty1、Tn7トランスポザーゼ、Tn/O及びIS10、Mariner transposase、Tc1、P Element、Tn3、細菌インサート配列、レトロウイルス、及び酵母のレトロトランスポゾンが挙げられる(又はそれによってコードされる)。より多くの例としては、IS5、Tn10、Tn903、IS911、及びトランスポザーゼファミリー酵素の設計されたバージョンが挙げられる。本明細書に記載される方法はまた、トランスポザーゼの組み合わせを含み、単一のトランスポザーゼのみを含むのではない。
いくつかの実施形態では、トランスポザーゼは、Tn5、Tn7、MuA、若しくはビブリオハーベイトランスポザーゼ、又はこれらの活性変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその活性変異体である。いくつかの実施形態では、Tn5トランスポザーゼは、高活性Tn5トランスポザーゼ、又はその活性変異体である。いくつかの態様では、Tn5トランスポザーゼは、参照により本明細書に組み込まれる、PCT国際公開第2015/160895号に記載されているTn5トランスポザーゼである。いくつかの態様では、Tn5トランスポザーゼは、野生型Tn5トランスポザーゼに対する54、56、372、212、214、251、及び338位での変異を有する、高活性Tn5である。いくつかの態様では、Tn5トランスポザーゼは、野生型Tn5トランスポザーゼ:E54K、M56A、L372P、K212R、P214R、G251R、及びA338Vに対する以下の変異を有する高活性Tn5である。いくつかの実施形態では、Tn5トランスポザーゼは、融合タンパク質である。いくつかの実施形態では、Tn5トランスポザーゼ融合タンパク質は、融合伸長因子Ts(Tsf)タグを含む。いくつかの実施形態では、Tn5トランスポザーゼは、野生型配列に対するアミノ酸54、56、及び372における変異を含む高活性Tn5トランスポザーゼである。いくつかの実施形態では、高活性Tn5トランスポザーゼは融合タンパク質であり、任意選択で、融合タンパク質は伸長因子Ts(Tsf)である。いくつかの実施形態では、認識部位は、Tn5型トランスポザーゼ認識部位である(Goryshin and Reznikoff,J.Biol.Chem.,273:7367,1998)。一実施形態では、過剰活性Tn5トランスポザーゼとの複合体を形成するトランスポザーゼ認識部位が使用される(例えば、EZ Tn5(商標)Transposase,Epicentre Biotechnologies,Madison,Wis.)。いくつかの実施形態では、Tn5トランスポザーゼは野生型Tn5トランスポザーゼである。
いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼの2つの分子のダイマーを含む。いくつかの実施形態では、トランスポソーム複合体は、ホモダイマーであり、トランスポザーゼの2つの分子は各々、同じ型の第1及び第2のトランスポゾンに結合している(例えば、各モノマーに結合した2つのトランスポゾンの配列は同じであり、「ホモダイマー」を形成する)。いくつかの実施形態では、本明細書に記載の組成物及び方法は、トランスポソーム複合体の2つの集団を採用する。いくつかの実施形態では、各集団におけるトランスポゾンは同じである。いくつかの実施形態では、各集団におけるトランスポソーム複合体は、ホモダイマーであり、第1の集団は、各モノマーにおいて第1のアダプター配列を有し、第2の集団は、各モノマー中に異なるアダプター配列を有する。
いくつかの実施形態では、トランスポザーゼ複合体は、第1及び第2のモノマーを含むトランスポザーゼ(例えば、Tn5トランスポザーゼ)ダイマーを含む。いくつかの態様では、各モノマーは、第1のトランスポゾン、第2のトランスポゾン、及び付着ポリヌクレオチドを含み、第1のトランスポゾンは、その3’末端にトランスポゾン末端配列(3’トランスポゾン末端配列とも呼ばれる)及びその5’末端にアダプター配列(5’アダプター配列とも呼ばれる)を含み、第2のトランスポゾンは、その5’末端にトランスポゾン末端配列(5’トランスポゾン末端配列とも呼ばれる)及びその3’末端にアダプター配列(3’アダプター配列とも呼ばれる)を含み、付着ポリヌクレオチドは、第1のトランスポゾンの5’アダプター配列にハイブリダイズする付着アダプター配列、プライマー配列、及びリンカーを含む。いくつかの実施形態では、第2のトランスポゾンの5’トランスポゾン末端配列は、第1トランスポゾンの3’トランスポゾン末端配列と少なくとも部分的に対して相補的である。いくつかの実施形態では、付着ポリヌクレオチドの付着アダプター配列は、第1のトランスポゾンの5’アダプター配列と少なくとも部分的に対して相補的である。いくつかの実施形態では、付着ポリヌクレオチドのリンカーは、結合要素を含む。
1.トランスポソーム複合体
いくつかの実施形態では、トランスポソーム複合体は、第1のリードプライマー結合配列の相補体を含む第1のトランスポゾンであって、第1のリードプライマー結合配列の相補体は、トランスポゾン末端配列を含む3’部分と、第1のアダプター配列の相補体と、を含む、第1のトランスポゾンと、トランスポゾン末端配列の相補体を含む5’部分を含む第2のトランスポゾンと、ハイブリダイゼーション配列の相補体と、を含む。いくつかの実施形態では、第1のリードプライマー結合配列は、第1のリード配列決定アダプター配列を含む。
いくつかの実施形態では、トランスポソーム複合体は、第1のリードプライマー結合配列の相補体を含む第1のトランスポゾンであって、第1のリードプライマー結合配列の相補体は、トランスポゾン末端配列を含む3’部分と、第1のアダプター配列の相補体と、を含む、第1のトランスポゾンと、トランスポゾン末端配列の相補体を含む5’部分を含む第2のトランスポゾンと、ハイブリダイゼーション配列の相補体と、を含む。いくつかの実施形態では、第1のリードプライマー結合配列は、第1のリード配列決定アダプター配列を含む。
いくつかの実施形態では、3’トランスポゾン末端配列はモザイク末端(ME)配列を含み、5’トランスポゾン末端配列はME’配列を含む。
いくつかの実施形態では、第1のアダプター配列の相補体は、B15配列である。
いくつかの実施形態では、第1のリードプライマー結合配列は、ME’-B15’である。
いくつかの実施形態では、第2のトランスポゾンは、第1のリードプライマー結合配列の5’側に相補付着配列を含む。いくつかの実施形態では、相補付着配列は、P7配列を含む。
いくつかの実施形態では、トランスポソーム複合体は、次の構造を有する。
いくつかの実施形態では、標的化されたトランスポソーム複合体は、トランスポザーゼと、付着ポリヌクレオチドを含む第1のトランスポゾンであって、付着ポリヌクレオチドは、付着配列を含む5’部分を含む、第1のトランスポゾンと、第2のリードプライマー結合配列を含む3’部分であって、トランスポゾン末端配列を含む3’部分を含む、3’部分と、アダプターと、トランスポゾン末端配列の相補体を含む5’部分を含む第2のトランスポゾンと、ハイブリダイゼーション配列と、を含む。
いくつかの実施形態では、アダプターは、A14配列である。いくつかの実施形態では、付着配列は、P5配列を含む。
いくつかの実施形態では、トランスポソーム複合体は、次の構造を有する。
いくつかの実施形態では、本明細書に記載の第1及び第2のトランスポゾンは、互いにアニーリングされ、第1のトランスポゾンは、付着ポリヌクレオチドにアニーリングされる。次いで、アニーリングされたポリヌクレオチドを、Tn5トランスポザーゼなどのトランスポザーゼ上に装填し、それによってトランスポソーム複合体を形成し、次いで、ビーズなどの固体支持体と接触され、これに結合される。いくつかの実施形態では、アニーリングされたトランスポゾンは、ビーズなどの固体支持体に結合され、次いで、トランスポザーゼは、トランスポゾンと複合体化され、それによって、固体支持体に結合されるトランスポソームを生成する。
2.末端配列
いくつかの実施形態では、第1のトランスポゾンは3’トランスポゾン末端配列を含み、第2トランスポゾンは5’トランスポゾン末端配列を含む。いくつかの実施形態では、5’トランスポゾン末端配列は、3’トランスポゾン末端配列と少なくとも部分的に対して相補的である。いくつかの実施形態では、相補的トランスポゾン末端配列は、トランスポザーゼ(又は本明細書に記載される他の酵素)に結合する二本鎖トランスポゾン末端配列を形成するようにハイブリダイズする。いくつかの実施形態では、トランスポゾン末端配列は、モザイク末端(ME)配列である。したがって、いくつかの実施形態では、3’トランスポゾン末端配列はME配列であり、5’トランスポゾン末端配列はME’配列である。
いくつかの実施形態では、第1のトランスポゾンは3’トランスポゾン末端配列を含み、第2トランスポゾンは5’トランスポゾン末端配列を含む。いくつかの実施形態では、5’トランスポゾン末端配列は、3’トランスポゾン末端配列と少なくとも部分的に対して相補的である。いくつかの実施形態では、相補的トランスポゾン末端配列は、トランスポザーゼ(又は本明細書に記載される他の酵素)に結合する二本鎖トランスポゾン末端配列を形成するようにハイブリダイズする。いくつかの実施形態では、トランスポゾン末端配列は、モザイク末端(ME)配列である。したがって、いくつかの実施形態では、3’トランスポゾン末端配列はME配列であり、5’トランスポゾン末端配列はME’配列である。
3.アダプター配列
セクションII.Dで上述したように、本明細書に記載される方法の任意の実施形態では、第1のトランスポゾンは5’アダプター配列を含み、第2トランスポゾンは3’アダプター配列を含む。いくつかの実施形態では、付着ポリヌクレオチドは、5’アダプター配列にハイブリダイズする付着アダプター配列を含む。いくつかの実施形態では、付着アダプター配列は、5’アダプター配列と少なくとも部分的に相補的である。いくつかの実施形態では、アダプター配列は、A14配列又はB15配列である。したがって、いくつかの実施形態では、5’アダプター配列はA14配列であり、付着アダプター配列はA14’配列である。いくつかの実施形態では、3’アダプター配列は、B15’配列である。
セクションII.Dで上述したように、本明細書に記載される方法の任意の実施形態では、第1のトランスポゾンは5’アダプター配列を含み、第2トランスポゾンは3’アダプター配列を含む。いくつかの実施形態では、付着ポリヌクレオチドは、5’アダプター配列にハイブリダイズする付着アダプター配列を含む。いくつかの実施形態では、付着アダプター配列は、5’アダプター配列と少なくとも部分的に相補的である。いくつかの実施形態では、アダプター配列は、A14配列又はB15配列である。したがって、いくつかの実施形態では、5’アダプター配列はA14配列であり、付着アダプター配列はA14’配列である。いくつかの実施形態では、3’アダプター配列は、B15’配列である。
任意の実施形態では、A14-ME、ME、B15-ME、ME’、A14、B15、及びMEを含むアダプター配列又はトランスポゾン末端配列が以下に提供される:
A14-ME:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(配列番号1)
B15-ME:5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(配列番号2)
ME’:5’-phoS-CTGTCTCTTATACACATCT-3’(配列番号3)
A14:5’-TCGTCGGCAGCGTC-3’(配列番号4)
B15:5’-GTCTCGTGGGCTCGG-3’(配列番号5)
ME:AGATGTGTATAAGAGACAG(配列番号6)
A14-ME:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(配列番号1)
B15-ME:5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(配列番号2)
ME’:5’-phoS-CTGTCTCTTATACACATCT-3’(配列番号3)
A14:5’-TCGTCGGCAGCGTC-3’(配列番号4)
B15:5’-GTCTCGTGGGCTCGG-3’(配列番号5)
ME:AGATGTGTATAAGAGACAG(配列番号6)
4.固定されたトランスポソーム及び固体支持体
いくつかの実施形態では、トランスポソーム複合体は、第1又は第2のトランスポゾンを介して固体支持体に固定されている。いくつかの実施形態では、トランスポソーム複合体は、ビーズ上に固定されている。いくつかの実施形態では、トランスポソーム複合体は、第1又は第2のトランスポゾンを介してビーズ上に固定されている。
いくつかの実施形態では、トランスポソーム複合体は、第1又は第2のトランスポゾンを介して固体支持体に固定されている。いくつかの実施形態では、トランスポソーム複合体は、ビーズ上に固定されている。いくつかの実施形態では、トランスポソーム複合体は、第1又は第2のトランスポゾンを介してビーズ上に固定されている。
用語「固体表面」、「固体支持体」、及び他の文法的等価物は、トランスポソーム複合体の結合に適切であるか、又は適切であるように修飾され得る任意の材料を指す。当該技術分野において理解されるように、可能な基材の数は多数である。可能な基材としては、ガラス及び変性又は機能化ガラス、プラスチック(アクリル、ポリスチレン、並びにスチレン及び他の材料のコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、テフロン(登録商標)など)、多糖類、多面体有機シルセスキオキサン(POSS)材料、ナイロン又はニトロセルロース、セラミックス、樹脂、シリカ、又はシリコン並びに変性シリコン、炭素、金属、無機ガラス、プラスチック、光ファイバ束、ビーズ、常磁性ビーズ、及び様々な他のポリマーを含むシリカ系材料を含む。
いくつかの実施形態では、トランスポソーム複合体は、結合要素(及び任意選択のリンカー)を介して固体支持体上に固定されている。いくつかの実施形態では、固体支持体は、ビーズ、常磁性ビーズ、フローセル、マイクロ流体デバイスの表面、チューブ、プレートのウェル、スライド、パターン化表面、又はマイクロ粒子である。いくつかの実施形態では、固体支持体はビーズを含むか、又はビーズである。一実施形態では、ビーズは、常磁性ビーズである。いくつかの実施形態では、固体支持体は、複数の固体支持体を含む。いくつかの実施形態では、トランスポソーム複合体は、複数の固体支持体上に固定化される。いくつかの実施形態では、複数の固体支持体は、複数のビーズを含む。いくつかの実施形態では、複数のトランスポソーム複合体は、1mm2当たり少なくとも103、104、105、106 個の複合体の密度で固体支持体上に固定化される。いくつかの実施形態では、固体支持体は、ビーズ又は常磁性ビーズであり、各ビーズに結合した10,000、20,000、30,000、40,000、50,000、又は60,000超のトランスポソーム複合体が存在する。
好適なビーズ組成物としては、プラスチック、セラミックス、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性材料、トリアゾル(thoria sol)、炭素黒鉛、二酸化チタン、ラテックス、又はセファロース、セルロース、ナイロン、架橋ミセル、及びテフロン(登録商標)などの架橋デキストラン、並びに固体支持体について本明細書に概説される任意の他の材料が挙げられるが、これらに限定されない。特定の実施形態では、微小球は、磁気微小球又はビーズ、例えば、常磁性粒子、球体、又はビーズである。ビーズは球状である必要はない。不規則な粒子を使用してもよい。代替的に又は追加的に、ビーズは多孔質であってもよい。ビーズサイズは、ナノメートル、例えば、100nmから、ミリメートル、例えば、1mmまでの範囲であり、ビーズは0.2マイクロメートル~200マイクロメートルが好ましく、0.5~5マイクロメートルが特に好ましいが、いくつかの実施形態では、より小さい又はより大きいビーズが使用されてもよい。ビーズは、結合パートナーがコーティングされてもよく、例えば、ビーズは、ストレプトアビジンがコーティングされてもよい。いくつかの実施形態では、ビーズは、ストレプトアビジンがコーティングされた常磁性ビーズ、例えば、Dynabeads MyOneストレプトアビジンC1ビーズ(Thermo Scientificカタログ番号65601)、Streptavidin MagneSphere Paramagnetic粒子(Promegaカタログ番号Z5481)、Streptavidin Magneticビーズ(NEBカタログ番号S1420S)及びMaxBead Streptavidin(Abnovaカタログ番号U0087)である。固体支持体はまた、スライド、例えば、トランスポソーム複合体体が上に固定化され得るように修飾された、フローセル又は他のスライドであってもよい。
いくつかの実施形態では、結合パートナーは、1000~6000pmol/mg、又は2000~5000pmol/mg、又は3000~5000pmol/mg、又は3500~4500pmol/mgの密度で固体支持体又はビーズ上に存在する。
いくつかの実施形態では、固体表面は、試料管の内面である。いくつかの実施形態では、固体表面は、捕捉膜である。一実施例では、捕捉膜は、ビオチン捕捉膜(例えば、Promega Corporationから入手可能)である。いくつかの実施形態では、捕捉膜は、濾紙である。本開示のいくつかの実施形態では、不活性基材又はマトリックス(例えば、ガラススライド、ポリマービーズなど)からなる固体支持体は、例えば、ポリヌクレオチドなどの分子への共有結合を可能にする反応性基を含む中間材料の層又はコーティングの適用によって官能化された。このような支持体の例としては、ガラスなどの不活性基材上に支持されるポリアクリルアミドヒドロゲル、特に国際公開第2005/065814号及び米国特許出願公開第2008/0280773号に記載されているポリアクリルアミドヒドロゲルが挙げられるが、これらに限定されず、その内容は、参照によりその全体が本明細書に組み込まれる。タグメンテーションされたDNAライブラリーの構築のための、固体表面上でDNAをタグメンテーション(断片化及びタグ付け)する方法については、国際公開第2016/189331号及び米国特許出願公開第2014/0093916(A1)号に記載されており、これらは参照によりその全体が本明細書に組み込まれる。いくつかの実施形態では、本明細書に記載のトランスポソーム複合体は、結合要素を介して固体支持体に固定化される。いくつかのこのような実施形態では、固体支持体は、結合パートナーとしてストレプトアビジンを含み、結合要素はビオチンである。
いくつかの実施形態では、トランスポソーム複合体は、ビーズなどの固体支持体上に、特定の密度又は密度範囲で固定化される。いくつかの実施形態では、固体担体上の複合体の密度は、固定化反応中の溶液中のトランスポソーム複合体の濃度を指す。複合体密度は、固定化反応が定量的であることを前提とする。複合体が特定の密度で形成されると、表面結合したトランスポソーム複合体のバッチでは密度は一定のままである。得られたビーズを希釈することができ、希釈された溶液中の複合体の得られた濃度は、ビーズの調製密度を希釈係数で割ったものである。希釈されたビーズストックは、それらの調製物からの複合体密度を保持するが、複合体は希釈溶液におけるより低い濃度で存在する。希釈工程は、ビーズ上の複合体の密度を変化させず、したがって、ライブラリーの収率に影響を及ぼすが、インサート(断片)のサイズに影響を及ぼさない。いくつかの実施形態では、密度は、5nM~1000nM、又は5~150nM、又は10nM~800nMである。他の実施形態では、密度は、10nM、又は25nM、又は50nM、又は100nM、又は200nM、又は300nM、又は400nM、又は500nM、又は600nM、又は700nM、又は800nM、又は900nM、又は1000nMである。いくつかの実施形態では、密度は100nMである。いくつかの実施形態では、密度は300nMである。いくつかの実施形態では、密度は600nMである。いくつかの実施形態では、密度は800nMである。いくつかの実施形態では、密度は100nMである。いくつかの実施形態では、密度は1000nMである。
いくつかの実施形態では、組成物は、固体支持体と、固体支持体に固定化されたトランスポソーム複合体と、を含む。いくつかの実施形態では、トランスポソーム複合体は、トランスポゾン、第1のトランスポゾン、付着ポリヌクレオチド、及び第2のトランスポゾンを含む。いくつかの実施形態では、第1のトランスポゾンは、3’トランスポゾン末端配列及び5’アダプター配列を含む。いくつかの実施形態では、付着ポリヌクレオチドは、5’アダプター配列及び結合要素にハイブリダイズする付着アダプター配列を含む。いくつかの実施形態では、第2のトランスポゾンは、5’トランスポゾン末端配列及び3’アダプター配列を含む。いくつかの実施形態では、トランスポソーム複合体は、付着ポリヌクレオチドを介して固体支持体に固定化される。いくつかの実施形態では、付着ポリヌクレオチドは、プライマー配列を更に含む。
いくつかの実施形態では、結合要素は、任意選択的に置換されたビオチンを含むか、又は任意選択的に置換されたビオチンである。いくつかの実施形態では、結合要素は、リンカーを介して付着ポリヌクレオチドに連結される。いくつかの実施形態では、結合要素は、ビオチンリンカーを含むか、又はビオチンリンカーである。いくつかの実施形態では、結合要素は、3’、5’、若しくは内部ビオチンを含むか、又は3’、5’、若しくは内部ビオチンである。
本明細書に記載のトランスポソーム複合体のいくつかの実施形態は、付着ポリヌクレオチドを含む。本明細書で使用するとき、付着ポリヌクレオチドは、一方の末端上のトランスポゾンにハイブリダイズし、第2の末端上の表面に結合するポリヌクレオチドである。したがって、本明細書に記載のトランスポソーム複合体は、付着ポリヌクレオチドを介して固体支持体に固定化される。いくつかの実施形態では、付着ポリヌクレオチドは、第1のトランスポゾンのアダプター配列又は第2のトランスポゾンのアダプター配列、プライマー配列、及びリンカーにハイブリダイズする付着アダプター配列を含む。いくつかの実施形態では、リンカーは結合要素を含む。
本明細書に記載されるように、付着アダプター配列は、第1又は第2のトランスポゾンのアダプター配列と少なくとも部分的に対して相補的であってもよい。いくつかの実施形態では、付着アダプター配列は、5’アダプター配列にハイブリダイズする。付着アダプター配列が5’アダプター配列にハイブリダイズする実施形態では、5’アダプター配列はA14配列であり、付着アダプター配列はA14’配列である。いくつかの実施形態では、付着アダプター配列は、3’アダプター配列にハイブリダイズする。付着アダプター配列が3’アダプター配列にハイブリダイズする実施形態では、3’アダプター配列はB15’配列であり、付着アダプター配列はB15配列である。これらの実施形態のいずれにおいても、付着アダプター配列は、第1又は第2のトランスポゾンのアダプター配列に対して完全に相補的であってもよいか、又は第1又は第2のトランスポゾンのアダプター配列に対して部分的に相補的であってもよい。
いくつかの実施形態では、付着ポリヌクレオチドは、プライマー配列を含む。いくつかの実施形態では、プライマー配列は、P5プライマー配列又はP7プライマー配列又はその相補体(例えば、P5’又はP7’)である。P5及びP7プライマーは、様々なIlluminaプラットフォーム上でシーケンシングするためにIllumina,Inc.が販売している市販のフローセルの表面に使用される。プライマー配列は、参照によりその全体が本明細書に組み込まれる、米国特許出願公開第2011/0059865号に記載されている。5’末端でアルキン末端であり得るP5及びP7プライマーの例としては、以下が挙げられる:
P5:AATGATACGGCGACCACCGAGAUCTACAC(配列番号7)
P7:CAAGCAGAAGACGGCATACGAG*AT(配列番号8)
及びこれらの誘導体。いくつかの実施例では、P7配列は、G*位、例えば、8オキソ-グアニンにおける修飾グアニンを含む。他の実施例では、*は、G*と隣接する3’Aとの間の結合がホスホロチオエート結合であることを示す。いくつかの実施例では、P5及び/又はP7プライマーは、非天然リンカーを含む。任意選択で、P5及びP7プライマーの一方又は両方は、ポリTテールを含み得る。ポリTテールは、概して、上記の配列の5’末端に、例えば、5’塩基と末端アルキン単位との間に位置するが、場合によっては3’末端に位置し得る。ポリT配列は、任意の数、例えば、2~20個のTヌクレオチドを含み得る。P5及びP7プライマーは、例として与えられるが、本明細書に提示される例では、任意の好適なプライマーが使用され得ることを理解されたい。P5及びP7プライマー配列を含むプライマー配列を有するインデックス配列は、配列決定のためのライブラリを活性化するためにP5及びP7を加える役割を果たす。P5及びP7プライマーを例示するが、本明細書に提示される例では、任意の好適な増幅プライマーを使用できることを理解されたい。
P5:AATGATACGGCGACCACCGAGAUCTACAC(配列番号7)
P7:CAAGCAGAAGACGGCATACGAG*AT(配列番号8)
及びこれらの誘導体。いくつかの実施例では、P7配列は、G*位、例えば、8オキソ-グアニンにおける修飾グアニンを含む。他の実施例では、*は、G*と隣接する3’Aとの間の結合がホスホロチオエート結合であることを示す。いくつかの実施例では、P5及び/又はP7プライマーは、非天然リンカーを含む。任意選択で、P5及びP7プライマーの一方又は両方は、ポリTテールを含み得る。ポリTテールは、概して、上記の配列の5’末端に、例えば、5’塩基と末端アルキン単位との間に位置するが、場合によっては3’末端に位置し得る。ポリT配列は、任意の数、例えば、2~20個のTヌクレオチドを含み得る。P5及びP7プライマーは、例として与えられるが、本明細書に提示される例では、任意の好適なプライマーが使用され得ることを理解されたい。P5及びP7プライマー配列を含むプライマー配列を有するインデックス配列は、配列決定のためのライブラリを活性化するためにP5及びP7を加える役割を果たす。P5及びP7プライマーを例示するが、本明細書に提示される例では、任意の好適な増幅プライマーを使用できることを理解されたい。
本明細書で使用するとき、リンカーの一例は、結合要素を、付着ポリヌクレオチドのヌクレオチド部分の末端に共有結合する部分であり、付着ポリヌクレオチドを固体支持体に固定化するために使用されてもよい。リンカーは、開裂可能なリンカー、例えば、付着ポリヌクレオチドを除去するために開裂されることが可能なリンカー、したがって、固体支持体からのトランスポソーム複合体又はタグメンテーション産物であってもよい。本明細書で使用するとき、開裂可能なリンカーは、例えば、光分解、化学的開裂、熱開裂、又は酵素開裂などの化学的又は物理的手段によって開裂され得るリンカーである。いくつかの実施形態では、開裂は、生化学的、化学的、酵素的、求核性、還元感受性剤、又は他の手段によってもよい。開裂可能なリンカーは、制限エンドヌクレアーゼ部位;RNaseで開裂可能な少なくとも1つのリボヌクレオチド;特定の化学薬品の存在下で開裂可能なヌクレオチド類似体;光開裂可能なリンカーユニット;(例えば)過ヨウ素酸塩による処理によって開裂可能なジオール結合;化学的還元剤で開裂可能なジスルフィド基;光化学的開裂に供され得る開裂可能部分;及び、ペプチダーゼ酵素によって開裂可能なペプチド、又は他の適切な手段からなる群から選択される部分を含み得る。開裂は、開裂可能なヌクレオチド又は核酸塩基を、ウラシル又は8オキソ-グアニンなどの開裂可能なリンカーに組み込むことによって酵素的に媒介されてもよい。
いくつかの実施形態では、本明細書に記載されるリンカーは、例えば、-O-結合を形成する、付着ヌクレオチドを共有的かつ直接的に付着させてもよいか、又はリン酸塩若しくはエステルなどの別の基を介して共有的に付着されてもよい。代替的に、本明細書に記載されるリンカーは、結合ポリヌクレオチドのリン酸基に共有的に付着されてもよく、例えば、リン酸基を介して3’ヒドロキシルに共有的に付着されても、したがって、-O- P(O)3-結合を形成してもよい。
本明細書で使用するとき、結合要素は、結合パートナーに共有結合又は非共有結合するために使用することができる部分である。いくつかの態様では、結合要素は、トランスポソーム複合体上にあり、結合パートナーは固体支持体上にある。いくつかの実施形態では、結合要素は、固体支持体上の結合パートナーに結合するか、又は非共有結合することができ、それによって、トランスポソーム複合体を固体支持体に非共有結合的に付着させることができる。いくつかの実施形態では、結合要素は、固体支持体上の結合パートナーに結合(共有結合又は非共有結合)することができる。いくつかの態様では、結合要素は、固体支持体上の結合パートナーに結合(共有結合又は非共有結合)され、固定化されたトランスポソーム複合体をもたらす。
このような実施形態では、結合要素は、例えば、ビオチンを含むか、又はビオチンであり、結合パートナーは、アビジン若しくはストレプトアビジンを含むか、又はアビジン若しくはストレプトアビジンである。他の実施形態では、結合要素/結合パートナーの組み合わせは、FITC/抗FITC、ジオキシゲニン/ジオキシゲニン抗体、若しくはハプテン/抗体を含むか、又はFITC/抗FITC、ジオキシゲニン/ジオキシゲニン抗体、若しくはハプテン/抗体である。更なる好適な結合対としては、デスチオビオチン-アビジン、ジチオビオチン-アビジン、イミノビオチン-アビジン、ビオチン-アビジン、ジチオビオチン-スクシニル化アビジン、イミノビオチン-スクシニル化アビジン、ビオチン-ストレプトアビジン、及びビオチン-スクシニル化アビジンが挙げられるが、これらに限定されない。いくつかの実施形態では、結合要素はビオチンであり、結合パートナーはストレプトアビジンである。
いくつかの実施形態では、結合要素は、化学反応を介して結合パートナーに結合することができるか、又は固体支持体上の結合パートナーとの反応によって共有結合され、それによって、トランスポソーム複合体を固体支持体に共有的に付着する。いくつかの態様では、結合要素/結合パートナーの組み合わせは、アミン/カルボン酸(例えば、EDC又はNHS媒介カップリングなどの当業者に既知の条件下での標準的なペプチドカップリング反応による結合)を含むか、又はアミン/カルボン酸である。2つの構成要素の反応は、結合要素と結合パートナーとをアミド結合によって結合させる。代替的に、結合要素及び結合パートナーは、2つのクリック化学パートナー(例えば、トリアゾール結合を形成するように反応するアジド/アルキン)であってもよい。
いくつかの実施形態では、付着ポリヌクレオチドは、ユニバーサル配列、スペーサ領域、アンカー配列、又はインデックスタグ配列、又はこれらの組み合わせなどの追加の配列又は構成要素を更に含む。ユニバーサル配列は、2つ以上の核酸断片に共通のヌクレオチド配列の領域である。任意選択で、2つ以上の核酸断片はまた、配列差の領域を有する。複数の核酸断片の異なるメンバーにおいて存在し得るユニバーサル配列は、ユニバーサル配列に相補的である単一のユニバーサルプライマーを使用して、複数の異なる配列の複製又は増幅を可能にすることができる。
トランスポザーゼ、トランスポゾン、及び付着ポリヌクレオチドを含む、トランスポソーム複合体の変異が実現され得る。例えば、構成、デザイン、ハイブリダイゼーション、構造要素、及びトランスポソーム複合体の全体的な配置の変異が実現され得る。本明細書で提供される開示及び図面はいくつかのバリエーションを提供するが、本開示の範囲内の更なる変異が容易に実現され得ることが理解される。
いくつかの実施形態では、ポリヌクレオチドを生成するために使用される1つ以上のライブラリー産物は、ビーズベースのタグメンテーションによって生成される。いくつかの実施形態では、ポリヌクレオチドを生成するために使用される1つ以上のライブラリー産物は、溶液ベースのタグメンテーションによって生成される。
B.Truseq法
フォーク型アダプターに基づく技術は、例えば、Truseq試料調製キット(Illumina,Inc.)のワークフローにおいて例示されるような、ポリヌクレオチドを生成するために利用することができる。図10、図12及び図13は、Truseq法を用いてHYB又はHYB’配列を含むライブラリー産物を作製するための種々のアプローチを示す。
フォーク型アダプターに基づく技術は、例えば、Truseq試料調製キット(Illumina,Inc.)のワークフローにおいて例示されるような、ポリヌクレオチドを生成するために利用することができる。図10、図12及び図13は、Truseq法を用いてHYB又はHYB’配列を含むライブラリー産物を作製するための種々のアプローチを示す。
いくつかの実施形態では、アダプター組成物又はキットは、第1のフォーク型アダプター複合体と、第2のフォーク型アダプター複合体と、を含む、アダプター組成物又はキットであって、第1のフォーク型アダプター複合体は、相補付着ポリヌクレオチドであって、相補付着配列を含む5’部分と、アダプターを含む3’部分と、を含む、相補付着ポリヌクレオチドと、ハイブリダイゼーションポリヌクレオチドであって、(a)アダプターの一部の相補体を含み、それにハイブリダイズする5’部分と、(b)ハイブリダイゼーション配列の相補体であって、ハイブリダイゼーション配列の相補体は、相補付着ポリヌクレオチドに相補的ではない、ハイブリダイゼーション配列の相補体と、を含む、ハイブリダイゼーションポリヌクレオチドと、を含み、第2のフォーク型アダプター複合体は、付着ポリヌクレオチドであって、付着配列を含む5’部分と、アダプターを含む3’部分と、を含む、付着ポリヌクレオチドと、ハイブリダイゼーションポリヌクレオチドであって、(a)アダプターの一部の相補体を含み、それにハイブリダイズする5’部分と、(b)ハイブリダイゼーション配列であって、付着ポリヌクレオチドに相補的ではない、ハイブリダイゼーション配列と、を含む、ハイブリダイゼーションポリヌクレオチドと、を含む。
いくつかの実施形態では、付着配列は、P5プライマー配列を含み、相補付着配列は、P7プライマー配列を含む。
いくつかの実施形態では、相補付着ポリヌクレオチドは、B15配列を含み、ハイブリダイゼーションポリヌクレオチドは、A14配列を含む。
いくつかの実施形態では、第1のフォーク型アダプター複合体は、次の構造を有する。
いくつかの実施形態では、第2のフォーク型アダプター複合体は、次の構造を有する。
いくつかの実施形態では、アダプター複合体は、メチル化ヌクレオチドを含む(例えば、メチル化シトシンを含む)。
C.ライゲーションを含む方法
いくつかの実施形態では、ポリヌクレオチドのライブラリーは、各ポリヌクレオチドがアダプター配列によって分離された2つのインサートを含有するように(図18~図19)、ライゲーション工程を含む方法(図15A~図15F)によって調製される。各出発ポリヌクレオチドは、1つのインサートを有する。2つ以上のライブラリー由来の出発ポリヌクレオチドを制限酵素で処理して、適合性オーバーハングを有するポリヌクレオチドを生成し、その結果、ポリヌクレオチドを種々の所望の立体配置で一緒に連結して、ポリヌクレオチドの新しいライブラリーを生成し得る。オーバーハングは、フォーク型アダプターハンドルの相補性に起因して生じ得る任意の問題を回避する。いくつかの実施形態では、新しいライブラリーは、2つの出発ライブラリーから調製される。
いくつかの実施形態では、ポリヌクレオチドのライブラリーは、各ポリヌクレオチドがアダプター配列によって分離された2つのインサートを含有するように(図18~図19)、ライゲーション工程を含む方法(図15A~図15F)によって調製される。各出発ポリヌクレオチドは、1つのインサートを有する。2つ以上のライブラリー由来の出発ポリヌクレオチドを制限酵素で処理して、適合性オーバーハングを有するポリヌクレオチドを生成し、その結果、ポリヌクレオチドを種々の所望の立体配置で一緒に連結して、ポリヌクレオチドの新しいライブラリーを生成し得る。オーバーハングは、フォーク型アダプターハンドルの相補性に起因して生じ得る任意の問題を回避する。いくつかの実施形態では、新しいライブラリーは、2つの出発ライブラリーから調製される。
いくつかの実施形態では、オーバーハングは、制限酵素及び制限酵素認識部位を使用して生成される。いくつかの実施形態では、酵素は、II型、IIS型、IIP型、又はIIT型制限酵素である。いくつかの実施形態では、酵素は、BtgZIである。いくつかの実施形態では、酵素は、BgLIIである。いくつかの実施形態では、オーバーハングは、リガーゼを使用して一緒にライゲーションされる。
いくつかの実施形態では、ポリヌクレオチドは、ビオチンなどの結合要素に結合される。いくつかの実施形態では、ポリヌクレオチドの消化された末端は、ストレプトアビジン磁気ビーズなどの結合パートナーを適用することによって除去される。
図15A~図15Fは、タンデムインサートライブラリーを調製する例示的なライゲーション方法を示す。いくつかの実施形態では、タンデムインサートライブラリーは、複数のリードを使用して配列決定される。いくつかの実施形態では、リード1及びリード4は、第1のインサート由来のペアエンドデータを与える。いくつかの実施形態では、リード2及びリード3は、第2のインサート由来のペアエンドデータを与える。
いくつかの実施形態では、フォーク型アダプターは、異なる末端を有するポリヌクレオチドを生成するために使用されるインサートにライゲーションされる(図16A~図16B)。いくつかの実施形態では、第1のライブラリーのためのフォーク型アダプターは、(1)その第1の鎖上にP5及びリード1、並びに(2)その第2の鎖上にBtzI制限酵素認識部位を含む。いくつかの実施形態では、第2のライブラリーのためのフォーク型アダプターは、(1)その第1の鎖上にP7及びリード2、並びに(2)その第2の鎖上にBglII制限酵素認識部位を含む。いくつかの実施形態では、プライマー伸長を使用して、各ポリヌクレオチドの全長に沿って二本鎖である、すなわち、フォーク型立体配置を有さないポリヌクレオチドを生成する(図16A~図16B)。
D.鎖オーバーラップ伸長(SOE)を含む方法
いくつかの実施形態では、ポリヌクレオチドのライブラリーは、各ポリヌクレオチドがアダプター配列によって分離された2つのインサートを含有するように(図17~図18)、鎖オーバーラップ伸長(SOE)を含む方法(図17~18)によって調製される。いくつかの実施形態では、アダプター配列は、1つ以上のプライマー結合配列を含み得るハイブリダイゼーション配列として本明細書において定義される連結配列である。各出発ポリヌクレオチドは、1つのインサートを有する。2つ以上のライブラリー由来の出発ポリヌクレオチドをアダプターと連結する。いくつかの実施形態では、これらのアダプターは、フォーク型アダプター又はY字型アダプターである。フォーク型アダプターは、全ての出発ライブラリーがそのポリヌクレオチドに付着した固有のアダプター配列を有するように設計される。これらのアダプター配列は、ポリヌクレオチドの新しいライブラリーを生成するために、様々な所望の立体配置でアニーリングするための相補的配列を提供する(図17)。いくつかの実施形態では、新しいライブラリーは、2つの出発ライブラリーから調製される。いくつかの実施形態では、新しいライブラリーは、3つ以上の出発ライブラリーから調製される。
いくつかの実施形態では、ポリヌクレオチドのライブラリーは、各ポリヌクレオチドがアダプター配列によって分離された2つのインサートを含有するように(図17~図18)、鎖オーバーラップ伸長(SOE)を含む方法(図17~18)によって調製される。いくつかの実施形態では、アダプター配列は、1つ以上のプライマー結合配列を含み得るハイブリダイゼーション配列として本明細書において定義される連結配列である。各出発ポリヌクレオチドは、1つのインサートを有する。2つ以上のライブラリー由来の出発ポリヌクレオチドをアダプターと連結する。いくつかの実施形態では、これらのアダプターは、フォーク型アダプター又はY字型アダプターである。フォーク型アダプターは、全ての出発ライブラリーがそのポリヌクレオチドに付着した固有のアダプター配列を有するように設計される。これらのアダプター配列は、ポリヌクレオチドの新しいライブラリーを生成するために、様々な所望の立体配置でアニーリングするための相補的配列を提供する(図17)。いくつかの実施形態では、新しいライブラリーは、2つの出発ライブラリーから調製される。いくつかの実施形態では、新しいライブラリーは、3つ以上の出発ライブラリーから調製される。
例えば、第1のライブラリーは、一方の末端に第1のアダプター配列を有し、他方の末端に第2のアダプター配列を有するポリヌクレオチドを含む。これらの実施形態では、第1又は第2のアダプター配列は、第2のライブラリー中の第3のアダプター配列の3’末端配列に相補的な3’配列を有する。変性及び再アニーリングによる2つのライブラリーの混合は、両方のライブラリー由来の相補的末端のハイブリダイズを可能にする。これらの実施形態では、ポリメラーゼ伸長反応は、相補的領域を完全長まで伸長し、したがって、二重インサートポリヌクレオチドを生成する。
図17~図18は、タンデムインサートライブラリーを調製する例示的なSOE法を示す。いくつかの実施形態では、出発ライブラリーDNAを剪断し、DNA断片を生成する。ポリメラーゼを用いて、損傷したDNA末端を除去し、並びにDNA鎖を伸長して平滑末端二重鎖を生成する。キナーゼを用いて、DNA鎖の5’-ヒドロキシルをリン酸化する。次いで、ポリメラーゼを使用して、各二重鎖の3’末端に単一のアデニン塩基を付加する。このアデニンオーバーハング(図17の「Aテール」)により、DNA断片の各末端は、アダプターの単一のチミンオーバーハングにライゲーションされ得る。DNA断片をアダプターとライゲーションした後、ライブラリーを精製して、150~200塩基対断片について選択し、混合して、PCR反応のために調製する。DNA鎖は高温で変性し、低温で再アニールする。これにより、A及びA’相補的アダプター配列が互いにハイブリダイズすることを可能にする。次いで、PCR反応におけるポリメラーゼにより鎖を伸長して、タンデムインサートポリヌクレオチドを形成する。
多くの実施形態では、アダプターは、様々な組合せで様々な配列を含み得る。いくつかの実施形態では、アダプターは、P5、リード1、タグ、及び/又はA配列を含み得るフォーク型アダプターである。いくつかの実施形態では、アダプターは、P7、インデックス、リード2、タグ、及び/又はA’配列を含み得るフォーク型アダプターである。
いくつかの実施形態では、タンデムインサートライブラリーは、複数のリードを使用して配列決定される。いくつかの実施形態では、リード1及びリード4は、第1のインサート由来のペアエンドデータを与える。いくつかの実施形態では、リード2及びリード3は、第2のインサート由来のペアエンドデータを与える。
IV.連結された核酸配列決定鋳型を生成する方法
本出願はまた、連結された核酸配列決定鋳型を生成する方法を開示する。複数のインサート配列を、連結された核酸配列決定鋳型から配列決定することができる。言い換えれば、連結された核酸配列決定鋳型は、タンデムリードの生成に使用できる。
本出願はまた、連結された核酸配列決定鋳型を生成する方法を開示する。複数のインサート配列を、連結された核酸配列決定鋳型から配列決定することができる。言い換えれば、連結された核酸配列決定鋳型は、タンデムリードの生成に使用できる。
いくつかの実施形態では、連結された核酸配列決定鋳型は、ハイブリダイズした付加物の形成によって生成される。本明細書中で使用される場合、「ハイブリダイズした付加物」とは、ハイブリダイゼーション配列の相補体にアニールされたハイブリダイゼーション配列をいう。いくつかの実施形態では、完全二本鎖の連結された核酸配列決定鋳型は、ハイブリダイズした付加物の形成後に生成される。
いくつかの実施形態では、連結された核酸配列決定鋳型を生成する方法は、第1のリードプライマー結合配列を、第1の標的核酸に由来する第1のインサート配列の3’末端に付着させることと、第1のインサート配列の5’末端にハイブリダイゼーション配列を付着させることと、ハイブリダイゼーション配列の相補体を、第1の標的核酸の不連続領域又は第2の標的核酸に由来する第2のインサート配列の3’末端に付着させることと、ハイブリダイゼーション配列をハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することと、を含み、第1のインサート配列と第2のインサート配列との間の領域は、第2のリードプライマー結合配列であって、ハイブリダイゼーション配列を含み、第1のリードプライマー結合配列に直交する、第2のリードプライマー結合配列を含み、それにより、連結された核酸配列決定鋳型を生成する。
いくつかの実施形態では、第1のリードプライマー結合配列を付着させること及びハイブリダイゼーション配列を付着させることは、タグメンテーションに適した条件下で、1つ以上の標的核酸をトランスポソーム複合体と接触させることを含む。
いくつかの実施形態では、ハイブリダイゼーション配列の相補体を、第1の標的核酸の不連続領域又は第2の標的核酸に由来する第2のインサート配列の3’末端に付着させることは、タグメンテーションに適した条件下で、1つ以上の標的核酸をトランスポソーム複合体と接触させることを含む。
いくつかの実施形態では、第1のリードプライマー結合配列を第1のインサート配列の3’末端に付着させること及びハイブリダイゼーション配列を第1のインサート配列の5’末端に付着させることは、アダプター複合体の断片の末端へのライゲーションに適した条件下で、1つ以上の標的核酸を第1のフォーク型アダプター複合体と接触させて、両端で第1のアダプター複合体とライゲーションした断片及び両端で第2のアダプター複合体とライゲーションした断片を形成し、ライゲーションした断片を変性させることを含む。
いくつかの実施形態では、ハイブリダイゼーション配列の相補体を第2のインサート配列の3’末端に付着させることは、アダプター複合体の断片の末端へのライゲーションに適した条件下で、1つ以上の標的核酸を第2のフォーク型アダプター複合体と接触させて、両端で第1のアダプター複合体とライゲーションした断片及び両端で第2のアダプター複合体とライゲーションした断片を形成し、ライゲーションした断片を変性させることを含む。
いくつかの実施形態では、連結された核酸配列決定鋳型を生成する方法は、第1の標的核酸を含む第1の試料を第1のトランスポソーム複合体及び第2のトランスポソーム複合体と接触させることであって、各トランスポソーム複合体は、
トランスポザーゼと、
トランスポゾン末端配列を含む3’部分及びアダプター配列を含む5’部分を含む、第1のトランスポゾンと、
トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
第1のトランスポソーム複合体中のアダプター配列は、第1のアダプター配列の相補体であり、第2のトランスポソーム複合体中のアダプター配列は、第2のアダプター配列であり、
第1の標的核酸を断片化して、一方の末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされ、他方の末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第1のタグ付き生成物の3’末端に相補付着配列を付加し、第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、
第2の標的核酸を含む第2の試料をトランスポソーム複合体と接触させることであって、第2の標的核酸を断片化して、一方の末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされ、他方の末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第2のタグ付き生成物の3’末端に付着配列を付加し、第2のタグ付き生成物の5’末端にハイブリダイゼーション配列を付加して、第2の修飾されたタグ付き生成物を形成することと、
第1の修飾されたタグ付き生成物のハイブリダイゼーション配列を第2の修飾されたタグ付き生成物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、連結された核酸配列決定鋳型は、
(a)第2の標的核酸由来のインサート配列の3’側にある、第1のリードプライマー結合配列であって、第1のアダプター配列と、トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、
(b)2つのインサート配列の間にある第2のリードプライマー結合配列であって、トランスポゾン末端配列と、ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、
第1のリードプライマー結合配列は、第2のリードプライマー結合配列に直交する、ことと、を含む。
トランスポザーゼと、
トランスポゾン末端配列を含む3’部分及びアダプター配列を含む5’部分を含む、第1のトランスポゾンと、
トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
第1のトランスポソーム複合体中のアダプター配列は、第1のアダプター配列の相補体であり、第2のトランスポソーム複合体中のアダプター配列は、第2のアダプター配列であり、
第1の標的核酸を断片化して、一方の末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされ、他方の末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第1のタグ付き生成物の3’末端に相補付着配列を付加し、第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、
第2の標的核酸を含む第2の試料をトランスポソーム複合体と接触させることであって、第2の標的核酸を断片化して、一方の末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされ、他方の末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第2のタグ付き生成物の3’末端に付着配列を付加し、第2のタグ付き生成物の5’末端にハイブリダイゼーション配列を付加して、第2の修飾されたタグ付き生成物を形成することと、
第1の修飾されたタグ付き生成物のハイブリダイゼーション配列を第2の修飾されたタグ付き生成物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、連結された核酸配列決定鋳型は、
(a)第2の標的核酸由来のインサート配列の3’側にある、第1のリードプライマー結合配列であって、第1のアダプター配列と、トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、
(b)2つのインサート配列の間にある第2のリードプライマー結合配列であって、トランスポゾン末端配列と、ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、
第1のリードプライマー結合配列は、第2のリードプライマー結合配列に直交する、ことと、を含む。
いくつかの実施形態では、連結された核酸配列決定鋳型を生成する方法は、
第1の標的核酸を含む第1の試料を第1のトランスポソーム複合体と接触させることであって、第1のトランスポソーム複合体は、
トランスポザーゼと、
トランスポゾン末端配列を含む3’部分と、付着配列及び第1のアダプター配列の相補体を含む5’部分と、を含む、第1のトランスポゾンと、
トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
第1の標的核酸を断片化して、各末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされた、第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、
第2の標的核酸を含む第2の試料を第2のトランスポソーム複合体と接触させることであって、第2のトランスポソーム複合体は、
トランスポザーゼと、
トランスポゾン末端配列を含む3’部分と、第2のアダプター配列及び相補付着配列を含む5’部分と、を含む、第1のトランスポゾンと、
トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
第2の標的核酸を断片化して、各末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第2のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第2の修飾されたタグ付き生成物を形成することと、
第1の修飾されたタグ付き生成物のハイブリダイゼーション配列を第2の修飾されたタグ付き生成物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、連結された核酸配列決定鋳型は、
(a)第2の標的核酸由来のインサート配列の3’側にある、第1のリードプライマー結合配列であって、第1のアダプター配列と、トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、
(b)2つのインサート配列の間にある第2のリードプライマー結合配列であって、トランスポゾン末端配列と、ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、
第1のリードプライマー結合配列は、第2のリードプライマー結合配列に直交する、ことと、を含む。
第1の標的核酸を含む第1の試料を第1のトランスポソーム複合体と接触させることであって、第1のトランスポソーム複合体は、
トランスポザーゼと、
トランスポゾン末端配列を含む3’部分と、付着配列及び第1のアダプター配列の相補体を含む5’部分と、を含む、第1のトランスポゾンと、
トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
第1の標的核酸を断片化して、各末端が第1のトランスポソーム複合体のトランスポゾンでタグ付けされた、第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、
第2の標的核酸を含む第2の試料を第2のトランスポソーム複合体と接触させることであって、第2のトランスポソーム複合体は、
トランスポザーゼと、
トランスポゾン末端配列を含む3’部分と、第2のアダプター配列及び相補付着配列を含む5’部分と、を含む、第1のトランスポゾンと、
トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
第2の標的核酸を断片化して、各末端が第2のトランスポソーム複合体のトランスポゾンでタグ付けされた、第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
任意選択的にポリメラーゼ連鎖反応によって、第2のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第2の修飾されたタグ付き生成物を形成することと、
第1の修飾されたタグ付き生成物のハイブリダイゼーション配列を第2の修飾されたタグ付き生成物中のハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、連結された核酸配列決定鋳型は、
(a)第2の標的核酸由来のインサート配列の3’側にある、第1のリードプライマー結合配列であって、第1のアダプター配列と、トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、
(b)2つのインサート配列の間にある第2のリードプライマー結合配列であって、トランスポゾン末端配列と、ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、
第1のリードプライマー結合配列は、第2のリードプライマー結合配列に直交する、ことと、を含む。
いくつかの実施形態では、トランスポソーム複合体は、固体支持体上に固定されている。
V.フォーク型アダプターを用いて配列決定鋳型を調製する方法
いくつかの実施形態では、フォーク型アダプターを使用して、2つ以上のインサートを含む配列決定鋳型を調製することができる。
いくつかの実施形態では、フォーク型アダプターを使用して、2つ以上のインサートを含む配列決定鋳型を調製することができる。
いくつかの実施形態では、アダプターは、Y字型アダプターとしても知られるフォーク型アダプターであってもよい。フォーク型アダプターに基づく技術は、例えば、Truseq(商標)試料調製キット(Illumina,Inc.)のワークフローにおいて例示されるような、ポリヌクレオチドを生成するために利用することができる。また、TruSight(登録商標)Oncologyキット(Illumina,Inc.)のワークフローの試薬を使用して、フォーク型アダプターをアセンブルすることもできる。いくつかの実施形態では、フォーク型アダプターは、HYB又はHYB’配列を含む。
本明細書で使用される場合、「フォーク型アダプター」は、核酸の2つの鎖を含むアダプターを指し、2つの鎖はそれぞれ、他方の鎖に相補的である領域及び他方の鎖に相補的ではない領域を含む。いくつかの実施形態では、フォーク型アダプター中の2つの鎖の核酸は、ライゲーションの前に一緒にアニーリングされ、アニーリングは、相補的領域に基づく。いくつかの実施形態では、相補的領域は、それぞれ12ヌクレオチドを含む。いくつかの実施形態では、フォーク型アダプターは、二本鎖DNA断片の末端で両方の鎖にライゲーションされる。いくつかの実施形態では、フォーク型アダプターは、二本鎖DNA断片の一方の末端にライゲーションされる。いくつかの実施形態では、フォーク型アダプターは、二本鎖DNA断片の両端にライゲーションされる。いくつかの実施形態では、断片の対向する末端上のフォーク型アダプターは異なる(図27Aに示される)。いくつかの実施形態では、フォーク型アダプターの一方の鎖は、断片へのライゲーションを促進するために、その5’でリン酸化される。いくつかの実施形態では、フォーク型アダプターの一方の鎖は、3’Tの直前にホスホロチオエート結合を有する。いくつかの実施形態では、3’Tはオーバーハングである(すなわち、フォーク型アダプターの他方の鎖中のヌクレオチドと対形成していない)。いくつかの実施形態では、3’Tオーバーハングは、ライブラリー断片上に存在するAテールと塩基対を形成することができる。いくつかの実施形態では、ホスホロチオエート結合は、3’Tオーバーハングのエキソヌクレアーゼ消化をブロックする。
いくつかの実施形態では、各フォーク型アダプターは、互いに部分的にハイブリダイズして二本鎖セクション及び一本鎖セクションを形成する第1のオリゴヌクレオチド及び第2のオリゴヌクレオチドを含む。
図25は、配列決定鋳型を調製するために使用され得る一対のフォーク型アダプター(すなわち、第1のアダプター及び第2のアダプター)を示す。いくつかの実施形態では、各フォーク型アダプターの第1の鎖は、配列決定プライマー配列などのアダプターを含む。いくつかの実施形態では、各フォーク型アダプターの第2の鎖は、ハイブリダイゼーション配列(X)又はハイブリダイゼーション配列の相補体(X’)のいずれかを含む。
ハイブリダイゼーション配列(X)及びその相補体(X’)が望ましくない時間に互いに結合するのをブロックするために、ブロッキングオリゴヌクレオチドを用いることができる。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、それらがタグメンテーションの標的にならないように、1つ以上の修飾を含む。言い換えれば、ブロッキングオリゴヌクレオチドは、トランスポザーゼに耐性であり、したがって、ブロッキングオリゴヌクレオチドのハイブリダイゼーション配列又はその相補体へのハイブリダイゼーションによって形成される二本鎖核酸の開裂を回避するように設計することができる。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、ホスホロチオエート骨格を含む。
いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、ハイブリダイズをブロックしたい配列の全部又は一部の相補体を含む。したがって、いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、X又はX’配列の全て又は一部であり得る。本明細書中で使用される場合、「ブロッキングオリゴヌクレオチド」とは、2つの配列の少なくとも1つに結合したブロッキングオリゴヌクレオチドが除去されるまで、2つの配列の互いへの結合を阻害するために使用され得るオリゴヌクレオチドをいう。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、ハイブリダイゼーション配列(X又はHYB)又はその相補体(X’又はHYB’)のいずれかの全部又は一部に完全に又は部分的に相補的な配列を含む。例えば、HYB配列(図25のX)をブロックするためのブロッキングオリゴヌクレオチド(X’B’)は、HYB’配列の全部又は一部を含んでもよく、HYB’配列(図25のX’)をブロックするためのブロッキングオリゴヌクレオチド(XB)は、HYB配列の全部又は一部を含んでもよい。
図26に示されるフォーク型アダプターの場合、1つ以上のブロッキングオリゴヌクレオチドは、一方のフォーク型アダプター中のX配列の、他方のフォーク型アダプター中のX’配列への結合をブロックするように働き得る。
いくつかの実施形態では、ブロッキングオリゴヌクレオチド(XB)は、X’配列に結合する。いくつかの実施形態では、ブロッキングオリゴヌクレオチド(X’B’)は、X配列に結合する。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、X配列及びX’配列の両方に結合する。ブロッキングオリゴヌクレオチドは、X配列又はX’配列のいずれかに完全に又は部分的に相補的であり得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、完全なX又はX’配列に結合する。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、X又はX’配列の一部に結合する。
一方又は両方のフォーク型アダプターはまた、フォーク型アダプターの第1の鎖の5’末端上に親和性部分を含み得る。図26に示されるものなどのいくつかの実施形態では、第1のフォーク型アダプターの第1の鎖及び第2のフォーク型アダプターの第1の鎖の両方が、鎖の5’末端に親和性部分を含む。いくつかの実施形態では、親和性部分は、ビオチン、デスチオビオチン、又はデュアルビオチンである。いくつかの実施形態では、親和性部分は、ビオチンである(すなわち、一方又は両方のフォーク型アダプターの第1の鎖がビオチン化されている)。いくつかの実施形態では、親和性部分は、固体支持体の表面上の結合部分に結合する。いくつかの実施形態では、結合部分は、固体支持体の表面上のアビジン又はストレプトアビジンに結合するアビジン又はストレプトアビジンである。結合部分に結合できる親和性部分の範囲は、当業者に既知であり、ユーザーは、選択した親和性/結合部分の任意の対を選択することができる。
いくつかの実施形態では、結合部分は、タグ付けされた断片(フォーク型アダプターの断片へのライゲーションによって調製される)を固体支持体上に固定化する働きをする。いくつかの実施形態では、フォーク型アダプターの少なくとも1つの第1の鎖にライゲーションされた一本鎖断片は、固体支持体上に固定されている。いくつかの実施形態では、固定された断片を洗浄でき、ブロッキングオリゴヌクレオチドを、断片が固体支持体の表面から遊離されることなく除去できる。
いくつかの実施形態では、フォーク型アダプターの第1の鎖は、固体支持体又はビーズ上の親和性結合パートナーに結合できる5’親和性エレメントを含む。そのような親和性エレメントは、図25に示される第1及び第2のアダプター中の「Bio」によって示されるように、ビオチンであり得る。
いくつかの実施形態では、親和性エレメントは、第1の鎖に付着したリンカーを介して接続されている。いくつかの実施形態では、このリンカーは、開裂可能なリンカーである。
いくつかの実施形態では、親和性部分は、リンカーによってフォーク型アダプターの第1の鎖に連結される。いくつかの実施形態では、リンカーは、開裂可能なリンカーである。いくつかの実施形態では、ユーザーは、親和性部分とフォーク型アダプターの第1の鎖との間の開裂可能なリンカーを開裂することによって、所望の時間に固定された断片から調製された配列決定鋳型を固体支持体から遊離することができる。いくつかの実施形態では、配列決定鋳型のアンプリコンは、固体支持体の表面上で調製され得、この場合、アンプリコンは、表面から配列決定鋳型の遊離を必要とせずに配列決定され得る。
いくつかの実施形態では、ハイブリダイゼーション配列(HYB)及びハイブリダイゼーション配列の相補体(HYB’)は、互いにハイブリダイズすることができる。しかしながら、いくつかの場合において、これは、1つのフォーク型アダプターにおけるHYBの別のフォーク型アダプターにおけるHYB’への結合に基づいて、異なるフォーク型アダプター間のダイマー化を潜在的にもたらし得る。このようなアダプターダイマー化は、フォーク型アダプターを核酸断片の末端にライゲーションする能力を低下させる可能性がある。
いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、ユーザーがこの結合が起こることを望むまで、異なるフォーク型アダプター間のHYBのHYB’への結合をブロックするために使用される。いくつかの実施形態では、ハイブリダイゼーション配列又はその相補体は、ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合している。
図26A~26Cは、様々な異なるフォーク型アダプターの実施形態を示す。ブロッキングオリゴヌクレオチドは、第1及び第2のフォーク型アダプターの両方の第2の鎖に結合され得る(図26A)。あるいは、ブロッキングオリゴヌクレオチドは、第1のフォーク型アダプターの第2の鎖のみ(図26B)、又は第2のフォーク型アダプターの第2の鎖のみに結合され得る。ハイブリダイゼーション配列(X)又はハイブリダイゼーション配列の相補体(X’)のいずれかがブロッキングオリゴヌクレオチドによって結合される限り、ブロッキングオリゴヌクレオチドは、XのX’への会合を介する、フォーク型アダプターの互いへのアニーリングをブロックする。図26Dに示されるように、溶液中のトランスポソーム複合体を用いて同様の方法を実施することができる。
いくつかの実施形態では、2つのポリヌクレオチド鎖を含むフォーク型アダプターは、(a)配列決定プライマー配列を含む第1の鎖と、(b)3’ハイブリダイゼーション配列又はその相補体を含む第2の鎖と、を含み、第1の鎖の3’末端は、第2の鎖の5’末端に完全に又は部分的に相補的である。言い換えれば、フォーク型アダプターの2つの鎖は、特定の領域において一緒にハイブリダイズすることができ、一方、2つの鎖は別の領域において分離している。第1及び第2の鎖の配列は、2つの鎖が分離している領域において異なるか、又は全て若しくは部分的に非相補的であってもよいが、第1及び第2の鎖は、同じであり、2つの鎖が一緒にハイブリダイズしている領域において、完全に若しくは部分的に相補的であってもよい。
当該技術分野で周知であるように、UMI及び試料インデックスなどの目的とする更なる配列は、フォーク型アダプターに含まれ得る。言い換えれば、フォーク型アダプターは、図25に示される配列のタイプに限定されないが、フォーク型アダプターは、UMI又は試料インデックスなどの1つ以上の更なるタイプの配列を含み得る。
いくつかの実施形態では、第1の鎖及び/又は第2の鎖は、アダプター、バーコード配列、固有分子識別子(UMI)配列、試料インデックス配列、捕捉配列、又は開裂配列のうちの少なくとも1つを更に含む。
いくつかの実施形態では、フォーク型アダプターの第1の鎖に含まれる配列決定プライマー配列は、B15配列若しくはA14配列、又はそれらの相補体を含む。いくつかの実施形態では、フォーク型アダプターの第1の鎖は、P7若しくはP5プライマー配列、又はそれらの相補体を更に含む。そのような実施形態は図25に示されており、第1のアダプターの第1の鎖は、P5配列及び第1のリード配列決定アダプター配列(P5.R1)を含み、第2のアダプターの第1の鎖は、P7配列及び第2のリード配列決定アダプター配列(P7.R2)を含む。
いくつかの実施形態では、フォーク型アダプターは、別の非同一のフォーク型アダプターとの混合物に含まれる。いくつかの実施形態では、混合物は、異なる第1のフォーク型アダプター及び第2のフォーク型アダプターを含む。
いくつかの実施形態では、組成物又はキットは2つのフォーク型アダプターを含み、(a)第1のフォーク型アダプターが、第1のリード配列決定プライマー配列を含む第1の鎖と、ハイブリダイゼーション配列の相補体を含む第2の鎖と、を含み、(b)第2のフォーク型アダプターが、第2のリード配列決定プライマー配列を含む第1の鎖と、ハイブリダイゼーション配列を含む第2の鎖と、を含む。いくつかの実施形態では、キット又は組成物に含まれる一方又は両方のフォーク型アダプターは、ブロッキングオリゴヌクレオチドを含む。
フォーク型アダプターの混合物は、二本鎖核酸断片にライゲーションされ得る。これらの断片は、当該技術分野で周知の技術、例えば、音響、噴霧、遠心力、ニードル、又は流体力学を使用する物理的手段を使用して、DNA(例えば、ゲノムDNA又はRNAから調製されたcDNA)から調製され得る。DNase処理などの、断片を調製する酵素的手段も周知である。
第1のフォーク型アダプター及び第2のフォーク型アダプターを含む混合物が、ライゲーションのための条件下で二本鎖核酸断片と組み合わされる場合、予測される比は、断片の50%が、一方の末端の第1のフォーク型アダプター、及び第2の末端の第2のフォーク型アダプターでタグ付けされ(図27A)、断片の25%が、両方の末端の第1のフォーク型アダプターでタグ付けされ(図27B)、断片の25%が、両方の末端の第2のフォーク型アダプターでタグ付けされる(図27C)。いくつかの実施形態では、図27A~27Cに示されるライゲーション産物は、溶液中で調製されるライゲーション反応によって生成され得る。言い換えれば、図27A~27Cに示されるタグ付けされた断片は、溶液中で調製され得る。
いくつかの実施形態では、フォーク型アダプターのライゲーションによって溶液中で調製されたタグ付けされた断片は、次いで、固体支持体の表面上に固定化され得る。
いくつかの実施形態では、1つ以上の連結された核酸配列決定鋳型を生成する方法は、標的核酸から調製されたインサートをそれぞれ含む二本鎖核酸断片を含む試料を、2つのフォーク型アダプターを含む組成物又はキットと接触させることであって、一方又は両方のフォーク型アダプターは、ブロッキングオリゴヌクレオチドを含む、ことを含む。いくつかの実施形態では、試料を2つのフォーク型アダプターと接触させた後、方法は、フォーク型アダプターを二本鎖断片にライゲーションして、タグ付けされた二本鎖断片を調製することと、タグ付けされた二本鎖断片を固体支持体上に固定することとを含む。
いくつかの実施形態では、二本鎖断片は、フォーク型アダプターとのライゲーション後に固体支持体に適用される。いくつかの実施形態では、タグ付けされた二本鎖断片の両方の5’末端の両方は、固体支持体の表面上の結合部分に結合できる親和性部分を含む(親和性部分を含むフォーク型アダプターの第1の鎖のライゲーションに基づく)。いくつかの実施形態では、結合部分への親和性部分の結合により、固体支持体上の断片を固定され、その結果、ハイブリダイゼーション配列又はその相補体に結合したブロッキングオリゴヌクレオチドの遊離を可能にし得る温度変化によって支持体から遊離されない。
固体支持体の表面上に二本鎖断片を固定化した後、方法は、(1)固定された一本鎖断片を生成するために固定されたタグ付けされた二本鎖断片を、及び、(2)ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するためにブロッキングオリゴヌクレオチドを、変性させることを含む。いくつかの実施形態では、変性させることは、温度の上昇、pHの変化、及び/又は1つ以上のカオトロピック剤の添加によって行われる。いくつかの実施形態では、例えば、1回の温度変化は、二本鎖断片の2つの鎖の変性及びブロッキングオリゴヌクレオチドの遊離を媒介し得る。いくつかの実施形態では、変性に関連する温度の上昇は、45℃~55℃から85℃~95℃への上昇であり、任意選択的に、温度の上昇は、50℃~90℃への上昇である。いくつかの実施形態では、1つ以上のカオトロピック剤は、ホルムアミド及び/又はNaOHを含む。
いくつかの実施形態では、第1の一本鎖断片はインサートを含み、第2の一本鎖断片は、第1の断片に含まれるインサートの相補体であるインサートを含む。いくつかの実施形態では、第1の一本鎖断片はインサートを含み、第2の断片は、第1の断片に含まれるインサートの相補体ではないインサートを含む。いくつかの実施形態では、ハイブリダイズすることは、各断片の一方の末端にライゲーションされた第1のフォーク型アダプターと、各断片の他方の末端にライゲーションされた第2のフォーク型アダプターと、を含む、二本鎖断片から調製された一本鎖断片間で起こる。いくつかの実施形態では、2つの固定された一本鎖断片は、第1の断片中のハイブリダイゼーション配列の、第2の断片中のハイブリダイゼーション配列の相補体への結合がない状態で、互いにハイブリダイズして架橋を形成しない。いくつかの実施形態では、2つの固定された一本鎖断片を互いにハイブリダイズして架橋を形成することは、各断片の両端にライゲーションされた同じフォーク型アダプターを含む、二本鎖断片から調製された一本鎖断片間で起こらない。
いくつかの実施形態では、固体支持体の表面は、変性後に洗浄され、ブロッキングオリゴヌクレオチドは洗浄によって除去されるが、一本鎖断片は、固体支持体の表面の結合部分を有する断片上の5’親和性部分間の相互作用に起因して固定されたままである。いくつかの実施形態では、二本鎖又は一本鎖断片の固定化は、第1及び/又は第2のフォーク型アダプター由来の親和性部分の、固体支持体の表面上の1つ以上の結合部分への結合による。いくつかの実施形態では、親和性部分は、ビオチン、デスチオビオチン、又はデュアルビオチンであり、結合部分は、アビジン又はストレプトアビジンである。
一本鎖断片は、固体支持体上の単一表面上に既に固定されている二本鎖断片から調製されるので、二本鎖断片由来の相補的一本鎖断片は、非常に近接している可能性が高い(図28Aに示され、ここでは、固体支持体の左表面及び右表面が同じ表面の異なる図を示す)。ブロッキングオリゴヌクレオチドの変性は、ハイブリダイゼーション配列及びその相補体(図28AにおけるX及びX’)がこの段階で互いに結合するために利用可能であることを意味する。
次に、方法は、2つの固定された一本鎖断片を互いにハイブリダイズさせて、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、両方の一本鎖断片の3’末端から伸長させて、鋳型の各鎖が両方の固定された一本鎖断片由来のインサート(又はその相補体)を含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む(図29に示される)。
いくつかの実施形態では、第1の末端で第1のフォーク型アダプターの第1の鎖(例えば、図25に示される)及び第2のフォーク型アダプターの第2の鎖とライゲーションされた二本鎖断片から調製された一本鎖断片は、第1の断片中のハイブリダイゼーション配列(X)の、第2の断片中のハイブリダイゼーション配列の相補体(X’)への会合によって、第1の末端で第1のフォーク型アダプターの第1の鎖及び第2のフォーク型アダプターの第2の鎖とライゲーションされた二本鎖断片から調製された別の一本鎖断片に結合することができる(図28A)。
いくつかの実施形態では、変性、ハイブリダイズ及び伸長の1回以上の更なる工程が実施される。このようにして、方法は、一本鎖断片が、HYB/HYB’結合を介して架橋(及び連結された配列決定鋳型)を形成する適切な他の一本鎖断片がなくなるまで、配列決定鋳型の作製を進行できる。
いくつかの実施形態では、二本鎖断片から調製された両方の一本鎖断片は、同じ固体支持体の表面上に固定されている。いくつかの実施形態では、方法は、固体支持体上の単一の表面を用いて行われ、その結果、全ての断片が同じ固体支持体上に固定される。図28A~28Cに提示される左及び右の表面(第1及び第2の断片が付着して示される)は、固体支持体上の同じ表面の2つの異なる図を表す。
いくつかの実施形態では、ブロッキングオリゴヌクレオチドの遊離は、それらの相補配列に結合できる「遊離」ハイブリダイゼーション配列を生成する。いくつかの実施形態では、1つの一本鎖断片に含まれるハイブリダイゼーション配列は、別の一本鎖断片中のハイブリダイゼーション配列の相補体に結合し得る。そのような結合は、図28Aに示されるような「架橋」を生成し得る。
伸長後、連結された配列決定鋳型は、図29に示されるように、互いのコピーである2つのインサートを含み得る。
同一のライゲーションされたアダプターを有する一本鎖断片は、互いにハイブリダイズすることができない。例えば、X’でタグ付けされた2つの断片は、ハイブリダイゼーション配列において互いに対形成することができず(図28B)、Xでタグ付けされた2つの断片は、ハイブリダイゼーション配列において互いに対形成することができない(図28C)。したがって、2つのインサートを含む配列決定鋳型を、同じアダプターを含む断片から調製することができない(図28B及び図28Cに示される0%によって示される)。2つのインサート配列は互いにハイブリダイズすることができるが(図28A~28Cの鎖A及び鎖A’の配列)、鎖Aと鎖A’との間のそのような対形成の後に相補的ではない3’配列(X/X’)が続くため、これらの配列間の直接的なハイブリダイゼーションにより、ハイブリダイズ後の伸長が不可能になる。
このようにして、2つのコピーのインサートを含む配列決定鋳型の100%が、異なるアダプターを含む断片から調製される(図28A)。第1のフォーク型アダプターは、第2のフォーク型アダプターとは異なる配列を含み得るので、この態様は重要である。例えば、図28Aに示されるように、第1のフォーク型アダプターは、第1のリード配列決定アダプター配列(P5.R1)を含んでもよく、第2のフォーク型アダプターは、第2のリード配列決定アダプター配列(P7.R2)を含んでもよい。
したがって、図29に示されるように、同じインサート配列の2つのコピーと所望の配列決定プラットフォームに必要とされ得る適切なアダプターとを含む全長の連結された配列決定鋳型を、伸長後に調製することができる。言い換えれば、当業者は、結果として生じる配列決定鋳型が、好ましい配列決定プラットフォームのための所望のアダプター配列を含むように、フォーク型アダプターを設計することができる。
二本鎖断片は、最初に固体支持体上に固定化され、次いで変性されるので、同じ二本鎖断片から変性された2つの一本鎖断片は、表面上で互いに近接して固定されている可能性が高い。この工程の順序は、同じ二本鎖断片由来の2つの一本鎖断片(図28Aに示されるように、一方の断片が鎖A配列を含み、他方の断片が鎖A’配列を含む)が、互いに相互作用できる可能性が高いことを意味する。この態様は、本発明の方法によって調製される配列決定鋳型が、標的核酸由来の同じ配列の2つのコピー(鎖A由来の1つ及び伸長によって調製される鎖A’の相補体由来の1つ)を含む可能性を増加させる。本明細書に記載されるように、(標的核酸の相補鎖から生じる)同じインサート配列の2つのコピーを有するこの配列決定鋳型は、標的核酸の鎖とアンチセンス鎖との間の塩基対ミスマッチのエラー訂正又は同定を可能にする。このような塩基対ミスマッチはまれである場合があり、そうでなければ標準的な配列決定での解決が困難であり得る。
あるいは、無関係のインサート配列及び相補的アダプターを含む一本鎖断片もまた、ハイブリダイズして架橋を形成し、次いで、連結された配列決定鋳型を生成し得る。2つの異なるインサートを有する連結された配列決定鋳型は、単一のインサートを含む標準的な配列決定鋳型を用いた配列決定と比較して、追加の配列リードを可能にすることによって、シーケンシング深度を増加させるのに役立ち得る。
A.近接データを評価するための区画化の方法
本明細書に記載される任意の方法は、区画化と共に使用され得る。いくつかの実施形態では、区画化は、異なるインサートが同じ標的核酸に含まれたかどうかなど、近接データを生成することを可能にする。同じ標的核酸が染色体である場合、区画化は、本明細書中に記載されるハプロタイプフェージングの方法に使用され得る。
本明細書に記載される任意の方法は、区画化と共に使用され得る。いくつかの実施形態では、区画化は、異なるインサートが同じ標的核酸に含まれたかどうかなど、近接データを生成することを可能にする。同じ標的核酸が染色体である場合、区画化は、本明細書中に記載されるハプロタイプフェージングの方法に使用され得る。
いくつかの実施形態では、区画化は、フォーク型アダプター又はトランスポソームを使用して近接データを評価する本発明の方法と共に使用される。いくつかの実施形態では、区画は、利用可能な標的核酸の数を制限するために希釈して使用されてもよい。いくつかの実施形態では、各区画は、一般に、希釈後に1つの標的核酸を含むか、又は標的核酸を含まない(図31に示す)。したがって、所定の区画において調製された断片は、一般に、同じ標的核酸から調製された断片である。このようにして、これらの方法によって調製された同じ連結された配列決定鋳型に含まれるインサートは、同じ標的核酸に由来したと推測することができる。
いくつかの実施形態では、区画は、ウェル、チューブ、又は液滴である。例えば、図31はウェルを用いる方法を示し、図32は液滴を用いる方法を示す。広範な異なるウェル、チューブ、及び液滴が当業者に既知であり、任意のタイプが本発明の方法において使用され得る。
「液滴」は、液滴アクチュエータ上のある体積の液体を意味する。典型的には、液滴は、充填流体によって少なくとも部分的に結合される。例えば、液滴は、充填流体によって完全に包囲されてもよく、又は充填流体及び液滴アクチュエータの1つ以上の表面に囲まれていてよい。別の例として、液滴は、充填流体、液滴アクチュエータの1つ以上の表面、及び/又は大気によって囲まれていてよい。別の例では、液滴は、充填流体及び大気によって囲まれていてよい。液滴は、例えば、水性若しくは非水性であってもよく、又は水性及び非水性成分を含む混合物若しくはエマルジョンであってもよい。液滴は、多種多様な形状をとることができ、非限定的な例としては、略円盤形、スラグ形、切頭球形、楕円形、球形、部分的に圧縮された球形、半球形、卵形、円筒形、そのような形状の組み合わせ、及び液滴操作中に形成される様々な形状、例えば、合体若しくは分割、又はそのような形状と液滴アクチュエータの1つ以上の表面との接触の結果として形成される様々な形状が挙げられる。本開示のアプローチを使用して液滴操作に供され得る液滴流体の例については、その開示全体が参照により本明細書に組み込まれる、2007年10月25日公開のEckhardtら、国際公開第2007/120241号、表題「Droplet-Based Biochemistry」を参照されたい。米国特許第10,975,371号は、液滴及び液滴アクチュエータの多種多様な用途を教示しており、その全体が本明細書に組み込まれる。
いくつかの実施形態では、断片は、フォーク型アダプターの2つのプールを使用して区画内で調製することができ、一方のプールは、ハイブリダイゼーション配列を含むフォーク型アダプター(すなわち、図25の第2のアダプター)を含み、他方のプールは、ハイブリダイゼーション配列の相補体を含むフォーク型アダプター(すなわち、図25の第1のアダプター)を含む。
いくつかの実施形態では、1つ以上の連結された核酸配列決定鋳型を生成する方法は、標的二本鎖核酸を含む試料を複数の異なる区画に区画化することと、複数の異なる区画内の二本鎖核酸由来のインサートをそれぞれ含む断片を調製することとを含む。次に、方法は、複数の異なる区画を、2つのフォーク型アダプターを含む組成物又はキットと接触させることであって、一方又は両方のフォーク型アダプターが、ブロッキングオリゴヌクレオチドを含む、ことと、フォーク型アダプターを二本鎖断片にライゲーションして、複数の異なる区画内でタグ付けされた二本鎖断片を調製することとを包含し得る。
いくつかの実施形態では、方法は、次に、(1)一本鎖断片を生成するために固定されたタグ付けされた二本鎖断片を、及び、(2)複数の異なる区画内のハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するためにブロッキングオリゴヌクレオチドを、変性させることと、同じ区画内の2つの一本鎖断片を互いにハイブリダイズさせて、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、を含み得る。いくつかの実施形態では、方法は、各一本鎖断片の3’末端から伸長させて、同じ区画内の両方の一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することを含み得る。
いくつかの実施形態では、標的二本鎖核酸は、二本鎖DNA断片を含み、断片を調製することにより、二本鎖DNA断片の小断片を調製する。言い換えれば、標的二本鎖核酸は、比較的大きな断片に断片化されてもよく、これは次に区画内で小断片に断片化される。これは図31及び図32に示され、ここでf1断片は小断片1.1、1.2及び1.3に断片化される。
この方法では一本鎖断片が固定化されないため、2つの異なるインサート配列を含む連結された配列決定鋳型が調製される可能性が高い。いくつかの実施形態では、第1の一本鎖断片はインサートを含み、第2の断片は、第1の断片に含まれるインサートの相補体ではないインサートを含む。
いくつかの実施形態では、ハイブリダイズすることは、各断片の一方の末端にライゲーションされた第1のフォーク型アダプターと、各断片の他方の末端にライゲーションされた第2のフォーク型アダプターと、を含む、二本鎖断片から調製された一本鎖断片間で起こる。
いくつかの実施形態では、一本鎖断片は、第1の断片中のハイブリダイゼーション配列の、第2の断片中のハイブリダイゼーション配列の相補体への結合がない状態で、互いにハイブリダイズして架橋を形成しない。いくつかの実施形態では、2つの一本鎖断片を互いにハイブリダイズして架橋を形成することは、各断片の両端にライゲーションされた同じフォーク型アダプターを含む、二本鎖断片から調製された一本鎖断片間で起こらない。
B.ハプロタイプフェージング
「ハプロタイプフェージング」は、本明細書で使用される場合、同じ染色体上に共存する対立遺伝子を同定することを指す。配列決定データは、一般に、フェージングされていない遺伝子型からなり、このようなデータは、特定の対立遺伝子が2つの親染色体又はハプロタイプのいずれに該当するかを区別することができない。
「ハプロタイプフェージング」は、本明細書で使用される場合、同じ染色体上に共存する対立遺伝子を同定することを指す。配列決定データは、一般に、フェージングされていない遺伝子型からなり、このようなデータは、特定の対立遺伝子が2つの親染色体又はハプロタイプのいずれに該当するかを区別することができない。
区画化の方法(例えば、全ゲノムハプロタイピングの準備に使用するため)は当技術分野で周知であり、例えば、Amini et al.,Nat Genet.46(12):1343-9(2014)、Kaper F,et al.Proc.Natl.Acad.Sci.U S A.110(14):5552-5557(2013)、Kitzman JO,et al.Nat.Biotechnol.29(1):59-63(2011)、Peters BA,et al.Nature.487(7406):190-195(2012)、Fan HC,et al.Nat.Biotechnol.29(1):51-57(2011)、Levy S,et al.PLoS Biol.5(10):e254(2007)、Duitama J,et al.Nucleic Acids Res.40(5):2041-2053(2012)、Suk EK,et al.Genome Res.21(10):1672-1685(2011)に教示されており、各々の全開示内容が、参照により本明細書に組み込まれる。
いくつかの実施形態では、区画化は、異なるハプロタイプを異なる区画に分離し、方法は、ハプロタイプフェージングに使用される。いくつかの実施形態では、二本鎖DNAなどの標的核酸は、限界希釈によって複数の区画に等分され、その結果、個々の区画は、限定された数のDNA分子を含み、それによって、ゲノムの任意の位置が、区画中のハプロイドDNAによって表される可能性が高い。
いくつかの実施形態では、限界希釈は、両方のハプロタイプ(図33におけるChr1-Hap1及びChr2-Hap2など)が同じ区画内にある可能性を低減するが、方法は、単一の染色体のみが区画内に含まれることを必要としない。言い換えれば、希釈は、同じ染色体の2つのハプロイドコピーが同じ区画に含まれる可能性が無視できる程度(例えば、5%未満又は1%未満)であり得るが、区画は、多くの場合、2つ以上の染色体を含み得る(このとき、2つ以上の染色体は、一般的に、同じ染色体のハプロイドコピーではない)。
そのような方法は図33に示されており、ここでは染色体を区画内への限界希釈に供し、続いて一本鎖断片を調製し、次いでハイブリダイゼーション及び伸長を行って個々の区画内で連結された配列決定鋳型を調製する。
図33に示す例では、Chr1-Hap1は、Chr2-Hap1を有する区画に含まれるが、Chr1-Hap2は、Chr2-Hap2を有する区画に含まれる。連結された配列決定鋳型は区画を用いて調製されるため、これらの鋳型は、同じ区画にあった染色体のインサートのみを含むことができる(チェック付き矢印を有するボックスとして示される)。他の組合せ(「X」矢印を有するボックスに示される)は、これらのハプロタイプがこの例において同じ区画に含まれなかったため、形成することができない。
この方法が既知のゲノムを有する生物由来の試料を用いて実施される場合、同じ連結された配列決定鋳型における異なる染色体由来のインサートの存在(これらの異なる染色体は、方法の間に同じ区画に含まれていたため)は、配列決定データから解明され得る。同じ区画にあった染色体を決定するための分析によって、ハプロイドコピーに含まれる対立遺伝子に関する情報を決定することができる。いくつかの実施形態では、方法は、バーコードを必要としない。代わりに、本発明の、区画において調製された連結された配列決定鋳型の使用は、バーコードを必要とすることなく、どのインサート配列がハプロイドコピーに含まれていたかについて、分析を可能にする。
VI.溶液中でトランスポソームを使用して複数のインサートを含む配列決定鋳型を調製する方法
いくつかの実施形態では、タグメンテーションを溶液中で実施して、タグ付けされた二本鎖断片を調製する。これらのタグ付けされた二本鎖断片は、フォーク型アダプターのライゲーションのための上記の方法と同様に、複数のインサートを含む配列決定鋳型を調製するために使用され得る。いくつかの実施形態では、タグ付けされた二本鎖断片は、トランスポソームの2つのプールを使用して溶液中で調製され、次いで、タグ付けされた二本鎖断片は、固体支持体上に固定される。いくつかの実施形態では、固定化は、タグメンテーション中にタグ付けされた断片に組み込まれた親和性部分を、固体支持体上の結合部分に結合させることによって行われる。図26Dは、タグメンテーションを使用して溶液中でタグ付けされた二本鎖断片を調製する実施形態を示し、これらのタグ付けされた二本鎖断片は、フォーク型アダプターを使用する方法について上述したように、連結された配列決定鋳型を調製するために使用できる。
いくつかの実施形態では、タグメンテーションを溶液中で実施して、タグ付けされた二本鎖断片を調製する。これらのタグ付けされた二本鎖断片は、フォーク型アダプターのライゲーションのための上記の方法と同様に、複数のインサートを含む配列決定鋳型を調製するために使用され得る。いくつかの実施形態では、タグ付けされた二本鎖断片は、トランスポソームの2つのプールを使用して溶液中で調製され、次いで、タグ付けされた二本鎖断片は、固体支持体上に固定される。いくつかの実施形態では、固定化は、タグメンテーション中にタグ付けされた断片に組み込まれた親和性部分を、固体支持体上の結合部分に結合させることによって行われる。図26Dは、タグメンテーションを使用して溶液中でタグ付けされた二本鎖断片を調製する実施形態を示し、これらのタグ付けされた二本鎖断片は、フォーク型アダプターを使用する方法について上述したように、連結された配列決定鋳型を調製するために使用できる。
いくつかの実施形態では、1つ以上の連結された核酸配列決定鋳型を生成する方法は、(a)二本鎖標的核酸を含む試料を、溶液中のトランスポソーム複合体の2つのプールと接触させることであって、トランスポソーム複合体の第1のプールは、トランスポザーゼと、3’トランスポゾン末端配列及び第1のリード配列決定アダプター配列を含む第1のトランスポゾンと、3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含み、トランスポソーム複合体の第2のプールは、トランスポザーゼと、3’トランスポゾン末端配列及び第2のリード配列決定アダプター配列を含む第1のトランスポゾンと、3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含む、ことを含む。
いくつかの実施形態では、一方又は両方の第2のトランスポゾンは、ブロッキングオリゴヌクレオチドを含む。そのようなブロッキングオリゴヌクレオチドは、フォーク型アダプターを用いる方法について上述されており、ブロッキングオリゴヌクレオチドは、トランスポソーム複合体の一方のプールに含まれるハイブリダイゼーション配列の、トランスポソーム複合体の他方のプールにおけるハイブリダイゼーション配列の相補体への結合を阻害するために使用され得る。
いくつかの実施形態では、方法は、二本鎖核酸をタグメンテーションして、タグ付けされた二本鎖断片を生成することと、トランスポソーム複合体を二本鎖断片から遊離させることと、二本鎖断片を伸長し、ライゲーションすることと、を含む。
いくつかの実施形態では、タグ付けされた二本鎖断片は、固体支持体上に固定される。いくつかの実施形態では、この固定化は、タグに含まれる5’親和性部分を固体支持体上の結合部分に結合させることによって行われる。
いくつかの実施形態では、方法は、次に、(1)固定された一本鎖断片を生成するために固定されたタグ付けされた二本鎖断片を、及び、(2)ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するためにブロッキングオリゴヌクレオチドを、変性させることを含む。いくつかの実施形態では、変性後、方法は、2つの固定された一本鎖断片を互いにハイブリダイズさせて、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、各一本鎖断片の3’末端から伸長させて、両方の固定された一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む。
いくつかの実施形態では、二本鎖の連結された核酸配列決定鋳型は、インサート配列及びインサート配列のコピーを含む。いくつかの実施形態では、二本鎖の連結された核酸配列決定鋳型は、互いに異なる2つのインサート配列を含む。
1つの一本鎖鋳型中のハイブリダイゼーション配列の、別の一本鎖鋳型中のハイブリダイゼーション配列の相補体へのハイブリダイズ、及び連結された配列決定鋳型を調製するための伸長は、フォーク型アダプター方法について上述されるように実施され得る。本質的に、溶液中でタグ付けされた二本鎖断片が調製されると(フォーク型アダプターのライゲーション又は溶液中のタグメンテーションのいずれかによって)、後の固定化及び架橋調製の工程の後、連結された配列決定鋳型を同様の工程によって実施できる。
いくつかの実施形態では、ハイブリダイズすることは、各断片の一方の末端に第1のトランスポソーム複合体の第2のトランスポゾン由来のタグと、各断片の他方の末端に第2のトランスポソームの第2のトランスポゾン由来のタグとを含む、二本鎖断片から調製された一本鎖断片間で起こる。
いくつかの実施形態では、2つの固定された一本鎖断片を互いにハイブリダイズさせて架橋を形成することは、各断片の両端に同じトランスポソーム複合体由来のタグを含む二本鎖断片から調製された一本鎖断片間では起こらない。
VII.固定されたトランスポソームを有する固体支持体を用いて複数のインサートを含む配列決定鋳型を調製する方法
いくつかの実施形態では、複数のインサートを含む配列決定鋳型は、固体支持体上に固定されたトランスポソームを使用して調製される。いくつかの実施形態では、固体支持体は、ビーズ、スライド、容器の壁、フローセル、又はフローセルに含まれるナノウェルである。
いくつかの実施形態では、複数のインサートを含む配列決定鋳型は、固体支持体上に固定されたトランスポソームを使用して調製される。いくつかの実施形態では、固体支持体は、ビーズ、スライド、容器の壁、フローセル、又はフローセルに含まれるナノウェルである。
本明細書で使用するとき、「トランスポソーム複合体」又は「トランスポソーム」は、少なくとも1つのトランスポザーゼ(又は本明細書に記載の他の酵素)及びトランスポゾン認識配列から構成される。いくつかのそのようなシステムでは、トランスポザーゼは、転移反応を触媒することができる機能的複合体を形成するために、トランスポゾン認識配列に結合する。いくつかの側面では、トランスポゾン認識配列は、二本鎖トランスポゾン末端配列である。トランスポザーゼは、標的核酸内のトランスポザーゼ認識部位に結合し、トランスポゾン認識配列を標的核酸に挿入する。いくつかのそのような挿入事象では、トランスポゾン認識配列(又は末端配列)の1つの鎖が標的核酸に転写され、開裂事象が生じる。例示的な転位手順及びシステムは、トランスポザーゼでの使用に容易に適合され得る。
「トランスポザーゼ」は、トランスポゾン末端含有組成物(例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)を有する機能的複合体を形成し、かつ二本鎖標的核酸へのトランスポゾン末端含有組成物の挿入又は転位を触媒することができる酵素を意味する。本明細書に提示されるトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含み得る。
トランスポゾンベースの技術は、DNAを断片化するために利用することができ、ゲノムDNAなどの標的核酸は、標的を同時に断片化及びタグ付けする(「タグメンテーション」)トランスポソーム複合体で処理され、それによって、断片の末端に固有のアダプター配列でタグ付けされた断片化核酸分子の集団を生成する。タグメンテーションは、トランスポゾン末端配列(本明細書でトランスポゾンと称される)を含む1つ以上のタグ(アダプター配列など)で複合体化されたトランスポザーゼ酵素を含むトランスポソーム複合体によるDNAの修飾を含む。タグメンテーションは、DNAの断片化及び二重鎖断片の両方の鎖の5’末端へのアダプターのライゲーションを同時にもたらし得る。
転位反応は、1つ以上のトランスポゾンがランダムな部位又はほぼランダムな部位で標的核酸に挿入される反応である。転位反応の構成要素としては、トランスポザーゼ(又は本明細書に記載される核酸を断片化及びタグ付けすることができる他の酵素、例えば、インテグラーゼ)、及び酵素に結合する二本鎖トランスポゾン末端配列を含むトランスポゾン要素、及び2つのトランスポゾン末端配列のうちの1つに結合されたアダプター配列が含まれ得る。二本鎖トランスポゾン末端配列のうちの一本鎖は、標的核酸の一本鎖に転移され、相補的なトランスポゾン末端配列鎖は、転移されない(すなわち、非転移トランスポゾン配列)。アダプター配列は、必要に応じて又は所望に応じて、1つ以上の機能的配列(例えば、プライマー配列)を含み得る。
「トランスポゾン末端」という用語は、インビトロ転位反応で機能するトランスポザーゼ又はインテグラーゼ酵素との複合体を形成するために必要なヌクレオチド配列(「トランスポゾン末端配列」)のみを示す二本鎖核酸DNAを指す。いくつかの実施形態では、トランスポゾン末端は、転位反応においてトランスポザーゼと機能複合体を形成することができる。非限定的な例として、参照によりその全体が本明細書に組み込まれる米国特許出願公開第2010/0120098号の開示に記載されるように、トランスポゾン末端は、19-bpの外側末端(「outer end、OE」)トランスポゾン末端、内側末端(「inner end、IE」)トランスポゾン末端、又は野生型若しくは変異体Tn5トランスポザーゼによって認識される「モザイク末端」(「mosaic end、ME」)トランスポゾン末端、又はR1及びR2トランスポゾン末端を含み得る。トランスポゾン末端は、インビトロ転位反応においてトランスポザーゼ又はインテグラーゼ酵素と機能複合体を形成するのに好適な任意の核酸又は核酸類似体を含み得る。例えば、トランスポゾン末端は、DNA、RNA、修飾塩基、非天然塩基、修飾骨格を含むことができ、一方又は両方の鎖にニックを含むことができる。「DNA」という用語は、トランスポゾン末端組成物に関連して本開示全体を通して使用されるが、任意の好適な核酸又は核酸類似体がトランスポゾン末端において利用され得ることを理解すべきである。
同様に、「転移鎖」という用語は、両方のトランスポゾン末端の転移部分を指す。同様に、「非転移鎖」という用語は、両方の「トランスポゾン末端」の非転移部分を指す。転移鎖の3’末端は、インビトロ転位反応で標的DNAに結合又は転移される。転移されたトランスポゾン末端配列に相補的なトランスポゾン末端配列を示す非転移鎖は、インビトロ転位反応で標的DNAに結合又は転移されない。
いくつかの実施形態では、トランスポゾンは、フォーク型アダプタートランスポゾンである。フォーク型アダプタートランスポゾンは、2つの鎖を含む。いくつかの実施形態では、フォーク型アダプタートランスポゾンの第2の鎖は、アダプター配列と、第1のフォーク型アダプタートランスポゾンの第1の鎖に完全に又は部分的に相補的な配列とを含む。第1及び第2の鎖において完全な又は部分的な相補性を有する配列は、2つの鎖が一緒にハイブリダイズして、フォーク型構造を形成することを可能にする。
いくつかの実施形態では、2種類以上のトランスポソーム複合体は、固体支持体の表面上に固定されている。いくつかの実施形態では、断片は、異なるトランスポソームの使用に基づいて異なるタグを備えて調製することができる。
いくつかの実施形態では、固体支持体は、固定されたトランスポソーム複合体の2つのプールを含む。いくつかの実施形態では、トランスポソーム複合体の第1のプールは、(a)トランスポザーゼと、(b)3’トランスポゾン末端配列、第1のリード配列決定アダプター配列、及び5’親和性部分を含む第1のトランスポゾンと、(c)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含む。いくつかの実施形態では、トランスポソーム複合体の第2のプールは、(a)トランスポザーゼと、(b)3’トランスポゾン末端配列、第2のリード配列決定アダプター配列、及び5’親和性部分を含む第1のトランスポゾンと、(c)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含む。いくつかの実施形態では、各第1のトランスポゾンは、固体支持体の表面上の結合部分への5’親和性部分の結合によって固定されている。
いくつかの実施形態では、固定されたトランスポソーム複合体の第1のプールは、P5.R1を含む第1のオリゴヌクレオチドと、X’(ハイブリダイゼーション配列の相補体)を含む第2のオリゴヌクレオチドとを含む、第1のフォーク型アダプターを含む。いくつかの実施形態では、固定されたトランスポソーム複合体の第2のプールは、P7.R2を含む第1のオリゴヌクレオチドと、X(ハイブリダイゼーション配列)を含む第2のオリゴヌクレオチドとを含む、第2のフォーク型アダプターを含む。このような例示的な実施形態は、図34に示される。
いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼの2つの分子のダイマーを含む。いくつかの実施形態では、トランスポソーム複合体は、ホモダイマー及び/又はヘテロダイマーを含む。
いくつかの実施形態では、トランスポソーム複合体は、ホモダイマーであり、トランスポザーゼの2つの分子は各々、同じ型の第1及び第2のトランスポゾンに結合している(例えば、各モノマーに結合した2つのトランスポゾンの配列は同じであり、「ホモダイマー」を形成する)。いくつかの実施形態では、本明細書に記載の組成物及び方法は、トランスポソーム複合体の2つの集団を採用する。いくつかの実施形態では、各集団におけるトランスポゾンは同じである。本明細書で使用される場合、「ホモダイマー」は、両方の部位に同じトランスポゾン配列を含むトランスポソームダイマーを指す。いくつかの実施形態では、本明細書に記載の組成物及び方法は、第1のフォーク型アダプターをトランスポザーゼと接触させて第1のトランスポソーム複合体を調製し、第2のフォーク型アダプターをトランスポザーゼと接触させて第2のトランスポソーム複合体をアセンブルし、次いで第1及び第2のトランスポソーム複合体を一緒にプールすることによってアセンブルされた、トランスポソーム複合体の集団を使用する。いくつかの実施形態では、トランスポソーム複合体のプールは、第1のフォーク型アダプターを含むホモダイマー及び第2のフォーク型アダプターを含むホモダイマーを含む。
いくつかの実施形態では、トランスポソーム複合体は、ヘテロダイマーであり、トランスポザーゼの2つの分子は各々、第1及び第2のトランスポゾンを含む異なるフォーク型アダプターに結合している(例えば、トランスポソーム複合体の各モノマーに結合した2つのトランスポゾンの配列は異なり、「ヘテロダイマー」を形成する)。
いくつかの実施形態では、本明細書に記載の組成物及び方法は、第1のフォーク型アダプター及び第2のフォーク型アダプターをトランスポザーゼと一緒にプールして、トランスポソーム複合体のプールをアセンブルすることによってアセンブルされた、トランスポソーム複合体の集団を使用する。このプールの後、アセンブルされたトランスポソーム複合体の予測される比率は、第1のフォーク型アダプターを含むホモダイマーであるトランスポソーム複合体が25%、第2のフォーク型アダプターを含むホモダイマーであるトランスポソーム複合体が25%、並びに、第1のフォーク型アダプター及び第2のフォーク型アダプターを含むヘテロダイマーであるトランスポソーム複合体が50%である。いくつかの実施形態では、トランスポソーム複合体の第1及び/又は第2のプールは、ホモダイマー又はヘテロダイマーである。いくつかの実施形態では、トランスポソーム複合体の第1及び第2のプールは、ホモダイマー又はヘテロダイマーである。例示的なホモダイマー、ヘテロダイマー、及び固定化ホモダイマーを含む固体支持体、並びにそれらの使用方法は、米国特許第9,683,230号に開示されており、その全体が本明細書に組み込まれる。図35は、ホモダイマーの2つのプールを含む例示的な固体支持体を示し、ここで、全てのホモダイマーは固体支持体の表面上に固定されている。2つのホモダイマーのプール又はヘテロダイマーを含むプールを使用して、タグ付けされた二本鎖断片を生成することができ、少なくともいくつかの断片は、第1のプールに含まれるトランスポソーム複合体由来のタグを一方の末端に、第2のプールに含まれるトランスポソーム複合体由来のタグを他方の末端に含む。
いくつかの実施形態では、1つ以上のトランスポゾンは、アダプター、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む。言い換えれば、トランスポゾンは、配列決定など、ユーザーが実施したい方法において有用な追加の配列を含んでもよい。いくつかの実施形態では、1つ以上のトランスポゾンは、インデックス配列及び/又はUMIを含む。いくつかの実施形態では、1つ以上のトランスポゾンは、インデックス配列及びUMIを含む。UMIを含むトランスポゾン及びそれらの使用方法は、国際公開第2019/108972号、同第2018/136248号、同第2016176091号、及び同第202014437号に記載されており、これらはそれぞれ、その全体が本明細書に組み込まれる。
いくつかの実施形態では、トランスポソーム複合体の第1のプールに含まれる第1のトランスポゾン及び/又はトランスポソーム複合体の第2のプールに含まれる第1のトランスポゾンは、試料インデックスを含む。いくつかの実施形態では、トランスポソーム複合体の第1のプールに含まれる第1のトランスポゾン及びトランスポソーム複合体の第2のプールに含まれる第1のトランスポゾンの両方は、試料インデックスを含む。代表的な例では、実施形態は、図46Aに示されるように、トランスポソーム複合体の第1のプールに含まれるi5を含む第1のトランスポゾンと、トランスポソーム複合体の第2のプールに含まれるi7を含む第1のトランスポゾンとを含んでもよい。
いくつかの実施形態では、トランスポソーム複合体の第1のプールに含まれる第2のトランスポゾン及び/又はトランスポソーム複合体の第2のプールに含まれる第2のトランスポゾンは、試料インデックス及び/又はUMIを含む。いくつかの実施形態では、トランスポソーム複合体の第1のプールに含まれる第2のトランスポゾン及びトランスポソーム複合体の第2のプールに含まれる第2のトランスポゾンの両方は、試料インデックスを含む。
いくつかの実施形態では、トランスポソーム複合体の第1のプールに含まれる第2のトランスポゾン及びトランスポソーム複合体の第2のプールに含まれる第2のトランスポゾンの両方は、UMIを含む。代表的な例では、実施形態は、図46Bに示されるように、トランスポソーム複合体の第1のプールに含まれるi8を含む第2のトランスポゾンと、トランスポソーム複合体の第2のプールに含まれるi6を含む第2のトランスポゾンとを含んでよく、i6及びi8はUMIとして機能する。
いくつかの実施形態では、トランスポソームの第1のプール及び第2のプールの両方に含まれる第1及び第2のトランスポゾンは、試料インデックス配列又はUMIのいずれかを含み得る。そのようなトランスポソームが本発明の方法において使用される場合、図46Cに示されるようなポリヌクレオチドが産生され得る。
いくつかの実施形態では、1つ以上の二本鎖の連結された核酸配列決定鋳型(図37に示されるような)を生成する方法は、固体支持体に固定されている二本鎖核酸を含む試料を適用することと、二本鎖核酸をタグメンテーションして、二本鎖核酸由来のインサートを含むタグ付けされた二本鎖断片を生成することとを含み、二本鎖断片は、5’親和性部分が固体支持体の表面上の結合部分に結合することによって固体支持体に固定されている。いくつかの実施形態では、5’親和性部分は、第1のトランスポゾン(すなわち、トランスポソーム複合体に含まれるフォーク型アダプターの第1の鎖)に含まれる。
いくつかの実施形態では、次いでトランスポソーム複合体が二本鎖断片から遊離される。いくつかの実施形態では、二本鎖断片からのトランスポソーム複合体の遊離は、SDS及び洗浄を用いて実施される。
いくつかの実施形態では、方法は、トランスポソーム複合体の遊離後に、伸長して二本鎖断片をライゲーションすることを含む。いくつかの実施形態では、伸長及びライゲーションは、ポリメラーゼ、dNTP、及び伸長緩衝液(ELMT)を提供することを含む。
いくつかの実施形態では、方法は、伸長してライゲーションした二本鎖断片を一本鎖断片に変性させることを含み、5’親和性部分を含む一本鎖断片は、図38に示されるように、固体支持体上に固定されたままである。いくつかの実施形態では、変性は、固体支持体を加熱すること、又は化学変性剤を適用することを含む。いくつかの実施形態では、変性させることは、固体支持体の温度を90℃以上に上昇させることを含む。
いくつかの実施形態では、方法は、第1の固定された一本鎖断片に含まれるハイブリダイゼーション配列を、第2の固定された一本鎖断片に含まれるハイブリダイゼーション配列の相補体にハイブリダイズさせ、それによって架橋を形成することを含む。いくつかの実施形態では、ハイブリダイズさせることは、固体支持体を冷却すること、及び/又はハイブリダイゼーション緩衝液を適用することを含む。いくつかの実施形態では、冷却することは、固体支持体の温度を60℃以下に低下させることを含む。いくつかの実施形態では、ハイブリダイゼーション緩衝液は高塩濃度を含み、任意選択的に、高塩濃度は750mM NaClである。
いくつかの実施形態では、第1の一本鎖断片に含まれるハイブリダイゼーション配列(X又はHYB)は、第2の一本鎖断片に含まれるハイブリダイゼーション配列の相補体(X’又はHYB’)にハイブリダイズすることができる。いくつかの実施形態では、ハイブリダイゼーション配列及び/又はその相補体は、ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合しており、変性させることは、ブロッキングオリゴヌクレオチドを変性させてハイブリダイゼーション配列及び/又はその相補体をブロック解除することを含む。このようなブロッキングオリゴヌクレオチドは、フォーク型アダプターについて上述したように機能し得、このとき、ハイブリダイゼーション配列のその相補体への会合は、ブロッキングオリゴヌクレオチドが変性されるまでブロックされる。いくつかの実施形態では、トランスポソームに含まれるフォーク型アダプターは、3つのオリゴヌクレオチドを含み、このとき、2つのオリゴヌクレオチドは、フォーク型トランスポゾンの第1及び第2のトランスポゾンを含み、第3のオリゴヌクレオチドは、ブロッキングオリゴヌクレオチドである。いくつかの実施形態では、ブロッキングオリゴヌクレオチド(例えば、XB又はX’B’)は、第2のトランスポゾンの3’末端の一本鎖セクションにおいてフォーク型アダプタートランスポゾンにハイブリダイズされる。このブロッキングオリゴヌクレオチドは、フォーク型アダプタートランスポゾンの第1及び第2のアダプターのいずれか又は両方にハイブリダイズされ得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、第1のフォーク型アダプタートランスポゾン及び第2のフォーク型アダプタートランスポゾンが、第2のオリゴヌクレオチドの3’相補的セクションを介して互いにハイブリダイズすることを防止する。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、タグメンテーションの標的ではないヌクレオチドを含む。
いくつかの実施形態では、第1の固定された一本鎖断片に含まれるHYBの、第2の固定された一本鎖断片に含まれるHYB’への結合は、「架橋」と称され得る(フォーク型アダプターを使用する方法においてこの用語が使用されるのと同様)。
いくつかの実施形態では、X配列を含む断片は、他の断片中のX’配列にハイブリダイズすることができる(図42及び45に示される)。いくつかの実施形態では、第2のトランスポソームに含まれるフォーク型アダプターのみから、又は第1のトランスポソームに含まれるフォーク型アダプターのみから組み込まれたアダプターを含む断片は、一緒に架橋することができない(図43及び図44に示される)。
いくつかの実施形態では、2つの一本鎖断片の架橋後、方法は、伸長させ、二本鎖の連結された核酸配列決定鋳型を生成することを含む。
いくつかの実施形態では、方法は、ハイブリダイズさせ、伸長させ、二本鎖の連結された核酸配列決定鋳型を生成する更なる工程を含む。換言すれば、2つの固定された一本鎖断片間の架橋を可能にする工程は、二本鎖の連結された核酸配列決定鋳型がこれ以上調製できなくなるまで繰り返され得る。調製される二本鎖の連結された核酸配列決定鋳型の数は、相補的HYB/HYB’配列に近接して固定された一本鎖断片の数によって制限され得る。一本鎖断片が他の一本鎖断片と結合できなくなると、更なる連結された配列決定鋳型を調製することができなくなる。
いくつかの実施形態では、固定されたトランスポソームを使用して調製された連結された配列決定鋳型は、同じインサートの2つのコピーを含む。いくつかの実施形態では、DNAのトランスポソームに対する比率が高いと、同じインサートの2つのコピーを含む連結された配列決定鋳型の割合が高くなる。いくつかの実施形態では、固定されたトランスポソームによるタグメンテーションの前に、DNAを長さ1000bp未満の短い断片に予め断片化して、同じインサートの2つのコピーを含む高い割合の連結された配列決定鋳型を生成する。このような条件下での結果、一緒にハイブリダイズするセンス及びアンチセンス相補的配列を含む一本鎖断片が主となり、伸長が同じインサートの2つのコピーを含む連結された配列決定鋳型を生成する。
いくつかの実施形態では、連結された配列決定鋳型は、互いのコピーではない2つのインサートを含む。いくつかの実施形態では、連結された配列決定鋳型に含まれるインサートは異なる。いくつかの実施形態では、2つの異なるインサートを含む連結された配列決定鋳型は、以下に概説される方法を使用する近接データを生成するために使用される。
A.空間的に局在化されたトランスポソームによる二本鎖核酸の近接領域又は隣接領域の断片化
トランスポソーム複合体に含まれるトランスポザーゼへの二本鎖核酸の結合はランダムであるが、所与の二本鎖核酸は、固体支持体の表面の特定の領域に固定されているトランスポソームによって断片化される。方法のこの態様は、図45に概説されており、このとき、領域A~Eは、1つの二本鎖核酸において順序付けられ、したがって、タグメンテーションされた場合に架橋断片を生成する。この二本鎖核酸は空間的な制限を課し、二本鎖核酸の第1の領域が表面の所与の領域においてトランスポソーム複合体に結合すると、二本鎖核酸の残りはこの領域においてトランスポソーム複合体に自由に結合するだけである。トランスポソームが固定された固体支持体の表面上の断片の位置に基づいてゲノム接続性情報を保持する能力は、米国特許第10,246,746号に開示されており、その全体が参照により本明細書に組み込まれる。
トランスポソーム複合体に含まれるトランスポザーゼへの二本鎖核酸の結合はランダムであるが、所与の二本鎖核酸は、固体支持体の表面の特定の領域に固定されているトランスポソームによって断片化される。方法のこの態様は、図45に概説されており、このとき、領域A~Eは、1つの二本鎖核酸において順序付けられ、したがって、タグメンテーションされた場合に架橋断片を生成する。この二本鎖核酸は空間的な制限を課し、二本鎖核酸の第1の領域が表面の所与の領域においてトランスポソーム複合体に結合すると、二本鎖核酸の残りはこの領域においてトランスポソーム複合体に自由に結合するだけである。トランスポソームが固定された固体支持体の表面上の断片の位置に基づいてゲノム接続性情報を保持する能力は、米国特許第10,246,746号に開示されており、その全体が参照により本明細書に組み込まれる。
要するに、図45に示されるように、同じ二本鎖核酸由来の異なる断片をタグメンテーションし、隣接するトランスポソーム複合体にわたって固定することができる。したがって、二本鎖核酸から調製されたインサートを含む断片は、タグメンテーション前の二本鎖核酸中のこれらのインサート配列の距離に基づいた空間的関係で固定されている。
B.架橋のための固定された一本鎖断片の近接
固定されたトランスポソームを使用して調製された一本鎖核酸は、第1の一本鎖断片中のHYBと第2の一本鎖断片中のHYB’との間に架橋を形成する前に固定されているため、架橋中で結合する第1及び第2の断片は、固体支持体の表面上に近接して固定化されなければならない。例えば、第1及び第2の断片は、同じ二本鎖断片から産生されたセンス鎖及びアンチセンス鎖であり得る。これは図38及び39に示されており、両末端で固定されている二本鎖断片由来の相補的一本鎖断片を変性させて、次いでハイブリダイゼーションが可能な場合に互いに再アニールさせてもよい。図40に示されるように、一本鎖インサート(A及びA’を含むものなど)のハイブリダイゼーションは、伸長後に連結された配列決定鋳型の生成をもたらし得る。対照的に、鋳型は、両方がX’を含むか、又は両方がXを含む2つの断片の間で調製されない。
固定されたトランスポソームを使用して調製された一本鎖核酸は、第1の一本鎖断片中のHYBと第2の一本鎖断片中のHYB’との間に架橋を形成する前に固定されているため、架橋中で結合する第1及び第2の断片は、固体支持体の表面上に近接して固定化されなければならない。例えば、第1及び第2の断片は、同じ二本鎖断片から産生されたセンス鎖及びアンチセンス鎖であり得る。これは図38及び39に示されており、両末端で固定されている二本鎖断片由来の相補的一本鎖断片を変性させて、次いでハイブリダイゼーションが可能な場合に互いに再アニールさせてもよい。図40に示されるように、一本鎖インサート(A及びA’を含むものなど)のハイブリダイゼーションは、伸長後に連結された配列決定鋳型の生成をもたらし得る。対照的に、鋳型は、両方がX’を含むか、又は両方がXを含む2つの断片の間で調製されない。
いくつかの実施形態では、異なる二本鎖断片から調製された一本鎖断片は、架橋のために互いにハイブリダイズするのに十分に近接していてもよい。本質的に、第1及び第2の一本鎖断片の両方は、それらの5’末端で固体支持体の表面に係留され、したがって、各断片(HYB又はHYB’を含む)の遊離3’末端は、相互作用するために互いに到達し得なければならない。2つの固定されている断片の3’末端が、それらが固体支持体の表面上で離れすぎて固定されているために互いに到達できない場合、HYB/HYB’架橋は、これらの2つの断片の間に形成され得ない。
したがって、2つの固定されている断片間の距離が、長い方の断片の長さよりも大きい場合、それらのHYB/HYB’配列が重複し得ないので、これらの断片が相互作用することはない。いくつかの実施形態では、第1の固定された一本鎖断片に含まれるハイブリダイゼーション配列の、第2の固定された一本鎖断片に含まれるハイブリダイゼーション配列の相補体へのハイブリダイゼーションは、第1及び第2の断片が、第1又は第2の断片の長い方の長さよりも近い固体支持体の表面上で互いに近接している場合にのみ起こる。
いくつかの実施形態では、第1の一本鎖断片中のHYBに含まれる十分な数のヌクレオチドは、第2の一本鎖断片中のHYB’にハイブリダイズすることができなければならない。第1の一本鎖断片中のHYBと第2の一本鎖断片中のHYB’との間のヌクレオチドが互いにハイブリダイズすることができない場合、これらの2つの断片は架橋を生成することができない。いくつかの実施形態では、第1の固定された断片及び第2の固定された断片は、固体支持体上に近接して固定されており、近接していることにより、第1の固定された断片に含まれるハイブリダイゼーション配列に含まれる4個以上、5個以上、6個以上、7個以上、8個以上、9個以上、又は10個以上のヌクレオチドは、第2の固定された断片に含まれるハイブリダイゼーション配列の相補体に含まれるヌクレオチドに結合することが可能になる。
いくつかの実施形態では、第1の固定された断片及び第2の固定された断片は、固体支持体の表面上で互いに20~500ナノメートル以内に固定されている。いくつかの実施形態では、第1の固定された断片及び第2の固定された断片は、固体支持体の表面上で互いに20~300ナノメートル以内に固定されている。いくつかの実施形態では、500ナノメートル以内である固定された一本鎖断片は少なく、1つの断片中のHYBの他の断片中のHYB’への結合を介して互いに架橋することが可能であり得る。いくつかの実施形態では、二本鎖核酸において隣接していた配列由来の2つの固定された断片は、異なる断片がそれらの間に固定されていることなく、固体支持体の表面上で隣接し得る。
いくつかの実施形態では、試料は、複数の異なる二本鎖核酸を含む。いくつかの実施形態では、空間的に局在化された断片は、同じ二本鎖核酸から調製される。いくつかの実施形態では、第1及び第2の固定された断片の両方は、同じ二本鎖核酸から調製され、二本鎖の連結された核酸配列決定鋳型は、同じ二本鎖核酸由来の2つのインサートを含む。
いくつかの実施形態では、2つのインサートは、同じ二本鎖核酸(図41に示される架橋断片など)に含まれる2つの連続する配列に由来する。例えば、図42は、それ自体と架橋するか、又はB若しくはB’配列を含む一本鎖断片と架橋するA若しくはA’インサートを含む一本鎖断片を示し、A/A’断片及びB/B’断片の両方は、同じ二本鎖核酸中の隣接配列から調製される。このような対形成は、1つの断片中のX配列の別の断片中のX’配列へのハイブリダイゼーションに基づく。伸長後、二本鎖の連結された配列決定鋳型を調製することができる。連結された配列決定鋳型の少なくともいくつかは、一方の末端におけるP5/P5’及び他方の末端におけるP7/P7’の存在に基づいて配列決定可能である(図42において実線で輪郭を描いたボックスに示される)。生成され得る他の連結された配列決定鋳型は、それらが鋳型の両端に同じ相補的アダプター配列を有するため、一般的に配列決定可能ではない例えば、P5/P5’又はP7/P7’、図42の破線ボックス中の鋳型に示される)。
配列決定鋳型が固体支持体から遊離され、配列決定される場合、一本鎖鋳型中のA及びBインサート(並びに別の一本鎖鋳型中のA’及びB’インサート)の存在は、A配列及びB配列が同じ二本鎖核酸において近接していることを示すために使用され得る。例えば、A及びB配列は、同じ標的核酸中にあったと決定され得る。
図43は、同一のトランスポソーム(すなわち、同じトランスポゾンを含む)を用いてランダムに生じる架橋タグメンテーション反応を示す。図44に示されるように、得られた一本鎖断片は、X(上図)又はX’(下図)配列のみを含むため、得られた一本鎖断片は、互いにハイブリダイズ及び架橋することができない。Xを含むいくつかの一本鎖断片及びX’を含むいくつかの一本鎖断片の非存在下では、架橋は想定されず、二本鎖の連結された配列決定鋳型の生成を伴わない。
いくつかの実施形態では、固体支持体に適用される試料中の二本鎖核酸の濃度は、異なる二本鎖核酸ポリヌクレオチド由来の一本鎖断片が互いに架橋するのに十分に近接していることを一般に回避するのに十分に低い。このようにして、一緒に架橋する(かつ、二本鎖の連結された配列決定鋳型の調製を可能にする)ほとんどの断片は、同じ二本鎖核酸ポリヌクレオチドから調製された二本鎖断片由来であり、同じ試料中の別の二本鎖ポリヌクレオチド由来ではない。このようにして、無関係な二本鎖核酸由来の断片を含む連結された配列決定鋳型は、ユーザーが好む場合、固定されたトランスポソームを用いる方法を使用するときに一般に回避することができる。
いくつかの実施形態では、それらのHYB/HYB’間に架橋を形成する第1の一本鎖断片及び第2の一本鎖断片に含まれる2つのインサートは、同じ核酸の非連続領域に由来する。いくつかの実施形態では、HYB/HYB’架橋を形成する第1の一本鎖断片及び第2の一本鎖断片中の2つのインサートは、同じ二本鎖核酸中に含まれる2つの近接配列に由来する。いくつかの実施形態では、近接配列は、二本鎖核酸において、100以下のヌクレオチド、200以下のヌクレオチド、300以下のヌクレオチド、400以下のヌクレオチド、500以下のヌクレオチド、700以下のヌクレオチド、又は1,000以下のヌクレオチドによって分離される。近接配列間のそのような比較的短い距離は、これらの配列由来の一本鎖断片が互いに架橋して、連結された核酸配列決定鋳型を生成できる可能性を高める。
いくつかの実施形態では、固体支持体の領域は、同じ二本鎖核酸に含まれる近接配列由来の共通のインサート配列を共有する複数の二本鎖の連結された核酸配列決定鋳型を含む。図45に示される例示的な核酸を使用して、断片A~Eの空間的関係は、調製され得る連結された配列決定鋳型からの配列決定データを使用して解明され得る。図45は、1次元図を使用して可能な対形成を示すが、これらの相互作用が2次元平面(X,Y)上で起こることを理解しなければならない。更に、最初のトランスポソームに結合した核酸は、他のトランスポソームに結合する前に、曲がりくねった配置でそれ自体が複数回ねじれて戻ることができるため、断片を表面上に局在化させることができる。したがって、配列の最終的な対形成は、表面上の一本鎖断片のこの曲がりくねった配置に基づき得る。
いくつかの実施形態では、配列(図45のA~Eなど)の近接性は、これらの配列を含むどの断片が架橋し、連結された配列決定鋳型を形成できたかを分析することによって解決することができる。
いくつかの実施形態では、固体支持体の表面上でより近い断片(タグメンテーションされた二本鎖核酸において近接していた断片から調製されたため)は、より離れた断片よりも高い頻度で互いに架橋する。したがって、所与の二本鎖核酸から生成された一本鎖断片の表面上の曲がりくねった配置に基づいて、隣接断片は一般に最も高い頻度で架橋して連結された配列決定鋳型を形成する(図39に示されるように、連結された配列決定鋳型を生成しない、それらのインサート配列を含む同じインサートを用いて調製された一本鎖断片の再アニーリング、及び図40に示されるように、一方の断片におけるハイブリダイゼーション配列決定を他方の断片におけるその相補体に架橋することによって同じインサートを用いて調製された一本鎖断片の再アニーリングを除く)。図45に示されるように、断片化された二本鎖核酸中の2つの配列間の距離が増加するにつれて、固体支持体の表面上のインサートとしてこれらの配列を含む一本鎖断片間の距離も一般に増加する。したがって、2つの異なるインサート(又はそれらの相補体)を含む生成された連結された配列決定鋳型の頻度は、タグメンテーションされた二本鎖核酸における近接情報の分析を可能にする。
隣接配列は、より離れた配列と比較して、同じ連結された配列決定鋳型に含まれる頻度がより高いと推定され、この頻度は、断片間の距離が増加するにつれて減少する。その結果、タグメンテーションされた二本鎖核酸中の距離が大きすぎる任意の2つの配列は、架橋して連結された配列決定鋳型を形成することができない。したがって、配列決定データにおけるこれらの連結された配列決定鋳型の欠如は、所与のインサート対を含む一本鎖断片間に架橋を形成するには距離が遠すぎると解釈することができる。
図45は、固定されたトランスポソームを用いて調製された架橋断片が、XのX’への結合に基づいて互いにハイブリダイズすることができる変性一本鎖断片もたらす方法について示す。一本鎖断片の架橋(続いて、連結された配列決定鋳型を生成し得る)は、タグメンテーションされた二本鎖核酸の配列に沿って「ウォーク」するために使用され得る。したがって、表面上に形成された連結された配列決定鋳型のプールのコンパイルされた配列決定データを使用して、タグメンテーションされた二本鎖核酸の表現を形成することができる。
同じ二本鎖断片(例えば、図40のA及びA’を含むもの)から形成される一本鎖断片は、互いに架橋し、次いで、同じインサート配列の2つのコピーを含む連結された配列決定鋳型を形成することができる。同じインサートの2つのコピーを含むそのような連結された配列決定鋳型は、本明細書に記載されるように、エラー訂正、一本鎖にのみ存在する変異の同定、及びメチル化分析のために使用され得る。
いくつかの実施形態では、タグメンテーション事象後に残された核酸配列中のギャップは、伸長工程を使用して埋めることができる。一般に、伸長工程の後にライゲーション工程が続く。伸長及び/又はライゲーションは、適切な条件を使用して行われる。いくつかの実施形態では、使用される緩衝液は、伸長-ライゲーションミックス緩衝液(例えば、伸長-ライゲーションミックス緩衝液3、ELM3)である。T4 DNA pol Exo-(New England BioLabs、カタログ番号M0203S)又はTtaq608などのポリメラーゼを、かかる伸長及び/又はライゲーション工程において使用できる。
C.固定されたトランスポソームを用いて調製された配列決定鋳型の代表的な構造
ユーザーは、フォーク型アダプターを含むトランスポゾンを設計して、目的の配列(例えば、アダプター、プライマー結合部位など)を組み込むことができる。これらの目的の配列は、例えば、使用を好む配列決定プラットフォーム、及びそのプラットフォーム上で鋳型を配列決定するための要件に基づいて、ユーザーによって選択され得る。
ユーザーは、フォーク型アダプターを含むトランスポゾンを設計して、目的の配列(例えば、アダプター、プライマー結合部位など)を組み込むことができる。これらの目的の配列は、例えば、使用を好む配列決定プラットフォーム、及びそのプラットフォーム上で鋳型を配列決定するための要件に基づいて、ユーザーによって選択され得る。
本明細書に記載される配列決定鋳型を調製するためのトランスポソームに含まれ得る代表的な第1及び第2のフォーク型アダプターを図46A及び図46Bに示す。図46A~図46Cはまた、そのようなトランスポソームを用いて生成され得る代表的な配列決定鋳型の構造を示す。
いくつかの実施形態では、固定されたトランスポソームを使用して調製される配列決定鋳型は、以下の構造を有する。
5’-P5-i5-A14-ME-インサート1-ME’-HYB-ME-インサート2-ME’-B15’-i7’-P7’-3’、
5’-P5-A14-ME-インサート1-ME’-i6-HYB-i8’-ME-インサート2-ME’-B15’-P7’-3’、若しくは
5’-P5-i5-A14-ME-インサート1-ME’-i6-HYB-i8’-ME-インサート2-ME’-B15’-i7’-P7’-3’、又はこれらの相補体。
5’-P5-i5-A14-ME-インサート1-ME’-HYB-ME-インサート2-ME’-B15’-i7’-P7’-3’、
5’-P5-A14-ME-インサート1-ME’-i6-HYB-i8’-ME-インサート2-ME’-B15’-P7’-3’、若しくは
5’-P5-i5-A14-ME-インサート1-ME’-i6-HYB-i8’-ME-インサート2-ME’-B15’-i7’-P7’-3’、又はこれらの相補体。
D.増幅
いくつかの実施形態では、方法は、生成された二本鎖配列決定鋳型を固体支持体の表面から遊離させた後、かつ配列決定の前に増幅することを含む。
いくつかの実施形態では、方法は、生成された二本鎖配列決定鋳型を固体支持体の表面から遊離させた後、かつ配列決定の前に増幅することを含む。
いくつかの実施形態では、配列決定鋳型は、米国特許第7,985,565号及び同第7,115,400号の開示によって例示されるように、クラスター増幅法を使用して増幅され、これらの各々の内容は、参照によりその全体が本明細書に組み込まれる。米国特許第7,985,565号及び同第7,115,400号の組み込まれている材料は、固定されている核酸分子のクラスター又は「コロニー」からなるアレイを形成するために、増幅産物を固体支持体上に固定することを可能にする固相核酸増幅の方法を記載する。そのようなアレイ上の各クラスター又はコロニーは、複数の同一の固定化されたポリヌクレオチド鎖及び複数の同一の固定化された相補的ポリヌクレオチド鎖から形成される。そのように形成されたアレイは、本明細書では一般に「クラスター化アレイ」と称される。米国特許第7,985,565号及び同第7,115,400号に記載されているような固相増幅反応の産物は、固定されているポリポリヌクレオチド鎖と固定されている相補鎖の対をアニーリングすることによって形成されるいわゆる「架橋(bridged)」構造体であり、両方の鎖は、いくつかの実施形態では、共有結合を介して、5’末端で固体支持体上に固定されている。クラスター増幅方法論は、固定化された核酸鋳型を使用して固定化されたアンプリコンを産生する方法の例である。他の好適な方法を使用して、本明細書で提供される方法に従って産生された配列決定鋳型から固定されたアンプリコンを産生することもできる。例えば、1つ以上のクラスター又はコロニーは、増幅プライマーの各対の一方又は両方のプライマーが固定化されているかどうかにかかわらず、固相PCRによって形成することができる。
他の実施形態では、配列決定鋳型は、溶液中で増幅される。例えば、いくつかの実施形態では、核酸断片は、開裂されるか、又は別の方法で固体支持体から遊離され、次いで増幅プライマーは、溶液中で遊離分子にハイブリダイズされる。他の実施形態では、増幅プライマーを、1つ以上の初期の増幅工程のために核酸断片にハイブリダイズさせ、その後溶液中の後続の増幅工程を行う。したがって、いくつかの実施形態では、固定化された核酸鋳型を使用して、液相アンプリコンを産生することができる。
本明細書に記載されるか、又は当該技術分野において一般に既知である増幅法論のいずれも、配列決定鋳型を増幅するために、ユニバーサル又は標的特異的プライマーとともに利用され得ることを理解されたい。増幅のための好適な方法には、参照によりその全体が本明細書に組み込まれる、米国特許第8,003,354号に記載されるように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写媒介増幅(TMA)及び核酸配列ベースの増幅(NASBA)が含まれるが、これらに限定されない。上記の増幅方法を使用して、関心対象の1つ以上の核酸を増幅することができる。例えば、マルチプレックスPCR、SDA、TMA、NASBAなどを含むPCRを利用して配列決定鋳型を増幅することができる。いくつかの実施形態では、関心対象の核酸に特異的に向けられるプライマーは、増幅反応に含まれる。
VIII.区画内の溶液中でトランスポソームを使用して複数のインサートを含む配列決定鋳型を調製する方法
二本鎖核酸内の配列の近接データを評価する方法は、フォーク型アダプターを用いる方法について上述したような区画を使用して、区画を用いて行うこともできる。いくつかの実施形態では、区画は、ウェル、チューブ、又は液滴である。
二本鎖核酸内の配列の近接データを評価する方法は、フォーク型アダプターを用いる方法について上述したような区画を使用して、区画を用いて行うこともできる。いくつかの実施形態では、区画は、ウェル、チューブ、又は液滴である。
いくつかの実施形態では、区画内のトランスポソームは、溶液中に存在する。いくつかの実施形態では、トランスポソームは、区画内で配列決定鋳型を調製するときに固体支持体上に固定化されない。
いくつかの実施形態では、二本鎖断片は、一本鎖断片を調製する前に固定化されないため、区画中のトランスポソームを用いる方法は、一般に、2つの異なるインサートを含む連結された配列決定鋳型を調製する。これは、同じ二本鎖断片から調製された2つの一本鎖断片を固体支持体に近接して有する選択圧が、断片が固定化されず、代わりにタグメンテーションが溶液相中で起こる場合に失われるためである。
いくつかの実施形態では、トランスポソームの2つのプールを使用できる。いくつかの実施形態では、図34に示される第1のトランスポソーム及び第2のトランスポソームを使用できる。
いくつかの実施形態では、1つ以上の連結された核酸配列決定鋳型を生成する方法は、標的二本鎖核酸を含む試料を複数の異なる区画に区画化することと、二本鎖核酸をタグメンテーションして、複数の異なる区画内の二本鎖核酸由来のインサートを含むタグ付けされた二本鎖断片を生成することと、を含む。
いくつかの実施形態では、タグメンテーションは、トランスポソーム複合体の2つのプールを用いて行われる。いくつかの実施形態では、トランスポソーム複合体の第1のプールは、(a)トランスポザーゼと、(b)3’トランスポゾン末端配列、及び第1のリード配列決定アダプター配列を含む第1のトランスポゾンと、(c)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含む。いくつかの実施形態では、トランスポソーム複合体の第2のプールは、(a)トランスポザーゼと、(b)3’トランスポゾン末端配列及び第2のリード配列決定アダプター配列を含む第1のトランスポゾンと、(c)3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含む。いくつかの実施形態では、タグメンテーションにより、タグ付けされた二本鎖断片が調製される。いくつかの実施形態では、第1の一本鎖断片はインサートを含み、第2の断片は、第1の断片に含まれるインサートの相補体ではないインサートを含む。
いくつかの実施形態では、方法は、タグ付けされた二本鎖断片を変性させて一本鎖断片を生成することと、第1の断片中のハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって、同じ区画内の2つの一本鎖断片を互いにハイブリダイズさせることと、各一本鎖断片の3’末端から伸長させて、両方の一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む。いくつかの実施形態では、鋳型は、更なる処理の前に区画から遊離される。
いくつかの実施形態では、二本鎖の連結された核酸配列決定鋳型は、同じ区画に存在する2つの一本鎖断片のハイブリダイゼーションからのみ生成される。言い換えれば、同じ区画内の一本鎖断片のみが一緒にハイブリダイズすることができ、異なる区画内の一本鎖断片は互いへの会合に利用できない。いくつかの実施形態では、区画化することは、ほとんどの区画が1つの標的二本鎖核酸を含むか又は標的二本鎖核酸を含まないように試料を希釈することを含む。このようにして、同じ連結された配列決定鋳型に含まれるインサート配列は、同じ標的核酸に含まれていた可能性が高い。
このようにして、ユーザーは、同じ連結された配列決定鋳型に含まれる2つの配列が同じ標的核酸に由来することを同定することができる。同じ標的核酸に由来する配列を同定するそのような能力は、所与の標的核酸を含む配列に役立ち得る。
いくつかの実施形態では、区画化は、異なるハプロタイプを異なる区画に分離し、方法は、ハプロタイプフェージングに使用される。言い換えれば、ユーザーは、同じ連結された配列決定鋳型に含まれる配列を評価し、これらの配列が同じハプロタイプに含まれることを決定することができる。いくつかの実施形態では、ハプロタイプフェージングは、バーコードを必要としない。
いくつかの実施形態では、ハイブリダイゼーション配列及び/又はその相補体は、ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合しており、変性させることは、ブロッキングオリゴヌクレオチドを変性させてハイブリダイゼーション配列及び/又はその相補体をブロック解除することを含む。このようなブロッキングオリゴヌクレオチドは、フォーク型アダプターを用いる方法について上述されている。いくつかの実施形態では、1つ以上のブロッキングオリゴヌクレオチドは、溶液中での第1のトランスポソームと第2のトランスポソームとの会合を阻害する。換言すれば、ハイブリダイゼーション配列及びその相補体の会合のタイミングは、一本鎖のタグ付けされた断片が調製された後にのみ起こるように制御され得る。
いくつかの実施形態では、変性させることは、温度の上昇、pHの変化、及び/又は1つ以上のカオトロピック剤の添加によって行われる。いくつかの実施形態では、温度の上昇は、45℃~55℃から85℃~95℃への上昇であり、任意選択的に、温度の上昇は、50℃から90℃への上昇である。いくつかの実施形態では、1つ以上のカオトロピック剤は、ホルムアミド及び/又はNaOHを含む。
いくつかの実施形態では、変性、ハイブリダイズ及び伸長の1回以上の更なる工程が実施される。言い換えれば、変性、ハイブリダイズ、及び伸長の工程は、他の一本鎖断片とハイブリダイズするために利用可能な一本鎖断片がなくなるまで繰り返され得る。
いくつかの実施形態では、方法は、鋳型を増幅することを更に含む。
IX.連結された核酸配列鋳型を配列決定する方法
いくつかの実施形態では、方法は、連結された核酸配列決定鋳型を配列決定することを含む。いくつかの実施形態では、タンデムリードは、連結された核酸配列決定鋳型を配列決定することによって生成される。
いくつかの実施形態では、方法は、連結された核酸配列決定鋳型を配列決定することを含む。いくつかの実施形態では、タンデムリードは、連結された核酸配列決定鋳型を配列決定することによって生成される。
いくつかの実施形態では、異なるインサートの配列は、連続的に生成される。いくつかの実施形態では、連結された核酸配列決定鋳型を配列決定する方法は、第1のインサート配列を配列決定することと、第2のインサート配列を配列決定することとを含む。
いくつかの実施形態では、連結された核酸配列決定鋳型を配列決定する方法は、第1のリードプライマー結合配列に相補的な第1のリード配列決定プライマーを用いて配列決定を開始することによって、ポリヌクレオチドの第1のインサート配列を配列決定することと、第2のリードプライマー結合配列に相補的な第2のリード配列決定プライマーを用いて配列決定を開始することによって、第2のインサート配列を配列決定することと、を含む。例示的な方法は図2に示しており、ここでは、「リード1」配列決定プライマーを使用して、第1のインサート配列(ポリヌクレオチド中のP5’配列とHYB配列との間に位置する)を配列決定し、「リード2」配列決定プライマーを使用して、第2のインサート配列(ポリヌクレオチド中のHYB’配列とP7’配列との間に位置する)を配列決定する。いくつかの実施形態では、第1及び第2のインサート配列は、別々のライブラリー(図3に示される「ライブラリーA」及び「ライブラリーB」)から生成され得る。
いくつかの実施形態では、連結された核酸配列決定鋳型を配列決定する方法は、第2のインサート配列の相補体を配列決定し、次いで第1のインサート配列の相補体を配列決定することを含む。
いくつかの実施形態では、連結された核酸を配列決定する方法は、第1の相補リードプライマー結合配列に相補的な第1の相補リード配列決定プライマーを用いて配列決定を開始することによって、第2のインサート配列の相補体を配列決定することと、第2の相補リードプライマー結合配列に相補的な第2の相補リード配列決定プライマーを用いて配列決定を開始することによって、第1のインサート配列の相補体を配列決定することと、を含む。
いくつかの実施形態では、ポリヌクレオチド由来の3つ以上のインサート配列又はインサート配列の3つ以上の相補体を配列決定することができる。
本明細書に記載される複数のインサート配列を含むポリヌクレオチドは、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、Ion Torrent(Guilford,CT,Life Technologiesの子会社)から市販されている電気検出器及び関連技術を使用し得る放出されたプロトンの検出に基づく配列決定、ナノ細孔配列決定などを含む、直接配列決定又は次世代配列決定などの、任意の好適な配列決定方法論に従って配列決定され得る。いくつかの実施形態では、DNA断片は、フローセルなどの固体支持体上で配列決定される。本開示の複数のインサート配列を含むポリヌクレオチドでの使用に容易に適合させることができる例示的なSBS手順、流体システム、及び検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、同第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
本明細書に記載される方法は、使用される任意の特定の種類のシーケンシング計装系に限定されない。
X.複数のインサートを含む配列決定鋳型の使用方法
いくつかの実施形態では、複数のインサートを含む配列決定鋳型を使用して、二本鎖核酸由来の2つ以上のインサートの配列を決定する。
いくつかの実施形態では、複数のインサートを含む配列決定鋳型を使用して、二本鎖核酸由来の2つ以上のインサートの配列を決定する。
いくつかの実施形態では、2つ以上のインサートを含む配列決定鋳型を使用して、二本鎖核酸由来のインサートの配列の複数のコピーを生成する。そのような鋳型に含まれるインサート由来の各配列は同じ配列を有すると予想されるが、様々な異なるアーチファクトが不正確な配列をもたらし得ることが周知である。例えば、増幅中に配列決定鋳型から生成されるアンプリコンに導入されるエラーは、インサートを調製するために使用される二本鎖核酸における差異に関連しない配列における不一致を引き起こし得る。
A.配列決定
いくつかの実施形態では、方法は、固体支持体から生成された二本鎖の連結された核酸配列決定鋳型を遊離させることと、鋳型を配列決定して、鋳型に含まれるインサート配列を決定することと、を含む。いくつかの実施形態では、遊離は、酵素消化又は化学的開裂を含む。固体支持体の表面から配列決定鋳型を遊離させるこのような手段は、当該技術分野で周知である。
いくつかの実施形態では、方法は、固体支持体から生成された二本鎖の連結された核酸配列決定鋳型を遊離させることと、鋳型を配列決定して、鋳型に含まれるインサート配列を決定することと、を含む。いくつかの実施形態では、遊離は、酵素消化又は化学的開裂を含む。固体支持体の表面から配列決定鋳型を遊離させるこのような手段は、当該技術分野で周知である。
米国特許第7,985,565号及び同第7,115,400号の組み込まれている材料は、固定化された核酸分子のクラスター又は「コロニー」からなるアレイを形成するために、増幅産物を固体支持体上に固定化することを可能にする固相核酸増幅の方法を記載する。
本開示の方法によって生成されるアンプリコンでの使用に容易に適合させることができる例示的なSBS手順、流体システム、及び検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、同第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
いくつかの実施形態では、配列決定は、増幅後に行われる。いくつかの実施形態では、増幅は、配列決定前に行われない。多数の異なる配列決定法が当業者に既知であり、例えば、米国特許第9,683,230号及び同第10,920,219号に記載されており、これらのそれぞれは、参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態では、シーケンシング断片を、フローセルに付着させる。いくつかの実施形態では、シーケンシング断片を、フローセル又は表面にグラフトされた相補的プライマーにハイブリダイズさせる。いくつかの実施形態では、シーケンシング断片の配列は、アレイシーケンシング法又は合成しながらのシーケンシングなどの次世代シーケンシング法によって検出される。
P5及びP7プライマーは、様々なIlluminaプラットフォーム上でシーケンシングするためにIllumina,Inc.が販売している市販のフローセルの表面に使用される。このようなプライマー配列は、参照によりその全体が本明細書に組み込まれる、米国特許出願公開第2011/0059865(A1)号に記載されている。P5及びP7プライマーを例示するが、本明細書に提示される例では、任意の好適な増幅プライマーを使用できることを理解されたい。
いくつかの実施形態では、配列決定のために使用される配列決定プライマーは、配列決定鋳型に含まれる1つ以上の固有のプライマー結合配列に完全に又は部分的に相補的な配列を含む。いくつかの実施形態では、配列決定プライマーは、少なくともA2配列(配列番号40)、少なくともA14配列(配列番号4)、若しくは少なくともB15配列(配列番号5)、又はそれらの相補体を含む。
いくつかの実施形態では、配列決定は、A14、B15、及び/又はハイブリダイゼーション配列(HYB)に結合する配列決定プライマーを使用して行われる。図47は、本明細書に記載される鋳型を配列決定するために使用され得るプライマーのいくつかの代表的な組み合わせを提示する。
本明細書に記載の特定の方法の利点は、複数の標的核酸の迅速かつ効率的な検出を並行して提供することである。したがって、本開示は、当該技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又は配列決定試薬を1つ以上の核酸断片に送達することができる流体成分を含むことができ、システムは、ポンプ、弁、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768(A1)号及び米国特許出願第13/273,666号に記載され、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例として取ると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含み得る。増幅された核酸を作成し、また核酸の配列を決定することができる統合配列決定システムの例としては、MiSeq(商標)プラットフォーム(Illumina Inc.,San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願第13/273,666号に記載のデバイスが挙げられるが、これらに限定されない。
B.配列決定における暗サイクル
いくつかの実施形態では、カスタム配列決定レシピは、特定の配列の記録をスキップするために使用される暗サイクル(暗領域としても知られる)を含むように調製することができる。本明細書中で使用される場合、「暗サイクル」とは、特定の配列の配列決定化学が行われるが、この配列決定がシーケンサーによって画像化されない方法をいう。国際公開第2012055929号及び同第2010127304号は、暗サイクルについて記載しており、これらの各々は、参照により本明細書に組み込まれる。暗サイクルを使用して、配列決定結果を全体的に悪化させ得る、ME配列のライブラリーなどの低多様性配列を繰り返し配列決定することに関するフェージング/プレフェージング問題を軽減することができる。暗サイクルの後、配列決定鋳型に含まれるインサート配列が記録されるように、配列の画像化が再開される。
いくつかの実施形態では、カスタム配列決定レシピは、特定の配列の記録をスキップするために使用される暗サイクル(暗領域としても知られる)を含むように調製することができる。本明細書中で使用される場合、「暗サイクル」とは、特定の配列の配列決定化学が行われるが、この配列決定がシーケンサーによって画像化されない方法をいう。国際公開第2012055929号及び同第2010127304号は、暗サイクルについて記載しており、これらの各々は、参照により本明細書に組み込まれる。暗サイクルを使用して、配列決定結果を全体的に悪化させ得る、ME配列のライブラリーなどの低多様性配列を繰り返し配列決定することに関するフェージング/プレフェージング問題を軽減することができる。暗サイクルの後、配列決定鋳型に含まれるインサート配列が記録されるように、配列の画像化が再開される。
カスタム配列決定プロトコールは、スキップされる配列の長さに及ぶ適切な数の暗サイクルを含み得る。言い換えれば、暗サイクルの数は、スキップが意図される塩基の数に基づき得る。例えば、スキップされる配列が19塩基長のME配列である場合、19回の暗サイクルが使用される。いくつかの実施形態では、スキップされる配列は、ME配列又はその相補体である。19ヌクレオチド長のMEを有する実施形態では、暗サイクルの数は19である。異なる数のヌクレオチドを有するMEでは、暗サイクルは一般的にヌクレオチドの数である。いくつかの実施形態では、ユーザーは、ME全体をスキップすることができる。いくつかの実施形態では、ユーザーは、MEドメイン及びその配列部分の大部分をスキップして、配列決定されるMEに含まれるヌクレオチドを無視することができる。
いくつかの実施形態では、配列決定法は、データが配列決定法の一部について記録されていない暗サイクルを含む。いくつかの実施形態では、記録されていないデータは、3’トランスポゾン末端配列に関連する配列データである。いくつかの実施形態では、記録されていない配列データは、ME配列である。いくつかの実施形態では、暗サイクルは19サイクルを含む。
いくつかの実施形態では、配列決定は、データが配列決定の一部について記録されていない暗サイクルを含む。いくつかの実施形態では、記録されていないデータは、トランスポゾン末端配列又はその相補体(ME又はME’)に関連する配列データである。
配列決定プライマー配列(すなわち、プライマー結合部位)への配列決定プライマーの結合の例を、図47の代表的なポリヌクレオチドの上の矢印で示す。配列決定プライマーがA14、B15’、又はX配列に結合した後、暗サイクルを使用して、ME配列の一部又は全部の配列決定を回避することができる。
いくつかの実施形態では、配列決定法は、暗サイクルを含まない。これらの実施形態では、カスタムプライマーを使用して暗サイクルの必要性を排除する。いくつかの実施形態では、カスタムプライマーは、MEと整列する配列を含む架橋プライマーであってもよく、ME配列は画像化されない。
C.二本鎖核酸の一本鎖に存在する変異のエラー訂正又は同定
いくつかの実施形態では、同じインサートの2つのコピーを含む連結された配列決定鋳型は、エラー訂正、及び一本鎖にのみ存在する変異の同定のために使用され得る。これは、本質的に、単一の連結された配列決定鋳型の読み取りが、タグメンテーションされた二本鎖核酸の両方の鎖を読み取ることと等価であるためである。したがって、連結された配列決定鋳型の調製及び配列決定は、シーケンシング深度を増加させることができる。シーケンシング深度の増加は、例えば、固形腫瘍患者に存在する稀な体細胞変異を発見して、変異を同定する機会を高めるために極めて重要であり得る。
いくつかの実施形態では、同じインサートの2つのコピーを含む連結された配列決定鋳型は、エラー訂正、及び一本鎖にのみ存在する変異の同定のために使用され得る。これは、本質的に、単一の連結された配列決定鋳型の読み取りが、タグメンテーションされた二本鎖核酸の両方の鎖を読み取ることと等価であるためである。したがって、連結された配列決定鋳型の調製及び配列決定は、シーケンシング深度を増加させることができる。シーケンシング深度の増加は、例えば、固形腫瘍患者に存在する稀な体細胞変異を発見して、変異を同定する機会を高めるために極めて重要であり得る。
いくつかの実施形態では、本明細書に記載される連結された配列決定鋳型の配列決定の結果は、エラー訂正を可能にする。このようなエラーは、増幅又は配列決定自体の間に導入されたランダムエラーを補正することを含み得る。
いくつかの実施形態では、本明細書に記載される連結された配列決定鋳型の配列決定の結果は、二本鎖核酸の一方の鎖にのみ存在する変異又は他の塩基対の差異の同定を可能にする。
同じインサートの2つのコピーを含むそのような連結された配列決定鋳型を調製する異なる手段、例えば、フォーク型アダプターのライゲーションを使用して(図29に示される)、又はフォーク型アダプターを含むトランスポソームによるタグメンテーションを使用して(図40に示される)調製された一本鎖断片の架橋後の伸長が、本明細書に記載される。
いくつかの実施形態では、連結された配列決定鋳型における配列の2つのコピー間の差異は、エラー(例えば、配列決定又は増幅によって導入されるミス)に起因する。
いくつかの実施形態では、方法は、異なる鋳型から調製された所与のインサートの複数の配列の配列決定結果を評価することと、このインサートに関する配列決定結果におけるエラーを補正することとを含む。いくつかの実施形態では、エラーを補正することは、同じ連結された配列決定鋳型に含まれるインサート及びその相補体並びに/又は複数の連結された配列決定鋳型に含まれるインサート由来の配列決定データに基づく。
いくつかの実施形態では、連結された配列決定鋳型における配列の2つのコピー間の差異は、タグメンテーションされた二本鎖核酸の一本鎖にのみ存在した変異に起因する。一方の鎖のみに存在するそのような変異は、「非標準塩基対形成」と呼ばれる場合があり、核酸塩基損傷又は変異による場合がある。このような非標準塩基対形成は、一般に、評価することが困難であり得、本発明の方法は、このような塩基対形成の同定を改善し得る。
いくつかの実施形態では、方法は、異なる鋳型から調製された所与のインサートの複数の配列の配列決定結果を評価することを含む。いくつかの実施形態では、非標準塩基対形成の事象を決定することは、同じ連結された配列決定鋳型に含まれるインサート;及びその相補体並びに/又は複数の連結された配列決定鋳型に含まれるインサート由来の配列決定データに基づく。
D.近接性又は連続性情報の決定
いくつかの実施形態では、方法は、同じ鋳型に含まれるインサートの配列を評価することと、同じ鋳型に含まれるインサートに基づいて、二本鎖核酸に含まれる配列についての近接データを決定することとを含む。
いくつかの実施形態では、方法は、同じ鋳型に含まれるインサートの配列を評価することと、同じ鋳型に含まれるインサートに基づいて、二本鎖核酸に含まれる配列についての近接データを決定することとを含む。
図45に示されるように、本発明の方法は、二本鎖核酸から調製された二本鎖断片を変性させることによって生成される一本鎖断片由来の連結された配列決定鋳型の架橋及び生成とともに、二本鎖核酸(例えば、図45に示されるもの)に沿って「ウォーク」するために使用できる。上述したように、所与のインサート対を含む連結された配列決定鋳型の数及び頻度を使用して、二本鎖核酸についての連続性データを決定することができる。
XI.連結された配列決定鋳型を使用するメチル化分析の方法
いくつかの実施形態では、インサート配列及び同じインサートのコピーを含む連結された配列決定鋳型をメチル化分析に使用できる。これらの配列は、インサート配列の「2つのコピー」を有する連結配列として上述され得るが、インサート配列のコピーは、それらを促進する条件の非存在下では、修飾ヌクレオチド(例えば、修飾シトシン)を含まない。この態様は図48に示されており、ここでは、S及びS’インサート配列はメチル化シトシン及びヒドロキシメチル化シトシンを含むが、S-コピー及びS’-コピーは含まない。したがって、S及びS-コピーの配列は同じであり、S’及びS’-コピーは同じであるが、S及びS-コピーのメチル化状態は異なり得、S’及びS’-コピーのメチル化状態は異なり得る。
いくつかの実施形態では、インサート配列及び同じインサートのコピーを含む連結された配列決定鋳型をメチル化分析に使用できる。これらの配列は、インサート配列の「2つのコピー」を有する連結配列として上述され得るが、インサート配列のコピーは、それらを促進する条件の非存在下では、修飾ヌクレオチド(例えば、修飾シトシン)を含まない。この態様は図48に示されており、ここでは、S及びS’インサート配列はメチル化シトシン及びヒドロキシメチル化シトシンを含むが、S-コピー及びS’-コピーは含まない。したがって、S及びS-コピーの配列は同じであり、S’及びS’-コピーは同じであるが、S及びS-コピーのメチル化状態は異なり得、S’及びS’-コピーのメチル化状態は異なり得る。
本明細書で使用される場合、「メチル化分析」とは、標的核酸由来の所定のインサート中のシトシンがメチル化又はヒドロキシメチル化されているかどうかを評価することをいう。本明細書で使用される場合、「修飾シトシン」は、メチル化又はヒドロキシメチル化シトシンを指し、「非修飾シトシン」は、メチル化されていないシトシンを指す。いくつかの実施形態では、メチル化シトシンは5-メチルシトシン(5mC)であり、ヒドロキシメチル化シトシンは5-ヒドロキシメチルシトシン(5hMC)である。
メチル化分析を実施する手段は、当該技術分野で一般的に既知であるが、これらの方法は、試料の2つの異なるアリコート(一方のアリコートは、修飾シトシン又は非修飾シトシンを改変するための薬剤で処理され、他方のアリコートは未処理である)の比較に依存し得る。次いで、メチル化分析のための標準的な配列決定分析が、多くの場合、処理されたアリコートと未処理のアリコートとの間のミスマッチを評価すること、及び/又は標的核酸由来の相補配列の配列結果における差異を評価することによって、修飾シトシンを同定するために行われ得る。
代わりに、本発明の方法は、試料の2つの別個のアリコートを必要とせずに、標的核酸を含む試料から調製された二本鎖の連結された配列決定鋳型を使用する。更に、本発明の方法は、一本鎖の連結された配列決定鋳型中に一緒に連結されたインサート配列及びインサート配列のコピーを有し、これらの2つの配列間の差異をメチル化分析に使用できる。これらの連結された配列の分析は、連結されていない配列の分析よりも簡単であり、単一の試料のみを必要とする。
いくつかの実施形態では、二本鎖の連結された配列決定鋳型の2つの相補鎖は、増幅され(例えば、クラスター増幅を用いて)、フローセル上で配列決定され、これにより、本明細書に記載されるように、修飾及び非修飾シトシンを同定するための塩基コード分析を可能にする。いくつかの実施形態では、ウラシルはSBS配列決定に使用されるポリメラーゼを停止させるため、増幅は、配列決定鋳型に組み込まれるウラシルをチミンで置換する。いくつかの実施形態では、増幅中のウラシルのチミンによる置換は、クラスター増幅ミックス中のdTTPの存在(及びクラスター増幅ミックス中のdUPTの非存在)に基づく。
本出願は、図48~図62Cに示されるように、当業者がそのような分析を行うために選択し得る、多種多様な異なる方法を開示する。特定の方法の選択は、ユーザーがシトシンを変換したいのか、メチル化シトシンを変換したいのかに依存する。また、ユーザーは、メチル化シトシン、ヒドロキシメチル化シトシン、及び非修飾シトシンを互いに区別する方法を選択してもよく、又はユーザーは、修飾シトシンのみを非修飾シトシンから区別することを選択してもよい。
いくつかの実施形態では、シトシン又は修飾シトシンのウラシル又はジヒドロキシウラシル(DHU)への変換後、PCR反応は、ウラシル又はDHUをチミンに変換する。このようにして、相補的配列中のT/Gミスマッチ(標準的なC/Gマッチの代わりに)は、以下に議論されるように、シトシン又は修飾シトシンのいずれかを含む位置として評価され得る。
いくつかの実施形態では、連結された配列決定鋳型に含まれるインサート配列に含まれる修飾シトシンを同定する方法は、二本鎖の連結された配列決定鋳型を調製することであって、各鎖はインサート配列及びインサート配列のコピーを含み、2つの鎖は互いに相補的である、ことと、修飾シトシン及び/又は非修飾シトシンを改変するための条件に各鎖を供することとを含む。種々のアプローチが本明細書中に記載されるが、当業者は、修飾シトシン又は非修飾シトシンのいずれかを改変するための任意の方法を選択し得る。いくつかの実施形態では、修飾シトシン又は非修飾シトシンのいずれかを改変することは、いくつかの代表的な方法について本明細書に記載されるように、ユーザーが標的核酸中の修飾シトシン又は非修飾シトシンの位置を同定することを可能にする。
各鎖がインサート配列及びインサート配列のコピーを含み、2つの鎖が互いに相補的である、本発明の方法に使用できる例示的な二本鎖の連結された配列決定鋳型を図48に示す(一方の鎖にSインサート及びS-コピーを含み、他方の鎖にS’インサート及びS’-コピーを含む)。
いくつかの実施形態では、方法は、各一本鎖の連結された配列決定鋳型のアンプリコン及び配列決定アンプリコンを調製することと、各鎖から生成されたアンプリコン中のインサート配列及びインサート配列のコピーに関する配列決定結果を評価することとを更に含む。いくつかの実施形態では、方法は、二本鎖の連結された配列決定鋳型の各鎖の配列に基づいて、インサート配列に含まれる修飾シトシンの位置を決定することを含む。
本明細書に示される図では、一方の鎖を「上鎖」と称し、他方を「下鎖」と称して、これらが二本鎖の連結された配列決定鋳型に一緒に含まれる相補的一本鎖鋳型であることを示し得る。
いくつかの実施形態では、連結された配列決定鋳型は、本明細書に記載の方法によって調製される。あるいは、CODEC法(2021年6月12日投稿のBae et al.,bioRxiv,10.1101/2021.06.11.448110に記載)に記載されているような、連結された配列決定鋳型を調製する他の方法を使用してもよく、その後、本明細書に記載されているメチル化分析を行う。
いくつかの実施形態では、二本鎖の連結された配列決定鋳型を生成するための伸長は、図53に示されるように、メチル化dCTPを含む反応溶液を用いて行われる。いくつかの実施形態では、メチル化dCTPを含む反応溶液を用いて伸長を実施して、インサート配列のコピー中のメチル化シトシンの保存を可能にする(例えば、図53のS’-コピー及びS-コピーに示される)。メチル化dCTPによるこの伸長は、図55A~図55Cに示されるPCR及び分析を用いて、非修飾シトシンのみを変換する方法で対にすることができる(図54)。メチル化dCTPによるこの伸長はまた、図57A~57Cに示されるPCR及び分析を用いて、修飾シトシンのみを変換する方法で対にすることができる(図56)。UからTへのこのPCR変換は、標準的な手段による配列決定を可能にする。
いくつかの実施形態では、連結された配列決定鋳型に含まれるウラシルは、アンプリコンを調製するときにチミンに変換される。この態様は、例えば、図50A及び50Bに示されており、ここでは、PCRによって調製されたアンプリコンはTを置換しているが、PCR前の鋳型はUを含んでいた。
いくつかの実施形態では、修飾シトシンは、TET支援ピリジンボラン配列決定(TAPS)によって改変される。TAPSを含む方法が図51に示されており、ここでは、メチル化シトシン(mC)及びヒドロキシメチル化シトシン(hmC)がジヒドロキシウラシル(DHU)に変換される。DHUは、図52A及び52Bに示されるように、PCR増幅中にTによって置換され、それぞれ、インサート(すなわち、「オリジナル」)及びそのコピーにおける(T,C)をメチル化シトシンを有する位置として、及び(C,C)を非修飾シトシンを有する位置としてコールすることを可能にする。これらの(T,C)及び(C,C)は全て、図52Cに示されるように、相補鎖の配列中のGと対になる。
いくつかの実施形態では、非修飾シトシンは、化学反応又は酵素反応によって改変される。言い換えれば、修飾シトシンは影響を受けないままであり得るが、非修飾シトシンは改変され得る。いくつかの実施形態では、化学反応は亜硫酸水素ナトリウムによる処理である。いくつかの実施形態では、酵素反応は、Tetメチルシトシンジオキシゲナーゼ2(TET2)、T4-BGT、及びAPOBEC3Aでの処理を含む(例えば、Vaisvilas et al.,Genome Res.31(7):1280-1289(2021)に記載されているように、EM-seqとして知られている方法を使用)。そのような方法は図49に示され、ここでは未修飾シトシンはウラシルに変換される。ウラシルは、PCR増幅中にチミンによって置換され(図50A及び50Bに示される)、それぞれ、インサート(すなわち、「オリジナル」)及びそのコピー中の(C,T)を修飾シトシンを有する位置として、及び(T,T)を非修飾シトシンを有する位置としてコールすることを可能にする。相補鎖において、これらの(C,T)及び(T,T)は全て、図50Cに示されるように、Gと対になる。このようにして、標的核酸中で元々Cであったインサートの配列中のTの位置を、標的核酸中で元々Tであった位置から区別することができる(標的核酸中に生じたTが相補鎖中のAと対になるため)。修飾されたCは、処理によって改変されなかったため、Cとして保持される。
いくつかの実施形態では、本発明の方法は、ヒドロキシメチル化シトシンからメチル化シトシンの位置を区別する。いくつかの実施形態では、追加の反応工程は、ヒドロキシメチル化シトシンからメチル化シトシンを区別する反応を可能にする。
ヒドロキシメチル化シトシンからメチル化シトシンの位置を区別するためのいくつかの実施形態では、修飾及び/又は非修飾シトシンを改変するための条件に各鎖を供することは、(a)各鎖を、β-グリコシルトランスフェラーゼと反応させることと、(b)各鎖を、DNAメチルトランスフェラーゼ(DNMT)と反応させることと、(c)各鎖を、非修飾シトシンをウラシルに変換する条件で反応させることと、を含む。かかる方法を図58及び図59に示す。この方法の配列決定データの分析を図60A~図60Cに示す。図60Cに示されるように、この方法を使用して、元の標的核酸由来のシトシンは、配列決定データにおいて(T,T)として存在し、メチル化シトシンは(C,C)として存在し、ヒドロキシメチル化シトシンは(C,T)として存在し、これらの全ては、相補鎖においてGと対形成される。
ヒドロキシメチル化シトシンからメチル化シトシンの位置を区別するためのいくつかの実施形態では、修飾シトシン及び/又は非修飾シトシンを改変するための条件に各鎖を供することは、(1)各鎖を、DNMTと反応させることと、(2)各鎖を、メチル化シトシンをジヒドロキシウラシル(DHU、例えばTAPSを使用)に変換する条件で反応させることとを含む。かかる方法を図61に示す。この方法の配列決定データの分析を図62A~図62Cに示す。図62Cに示されるように、この方法を使用して、元の標的核酸由来の非修飾シトシンは、配列決定データにおいて(C,C)として存在し、メチル化シトシンは(T,T)として存在し、ヒドロキシメチル化シトシンは(T,C)として存在し、これらの全ては、相補鎖においてGと対形成される。
A.非修飾CのUへの変換を含む方法
いくつかの実施形態では、メチル化分析は、5-メチルシトシン(5mC)及び5-ヒドロキシメチルシトシン(5hMC)を未変化のままにしながら、非メチル化シトシンのウラシルへの変換を用いて行われる。例示的な方法は、バイサルファイトシークエンシングである。亜硫酸水素塩で処理されたDNAのPCR増幅はウラシルをチミンとして読み取るため、各シトシンの修飾を単一塩基の解像度で推測でき、CからTへの移行が非メチル化シトシンの位置を提供する。
いくつかの実施形態では、メチル化分析は、5-メチルシトシン(5mC)及び5-ヒドロキシメチルシトシン(5hMC)を未変化のままにしながら、非メチル化シトシンのウラシルへの変換を用いて行われる。例示的な方法は、バイサルファイトシークエンシングである。亜硫酸水素塩で処理されたDNAのPCR増幅はウラシルをチミンとして読み取るため、各シトシンの修飾を単一塩基の解像度で推測でき、CからTへの移行が非メチル化シトシンの位置を提供する。
B.修飾CのUへの変換を含む方法
いくつかの実施形態では、亜硫酸水素塩を含まない方法を、メチル化分析に使用する。いくつかの実施形態では、TET支援Pic-ボラン配列決定(TAPS)は、修飾シトシンを、一般的なポリメラーゼによってTとして「読み取る」ことができる、ほぼ天然塩基であるジヒドロキシウラシル(DHU)に変換する。いくつかの実施形態では、TAPSは、非修飾シトシンに影響を及ぼすことなく、シトシン修飾を直接検出する。いくつかの実施形態では、TAPSを使用して5mC及び5hMCを検出することができる。TAPSで処理されたDNAのPCR増幅はDHUをチミンとして読み取るため、各シトシンの修飾を単一塩基の解像度で推測でき、CからTへの移行が修飾シトシンの位置を提供する。
いくつかの実施形態では、亜硫酸水素塩を含まない方法を、メチル化分析に使用する。いくつかの実施形態では、TET支援Pic-ボラン配列決定(TAPS)は、修飾シトシンを、一般的なポリメラーゼによってTとして「読み取る」ことができる、ほぼ天然塩基であるジヒドロキシウラシル(DHU)に変換する。いくつかの実施形態では、TAPSは、非修飾シトシンに影響を及ぼすことなく、シトシン修飾を直接検出する。いくつかの実施形態では、TAPSを使用して5mC及び5hMCを検出することができる。TAPSで処理されたDNAのPCR増幅はDHUをチミンとして読み取るため、各シトシンの修飾を単一塩基の解像度で推測でき、CからTへの移行が修飾シトシンの位置を提供する。
C.β-グルコシルトランスフェラーゼによる処理を含む方法
いくつかの実施形態では、β-グルコシルトランスフェラーゼは、ヒドロキシメチルシトシン(hMC)をグルコシル化メチルシトシン(gmC)に選択的に変換する方法において使用される。いくつかの実施形態では、ヒドロキシメチル化シトシンは、メチル化シトシン及びヒドロキシメチル化シトシンを改変させる後の反応から「保護」される。かかる方法を図58に示す。
いくつかの実施形態では、β-グルコシルトランスフェラーゼは、ヒドロキシメチルシトシン(hMC)をグルコシル化メチルシトシン(gmC)に選択的に変換する方法において使用される。いくつかの実施形態では、ヒドロキシメチル化シトシンは、メチル化シトシン及びヒドロキシメチル化シトシンを改変させる後の反応から「保護」される。かかる方法を図58に示す。
D.DNMTによる治療を含む方法
いくつかの実施形態では、DNAメチルトランスフェラーゼ(DNMT)が使用される。いくつかの実施形態では、DNMTは、DNAメチルトランスフェラーゼ1(DNMT1)である。いくつかの実施形態では、DNMT1などのDNMTは、ヘミメチル化mCpG/GpCモチーフを認識し、非メチル化Cをメチル化してmCpG/GpMCを形成する。DNMT1は、Takahashi et al.,FEBS Open Bio 5(2015)741-747に記載されているように、ヘミヒドロキシメチル化CpG配列に対して活性を有さない。したがって、DNMTによる処理は、図58~図62Cに示されるように、メチル化シトシンをヒドロキシメチル化シトシンから区別する方法において使用できる。
いくつかの実施形態では、DNAメチルトランスフェラーゼ(DNMT)が使用される。いくつかの実施形態では、DNMTは、DNAメチルトランスフェラーゼ1(DNMT1)である。いくつかの実施形態では、DNMT1などのDNMTは、ヘミメチル化mCpG/GpCモチーフを認識し、非メチル化Cをメチル化してmCpG/GpMCを形成する。DNMT1は、Takahashi et al.,FEBS Open Bio 5(2015)741-747に記載されているように、ヘミヒドロキシメチル化CpG配列に対して活性を有さない。したがって、DNMTによる処理は、図58~図62Cに示されるように、メチル化シトシンをヒドロキシメチル化シトシンから区別する方法において使用できる。
実施例
実施例1.ビーズに連結したトランスポソームを介したポリヌクレオチドの調製の概要
複数のインサート配列を含むポリヌクレオチドを、ビーズに連結したトランスポソーム(BLT)に基づく方法によって生成することができる。図5A~図5Cは、Nextera FlexワークフローなどのBLTによるタグメンテーションを使用してインサート配列を含む断片を生成する一般的な方法を示す。しかしながら、図5Cに示されるように、標準的なNextera配列決定可能断片は、1つ以上の標的核酸由来の単一のインサート配列を含む。対照的に、本明細書に記載されるポリヌクレオチドは、複数のインサート配列を含む。
実施例1.ビーズに連結したトランスポソームを介したポリヌクレオチドの調製の概要
複数のインサート配列を含むポリヌクレオチドを、ビーズに連結したトランスポソーム(BLT)に基づく方法によって生成することができる。図5A~図5Cは、Nextera FlexワークフローなどのBLTによるタグメンテーションを使用してインサート配列を含む断片を生成する一般的な方法を示す。しかしながら、図5Cに示されるように、標準的なNextera配列決定可能断片は、1つ以上の標的核酸由来の単一のインサート配列を含む。対照的に、本明細書に記載されるポリヌクレオチドは、複数のインサート配列を含む。
2つのインサート配列を含む例示的なポリヌクレオチドは、図6A~図6Eに示されるように、タグメンテーションと、それに続く異なるタイプの産物を含む2つのライブラリーを生成するためのPCR反応によって生成することができ、一方のライブラリーは、ライブラリー産物がP5-A14/Hyb-B15-ME配列を含み、一方のライブラリーは、ライブラリー産物がP7-B15/Hyb’-A14-ME配列を含む。
複数のインサート配列を含む得られたポリヌクレオチドを使用して、配列決定できる連結された核酸配列決定鋳型のライブラリーである「タンデムリードライブラリー」を生成することができる。図4A~図4Bは、標準的なIlluminaペアエンドライブラリー(図4A)と、複数のインサート配列を含むポリヌクレオチドを用いる本発明の方法(図4B)との間の差異を強調する。図4Bに示されるように、リード1-A配列決定プライマー(第1のリードプライマー)は、このハイブリッドDNAライブラリー(すなわち、複数のインサート配列を含むポリヌクレオチド)の第1のインサートのフォワードリードを配列決定する。150サイクルのSBS配列決定後、SBS合成鎖を変性して、次いで、リード1-B配列決定プライマー(第2のリードプライマー)をハイブリダイズでき、第2のインサートのフォワードリード。次いで、ペアエンドターンアラウンドを実施して、リード2-A配列決定プライマー(第3のリードプライマー)を有する第2のインサートのリバース鎖、続いてリード2-B配列決定プライマー(第4のリードプライマー)を有する第1のインサートのリバース鎖についてそれぞれ150サイクルを同様に実施することができる。
複数のインサート配列を有するポリヌクレオチドを調製するワークフローは、十分に確立されたビーズに連結したトランスポソームライブラリー調製手法(例えば、Nextera flex)又はアダプターベースの方法(例えば、Truseq)を活用する。
実施例2.タグメンテーション及びそれに続くP5/P7及びハイブリダイゼーション及びハイブリダイゼーションの相補体配列の付加によるポリヌクレオチドの調製
例示的な方法では、A14及びB15配列を含むライブラリー産物を、タグメンテーション反応中にA14及びB15配列を付加するためのタグメンテーションによって生成した(図6A)。これに続いて、図6B~6Cに示されるように、PCRによってP5/HYB配列(チューブ1中)及びP7/HYB’(チューブ2中)を添加した。
例示的な方法では、A14及びB15配列を含むライブラリー産物を、タグメンテーション反応中にA14及びB15配列を付加するためのタグメンテーションによって生成した(図6A)。これに続いて、図6B~6Cに示されるように、PCRによってP5/HYB配列(チューブ1中)及びP7/HYB’(チューブ2中)を添加した。
精製後、ライブラリーを混合する。次いで、HYBとHYB’との間で生成されるハイブリダイズした付加物に基づいて、伸長された産物が調製され得る。図6Dにおいてボックスで囲まれた産物のみがHYB又はHYB’配列を含み、HYB/HYB’ハイブリダイゼーションに基づいて別のライブラリー産物とハイブリダイズした付加物を形成することができ、その後、伸長を使用して、連結された核酸配列決定鋳型を生成することができる。伸長産物の少なくとも1/9 は、クラスターを形成することができる配列決定可能な産物である(すなわち、HYB’[H’]及びP5を含む1つの鎖並びにP7及びHYB[H]を含む1つの鎖を含む連結された核酸配列決定鋳型、図6E)。
実施例3.タグメンテーション及びそれに続くハイブリダイゼーション及びハイブリダイゼーションの相補体配列の付加によるポリヌクレオチドの調製
例示的な方法では、インサート、アダプター、及びハイブリダイゼーション配列を含むライブラリー産物を、BLTによるタグメンテーション、続いてHYB及びHYB’の付加によって生成した。この例示的な方法において、1つのチューブは、ビーズベースのタグメンテーションを使用してP5-HYB’フォーク型ライブラリーを形成し、別のチューブは、溶液ベースのタグメンテーションを使用してP7-HYBフォーク型ライブラリーを形成した。HYB及びHYB’を、タグメンテーション後のライブラリー産物に添加した。
例示的な方法では、インサート、アダプター、及びハイブリダイゼーション配列を含むライブラリー産物を、BLTによるタグメンテーション、続いてHYB及びHYB’の付加によって生成した。この例示的な方法において、1つのチューブは、ビーズベースのタグメンテーションを使用してP5-HYB’フォーク型ライブラリーを形成し、別のチューブは、溶液ベースのタグメンテーションを使用してP7-HYBフォーク型ライブラリーを形成した。HYB及びHYB’を、タグメンテーション後のライブラリー産物に添加した。
最初に、10μLのBLT(10fmole)を用いてP5/HYB’ライブラリーを作製し、200μLの洗浄緩衝液で洗浄した。次に、176μLの作業緩衝液を1μLの一本鎖結合タンパク質と混合した。洗浄緩衝液をビーズから除去し、44μLの作業緩衝液+SSBミックスを添加した。溶液を室温で1分間インキュベートした。次いで、合計6μLの10×タグメンテーション緩衝液をビーズに添加し、タグメンテーションを37℃で10分間進行させた。次に、12μLの5%SDSを添加し、37℃で10分間インキュベートした後、200μLの洗浄緩衝液で3回洗浄し、200μLの洗浄緩衝液に再懸濁した。
ハイブリダイゼーション配列を付加するために、断片を60℃で5分間インキュベートしてME’配列を変性させた。200μLの洗浄緩衝液で素早く洗浄した後、ビーズを80μLの2μM ME’-HYB’中に再懸濁し、Annealrtプログラムを60℃から開始して20℃まで下げて行った(1サイクルあたり1℃)。ビーズを200μLの洗浄緩衝液で洗浄し、80μLのELM3に再懸濁した後、室温で30分間回転させた。ビーズを200μLの洗浄緩衝液で洗浄し、洗浄緩衝液中4℃で保存した。
これとは別に、P7-B8-ME/ME’を含むオリゴヌクレオチド(オリゴ)二本鎖を用いてP7/HYBライブラリーを作製した。オリゴヌクレオチド二本鎖はオリゴ1及びオリゴ2を含んでいた。表2は、オリゴヌクレオチド二本鎖を生成するための反応溶液の成分を記載する。
オリゴ1:(20P7-B8-ME)5’-CAG AAG ACG GCA TAC GAG ATG GGC TCG GAG ATG TGT ATA AGA GAC AG-3’(配列番号9)
オリゴ2:(ME’)5’-/Phos/CTG TCT CTT ATA CAC ATC T-3’(配列番号3)
オリゴ1:(20P7-B8-ME)5’-CAG AAG ACG GCA TAC GAG ATG GGC TCG GAG ATG TGT ATA AGA GAC AG-3’(配列番号9)
オリゴ2:(ME’)5’-/Phos/CTG TCT CTT ATA CAC ATC T-3’(配列番号3)
オリゴヌクレオチド二本鎖溶液を調製した後、表3のプロトコールを使用してAnnealrtレシピをPCRで実施した。二本鎖を長期保存のために-20℃で保存し、複数回の凍結融解サイクルを回避した。
酵素複合体を表4に概説するように構築し、37℃で一晩インキュベートし、次いで20℃で保存した。
酵素複合体を標準保存緩衝液で1/5に希釈して400nMとした。タグメンテーション反応物を表5に基づいて調製し、タグメンテーションを55℃で5分間進行させた。
zymo-kitを用いてカラム精製を行い、20μLの再懸濁緩衝液(RSB)中に溶出した。次いで、合計18μLのタグメンテーションライブラリー+2μLの100μM HYB-ME’オリゴ(最終濃度10μM)を75℃のインキュベーションで5分間インキュベートし、続いて20℃までゆっくりと低下させて、オリゴ3及びオリゴ4を使用してME’オリゴをHYB-ME’で置換した。
オリゴ3:(p-18ME’HYB’)/5Phos/TGTCTCTTATACACATCTCTCTCTTCTCTCCTTCTTCTCTCT(配列番号10)
オリゴ4:(p-18ME’HYB)/5Phos/TGTCTCTTATACACATCTAGAGAGAAGAAGGAGAGAAGAGAG(配列番号11)
オリゴ3:(p-18ME’HYB’)/5Phos/TGTCTCTTATACACATCTCTCTCTTCTCTCCTTCTTCTCTCT(配列番号10)
オリゴ4:(p-18ME’HYB)/5Phos/TGTCTCTTATACACATCTAGAGAGAAGAAGGAGAGAAGAGAG(配列番号11)
合計180μLのELM3を添加し、溶液を室温で30分間回転させた。SPRIビーズ洗浄を行った。
この段階で、P5ライブラリーはビーズ上にあり、P7ライブラリーは溶液中にあった。両方のライブラリーを混合し、Annealrtプログラムを開始して40℃から20℃に下げ、続いてビーズを洗浄し、100μLのAMS1伸長緩衝液(Bstポリメラーゼなどの鎖置換ポリメラーゼ及びヌクレオチドを含む)に再懸濁した。再懸濁した溶液をNaOHで洗浄し、ライブラリーをビーズ表面から増幅した。本実施例では、P5/A14及びP7/B15プライマーを用いてPCRを行った。Ampureビーズ洗浄を実施して、未結合アダプターを除去した。
Qubit濃度は0.849μL/mLと測定され、これは約2nMである。5pMの一本鎖ライブラリーを、FC#CD79Kを播種したmiseqフローセル上で作製した。クラスターは、かすかで5pMと一致しないようであったため、更に24サイクルの増幅を行った。
このプロトコールはハイブリッドライブラリを形成するが、十分な効率を有していない可能性がある。例えば、NaOHによるビーズ上での変性は、試料の損失及び配列決定のためのフローセル上での不十分な密度を引き起こし得る。ビーズ上での両方のライブラリーの調製は、収率を改善し得る。
実施例4.ビーズに連結したトランスポゾンによるDNAライブラリーの調製、その後の変性、ハイブリダイゼーション、及び鎖伸長
ハイブリッドDNAライブラリーを調製するためのワークフローは、ビーズに連結したトランスポゾン(BLT)を用いて行うことができる。ライブラリー調製のための標準プロトコールとの違いは、2つのタイプのビーズの存在である(タイプIビーズは、ME’-HYB’を含むBLTを有し、タイプIIビーズは、トランスポゾンの非挿入鎖にME’-HYBを含むBLTを有する)。
ハイブリッドDNAライブラリーを調製するためのワークフローは、ビーズに連結したトランスポゾン(BLT)を用いて行うことができる。ライブラリー調製のための標準プロトコールとの違いは、2つのタイプのビーズの存在である(タイプIビーズは、ME’-HYB’を含むBLTを有し、タイプIIビーズは、トランスポゾンの非挿入鎖にME’-HYBを含むBLTを有する)。
BLTタグメンテーション及びギャップ充填ライゲーション(ELM3を使用)の後は、ライブラリー調製完了のための2つの選択肢がある。図9Bに示されるように、非アンカー鎖をBLTから変性させて、ライブラリーのHYB-HYB’部分をハイブリダイズさせることができ、次いで、AMS1ポリメラーゼ伸長ミックスを添加して鎖を伸長させて、末端にP5-P7’又はP7-P5’を有するライブラリーを完成させることができる。次いで、このライブラリーは、PCR又はビオチンを有する遊離緩衝液によってビーズから遊離され得る。
別の方法を図8A~図8Bに示す。ここで、P5アンカートランスポソームは、低濃度のビオチンを含有する遊離緩衝液によってライブラリーが遊離できないように、ビオチン又は化学的コンジュゲーションを使用して結合される。他のビーズタイプは、単一のデスチオビオチンを使用してビーズに固定されたP7を有し、これは、遊離緩衝液を使用してストレプトアビジンから容易に除去され得る。したがって、P7-HYBライブラリーを選択的に遊離し、ビーズタイプI上のP5-HYB’ライブラリーにハイブリダイズが可能になり得る。
再び、AMS1ポリメラーゼ伸長ミックスを添加して鎖を伸長させてP5-P7’又はP7-P5’ライブラリーを作製し、次いでPCR又は他の遊離条件(変性緩衝液+高温など)を使用してライブラリーをビーズから収集する。
連結された核酸配列決定鋳型を形成するためのHYBのHYB’へのハイブリダイゼーション及び伸長のためのこれらのアプローチは、Truseq又は他のタイプのトランスポソーム反応によって生成されるものなどの他の供給源からのライブラリー産物に使用できる。
実施例5.デスチオビオチンでタグ付けされたオリゴヌクレオチドを使用するビーズベースのプロトコールによるポリヌクレオチドの調製
プロトコールを、デスチオビオチンでタグ付けされたオリゴヌクレオチドを使用して開発した。デスチオビオチンによるタグ付けは、NaOH変性工程の必要性を回避することができる。
プロトコールを、デスチオビオチンでタグ付けされたオリゴヌクレオチドを使用して開発した。デスチオビオチンによるタグ付けは、NaOH変性工程の必要性を回避することができる。
P5/HYB’ライブラリーを生成するために、合計10μLのBLT(10fmole)を200μLの洗浄緩衝液で洗浄した。176μLの作業緩衝液を1μLの一本鎖結合(SSB)タンパク質と混合した。洗浄緩衝液をビーズから除去し、44μLの作業緩衝液+SSBミックスを添加し、室温で1分間インキュベートした。次いで、6μLの10×タグメンテーション緩衝液をビーズに添加し、タグメンテーションを37℃で10分間進行させた。12μLの5%SDSを添加し、37℃で10分間インキュベートした。ビーズを200μLの洗浄緩衝液で3回洗浄し、200μLの洗浄緩衝液に再懸濁した。ビーズを60℃で5分間インキュベートしてME’を変性させ、200μLの洗浄緩衝液で素早く洗浄した。ビーズを80μLの2μM ME’-HYB’中に再懸濁した。Run Annealrtプログラムを、60℃から開始し、20℃まで下げた(1サイクル当たり1℃)。ビーズを200μLの洗浄緩衝液で洗浄し、80μLのELM3伸長-ライゲーション緩衝液に再懸濁し、室温で30分間回転させ、次いで200μLの洗浄緩衝液で洗浄し、4℃の洗浄緩衝液中に保存した。
P7/HYBライブラリーを、単一デスチオビオチンP7-B8-MEオリゴヌクレオチドを使用して生成して酵素複合体を作製し、Dynabeads M280ストレプトアビジンビーズにアセンブルした。対照的に、P5/HYB’は、2つのデスチオビオチンを有するBLTを使用して生成した。したがって、遊離条件は、2つのライブラリーについて異なり、P5/HYB’ライブラリーは、60℃で20mMビオチンの遊離条件を有する2つのデスチオビオチンを有するBLTを用いて生成され、一方、P7/HYBライブラリーは、70℃で10μMビオチンの遊離条件を有する単一のデスチオビオチンを有する。
P7/HYBライブラリーを調製するために、オリゴヌクレオチド(オリゴ)二重鎖を表6に記載されるように調製した。
オリゴ1:(desthio20P7-B8-ME)5’- /5deSBioTEG/ CAGAAGACGGCATACGAGAT GGGCTCGG AGATGTGTATAAGAGACAG-3’(配列番号12)
オリゴ2:(ME’)5’-/Phos/CTG TCT CTT ATA CAC ATC T-3’(配列番号3)
オリゴ1:(desthio20P7-B8-ME)5’- /5deSBioTEG/ CAGAAGACGGCATACGAGAT GGGCTCGG AGATGTGTATAAGAGACAG-3’(配列番号12)
オリゴ2:(ME’)5’-/Phos/CTG TCT CTT ATA CAC ATC T-3’(配列番号3)
オリゴヌクレオチド二本鎖溶液を調製した後、表7のプロトコールを使用してAnnealrtレシピをPCRで実施した。二本鎖を長期保存のために-20℃で保存し、複数回の凍結融解サイクルを回避した。
酵素複合体を表8に概説するように構築し、37℃で一晩インキュベートし、次いで20℃で保存した。
40μLのM280ビーズを200μLの洗浄緩衝液で洗浄し、40μLの洗浄緩衝液に再懸濁し、2μLの2μMトランスポソーム複合体(10fmole/BLT)を添加した。ビーズを室温で30分間回転させ、洗浄し、40μLの洗浄緩衝液に再懸濁した。10μLの酵素ビーズを200μLの洗浄緩衝液で洗浄した。176μLの作業緩衝液を1μLの一本鎖結合タンパク質と混合した。洗浄緩衝液をビーズから除去し、44μLの作業緩衝液+SSBミックスを添加し、室温で1分間インキュベートした。6μLの10×タグメンテーション緩衝液をビーズに添加し、タグメンテーションを37℃で10分間進行させた。次いで、12μLの5%SDSを添加し、37℃で10分間インキュベートした。ビーズを200μLの洗浄緩衝液で3回洗浄し、200μLの洗浄緩衝液に再懸濁した。次いで、ビーズを60℃で5分間インキュベートしてME’を変性させ、200μLの洗浄緩衝液で素早く洗浄し、ビーズを80μLの2μM ME’-HYB中に再懸濁した。Run Annealrtプログラムを、60℃から開始し、20℃まで下げた(1サイクル当たり1℃)。ビーズを200μLの洗浄緩衝液で洗浄し、80μLのELM3伸長ライゲーション緩衝液に再懸濁し、室温で30分間回転させた。ビーズを200μLの洗浄緩衝液で洗浄し、洗浄緩衝液中に4℃で保存した。
この時点で、ビーズ上の2つの別々のライブラリーセットが準備される。15サイクルのPCRを各ライブラリーセットについて行うと、PCR産物の上清は、予想される位置にBAピークを示す。PCR反応において、表9に概説するように、P5/HYB’ライブラリーについてはP5及びHYBをPCRプライマー1として使用し、P7/HYBライブラリーについてはP7及びHYB’をPCRプライマー2として使用した。
P7/HYBビーズをHT1ハイブリダイゼーション緩衝液中の10mMビオチンに再懸濁し、オリゴヌクレオチド二本鎖のオリゴ1が単一のデスチオビオチンを含んでいたため、60℃で10分間遊離させた。上清をP5/HYBビーズに添加し、次いで50℃から開始して20℃までゆっくりと下降させて、ライブラリー産物をハイブリダイズさせた。次いで、ビーズを洗浄緩衝液で洗浄し、AMS1を添加し、50℃で10分間インキュベートした。2つのインサート配列(各ライブラリーから1つ)を含むポリヌクレオチドをロードし、HT1ハイブリダイゼーション緩衝液中の20mMビオチンによってフローセル上に遊離させた。
実施例6.HYB/HYB’配列の更新
最初の実験は、HYB1と称し得るHYB配列を用いて行った。
HYB1(配列番号13):5’-AGA GAG AAG AAG GAG AGA AGA GAG-3’
最初の実験は、HYB1と称し得るHYB配列を用いて行った。
HYB1(配列番号13):5’-AGA GAG AAG AAG GAG AGA AGA GAG-3’
更新されたHYB設計であるHYB2は、追加のA/T含量、A及びGヌクレオチドのシャッフル、並びにHYB配列の5’末端上のC/Gロックを含めた。
HYB2(配列番号14):5’-GAG TAA GTG GAA GAG ATA GGA AGG-3’
HYB2(配列番号14):5’-GAG TAA GTG GAA GAG ATA GGA AGG-3’
実施例7.Truseq PCR Freeを用いたポリヌクレオチドの調製
複数のインサート配列を含むポリヌクレオチドもまた、Truseq PCR Freeプロトコールを用いて調製した。
複数のインサート配列を含むポリヌクレオチドもまた、Truseq PCR Freeプロトコールを用いて調製した。
1μgのNA12878ゲノムDNAを各フォーク型ライブラリーのインプットとして使用し、続いてIllumina Truseq PCRフリープロトコールを使用してDNAを剪断し、末端修復及びAテーリングを行った。
使用したライゲーション工程では、P5/HYB2’アダプター及びP7/HYB2アダプターセットを使用した。P7/HYB2アダプター(配列番号24及び25)をインサート配列1に使用し、P5/HYB2’アダプター(配列番号26及び27)をインサート配列2に使用した。これらのアダプターにおいて、Cはメチル化されていた。
表10のAnnealrtレシピを用いてアダプターセットを調製し(最終濃度10μM)、二本鎖を-20℃で長期間保存し、複数回の凍結融解サイクルを回避した。オリゴヌクレオチドのストック濃度は100μMであり、最終アダプター濃度は1×アニーリング緩衝液(20mM Tris、50mM NaCl、0.01mM EDTA)中10μMであった。
ライゲーションは、カスタムアダプターセットを使用するライゲーション工程についてのIllumina PCR free Truseqプロトコールに従って実施した。Truseqプロトコールに列挙されるように2回精製を実施し、最終ライブラリーを22.5μLのIllumina再懸濁緩衝液中に溶出した。
次いで、フォーク型ライブラリーは、2つのインサート配列を含むポリヌクレオチドを調製するためのスタッキングの準備ができていた。6μLのP5/Hyb2’を有するフォーク型ライブラリー産物及び6μLのp7/Hyb2を有するフォーク型ライブラリー産物を混合し、1.3μLの10×アニーリング緩衝液を添加した。表11に列挙したPCRのアニーリングプログラムを使用して、2つのライブラリー産物をハイブリダイズさせた。
アニーリング工程後、117μL(アニーリングしたライブラリーの体積の9倍)のAMS1を添加し、続いて50℃で10分間インキュベートした。伸長後、Illumina適合タンデムライブラリーを形成した。1×SPRI精製を行い、試料を12μLのIllumina再懸濁緩衝液中に溶出した。
Bioanalyzerを実行させて、タンデムライブラリーのサイズを確認し、qPCRを用いて最終ライブラリー産物を定量した。図11に示されるように、タンデムライブラリーは612塩基対の平均サイズを示し、これは出発のP5-HYB’又はP7-HYBライブラリーの約2倍であった。これらの結果は、Truseq法を用いてタンデムライブラリーの対形成に成功したことを示す。
タンデムライブラリーは、2つではなく4つのリードを有するようにレシピを修正して、Illuminaプラットフォーム上で配列決定することができる。配列決定プライマーの位置を更新して、各配列決定リードについて正しい配列決定プライマーを使用した。
実施例8.複数のインサートを含むポリヌクレオチドの配列決定
これらの実験では、ビーズに連結したトランスポゾンを用いてヒトゲノムライブラリー断片を作製した後、複数のインサートを含むポリヌクレオチドを調製した。ポリヌクレオチドを、Miseq FCによって配列決定した。図14Aに示すデータは、リード1 SBS3T配列決定プライマーを使用した標準リード1配列決定(リード1-A)である。リード1-Aによる配列決定を終えた後、合成された鎖を変性させ、中間配列決定プライマー(リード1-B seqプライマー、第2のリードプライマーである)とハイブリダイズさせた。2回の読み取りサイクルの配列決定のサムネイル画像を図14Bに示す。データを明確に示すために、いくつかの過剰増幅されたクラスターが存在する。
これらの実験では、ビーズに連結したトランスポゾンを用いてヒトゲノムライブラリー断片を作製した後、複数のインサートを含むポリヌクレオチドを調製した。ポリヌクレオチドを、Miseq FCによって配列決定した。図14Aに示すデータは、リード1 SBS3T配列決定プライマーを使用した標準リード1配列決定(リード1-A)である。リード1-Aによる配列決定を終えた後、合成された鎖を変性させ、中間配列決定プライマー(リード1-B seqプライマー、第2のリードプライマーである)とハイブリダイズさせた。2回の読み取りサイクルの配列決定のサムネイル画像を図14Bに示す。データを明確に示すために、いくつかの過剰増幅されたクラスターが存在する。
10個のクラスターからのリードの例を表12に示して、2つのライブラリー断片の単一クラスターへの連結の成功を示す。4×100サイクルの配列決定を行い、得られたリード対をヒトゲノムにマッピングした。表12は、BAMファイルで報告されたクラスターのタイル、x及びy座標を示す。所与のクラスターについて、各リードがマッピングされた染色体が提供される。予想通り、各ライブラリーからの2つのペアリードは同じ染色体にマッピングされ、2つのライブラリー断片は異なる染色体にマッピングされる。したがって、表12の結果は、ポリヌクレオチド中の2つのインサートがヒトゲノム中の異なる領域に由来することを示す。
個々のクラスター由来のリードのこれらの結果は、ポリヌクレオチドへの2つのライブラリー断片の連結が成功したこと、及び2つの別個のインサート配列の配列決定を実証している。
実施例9.ライゲーション法を用いた、剪断されたゲノムDNA断片を有する出発ライブラリーからのポリヌクレオチドの調製
制限酵素消化及びライゲーションを含む方法を使用して、複数のインサート配列を含むポリヌクレオチドを生成した。本明細書中の図15A~図15Fに記載される例示的な方法において、第1のライブラリーは、剪断されたE.coliゲノムDNAに由来するインサートを含み、第2のライブラリーは、剪断されたヒトゲノムDNAに由来するインサートを含んだ。第1のライブラリーをBtgZIで消化し、第2のライブラリーをBglIIで消化した。2つの消化されたライブラリーを一緒にライゲーションして、各ポリヌクレオチドがE.coliゲノム由来の1つのインサート及びヒトゲノム由来の別のインサートを含有するタンデムインサートライブラリーを生成した(図19)。
制限酵素消化及びライゲーションを含む方法を使用して、複数のインサート配列を含むポリヌクレオチドを生成した。本明細書中の図15A~図15Fに記載される例示的な方法において、第1のライブラリーは、剪断されたE.coliゲノムDNAに由来するインサートを含み、第2のライブラリーは、剪断されたヒトゲノムDNAに由来するインサートを含んだ。第1のライブラリーをBtgZIで消化し、第2のライブラリーをBglIIで消化した。2つの消化されたライブラリーを一緒にライゲーションして、各ポリヌクレオチドがE.coliゲノム由来の1つのインサート及びヒトゲノム由来の別のインサートを含有するタンデムインサートライブラリーを生成した(図19)。
タンデムインサートライブラリーポリヌクレオチド由来のポリヌクレオチドを異なる濃度で含有する8レーン配列決定フローセルを調製し、レーン1は2pMを有し、レーン2は10pMを有し、レーン3は20pMを有し、レーン6は2pMを有し、レーン7は10pMを有し、レーン8は20pMを有した。レーン4及び5は対照反応のためのレーンであり、レーン4は単一鋳型対照反応を有し、レーン5はpHIX配列決定ライブラリー対照反応を有した(図19)。リード1及び4を使用して、E.coliゲノム由来のインサートを配列決定した(図19)。リード2及び3を使用して、ヒトゲノム由来のインサートを配列決定した(図19)。
図20A~図20Dに示されるように、2pM又は10pMでクラスター化されたレーンは、純度フィルターを通過した高い割合(%PF)の純粋なクラスターを生成し、正しく形成された鋳型のクラスター化及び配列決定の成功を示した。更に、予想される参照ゲノムに整列させた場合、高い割合のリードが正確に一致し、鋳型が予想されるインサートを含有したことを示した。
両方のインサートについて配列決定の各サイクルで検出された4塩基の各々の割合は、図21A~Bにおいてサイクルプロットあたりの%ベースコールで表される。A、T、G、及びCは、E.coli断片を含有する第1のインサートにおいて各サイクルについて25%の割合で生じることが予想され、観察された。同様に、A、T、C、及びGは、ヒト断片を含有する第2のインサートにおいて各サイクルについて30%、30%、20%、及び20%の割合で生じることが予想され、観察された。データは、設計されたライブラリーにおいて2つのインサートを検出した4回の読み取りが行われたことを示す。
実施例10.鎖オーバーラップ伸長(SOE)法を用いた単一鋳型を有する出発ライブラリーからのポリヌクレオチドの調製。
鎖オーバーラップ伸長(SOE)を含む方法を使用して、複数のインサート配列を含むポリヌクレオチドを生成した。本明細書に記載される例示的な方法において(図16A~図16B及び図17)、第1のライブラリーは、E.coli由来のインサート単一鋳型(すなわち、アンプリコン)を含有し、第2のライブラリーは、PhiX由来の単一鋳型を含有した(図22及び図24A~図24C)。少なくとも2つの異なるアンプリコンのセットを使用した。アダプターを単一鋳型にライゲーションし、(図16A~図16B及び図17)に示すSOE法を使用してタンデムインサートライブラリーを作製した。
単一インサート対照PhiXライブラリーを含有するレーン5を除く全てのレーンにおいて、タンデムインサートライブラリーポリヌクレオチド由来のポリヌクレオチドを含有する配列決定フローセルを調製した。リード1及び4を使用して、PhiX単一鋳型由来のインサートを配列決定した(図22)。リード2及び3を使用して、E.coli単一鋳型由来のインサートを配列決定した(図22)。
4リード配列決定実行からの一次メトリックを図23A~図23Dに示す。第1及び第2のインサートをそれぞれカバーするリード1及び2は、クラスター数、%PF、及び%アラインを示し、各ポリヌクレオチド中の2つのインサートの存在を示す。対照的に、単一インサート対照を含有するレーン5は、リード2について意味のあるデータを生じず、第2のインサートが存在しないことを示した。
図24A~Cは、本実施例の方法を使用して生成されたタンデムインサートポリヌクレオチドの完全なアンプリコン配列を示す。(アダプター配列は「アダプター」とマークされ、それらの実際の配列は示されていない。)図24A~Cは、リード1及びリード2の上位5つの最も一般的なリード配列、並びにそれらのカウントを強調した、シーケンサー機器出力からの予想配列を示す。リード1は第1のインサートに読み込まれ、リード2は第2のインサートに読み込まれる。データは、両方のアンプリコンの存在を示し、タンデムインサートポリヌクレオチドの生成が成功したことを確認する。
両方のインサートについて配列決定の各サイクルで検出された4塩基の各々の割合は、図21A~Bにおいてサイクルプロットあたりの%ベースコールで表される。A、T、G、及びCは、E.coli断片を含有する第1のインサートにおいて各サイクルについて25%の割合で生じることが予想され、観察された。同様に、A、T、C、及びGは、ヒト断片を含有する第2のインサートにおいて各サイクルについて30%、30%、20%、及び20%の割合で生じることが予想され、観察された。データは、設計されたライブラリーにおいて2つのインサートを検出した4回の読み取りが行われたことを示す。
実施例11.フォーク型アダプター及び固体支持体を使用する、2つ以上のインサートを含む配列決定鋳型の調製
2つ以上のインサートを含む配列決定鋳型を調製する方法は、フォーク型アダプター及びライゲーションされたアダプターを有する断片を固定化するための表面を用いて行うことができ、固体支持体は、複数の断片を一緒にハイブリダイズさせて、連結された配列決定鋳型を生成することを可能にする。
2つ以上のインサートを含む配列決定鋳型を調製する方法は、フォーク型アダプター及びライゲーションされたアダプターを有する断片を固定化するための表面を用いて行うことができ、固体支持体は、複数の断片を一緒にハイブリダイズさせて、連結された配列決定鋳型を生成することを可能にする。
図25に示されるように、第1及び第2のアダプターを調製することができる。アダプターは、2つのアダプターがそれぞれ、互いに部分的にハイブリダイズして二本鎖セクション及び一本鎖セクションを形成する第1のオリゴヌクレオチド及び第2のオリゴヌクレオチドを含むように、構造が「Y字型」又は「フォーク型」であり得る(すなわち、各アダプターがフォーク型アダプターである)。各フォーク型アダプターは、アダプターを表面に付着させるための結合部分を含む。この部分結合は、ビオチン又は当業者に既知の他の化学物質であり得る。この部分は、フォーク型アダプター中のオリゴヌクレオチドのうちの1つの5’末端に存在し得、これは、フォーク型アダプターの「第1の鎖」と呼ばれ得る。第1の鎖は、Illuminaの配列決定プラットフォームの「リード1」配列(P5.R1と称される)に対応する完全配列又は部分配列を含み得、第2のアダプターの場合、Illuminaの配列決定プラットフォームの「リード2」配列(例えば、P7.R2)を含み得る。第2の鎖は、5’末端セクション及び3’末端セクションの2つのセクションを含む。5’末端セクションは相補的であり、第1の鎖の3’末端にハイブリダイズする。第1のアダプターにおける第2の鎖(X’)の3’末端セクションは、第2のアダプターにおける第2のオリゴヌクレオチド(X)の3’末端セクションに相補的である。X及びX’は、それぞれ、ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体であり得る。
ブロッキングオリゴヌクレオチドは、いずれかのフォーク型アダプターの第2の鎖の3’末端で一方又は両方のフォーク型アダプターにハイブリダイズされ得る(すなわち、ブロッキングオリゴヌクレオチドは、フォーク型アダプターの第2の鎖の一本鎖セクションにハイブリダイズされる)。このブロッキングオリゴヌクレオチドは、第1のフォーク型アダプター又は第2のフォーク型アダプターのいずれか又は両方にハイブリダイズされ得る(図26)。ブロッキングオリゴヌクレオチドは、第1のフォーク型アダプター及び第2のアダプターが、各第2の鎖の3’相補的セクション(すなわち、図26に示されるX及びX’配列、それぞれハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体に対応し得る)を介して互いにハイブリダイズすることを防止する。
第1のフォーク型アダプター及び第2のフォーク型アダプターの混合物が、第1の鎖(図27A~27Cの上鎖A)及び下鎖(図27A~図27Cの下の相補体A’)を含む二本鎖DNA断片の末端にライゲーションされる場合、3つの異なるタグ付けされたライブラリー産物が形成され得る。一方の末端に第1のフォーク型アダプター及び他方の末端に第2のフォーク型アダプターを有する断片(図27A)、両端に第1のフォーク型アダプターを有する断片(図27B)、又は両端に第2のフォーク型アダプターを有する断片(図27C)。異なる断片(図27A~図27Cに示される)は、50(図27A):25(図27B):25(図27C)の比で形成される。
次いで、ライゲーションされたアダプターを有する断片を表面に付加し、フォーク型アダプターの第1の鎖の5’親和性部分を介して付着させることができる。表面は、ビーズ、又はスライド、又は容器の壁、又はフローセル上のナノウェルであってもよい。次に、断片を変性させ、ブロッキングオリゴヌクレオチドが除去されるように流動させることができる。変性は、熱、pH、又はカオトロピック剤を含む、当業者に既知のいくつかの方法によって起こり得る。
表面が再生に有利な条件(例えば、表面の冷却)に供される場合、2つの一本鎖断片は、それらの全長にわたって完全に再アニーリングし得る。あるいは、一方の末端に第1のフォーク型アダプター由来のアダプター配列を有し、他方に第2のフォーク型アダプター由来のアダプター配列を有する一本鎖断片のみが、それらの3’相補的末端によってのみ再アニーリングし得る(すなわち、図28Aに示されるように、第2のフォーク型アダプターの第2の鎖のX配列の、第1のフォーク型アダプターの第2のオリゴヌクレオチドのX’配列との結合)。ポリメラーゼ、dNTP及び緩衝液を添加して、3’末端からポリヌクレオチドを伸長させて、2つのインサートをタンデムで含む新しい鋳型を生成することができる(図29)。
X’配列は別のX’配列にアニールしないため、両端に第1のフォーク型アダプター由来の配列を含む断片は、それらの3’末端を介して互いにアニールすることができず(図28B)、したがって伸長することができない。同様に、X配列は別のX配列にアニールしないため、両端に第2のフォーク型アダプター由来の配列を含む断片は、それらの3’末端を介して互いにアニールすることができず(図28C)、したがって伸長することができない。変性、再アニーリング、及び伸長のプロセスは、一方の末端に第1のフォーク型アダプター由来の配列及び他方の末端に第2のアダプター由来の配列(図28A)を含む全ての断片が、タンデムインサート(すなわち、同じポリヌクレオチド内の2つ以上のインサート)を含む配列決定鋳型に変換されるまで、複数回行うことができる。
図29に示されるように、配列決定鋳型は、第2のインサートとしてA上鎖のコピーに連結されたインサートとして元のA上鎖を含むことができる。元のA鎖に存在する任意の変異体は、コピーA鎖において複製され、したがって、両方のコピーが配列決定される場合、改変体のベースコールにおける信頼性を増加させる。同様に、コピーA鎖にのみ現れる変異体は、アーチファクトとして高い信頼度で棄却することができる。このようにして、この実施形態は、配列決定におけるベースコールの精度を改善する。
連結された配列決定鋳型はまた、A’下鎖のコピーに連結された元のA’下鎖の相補体を含む。配列決定のためのライブラリー調製の最終段階において、上鎖及び下鎖は、5’表面結合部分を破壊し、続いてライブラリーを変性させることによって表面から回収される。したがって、上鎖及び下鎖は、互いに独立して配列決定される。それらはまた、PCR又は配列決定の前にDNAをコピーする他の方法によって複製され得る。
図30は、多数のライブラリー断片(この例では、5つの断片A、B、C、D、及びEによって表される)が、表面に結合され、変性され、再アニーリングされ、次いで、伸長されて、連結された配列決定鋳型を形成する方法の概要を示す。両端に第1のフォーク型アダプター由来の配列又は両端に第2のフォーク型アダプター由来の配列を有する鋳型は、それらの3’末端を介して再アニーリングすることができず(例えば、図30の鋳型C及びE)、したがって伸長することができない。二本鎖断片(後に、一本鎖断片に変性される)は、二本鎖断片由来の2つの断片の再アニーリングに有利に働く密度で表面に添加(かつ固定化)されて、同じインサートの2つのコピーを含む連結された配列決定鋳型を生成し得、異なる二本鎖断片由来の2つの断片のアニーリングにむしろ有利に働く。
他の場合には、配列決定鋳型は、互いのコピーではない2つ以上のインサートを含み得る。このような配列決定鋳型は、2つの断片中のインサートが相補的であることなく、XのX’への結合によってアニーリングする2つの断片によって生成され得る。言い換えれば、いくつかの配列決定鋳型は、同じインサートの2つのコピーを有し得るが、他の配列決定鋳型は、無関係の配列を有する2つの異なるインサートを含み得る。
実施例12.区画化を使用する、2つ以上のインサートを含む配列決定鋳型の調製
2つ以上のインサートを含む配列決定鋳型を調製するための方法は、フォーク型アダプター及び区画化の手段を使用し得る。
2つ以上のインサートを含む配列決定鋳型を調製するための方法は、フォーク型アダプター及び区画化の手段を使用し得る。
DNA分子、例えば、別々のゲノム、別々の染色体、又はDNAの大きな断片(>1000bp、好ましくは5000bp超)のプールは、限界希釈によって複数の区画に分離され、その結果、個々の区画は、DNA分子を含まないか、単一のDNA分子を含むか、又は1つのハプロイドコピーの画分に等しい限定された数のDNA分子を含み、それによってゲノムの任意の位置がハプロイドDNAによって表される。区画化を組み込む方法は、主に連続性情報を捕捉するが、これらの方法はまた、(同じインサート配列のセンス鎖及びアンチセンス鎖を含む断片のハイブリダイゼーションを介して)所与のインサート配列の2つのコピーを有する連結された配列決定鋳型を生成することもできる。
区画化の方法(例えば、全ゲノムハプロタイピングの準備に使用するため)は当技術分野で周知であり、例えば、Amini et al.,Nat Genet.46(12):1343-9(2014)、Kaper F,et al.Proc.Natl.Acad.Sci.U S A.110(14):5552-5557(2013)、Kitzman JO,et al.Nat.Biotechnol.29(1):59-63(2011)、Peters BA,et al.Nature.487(7406):190-195(2012)、Fan HC,et al.Nat.Biotechnol.29(1):51-57(2011)、Levy S,et al.PLoS Biol.5(10):e254(2007)、Duitama J,et al.Nucleic Acids Res.40(5):2041-2053(2012)、Suk EK,et al.Genome Res.21(10):1672-1685(2011)に教示されており、各々の全開示内容が、参照により本明細書に組み込まれる。ユーザーは、好みと利用可能な装置に基づいて、特定の区画化手段、例えば、エマルジョンを選択し得、この方法は、当該技術分野で既知の種々の区画化方法に適合され得る。
図31は、区画がプレート上のウェル又は多数のチューブであり、出発プールが3つの分子、f1、f2及びf3を含有する方法を示す。各区画は、ライブラリー調製(すなわち、それ自体が比較的大きな断片であり得る出発二本鎖断片の断片化、小断片の末端の修復、及び末端がライゲーションされた小断片を形成するための実施例11に記載される第1のフォーク型アダプター及び第2のフォーク型アダプターの混合物を使用するライゲーション反応)に供される。次に、小断片を変性させ、それらの3’相補的末端を介して再アニーリングし、伸長させてタンデムインサート鋳型を形成する。図31の例示的な実施形態に示されるように、断片分子f1を含有する区画内の分子は、3つの小断片f1.1、f1.2、及びf1.3に断片化された。したがって、得られたタンデムインサート鋳型は、これら3つの小断片の順序、例えばf1.1-f1.2、f1.1-f1.3、及びf1.2-f1.3である。同じ小断片の他の順序、例えば、f1.1-f1.1、f1.2-f1.2、及びf1.3-f1.3もまた可能である。
異なる区画(例えば、f2、f3などを含む区画)もまた、タンデムインサート鋳型を形成するが、これらのウェル内の出発分子の順序からのみ形成することが理解される。換言すれば、同じ区画において生成された小断片のみが、一緒にハイブリダイズするために利用可能であり、連結された配列決定鋳型を生成する。したがって、連結された配列決定鋳型中に2つのインサート配列が一緒に存在することを利用して、特に、単一のDNA分子のみが区画中に一般に存在するように条件が最適化されている場合、これらのインサート配列が同じ出発DNA分子(例えば、図31中の断片f1、f2、又はf3)中に含まれていたことを推測することができる。
したがって、全ての区画からタンデムインサート鋳型が一緒にプールされ、配列決定される場合であっても、連続性情報は、連結された配列決定鋳型において捕捉される。図31は、3つの断片の代表例を示すが、出発二本鎖DNA分子(断片化前)由来の4つ以上の断片も可能である。
区画としてウェル又はチューブを使用する利点は、プロセスの各段階で試薬を加えることができることである。ウェル又はチューブを使用することの潜在的な欠点は、液体の取り扱い及びプラスチック器具の物理的規模である。したがって、マイクロフルイディクスを使用する、油中水滴を使用する区画化の代替方法が開発されている。液滴を合体させて、DNAを断片化するエンドヌクレアーゼなどの試薬を添加することができる。液滴技術は、連続性情報を捕捉するために使用されている(例えば、「Everything you wanted to know about Linked-Reads」10X Genomics,February 7,2017に概説される例示的な方法を参照されたい)が、このような方法は、多くの場合、隣接配列を連結するために外因性合成バーコードの添加を必要とする。
図32は、第1のフォーク型アダプター及び第2のフォーク型アダプターを使用する例示的な方法を示し、第1及び第2のフォーク型アダプターは相補的3’末端を含み、ワークフローを区画化するために液滴を使用する。区画(例えば、ウェル又はチューブ)を用いる方法と同様に、断片f1、f2、及びf3は、別個の液滴中に含まれ得る。フォーク型アダプターをライゲーションし、連結された配列決定鋳型を生成した後、エマルジョンを最終工程で一緒に合わせることができる。特に、より多くの出発核酸が液滴中に個々に含まれるエマルジョンが調製される場合、同じ連結された配列決定鋳型中の異なるインサート配列が存在することを利用して、これらのインサート配列が同じ出発核酸中に含まれていたことを推測することができる。
図33は、遺伝子中の2つ以上の変異体がそれらの起源染色体ハプロタイプに帰することができるハプロタイプフェージングの例を示す。この例では、出発試料は2つの無関係な遺伝子を有し、1つは染色体1上にあり、1つは染色体2上にある。2つの変異体、snp1及びsnp2は、染色体1上の遺伝子に存在するが、これらの2つの変異体は、遺伝子の2つのコピーのうちの1つにのみ見出され、すなわち、染色体1/ハプロタイプ1(すなわち、Chr1-Hap1)上に見出される遺伝子は、両方の変異体を含む。他の染色体1/ハプロタイプ2(すなわち、Chr1-Hap2)上のこの遺伝子の第2のコピーは、これらの遺伝子座において変異体を有さず、これらの遺伝子座における配列は野生型(wt)である。従って、遺伝子1のフェージングされたハプロタイプは、Chr1-Hap1-snp1-snp2及びChr1-Hap2-wt-wtである。同様に、染色体2上の第2の遺伝子も2つのコピーである、Chr2-Hap1及びChr2-Hap2を有するが、この場合、2つの変異体(snp3及びsnp4)はシスではなく(すなわち、両方の変異体が同じコピーにある)、代わりに、変異体が2つのハプロタイプ中の遺伝子のいずれかのコピーに見出される。したがって、フェージングされたハプロタイプは、Chr2-Hap1-snp3-wt及びChr2-Hap2-wt-snp4である。
サブハプロイド濃度への限界希釈及び区画化の結果として、同じ遺伝子の2つのコピー(ハプロタイプ)が同じ区画に存在する可能性は低い。しかし、ハプロタイプデータを調製するために、希釈は、所定の区画中の1つの標的核酸に限定する必要はなく、その代わりに、異なる染色体が同じ区画中に含まれることを可能にし得る。希釈は、一般的に、2つのハプロイドコピーが同じ区画に含まれる確率を制限する必要があるだけである。
図33に示されるように、1つの区画はChr1-Hap1-snp1-snp2及びChr2-Hap1-snp3-wtを有し、一方、別の区画はChr1-Hap2-wt-wt及びChr2-Hap2-wt-snp4を有する。変性、鋳型の3’末端を介した再アニーリング、及び伸長に続いて、元のハプロタイプを構成するものを含む、タンデムインサートの多くの順列が可能である(図33においてチェック付き矢印によって強調された破線の円で囲まれたものによって示される)。しかしながら、区画化のために、ハプロタイプをスクランブルする順列、例えば、Chr1-Hap1-snp1-Chr1-Hap2-wt又はChr2-Hap1-snp3-Chr2-Hap2-snp4(図33において「X」を含む矢印で強調された選択肢として示される)は可能ではない。このようにして、フェージング情報は、バーコード化を必要とすることなくタンデムインサートアプローチによって捕捉される。
実施例13.固定されたトランスポソームを有する固体支持体を使用する、2つ以上のインサートを含む配列決定鋳型の調製。
2つ以上のインサートを含む配列決定鋳型はまた、固定されたトランスポソームを有する固体支持体を使用して調製することができる。第1及び第2のトランスポソームを、図34に示すように調製する。第1のトランスポソームは、トランスポザーゼ酵素と第1のアダプターとの複合体を含む。第2のトランスポソームは、トランスポザーゼ酵素と第2のアダプターとの複合体を含む。2つのオリゴヌクレオチド、第1の鎖及び第2の鎖が互いに部分的にハイブリダイズして、二本鎖セクション及び一本鎖セクションを含むフォーク型アダプターを形成するため、アダプターの構造は、「Y字型」又は「フォーク型」である。第1の鎖及び第2の鎖はまた、第1トランスポゾン及び第2トランスポゾンと称され得る。
2つ以上のインサートを含む配列決定鋳型はまた、固定されたトランスポソームを有する固体支持体を使用して調製することができる。第1及び第2のトランスポソームを、図34に示すように調製する。第1のトランスポソームは、トランスポザーゼ酵素と第1のアダプターとの複合体を含む。第2のトランスポソームは、トランスポザーゼ酵素と第2のアダプターとの複合体を含む。2つのオリゴヌクレオチド、第1の鎖及び第2の鎖が互いに部分的にハイブリダイズして、二本鎖セクション及び一本鎖セクションを含むフォーク型アダプターを形成するため、アダプターの構造は、「Y字型」又は「フォーク型」である。第1の鎖及び第2の鎖はまた、第1トランスポゾン及び第2トランスポゾンと称され得る。
第1及び第2のアダプターの両方は、固体支持体の表面上の結合部分に結合して、第1の鎖を表面に付着させることができる親和性部分を含む。言い換えれば、表面上の結合部分とトランスポソーム中の親和性部分との会合を使用して、トランスポソームを表面に固定することができる。親和性部分は、ビオチン又は当業者に既知の他の化学物質であり得る。親和性部分は、トランスポソームに含まれるフォーク型アダプター中の鎖の1つの5’末端に存在する。第1のトランスポソームに含まれるフォーク型アダプターの第1の鎖は、Illuminaの配列決定プラットフォームの「リード1」配列(例えば、P5.R1)に対応する完全配列又は部分配列を含み、第2のトランスポソームに含まれるフォーク型アダプターの第1の鎖は、Illuminaの配列決定プラットフォームの「リード2」配列(例えば、P7.R2)に対応する完全配列又は部分配列を含む。
各フォーク型アダプターの第2の鎖は、2つのセクション、5’末端セクション及び3’末端セクションを含むことができる。第2の鎖の5’末端セクションは相補的であり、第1の鎖の3’末端にハイブリダイズされる。第1のトランスポソームアダプターに含まれるフォーク型アダプターの第2の鎖(X’)の3’末端セクションは、第2のトランスポソームに含まれるフォーク型アダプターの第2の鎖(X)の3’末端セクションに相補的である。
トランスポソームは、第1及び第2のトランスポソームに含まれるフォーク型アダプターの第1の鎖の5’末端を介して表面に付着される。付着のための方法は当業者に既知であり、例えば、ストレプトアビジンでコーティングされた表面に付着させるためのオリゴヌクレオチドのビオチン化である。表面への付着は、2つのトランスポソームのランダム配置をもたらしてもよく(図35)、又はいくつかの実施形態では、配置は、表面上の固定された所定の位置のアレイに順序付けられてもよい。この表面に加えられた二本鎖DNAの鎖は、DNAと表面との接触点の下に偶然に配置されたトランスポソームによってタグメンテーションを受ける。タグメンテーションは、固定されている第1のトランスポゾンのタグメンテーションされたDNAへの結合をもたらし、タグメンテーションされたDNAは固体支持体の表面に固定される。
固定されたトランスポソームを有するこの表面に添加された二本鎖DNAの鎖は、DNAと表面との接触点の下に偶然に位置付けられた1つ以上のトランスポソームによってタグメンテーションを受ける(図35)。個々のタグメンテーション反応は、第1のトランスポソーム又は第2のトランスポソームを用いて行うことができる。タグメンテーションはDNAを開裂し、アダプターの第1の鎖の3’OH末端を、開裂されたDNAの5’末端に共有結合させる。アダプター中の第2の鎖の5’末端は付着せず、ニック/ギャップが形成され、試薬ELM(伸長-ライゲーションミックス)を用いる重合/ライゲーション反応によって封止する。この反応を成功させるためには、トランスポザーゼ酵素をSDS及び洗浄によって除去しなければならない(図36)。
DNA対表面トランスポソーム比は、二本鎖DNA分子当たり2つ以下のタグメンテーション事象が生じるように選択することができる。二本鎖DNA当たり2つのタグメンテーション反応が起こる場合、隣接するトランスポソーム間に架橋が形成される。
第1のトランスポソーム及び第2のトランスポソームを用いてタグメンテーション反応が生じる場合、両末端に付加されたアダプターを有する出発DNAのセグメント(例えば、セグメントA)を含む架橋が形成される。架橋は、第1のトランスポソームと第2のトランスポソームとの間、又は第1のトランスポソームと第1のトランスポソームとの間、又は第2のトランスポソームと第2のトランスポソームとの間にあってもよい。このような順列は、それぞれ50:25:25の比で生じる。
これらの架橋を処理してTn5トランスポザーゼを除去し(例えば、SDS及び洗浄を用いて)、ニック/ギャップを封止し、次いで二本鎖断片を一本鎖断片に変性させると、鋳型の異なる組合せを形成することができる。
例えば、第1のトランスポソームと第2のトランスポソームとの間に架橋が形成される場合、2つの一本鎖鋳型、5’-P5-R1-A-X-3’及び5’-P7-R2-A’-X’-3’が形成される(図38)。第1のトランスポソームと第1のトランスポソームとの間に架橋が形成される場合、2つの一本鎖鋳型、5’-P5-R1-A-X’-3’及び5’-P5-R1-A’-X’-3’が形成される。第2のトランスポソームと第2のトランスポソームとの間に架橋が形成される場合、2つの一本鎖鋳型、5’-P7-R2-A-X-3’及び5’-P7-R2-A’-X-3’が形成される。
次いで、一本鎖の鎖を、当業者に既知の方法、例えば、冷却又は補助緩衝液条件によって処理して、再アニーリングを促進する。1つの結果は、一本鎖断片が単にそれらの相補体に再アニールすることである。あるいは、一本鎖断片は、それらの3’相補的末端によって、すなわち、X配列のX’配列への結合を介して再アニーリングし得る。これは、第1のトランスポソームアダプターと第2のトランスポソームアダプター、すなわち、5’-P5-R1-A-X-3’及び5’-P7-R2-A’-X’の間でのみ可能である(図39)。5’-P5-R1-A-X’-3’及び5’-P5-R1-A’-X’-3’はハイブリダイズすることができず、5’-P7-R2-A-X-3’及び5’-P7-R2-A’-X-3’も同様である。ポリメラーゼ及びdNTPが添加され、伸長反応が実施される場合、センス鎖中にタンデムのA鎖の2つのコピー及びアンチセンス鎖中にタンデムのA’鎖の2つのコピーを含むタンデムインサート鋳型二重鎖が形成される(図40)。2つの一本鎖インサートは、それらが両方ともX’配列を含むか、又は両方ともX配列を含む場合、対形成することができない。
2つの架橋が3つのタグメンテーション事象、例えば、図41においてA及びBによって表される2つの架橋によって形成される場合、第1及び第2のトランスポソームの順列に応じて、クロスインサートハイブリダイゼーションのより多数の順列が可能である。これらは、出発DNA由来の連続するAセグメント及びBセグメントの順列である2つのインサートを有するキメラ鋳型を生成する(図42)。インサートのこの近接会合は、タンデム鋳型を配列決定することによって明らかにされる。これらの連結された配列決定鋳型のいくつかは、それらの相補的末端に基づくPCR中の抑止のために増幅しない。また、いくつかの連結された配列決定鋳型は、それらの5’配列と3’配列との間の相補性のために、NGSプラットフォーム上で配列を生成しない。例えば、P5-R1-A’-x-B’-R1’-P5’及びP5’-R1’-A-x’-B-R1-P5は、両末端にP5/P5’を含み、断片の一方の末端にP5/P5’及び他方の末端にP7/P7’を必要とするペアエンド配列決定に利用可能ではないため、Illuminaシーケンサーで配列を生成しない。Illuminaシーケンサー上で配列を生成しない連結された配列決定鋳型の例は、図42において斜線ボックスで示されている。
2つの架橋は、第2のフォーク型アダプターを含む3つのトランスポソーム又は第1のフォーク型アダプターを含む3つのトランスポソームの間にも形成され得ることが理解されるであろう(図43)。これらの例では、変性鋳型の3’末端間に相補性は存在せず(図44)、したがって、タンデムインサート鋳型は産生されない。
3つ以上の架橋、例えば、図45においてA、B、C、D、Eによって表される5つの架橋が形成される場合、配列を共有する複数の連結された配列決定鋳型が形成され得る。例えば、インサートAはインサートBとハイブリダイズすることができ、インサートB’はインサートC’とハイブリダイズすることができ、インサートCはインサートDとハイブリダイズすることができるなどである。得られた伸長した鋳型は、配列決定されると、連続性情報が発見されること、並びに変異体のフェージングを提供することを可能にする。
変性、再アニーリング、及び伸長のプロセスは、第1の末端で第1のトランスポソームに含まれるフォーク型アダプターの第1の鎖由来のアダプター及び第2の末端で第2のトランスポソームに含まれるフォーク型アダプターの第2の鎖由来のアダプターを含む全ての鋳型が、2つのインサートを含む配列決定鋳型に変換されるまで、複数回行うことができる。
次いで、当業者に既知の手段を使用して、例えば、酵素的消化又は化学的開裂によって、フォーク型アダプターの第1の鎖の5’末端から組み込まれたタグを表面とつないでいる連結を破壊することによって、配列決定鋳型を表面から分離することができる。次いで、遊離された鋳型は、配列決定プラットフォームに直接導入され得るか、又は最初に更なる改変、例えば、更なるアダプター配列の付加又はPCRによる増幅を行い、その後配列決定することができる。
本発明の方法は、ゲノム内の隣接配列及び相補配列についての関連情報を捕捉するためのバーコードを必要としない。しかし、異なる試料由来の鋳型の2つ以上のライブラリーが配列決定の前にプールされる場合、試料バーコードが所望され得る。試料バーコードは、フォーク型アダプターの第1の鎖(図46A)、フォーク型アダプターの第2の鎖(図46B)、又はフォーク型アダプターの第1及び第2の鎖の両方(図46C)に含まれ得る。試料インデックスは、i5~i8を含む。あるいは、固有分子識別子(UMI)を使用して、異なるトランスポソーム複合体によって調製された異なる断片を標識してもよく、UMIは、トランスポソームに含まれるフォーク型アダプターの第1の鎖及び/又は第2の鎖に含まれ得る。次いで、図47に示されるように、A14、B15、又はHYB(又はそれらの相補体)に結合するプライマーを使用する異なる配列決定を実行して、インサート配列並びに試料インデックス及び/又はUMIを配列決定することができる。
実施例14.区画に含まれるトランスポソームを使用する、2つ以上のインサートを含む配列決定鋳型の調製
トランスポソームはまた、実施例12に記載されるように、限界希釈及び/又は区画化の方法とともに使用され得る。トランスポソームは、いくつかの断片上のX’及び他の断片上のXへの組み込みを可能にするために、図34に示されるような第1及び第2のトランスポソームであってもよい。
トランスポソームはまた、実施例12に記載されるように、限界希釈及び/又は区画化の方法とともに使用され得る。トランスポソームは、いくつかの断片上のX’及び他の断片上のXへの組み込みを可能にするために、図34に示されるような第1及び第2のトランスポソームであってもよい。
そのような方法では、トランスポソームは溶液中にあってもよく、固体支持体上に固定されていなくてもよい。トランスポソームはまた、固体支持体(ビーズなど)上に固定されてもよく、ほとんどの区画は単一の固体支持体のみを含む。区画内のDNA分子は、区画内に存在する第1及び第2のトランスポソームを用いてタグメンテーションされるが、必ずしも表面に付着して二本鎖のタグ付けされた断片を生成するわけではない。
次いで、タグ付けされた断片は、一本鎖断片を調製するために変性され得、ハイブリダイゼーションが、1つの断片上のX配列と別の断片上のX’配列との間で可能になり得る。ハイブリダイゼーション後、伸長を行って、連結された配列決定鋳型を調製することができる。次いで、これらの連結された配列決定鋳型を配列決定することができる。
溶液相トランスポソームが使用される場合、この方法は、一本鎖断片がハイブリダイズ前に固定化されないため、(同じインサートの2つのコピーを含む連結された配列決定鋳型とは対照的に)2つの異なるインサート配列を含む連結された配列決定鋳型を生成する可能性が高い。これらの区画は、タグメンテーション前に一般に1つのDNA分子を含むか又はDNA分子を含まないように最適化され得るため、配列決定結果における2つの異なるインサート配列を有する連結された配列決定鋳型の存在は、これらの2つのインサート配列が単一のDNA分子に含まれる配列(すなわち、DNA分子内の隣接配列又は近接配列)に由来することを推測するために使用され得る。
実施例15.連結された配列決定鋳型を使用するメチル化分析
本明細書に記載される連結された配列決定鋳型は、メチル化分析のために使用され得る。
本明細書に記載される連結された配列決定鋳型は、メチル化分析のために使用され得る。
図48は、メチル化シトシン及びヒドロキシメチル化シトシンを含むDNA断片が、連結された配列決定鋳型に組み込まれる方法を示す。この実施例では、元の二重鎖の「センス」鎖(s)は、5’-C.A.mC.G.hmC.G.T-3’の塩基を含む配列を含有し、このとき、Cは非メチル化シトシン塩基を表し、mCはメチル化シトシン塩基を表し、hmCはヒドロキシメチル化シトシンを表す。「アンチセンス鎖」(S’)は、センス鎖の相補体であり、これもメチル化されているため、3’-G.T.G.mC.G.hmC.A-5’である。非メチル化dCTPヌクレオチドを使用してタンデムインサート鋳型に変換した後、「センス」鎖は、メチル化シトシンを有さない「センス」鎖のコピー(s-コピー)にタンデムに連結され、その配列は、5’-C.A.mC.G.hmC.G.T-x-C.A.C.G.C.G.T-3’である。「アンチセンス鎖」(s’)は同様に、メチル化シトシンを有さない「アンチセンス」鎖のコピー(s’-コピー)にタンデムに連結され、その配列は、3’-G.T.G.C.G.C.A-x’-G.T.G.mC.G.hmC.A-5’である。
次いで、連結された配列決定鋳型は、メチル化Cを同定するための変換プロセスを受け得る。
図49に示されるように、連結された配列決定鋳型は、亜硫酸水素ナトリウム化学変換又はEM-Seq等の酵素反応等を用いて、非メチル化CをUに変換する化学反応に供されてもよい。
図50Aは、非メチル化CからUへの変換後の、センス配列のコピー(s-コピー)に連結された「センス」配列(s)を含有する図49に示される連結された配列決定鋳型の上鎖の結末を示す。PCR後、UをTに転換する。この一本鎖の連結された配列決定鋳型が配列決定され、「センス」配列(s)がセンス配列のコピー(s-コピー)と比較される場合、元の鋳型(タンデムインサート鋳型への変換前)の各塩基は、2つの「ベースコール」の「コード」によって表される。この「2塩基」コードは、元の鋳型のメチル化状態に依存する。したがって、図50Aの例では、元のセンス鎖(s)の5’-C.A.mC.G.hmC.G.T-3’は、5’-(T,T)(A,A)(C,T)(G,G)(C,T)(G,G)(T,T)-3’としてコードされる。
図50Bは同様に、非メチル化CからUへの変換後の、アンチセンス配列のコピー(s’-コピー’)に連結された「アンチセンス」配列(s’)を含有する図49に示される連結された配列決定鋳型の下鎖の結末を示す。PCR後、UをTに転換する。この一本鎖の連結された配列決定鋳型が配列決定される場合、元のアンチセンス鎖(s)の3’-G.T.G.mC.G.hmC.A-5’は、3’(G,G)(T,T)(G,G)(T,C)(G,G)(T,C)(A,A)5’としてコードされる。
元の塩基の体系化は、図50Cに示される方法を使用して、タンデムインサート鋳型の上鎖及び下鎖由来のリードからの「2塩基」コードを照合することによって、更に開発及び洗練される。これにより、元の二本鎖のメチル化状態が解読されることを可能にする「2×2塩基」コードを生成する。例えば、非メチル化シトシンを変換する亜硫酸水素塩などの化学物質が使用される図50Aの例では、(T,T)/(G,G)の上鎖/下鎖の「2×2塩基」コードは、元の塩基対が上鎖において非メチル化シトシンであり、下鎖においてグアニンであったことを識別する。対照的に、(C,T)/(G,G)のコードは、元の塩基対が上鎖においてメチル化シトシンであり、下鎖においてグアニンであったことを同定する。同様に、コード(G,G)/(T,C)は、元の塩基対が上鎖においてグアニンであり、下鎖においてメチル化シトシンであったことを同定する。このワークフローにおいて、メチル化シトシンは、ヒドロキシメチル化シトシンから区別することができない。
Liu et al.,Nature Biotechnology 37(4):424-429(2019)に記載されるTAPSワークフローを使用して、図51に示されるように、非メチル化シトシンではなくメチル化シトシンに対して変換が行われるメチル化分析も行うことができる。TAPSは、修飾シトシンを、一般的なポリメラーゼによってTとして「読み取る」ことができる、ほぼ天然塩基であるジヒドロキシウラシル(DHU)に変換する。「2×2塩基」コードは、図52A及び図52Bに示されるように生成され、コードは異なるが、それらは依然として、メチル化状態が上述のように同定されることを可能にする(メチル化シトシンは、ヒドロキシメチル化シトシンと区別することができないが)。図52A及び図52Bに示されるように、PCRはDHUをTに変換し、ミスマッチは特異的遺伝子座として(C,T)と読み取られる。図52Cは、メチル化シトシンの変換後の連結された配列決定鋳型の評価の概要を示す。
図53~図54Cは、その全体が本明細書に組み込まれるWong et al.,Nucleic Acids Research 19(5):1081-1085(1991)に記載されるように、連結された配列決定鋳型を生成するためのポリメラーゼ伸長反応が、メチル化dCTPを含むdNTPを用いて行われる、種々の異なる方法を要約する。伸長の間に調製されたコピー配列は、ここではメチル化シトシンを有し得る(図53)。s又はs’鎖が5hMCを含む場合、s-コピー又はs’-コピーは5mCを含む。
メチル化dCTPを含むdNTPによる伸長を使用した連結された配列決定鋳型の調製後、非メチル化CのUへの変換は、亜硫酸水素ナトリウム変換、酵素変換、又はボランベースの変換などの当技術分野で周知の方法のいずれかを用いて行うことができる(図54)。PCRに続いて、上鎖(図55A)及び下鎖(図55B)について示されるように、UをTに変換する。図55Cに示されるように、シトシンは、元のインサート由来のT及び所与の鎖におけるインサートのコピー由来のCとして配列決定され、一方、メチル化シトシン又はヒドロキシメチル化シトシンは、元のインサート及び所与の鎖におけるインサートのコピーの両方由来のCとして配列決定される。
図56及び図57A~図57Cは、メチル化dCTPを含むdNTPによる伸長と共に、非メチル化シトシンを変換するための化学的又は生化学的方法(亜硫酸水素ナトリウム処理など)を使用するワークフローを示す。新たな「2×2塩基」コードが生成されることにより、メチル化状態を同定することが可能になる(メチル化シトシンは、ヒドロキシメチル化シトシンと区別することができないが)。図57Cに示されるように、シトシンは、元のインサート由来のC及び所与の鎖におけるインサートのコピー由来のTとして配列決定され、一方、メチル化シトシン又はヒドロキシメチル化シトシンは、元のインサート及び所与の鎖におけるインサートのコピーの両方由来のTとして配列決定される。
方法はまた、シトシン、メチル化シトシン、及びヒドロキシメチル化シトシンを別々に同定するために使用され得る。図58に示されるように、ポリメラーゼ伸長工程中にd-CTPを用いて生成された連結された配列決定鋳型は、ヒドロキシメチルシトシン(hmC)をグルコシル化-メチルシトシン(gmC)に選択的に変換するβ-グルコシルトランスフェラーゼなどの酵素で処理することができる。この変換反応は、非メチル化シトシン又はメチル化シトシンでは起こらない。生成物は、ヘミメチル化mCpG/GpCモチーフを認識し、非メチル化Cをメチル化してmCpG/GpmCを形成するDNMT1などのDNAメチルトランスフェラーゼ酵素で更に処理される。DNMT1は、Takahashi et al.,FEBS Open Bio 5(2015)741-747に記載されているように、ヘミヒドロキシメチル化CpG配列に対して活性を有さない。DNMT1処理後、図59に示されるように、非メチル化シトシンのみを変換する変換(例えば、亜硫酸水素塩処理)を行ってもよい。PCR及び配列決定の後、図60A~60Cに概説されるように分析を行うことができる。図60Cに示されるように、標的核酸由来のシトシンは、インサート及びインサートのコピーにおいてTとして配列決定され、メチル化シトシンは、インサート及びインサートのコピーにおいてCとして配列決定され、ヒドロキシメチル化シトシンは、インサートにおいてC及びインサートのコピーにおいてTとして配列決定される。
方法はまた、メチル化シトシンのみの変換を使用して、シトシン、メチル化シトシン、及びヒドロキシメチル化シトシンを同定するために使用され得る。図61に示されるように、連結された配列決定鋳型をDMNT1で処理して、ヘミメチル化mCpG/GpCモチーフと反応させ、非メチル化Cをメチル化してmCpG/GpmCを形成することができる。次いで、連結された配列決定鋳型を処理して、メチル化CのみをDHUに変換することができる(例えば、TAPSによる)。PCR後に調製した鋳型を図62A及び62Bに示す。この方法を使用して、図62Cに示されるように、標的核酸由来のシトシンは、インサート及びインサートのコピーにおいてCとして配列決定され、メチル化シトシンは、インサート及びインサートのコピーにおいてTとして配列決定され、ヒドロキシメチル化シトシンは、インサートにおいてT及びインサートのコピーにおいてCとして配列決定される。
したがって、ユーザーは、所望のデータ、及びメチル化シトシンとヒドロキシメチル化シトシンとの区別を望むかどうかに基づいて、メチル化分析の決定された手段を選択することができる。
均等物
前述の明細書は、当業者が実施形態を実践することを可能にするのに十分であると考えられる。前述の説明及び実施例は、特定の実施形態を詳細に詳述し、本発明者らによって想到される最良の様式を説明する。しかしながら、前述の内容が本文にどれほど詳細にあらわれていても、実施形態は多くの方式で実施することができ、添付の特許請求の範囲及びその任意の均等物に従って解釈されるべきであることが理解されるであろう。
前述の明細書は、当業者が実施形態を実践することを可能にするのに十分であると考えられる。前述の説明及び実施例は、特定の実施形態を詳細に詳述し、本発明者らによって想到される最良の様式を説明する。しかしながら、前述の内容が本文にどれほど詳細にあらわれていても、実施形態は多くの方式で実施することができ、添付の特許請求の範囲及びその任意の均等物に従って解釈されるべきであることが理解されるであろう。
本明細書で使用するとき、約という用語は、明示的に示されているか否かにかかわらず、例えば、整数、割合、及び百分率を含む数値を指す。用語は、一般に、当業者が列挙された値(例えば、同じ機能又は結果を有する)と同等であると考えられる数値の範囲(例えば、列挙された範囲の±5~10%)を指す。少なくとも及び約などの用語が数値又は範囲のリストの前にある場合、その用語はリスト内に提供される値又は範囲の全てを変更する。場合によっては、約という用語は、最も近い有効数字に丸められた数値を含んでもよい。
Claims (66)
- ポリヌクレオチドであって、
a.第1のリードプライマー結合配列を含む5’末端ポリヌクレオチドと、
b.前記5’末端ポリヌクレオチドの3’側に位置する第1のインサート配列であって、標的核酸に由来する、第1のインサート配列と、
c.第2のリードプライマー結合配列及びハイブリダイゼーション配列を含む、前記第1のインサート配列の3’側に位置する連結配列と、
d.前記連結配列の3’側に位置する第2のインサート配列であって、前記標的核酸の非隣接配列に由来するか、又は前記第1のインサート配列とは異なる標的核酸に由来する、第2のインサート配列と、
e.3’末端ポリヌクレオチド配列と、を含む、ポリヌクレオチド。 - ポリヌクレオチドであって、
a.第1のリードプライマー結合配列を含む3’末端ポリヌクレオチドと、
b.標的核酸に由来する前記3’末端ポリヌクレオチドの5’側の第1のインサート配列と、
c.前記第1のリードプライマー結合配列に直交する第2のリードプライマー結合配列を含む連結配列であって、前記第2のリードプライマー結合配列がハイブリダイゼーション配列を含む、連結配列と、
d.前記連結配列の5’側にあり、前記標的核酸の非隣接配列に由来するか、又は前記第1のインサート配列とは異なる標的核酸に由来する、第2のインサート配列と、
e.前記ポリヌクレオチドの5’末端にあり、付着配列を含む、付着ポリヌクレオチドと、を含み、
前記3’末端ポリヌクレオチド、前記連結配列、及び前記付着ポリヌクレオチドは、前記標的核酸に由来しない、ポリヌクレオチド。 - 前記2つのインサート配列が、異なる標的核酸に由来する、請求項1又は請求項2に記載のポリヌクレオチド。
- 前記第1のインサート配列及び前記第2のインサート配列が、それぞれ独立して、40~400ヌクレオチド、100~200ヌクレオチド、又は150ヌクレオチドを含む、請求項1~3のいずれか一項に記載のポリヌクレオチド。
- 前記第1のリードプライマー結合配列が、第1のアダプター配列を含む、請求項1~4のいずれか一項に記載のポリヌクレオチド。
- 前記第1のリードプライマー結合配列が、トランスポゾン末端配列の相補体を更に含む、請求項1~5のいずれか一項に記載のポリヌクレオチド。
- 前記連結配列が、(a)前記ハイブリダイゼーション配列を含み、任意選択的に(b)前記ハイブリダイゼーション単位の3’側のトランスポゾン末端配列と、前記ハイブリダイゼーション単位の5’側の前記トランスポゾン末端配列の相補体と、を含む、請求項2~6のいずれか一項に記載のポリヌクレオチド。
- 前記付着ポリヌクレオチドが、第2のアダプター配列と、任意選択的にトランスポゾン末端配列と、を含む、請求項2~7のいずれか一項に記載のポリヌクレオチド。
- 前記3’末端ポリヌクレオチド及び/又は前記付着ポリヌクレオチドが、それぞれ独立して、バーコード配列、固有分子識別子(UMI)配列、捕捉配列、又は開裂配列のうちの少なくとも1つを含む、請求項2~8のいずれか一項に記載のポリヌクレオチド。
- 前記ポリヌクレオチドが、固体支持体上に固定されている、請求項2~8のいずれか一項に記載のポリヌクレオチド。
- 前記第2のインサート配列と前記付着ポリヌクレオチドとの間に、前記標的核酸の非隣接配列に由来するか、又は前記他のインサート配列とは異なる標的核酸に由来する、前記5’末端のインサート配列と、リードプライマー結合配列を含む前記3’末端の連結配列と、を含む、少なくとも1つの挿入単位を含み、前記リードプライマー結合配列は、前記他のリードプライマー結合配列と直交している、請求項2~12のいずれか一項に記載のポリヌクレオチド。
- 請求項1、3~6、及び11のいずれか一項に記載のポリヌクレオチドと、その相補体と、を含む組成物であって、前記相補体が、
a.第1の相補リードプライマー結合配列を含む、5’末端相補体と、
b.前記5’末端相補体の3’側に位置する、前記第2のインサート配列の相補配列と、
c.前記第2のインサート配列の前記相補配列の3’側に位置する相補連結配列であって、前記第2のインサート配列が、
i.第2の相補リードプライマー結合配列と、
ii.相補ハイブリダイゼーション配列と、を含む、相補連結配列と、
d.前記相補連結配列の3’側に位置する前記第1のインサート配列の相補配列と、
e.3’末端相補体と、を含む、組成物。 - 請求項2~11のいずれか一項に記載のポリヌクレオチドと、その相補体と、を含む組成物であって、前記相補体が、
a.第1の相補リードプライマー結合配列を含む3’末端相補体であって、前記第1の相補リードプライマー結合配列は、前記第1のリードプライマー結合配列及び前記第2のリードプライマー結合配列に直交している、3’末端相補体と、
b.前記3’末端相補体の5’側にある前記第2のインサート配列の相補体と、
c.前記第2のインサート配列の前記相補体の5’側にあり、3’から5’への第2の相補リードプライマー結合配列を含む、相補連結配列であって、前記第2の相補リードプライマー結合配列は、前記第1のリードプライマー結合配列及び前記第2のリードプライマー結合配列、並びに前記第1の相補リードプライマー結合配列に直交している、相補連結配列と、
d.前記相補連結配列の5’側の前記第1のインサート配列の相補体と、
e.相補付着配列を含む、前記5’末端にある相補付着ポリヌクレオチドと、を含む、組成物。 - トランスポソーム複合体であって、
a.トランスポザーゼと、
b.第1のリードプライマー結合配列の相補体を含む第1のトランスポゾンであって、前記第1のリードプライマー結合配列の相補体は、
i.トランスポゾン末端配列を含む3’部分と、
ii.第1のアダプター配列の相補体と、を含む、第1のトランスポゾンと、
c.第2のトランスポゾンであって、
i.前記トランスポゾン末端配列の相補体を含む5’部分と、
ii.ハイブリダイゼーション配列の相補体と、を含む、第2のトランスポゾンと、を含む、トランスポソーム複合体。 - トランスポソーム複合体であって、
a.トランスポザーゼと、
b.付着ポリヌクレオチドを含む第1のトランスポゾンであって、前記付着ポリヌクレオチドは、
i.付着配列を含む5’部分と、
ii.第2のリードプライマー結合配列を含む3’部分であって、
iii.トランスポゾン末端配列を含む3’部分と、
iv.アダプターと、を含む、3’部分と、を含む、第1のトランスポゾンと、
c.第2のトランスポゾンであって、
i.前記トランスポゾン末端配列の相補体を含む5’部分と、
ii.ハイブリダイゼーション配列と、を含む、第2のトランスポゾンと、を含む、トランスポソーム複合体。 - 請求項14又は15に記載のトランスポソーム複合体を含む組成物又はキット。
- 組成物又はキットであって、
a.固体支持体であって、任意選択的に、前記任意選択の支持体はビーズである、固体支持体と、
b.トランスポソーム複合体を生成するための構成要素であって、
i.トランスポザーゼと、
ii.オリゴヌクレオチド二本鎖を生成するためのオリゴヌクレオチドであって、第1のオリゴヌクレオチドは、3’トランスポゾン末端配列と、5’の第1のアダプター配列と、を含み、第2のオリゴヌクレオチドは、5’トランスポゾン末端配列と、3’の第2のアダプター配列と、を含み、前記5’トランスポゾン末端配列は、前記3’トランスポゾン末端配列に相補的であり、前記第1のアダプター配列及び前記第2のアダプター配列は同じではない、オリゴヌクレオチドと、を含む、構成要素と、
c.PCRによって断片に付着配列及びハイブリダイゼーション配列を付加するための第1のプライマーセット及び第2のプライマーセットであって、前記第1のプライマーセットは、断片にハイブリダイゼーション配列及び第1の付着配列を付加するためのプライマーを含み、前記第2のプライマーセットは、断片に相補ハイブリダイゼーション配列及び第2の付着配列を付加するためのプライマーを含み、前記第1の付着配列及び前記第2の付着配列は同じでない、第1のプライマーセット及び第2のプライマーセットと、を含む、組成物又はキット。 - 第1のフォーク型アダプター複合体及び第2のフォーク型アダプター複合体を含むアダプター組成物又はキットであって、
前記第1のフォーク型アダプター複合体は、
a.相補付着ポリヌクレオチドであって、
i.相補付着配列を含む5’部分と、
ii.アダプターを含む3’部分と、を含む、相補付着ポリヌクレオチドと、
b.ハイブリダイゼーションポリヌクレオチドであって、
i.前記アダプターの一部の相補体を含み、それにハイブリダイズする5’部分と、
ii.ハイブリダイゼーション配列の相補体と、を含み、前記ハイブリダイゼーション配列の前記相補体は、前記相補付着ポリヌクレオチドに相補的ではない、ハイブリダイゼーションポリヌクレオチドと、を含み、
前記第2のフォーク型アダプター複合体は、
a.付着ポリヌクレオチドであって、
i.付着配列を含む5’部分と、
ii.前記アダプターを含む3’部分と、を含む、付着ポリヌクレオチドと、
b.ハイブリダイゼーションポリヌクレオチドであって、
i.前記アダプターの一部の相補体を含み、それにハイブリダイズする5’部分と、
ii.ハイブリダイゼーション配列と、を含み、前記ハイブリダイゼーション配列は、前記付着ポリヌクレオチドに相補的ではない、ハイブリダイゼーションポリヌクレオチドと、を含む、アダプター組成物又はキット。 - 連結された核酸配列決定鋳型を生成する方法であって、
a.第1のリードプライマー結合配列を、第1の標的核酸に由来する第1のインサート配列の3’末端に付着させることと、
b.前記第1のインサート配列の5’末端にハイブリダイゼーション配列を付着させることと、
c.前記ハイブリダイゼーション配列の相補体を、前記第1の標的核酸の不連続領域又は第2の標的核酸に由来する第2のインサート配列の3’末端に付着させることと、
d.前記ハイブリダイゼーション配列を前記ハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
e.前記ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することと、を含み、
前記第1のインサート配列と前記第2のインサート配列との間の領域は、第2のリードプライマー結合配列であって、前記ハイブリダイゼーション配列を含み、前記第1のリードプライマー結合配列に直交する、第2のリードプライマー結合配列を含み、
それにより、連結された核酸配列決定鋳型を生成する、方法。 - 連結された核酸配列決定鋳型を生成する方法であって、
a.第1の標的核酸を含む第1の試料を、第1のトランスポソーム複合体及び第2のトランスポソーム複合体と接触させることであって、
各トランスポソーム複合体が、
i.トランスポザーゼと、
ii.トランスポゾン末端配列を含む3’部分及びアダプター配列を含む5’部分を含む、第1のトランスポゾンと、
iii.前記トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
前記第1のトランスポソーム複合体中の前記アダプター配列は、第1のアダプター配列の相補体であり、前記第2のトランスポソーム複合体中の前記アダプター配列は、第2のアダプター配列であり、
前記第1の標的核酸を断片化して、一方の末端が前記第1のトランスポソーム複合体の前記トランスポゾンでタグ付けされ、他方の末端が前記第2のトランスポソーム複合体の前記トランスポゾンでタグ付けされた、前記第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
b.任意選択的にポリメラーゼ連鎖反応によって、前記第1のタグ付き生成物の3’末端に相補付着配列を付加し、前記第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、
c.第2の標的核酸を含む第2の試料を前記トランスポソーム複合体と接触させることであって、前記第2の標的核酸を断片化して、一方の末端が前記第1のトランスポソーム複合体の前記トランスポゾンでタグ付けされ、他方の末端が前記第2のトランスポソーム複合体の前記トランスポゾンでタグ付けされた、前記第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
d.任意選択的にポリメラーゼ連鎖反応によって、前記第2のタグ付き生成物の3’末端に付着配列を付加し、前記第2のタグ付き生成物の5’末端にハイブリダイゼーション配列を付加して、第2の修飾されたタグ付き生成物を形成することと、
e.前記第1の修飾されたタグ付き生成物の前記ハイブリダイゼーション配列を、前記第2の修飾されたタグ付き生成物中の前記ハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
f.前記ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、前記連結された核酸配列決定鋳型は、
i.前記第2の標的核酸由来の前記インサート配列の3’側にある、第1のリードプライマー結合配列であって、前記第1のアダプター配列と、前記トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、
ii.前記2つのインサート配列の間にある第2のリードプライマー結合配列であって、前記トランスポゾン末端配列と、前記ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、
前記第1のリードプライマー結合配列は、前記第2のリードプライマー結合配列に直交する、ことと、を含む、方法。 - 連結された核酸配列決定鋳型を生成する方法であって、
a.第1の標的核酸を含む第1の試料を第1のトランスポソーム複合体と接触させることであって、前記第1のトランスポソーム複合体は、
i.トランスポザーゼと、
ii.トランスポゾン末端配列を含む3’部分と、付着配列及び第1のアダプター配列の相補体を含む5’部分と、を含む、第1のトランスポゾンと、
iii.前記トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
前記第1の標的核酸を断片化して、各末端が前記第1のトランスポソーム複合体の前記トランスポゾンでタグ付けされた、前記第1の標的核酸由来のインサート配列を含む第1のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
b.任意選択的にポリメラーゼ連鎖反応によって、前記第1のタグ付き生成物の5’末端にハイブリダイゼーション配列の相補体を付加して、第1の修飾されたタグ付き生成物を形成することと、
c.第2の標的核酸を含む第2の試料を第2のトランスポソーム複合体と接触させることであって、前記第2のトランスポソーム複合体は、
i.トランスポザーゼと、
ii.トランスポゾン末端配列を含む3’部分と、第2のアダプター配列及び相補付着配列を含む5’部分と、を含む、第1のトランスポゾンと、
iii.前記トランスポゾン末端配列の相補体を含む5’部分を含み、それにハイブリダイズする第2のトランスポゾンと、を含み、
前記第2の標的核酸を断片化して、各末端が前記第2のトランスポソーム複合体の前記トランスポゾンでタグ付けされた、前記第2の標的核酸由来のインサート配列を含む第2のタグ付き生成物を生成するのに十分な条件下で行う、ことと、
d.任意選択的にポリメラーゼ連鎖反応によって、前記第2のタグ付き生成物の5’末端に前記ハイブリダイゼーション配列の相補体を付加して、第2の修飾されたタグ付き生成物を形成することと、
e.前記第1の修飾されたタグ付き生成物の前記ハイブリダイゼーション配列を、前記第2の修飾されたタグ付き生成物中の前記ハイブリダイゼーション配列の相補体にアニーリングして、ハイブリダイズした付加物を形成することと、
f.前記ハイブリダイズした付加物から完全二本鎖の連結された核酸配列決定鋳型を合成することであって、前記連結された核酸配列決定鋳型は、
i.前記第2の標的核酸由来の前記インサート配列の3’側にある、第1のリードプライマー結合配列であって、前記第1のアダプター配列と、前記トランスポゾン末端配列の相補体と、を含む、第1のリードプライマー結合配列と、
ii.前記2つのインサート配列の間にある第2のリードプライマー結合配列であって、前記トランスポゾン末端配列と、前記ハイブリダイゼーション配列と、を含む、第2のリードプライマー結合配列と、を含み、
前記第1のリードプライマー結合配列は、前記第2のリードプライマー結合配列に直交する、ことと、を含む、方法。 - 連結された核酸配列決定鋳型を生成する方法であって、
a.
i.第1の標的核酸を含む第1の二本鎖ポリヌクレオチドを第1の制限酵素と、かつ、
ii.第2の標的核酸を含む第2の二本鎖ポリヌクレオチドを第2の制限酵素と、接触させ、
適合性オーバーハングを有する第1のポリヌクレオチド及び第2のポリヌクレオチドを産生することであって、前記制限酵素は、II型、IIS型、IIP型、及びIIT型制限酵素から選択される、ことと、
b.リガーゼを使用して、前記第1のポリヌクレオチド及び前記第2のポリヌクレオチドの前記適合性オーバーハングを付着させることと、を含む、方法。 - 前記接触工程の前に、
a.前記第1の制限酵素切断部位を、任意選択的にアダプターを使用することによって、第1の標的核酸に付着させ、プライマー伸長によって前記第1の二本鎖ポリヌクレオチドを生成することと、
b.前記第2の制限酵素切断部位を、任意選択的にアダプターを使用することによって、第2の標的核酸に付着させ、プライマー伸長によって前記第2の二本鎖ポリヌクレオチドを生成することと、が行われる、請求項22に記載の方法。 - 連結された核酸配列決定鋳型を生成する方法であって、
a.第1の核酸供給源及び第2の核酸供給源を剪断又は消化して、核酸断片の第1のライブラリー及び核酸断片の第2のライブラリーをそれぞれ生成することと、
b.前記第1の核酸供給源由来の各核酸断片に第1のアダプターを付着させ、前記第2の核酸供給源由来の各核酸断片に第2のアダプターを付着させることであって、
i.前記核酸断片を第1のポリメラーゼと接触させて、平滑末端を有する核酸断片を生成することと、
ii.キナーゼを用いて前記核酸断片の5’-ヒドロキシルをリン酸化することと、
iii.第2のポリメラーゼを用いて前記核酸断片に3’アデニンを付加することと、
iv.前記第1のアダプターを前記第1のライブラリーの各核酸断片にライゲーションし、前記第2のアダプターを前記第2のライブラリーの各核酸断片にライゲーションすることと、を含む、ことと、
c.任意選択的にPCRによって、前記第1の核酸ライブラリー及び前記第2の核酸ライブラリーを混合しアニーリングすることであって、
i.前記核酸が高温で変性し、
ii.A及びA’配列がより低温で互いにハイブリダイズする、ことと、
d.任意選択的にPCRによって、完全二本鎖の連結された核酸配列決定鋳型を合成することと、を含む、方法。 - 連結された核酸配列決定鋳型を配列決定する方法であって、
a.第1のリードプライマー結合配列に相補的な第1のリード配列決定プライマーを用いて配列決定を開始することによって、請求項1~11のいずれか一項に記載のポリヌクレオチドの第1のインサート配列を配列決定することと、
b.第2のリードプライマー結合配列に相補的な第2のリード配列決定プライマーを用いて配列決定を開始することによって、第2のインサート配列を配列決定することと、を含む、方法。 - 1つ以上の標的二本鎖核酸を含む試料を複数の異なる区画に区画化することを含み、連結された核酸配列決定鋳型を生成することが前記異なる区画内で行われる、請求項20~24のいずれか一項に記載の方法。
- ポリヌクレオチドであって、
a.第1のリード配列決定プライマー配列を含む5’末端ポリヌクレオチドと、
b.標的核酸に由来するインサート配列であって、前記5’末端ポリヌクレオチドの3’側にある、インサート配列と、
c.前記インサート配列の3’側にあるハイブリダイゼーション配列、又は、
d.前記ハイブリダイゼーション配列の3’側の前記インサート配列のコピー若しくは前記ハイブリダイゼーション配列の3’側の第2のインサート配列と、
e.第2のリード配列決定プライマー配列の相補体を含む3’末端ポリヌクレオチドと、を含む、ポリヌクレオチド。 - 前記ポリヌクレオチドが、
a.5’-P5-A14-インサート-HYB-インサート-B15’-P7’-3’、
b.5’-P7-B15-インサート-HYB’-インサート-A14’-P5’-3’、
c.5’-P5-A14-インサート1-HYB-インサート2-B15’-P7’-3’、又は
d.5’-P7-B15-インサート1-HYB’-インサート2-A14’-P5’-3’の構造を有し、HYBはハイブリダイゼーション配列であり、HYB’はハイブリダイゼーション配列の相補体である、請求項27に記載のポリヌクレオチド。 - 2つのポリヌクレオチド鎖を含むフォーク型アダプターであって、
a.配列決定プライマー配列を含む第1の鎖と、
b.3’ハイブリダイゼーション配列又はその相補体を含む第2の鎖と、を含み、前記第1の鎖の3’末端は前記第2の鎖の5’末端に完全に又は部分的に相補的であり、前記ハイブリダイゼーション配列又はその相補体は、前記ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合している、フォーク型アダプター。 - 前記第1の鎖が、固体支持体又はビーズ上の親和性結合パートナーに結合することができる5’親和性エレメントを含み、任意選択的に、前記親和性エレメントは、前記第1の鎖に付着したリンカーを介して接続されている、請求項29に記載のフォーク型アダプター。
- 請求項29又は30のいずれか一項に記載の2つのフォーク型アダプターを含む組成物又はキットであって、
a.第1のフォーク型アダプターは、第1のリード配列決定プライマー配列を含む第1の鎖と、ハイブリダイゼーション配列の相補体を含む第2の鎖と、を含み、
b.第2のフォーク型アダプターは、第2のリード配列決定プライマー配列を含む第1の鎖と、ハイブリダイゼーション配列を含む第2の鎖と、を含み、
一方又は両方のフォーク型アダプターが、ブロッキングオリゴヌクレオチドを含む、組成物又はキット。 - 1つ以上の連結された核酸配列決定鋳型を生成する方法であって、
a.標的核酸から調製されたインサートをそれぞれ含む二本鎖核酸断片を含む試料を、2つのフォーク型アダプターを含む請求項18又は29~31のいずれか一項に記載の組成物又はキットと接触させることであって、一方又は両方のフォーク型アダプターは、ブロッキングオリゴヌクレオチドを含む、ことと、
b.前記フォーク型アダプターを前記二本鎖断片にライゲーションして、タグ付けされた二本鎖断片を調製することと、
c.前記タグ付けされた二本鎖断片を固体支持体上に固定することと、
d.(1)固定された一本鎖断片を生成するために前記固定されたタグ付けされた二本鎖断片を、及び、(2)ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するために前記ブロッキングオリゴヌクレオチドを、変性させることと、
e.2つの固定された一本鎖断片を互いにハイブリダイズさせて、第1の断片中の前記ハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、
f.各一本鎖断片の3’末端から伸長させて、両方の固定された一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法。 - 1つ以上の連結された核酸配列決定鋳型を生成する方法であって、
a.二本鎖標的核酸を含む試料を、溶液中のトランスポソーム複合体の2つのプールと接触させることであって、前記トランスポソーム複合体の第1のプールは、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び第1のリード配列決定アダプター配列を含む第1のトランスポゾンと、
iii.前記3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含み、前記トランスポソーム複合体の第2のプールは、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び第2のリード配列決定アダプター配列を含む第1のトランスポゾンと、
iii.前記3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含み、一方又は両方の第2のトランスポゾンは、ブロッキングオリゴヌクレオチドを含む、ことと、
b.前記二本鎖核酸をタグメンテーションして、タグ付けされた二本鎖断片を生成することと、
c.前記トランスポソーム複合体を前記二本鎖断片から遊離させることと、
d.前記二本鎖断片を伸長し、ライゲーションすることと、
e.前記タグ付けされた二本鎖断片を固体支持体上に固定することと、
f.(1)固定された一本鎖断片を生成するために前記固定されたタグ付けされた二本鎖断片を、及び、(2)ハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するために前記ブロッキングオリゴヌクレオチドを、変性させることと、
g.2つの固定された一本鎖断片を互いにハイブリダイズさせて、第1の断片中の前記ハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、
h.各一本鎖断片の3’末端から伸長させて、両方の固定された一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法。 - 前記トランスポソーム複合体の第1のプール又は第2のプールが、請求項15に記載のトランスポソーム複合体を含み、前記第1のリード配列決定アダプター配列が、第1のリードプライマー結合配列を含む、請求項33に記載の方法。
- 1つ以上の連結された核酸配列決定鋳型を生成する方法であって、
a.標的二本鎖核酸を含む試料を、複数の異なる区画内に区画化することと、
b.前記複数の異なる区画内の前記二本鎖核酸由来のインサートをそれぞれ含む、断片を調製することと、
c.前記複数の異なる区画を、2つのフォーク型アダプターを含む請求項18又は29~31のいずれか一項に記載の組成物又はキットと接触させることであって、一方又は両方のフォーク型アダプターは、ブロッキングオリゴヌクレオチドを含む、ことと、
d.前記フォーク型アダプターを前記二本鎖断片にライゲーションして、前記複数の異なる区画内のタグ付けされた二本鎖断片を調製することと、
e.(1)一本鎖断片を生成するために前記固定されたタグ付けされた二本鎖断片を、並びに、(2)前記複数の異なる区画内のハイブリダイゼーション配列及びハイブリダイゼーション配列の相補体をブロック解除するために前記ブロッキングオリゴヌクレオチドを、変性させることと、
f.前記同じ区画内の2つの一本鎖断片を互いにハイブリダイズさせて、第1の断片中の前記ハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって架橋を形成することと、
g.各一本鎖断片の3’末端から伸長させて、前記同じ区画内の両方の一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法。 - 前記区画が、ウェル、チューブ、若しくは液滴であり、かつ/又は、前記同じ連結された配列決定鋳型に含まれるインサートが、前記同じ標的核酸から調製された、請求項26又は35に記載の方法。
- 前記区画化することが、最も相違するハプロタイプを異なる区画内に分離し、前記方法が、ハプロタイプフェージングのために使用される、請求項26、35、又は36のいずれか一項に記載の方法。
- 固定されたトランスポソーム複合体の2つのプールを含む固体支持体であって、
a.前記トランスポソーム複合体の第1のプールは、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列、第1のリード配列決定アダプター配列、及び5’親和性部分を含む第1のトランスポゾンと、
iii.前記3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含み、前記トランスポソーム複合体の第2のプールは、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列、第2のリード配列決定アダプター配列、及び5’親和性部分を含む第1のトランスポゾンと、
iii.前記3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含み、各第1のトランスポゾンは、前記固体支持体の表面上の結合部分への5’親和性部分の結合によって固定されている、固体支持体。 - 前記トランスポソーム複合体の第1のプール又は第2のプールが、請求項15のいずれか一項に記載のトランスポソーム複合体を含み、前記第1のリード配列決定アダプター配列が、第1のリードプライマー結合配列を含む、請求項38に記載の方法。
- 1つ以上の二本鎖の連結された核酸配列決定鋳型を生成する方法であって、
a.請求項38又は39に記載の固体支持体に固定されている二本鎖核酸を含む試料を適用することと、
b.前記二本鎖核酸をタグメンテーションして、前記二本鎖核酸由来のインサートを含むタグ付けされた二本鎖断片を生成することであって、前記二本鎖断片は、前記固体支持体の表面上の結合部分への5’親和性部分の結合によって前記固体支持体に固定されている、ことと、
c.前記トランスポソーム複合体を前記二本鎖断片から遊離させることと、
d.前記二本鎖断片を伸長し、ライゲーションすることと、
e.前記二本鎖断片を一本鎖断片に変性させることであって、5’親和性部分を含む一本鎖断片は、前記固体支持体上に固定されたままである、ことと、
f.第1の固定された一本鎖断片に含まれるハイブリダイゼーション配列を、第2の固定された一本鎖断片に含まれるハイブリダイゼーション配列の相補体にハイブリダイズさせ、それによって架橋を形成することと、
g.二本鎖の連結された核酸配列決定鋳型を伸長し、生成することと、を含む、方法。 - 前記第1の固定された断片及び前記第2の固定された断片が、前記固体支持体上に近接して固定されており、近接していることにより、前記第1の固定された断片に含まれる前記ハイブリダイゼーション配列に含まれる4個以上、5個以上、6個以上、7個以上、8個以上、9個以上、若しくは10個以上のヌクレオチドは、前記第2の固定された断片に含まれる前記ハイブリダイゼーション配列の相補体に含まれるヌクレオチドに結合することが可能になる、又は、前記第1の固定された断片及び前記第2の固定された断片が、前記固体支持体の表面上で互いに20~500ナノメートル以内に固定されている、請求項40に記載の方法。
- 前記第1の固定された断片及び前記第2の固定された断片の両方が、前記同じ二本鎖核酸から調製され、前記二本鎖の連結された核酸配列決定鋳型が、前記同じ二本鎖核酸由来の2つのインサートを含む、請求項40又は請求項41に記載の方法。
- 前記2つのインサートが、前記同じ二本鎖核酸に含まれる2つの近接配列に由来し、前記近接配列は、前記二本鎖核酸中の100以下のヌクレオチド、200以下のヌクレオチド、300以下のヌクレオチド、400以下のヌクレオチド、500以下のヌクレオチド、700以下のヌクレオチド、又は1,000以下のヌクレオチドによって隔てられている、請求項42に記載の方法。
- a.前記固体支持体から二本鎖の連結された核酸配列決定鋳型を遊離させることと、
b.前記鋳型を配列決定して、前記鋳型に含まれるインサート配列を決定することと、を更に含む、請求項40~43のいずれか一項に記載の方法。 - 1つ以上の連結された核酸配列決定鋳型を生成する方法であって、
a.標的二本鎖核酸を含む試料を、複数の異なる区画内に区画化することと、
b.前記二本鎖核酸をタグメンテーションして、前記複数の異なる区画内の前記二本鎖核酸由来のインサートを含むタグ付けされた二本鎖断片を生成することであって、前記タグメンテーションは、トランスポソーム複合体の2つのプールを用いて実施され、前記トランスポソーム複合体の第1のプールは、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び第1のリード配列決定アダプター配列を含む第1のトランスポゾンと、
iii.前記3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及びハイブリダイゼーション配列の3’相補体を含む第2のトランスポゾンと、を含み、
前記トランスポソーム複合体の第2のプールは、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び第2のリード配列決定アダプター配列を含む第1のトランスポゾンと、
iii.前記3’トランスポゾン末端配列に完全に又は部分的に相補的な5’配列及び3’ハイブリダイゼーション配列を含む第2のトランスポゾンと、を含む、ことと、
c.前記タグ付けされた二本鎖断片を変性させて、一本鎖断片を生成することと、
d.第1の断片中の前記ハイブリダイゼーション配列を第2の断片中のハイブリダイゼーション配列の相補体に結合させることによって、前記同じ区画内の2つの一本鎖断片を互いにハイブリダイズさせることと、
e.各一本鎖断片の3’末端から伸長させて、両方の一本鎖断片由来のインサートを含む二本鎖の連結された核酸配列決定鋳型を生成することと、を含む、方法。 - 二本鎖の連結された核酸配列決定鋳型が、前記同じ区画に存在する2つの一本鎖断片のハイブリダイゼーションからのみ生成される、請求項45に記載の方法。
- 前記ハイブリダイゼーション配列及び/又はその相補体が、前記ハイブリダイゼーション配列又はその相補体に完全に又は部分的に相補的であるブロッキングオリゴヌクレオチドに結合しており、前記変性させることが、前記ブロッキングオリゴヌクレオチドを変性させて前記ハイブリダイゼーション配列及び/又はその相補体をブロック解除することを含む、請求項45又は請求項46に記載の方法。
- 前記区画化することが、最も相違するハプロタイプを異なる区画内に分離し、前記方法が、ハプロタイプフェージングのために使用される、請求項45~47のいずれか一項に記載の方法。
- 前記鋳型を配列決定することを更に含む、請求項19~24、26、32~37、又は39~48のいずれか一項に記載の方法。
- 配列決定が、A14、B15、及び/又はハイブリダイゼーション配列(HYB)に結合する配列決定プライマーを使用して行われ、任意選択的に、配列決定が暗サイクルを含み、データが配列決定の一部について記録されていない、請求項49に記載の方法。
- a.前記同じ鋳型に含まれるインサートの配列を評価することと、
b.前記同じ鋳型に含まれるインサートに基づいて、前記二本鎖核酸に含まれる配列についての近接データを決定することと、を更に含む、請求項49又は50に記載の方法。 - 前記近接データが、インサート配列(又はその相補体)が前記同じ標的核酸に含まれていたことを決定する、請求項51に記載の方法。
- a.異なる鋳型から調製された所与のインサートの複数の配列の配列決定結果を評価することと、
b.前記配列決定データに基づいて、非標準塩基対形成の事象を決定することであって、前記配列決定データは、
i.前記同じ連結された配列決定鋳型に含まれる前記インサート及びその相補体、並びに/又は、
ii.複数の連結された配列決定鋳型に含まれる前記インサートからのものである、ことと、を更に含む、請求項49~52のいずれか一項に記載の方法。 - a.異なる鋳型から調製された所与のインサートの複数の配列の配列決定結果を評価することと、
b.前記配列決定データに基づいて、このインサートに関する配列決定結果におけるエラーを補正することであって、前記配列決定データは、
i.前記同じ連結された配列決定鋳型に含まれる前記インサート及びその相補体、並びに/又は、
ii.複数の連結された配列決定鋳型に含まれる前記インサートからのものである、ことと、を更に含む、請求項49~52のいずれか一項に記載の方法。 - 連結された配列決定鋳型に含まれるインサート配列に含まれる修飾シトシンを同定する方法であって、
a.二本鎖の連結された配列決定鋳型を調製することであって、各鎖はインサート配列及び前記インサート配列のコピーを含み、前記2つの鎖は互いに相補的である、ことと、
b.前記二本鎖の連結された配列決定鋳型を、修飾及び/又は非修飾シトシンを改変する条件に供することと、
c.前記二本鎖の連結された配列決定鋳型の各鎖のアンプリコンを調製することと、
d.アンプリコンを配列決定し、各鎖から生成された前記アンプリコン中の前記インサート配列及び前記インサート配列の前記コピーに関する配列決定結果を評価することと、
e.前記二本鎖の連結された配列決定鋳型の各鎖の配列に基づいて、前記インサート配列に含まれる修飾シトシンの位置を決定することと、を含む、方法。 - 前記修飾シトシンが、メチル化又はヒドロキシメチル化シトシンである、請求項55に記載の方法。
- 前記連結された配列決定鋳型が、請求項19~24、26、32~37、又は39~48のいずれか一項に記載の方法によって調製される、請求項55又は56に記載の方法。
- 前記二本鎖の連結された配列決定鋳型を生成するための伸長が、メチル化dCTPを含む反応溶液を用いて行われる、請求項57に記載の方法。
- 修飾シトシン又は非修飾シトシンが改変され、任意選択的に、修飾シトシンがTET支援ピリジンボラン配列決定(TAPS)処理によって改変されるか、又は非修飾シトシンが亜硫酸水素ナトリウム若しくは酵素処理によって改変される、請求項55~58のいずれか一項に記載の方法。
- 修飾シトシンが改変され、修飾シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(T,C)の存在によって決定され、非修飾シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(C,C)の存在によって決定され、前記修飾シトシン及び前記非修飾シトシンが、相補鎖中のG’と対形成している、請求項59に記載の方法。
- 非修飾シトシンが改変され、修飾シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(C,T)の存在によって決定され、非修飾シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(T,T)の存在によって決定され、前記修飾シトシン及び前記非修飾シトシンが、相補鎖中のG’と対形成している、請求項59に記載の方法。
- 前記方法が、メチル化シトシンの位置をヒドロキシメチル化シトシンから区別する、請求項59に記載の方法。
- 修飾シトシン及び/又は非修飾シトシンを改変するための条件に各鎖を供することが、
a.各鎖をβ-グリコシルトランスフェラーゼと反応させることと、
b.各鎖をDNAメチルトランスフェラーゼ(DNMT)と反応させることと、
c.各鎖を、非修飾シトシンをウラシルに変換する条件で反応させることと、を含む、請求項62に記載の方法。 - a.メチル化シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(C,C)の存在によって決定され、
b.ヒドロキシメチル化シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(C,T)の存在によって決定され、
c.非修飾シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(T,T)の存在によって決定され、
前記メチル化シトシン、前記ヒドロキシメチル化シトシン、及び前記非修飾シトシンは、相補鎖中のG’と対形成している、請求項63に記載の方法。 - 修飾シトシン及び/又は非修飾シトシンを改変するための条件に各鎖を前記供することが、
a.各鎖をDNMTと反応させることと、
b.各鎖を、メチル化シトシンをジヒドロキシウラシル(DHU)に変換する条件で反応させることと、を含む、請求項62に記載の方法。 - a.メチル化シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(T,T)の存在によって決定され、
b.ヒドロキシメチル化シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(T,C)の存在によって決定され、
c.非修飾シトシンの位置が、それぞれ前記インサート配列及び前記インサート配列の前記コピー中の(C,C)の存在によって決定され、
前記メチル化シトシン、前記ヒドロキシメチル化シトシン、及び前記非修飾シトシンは、相補鎖中のG’と対形成している、請求項65に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063094422P | 2020-10-21 | 2020-10-21 | |
US63/094,422 | 2020-10-21 | ||
US202163256040P | 2021-10-15 | 2021-10-15 | |
US63/256,040 | 2021-10-15 | ||
PCT/US2021/055878 WO2022087150A2 (en) | 2020-10-21 | 2021-10-20 | Sequencing templates comprising multiple inserts and compositions and methods for improving sequencing throughput |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023547366A true JP2023547366A (ja) | 2023-11-10 |
Family
ID=78622058
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023524116A Pending JP2023547366A (ja) | 2020-10-21 | 2021-10-20 | 複数のインサートを含む配列決定鋳型、並びに配列決定スループットを改善するための組成物及び方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20230407388A1 (ja) |
EP (1) | EP4232600A2 (ja) |
JP (1) | JP2023547366A (ja) |
KR (1) | KR20230091116A (ja) |
CN (1) | CN116438319A (ja) |
AU (1) | AU2021366658A1 (ja) |
CA (1) | CA3198842A1 (ja) |
IL (1) | IL302207A (ja) |
MX (1) | MX2023004461A (ja) |
WO (1) | WO2022087150A2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2024525180A (ja) * | 2021-06-17 | 2024-07-10 | エレメント バイオサイエンシズ,インコーポレイティド | ペアワイズシーケンシングのための組成物及び方法 |
WO2022266470A1 (en) * | 2021-06-17 | 2022-12-22 | Element Biosciences, Inc. | Compositions and methods for pairwise sequencing |
US11535892B1 (en) | 2021-06-17 | 2022-12-27 | Element Biosciences, Inc. | Compositions and methods for pairwise sequencing |
US11859241B2 (en) | 2021-06-17 | 2024-01-02 | Element Biosciences, Inc. | Compositions and methods for pairwise sequencing |
WO2023168300A1 (en) * | 2022-03-01 | 2023-09-07 | Guardant Health, Inc. | Methods for analyzing cytosine methylation and hydroxymethylation |
EP4341425A2 (en) | 2022-03-15 | 2024-03-27 | Illumina, Inc. | Concurrent sequencing of forward and reverse complement strands on concatenated polynucleotides for methylation detection |
WO2023175013A1 (en) | 2022-03-15 | 2023-09-21 | Illumina, Inc. | Methods for preparing signals for concurrent sequencing |
WO2023230550A2 (en) * | 2022-05-26 | 2023-11-30 | Illumina, Inc. | Preparation of long read nucleic acid libraries |
WO2024061799A1 (en) | 2022-09-19 | 2024-03-28 | Illumina, Inc. | Deformable polymers comprising immobilised primers |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2044616A1 (en) | 1989-10-26 | 1991-04-27 | Roger Y. Tsien | Dna sequencing |
EP3034626A1 (en) | 1997-04-01 | 2016-06-22 | Illumina Cambridge Limited | Method of nucleic acid sequencing |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US7955794B2 (en) | 2000-09-21 | 2011-06-07 | Illumina, Inc. | Multiplex nucleic acid reactions |
AU2001282881B2 (en) | 2000-07-07 | 2007-06-14 | Visigen Biotechnologies, Inc. | Real-time sequence determination |
WO2002044425A2 (en) | 2000-12-01 | 2002-06-06 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
SI3363809T1 (sl) | 2002-08-23 | 2020-08-31 | Illumina Cambridge Limited | Modificirani nukleotidi za polinukleotidno sekvenciranje |
EP2789383B1 (en) | 2004-01-07 | 2023-05-03 | Illumina Cambridge Limited | Molecular arrays |
EP3415641B1 (en) | 2004-09-17 | 2023-11-01 | Pacific Biosciences Of California, Inc. | Method for analysis of molecules |
GB0427236D0 (en) | 2004-12-13 | 2005-01-12 | Solexa Ltd | Improved method of nucleotide detection |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
EP4105644A3 (en) | 2006-03-31 | 2022-12-28 | Illumina, Inc. | Systems and devices for sequence by synthesis analysis |
ATE490971T1 (de) | 2006-04-18 | 2010-12-15 | Advanced Liquid Logic Inc | Biochemie auf tröpfchenbasis |
AU2007309504B2 (en) | 2006-10-23 | 2012-09-13 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
WO2010127304A2 (en) | 2009-05-01 | 2010-11-04 | Illumina, Inc. | Sequencing methods |
EP2633069B1 (en) | 2010-10-26 | 2015-07-01 | Illumina, Inc. | Sequencing methods |
US9644199B2 (en) | 2012-10-01 | 2017-05-09 | Agilent Technologies, Inc. | Immobilized transposase complexes for DNA fragmentation and tagging |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
ES2628485T3 (es) | 2013-07-03 | 2017-08-03 | Illumina, Inc. | Secuenciación mediante síntesis ortogonal |
MX370616B (es) * | 2013-11-22 | 2019-12-17 | Theranos Ip Co Llc | Amplificacion de acidos nucleicos. |
DK3083994T3 (da) | 2013-12-20 | 2021-09-13 | Illumina Inc | Bevarelse af genomisk konnektivitetsinformation i fragmenterede genomiske DNA-prøver |
TWI682997B (zh) | 2014-04-15 | 2020-01-21 | 美商伊路米納有限公司 | 用於改善插入序列傾向及增加dna輸入耐受度之經修飾的轉位酶 |
US10975371B2 (en) | 2014-04-29 | 2021-04-13 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
LT3207134T (lt) * | 2014-10-17 | 2019-09-10 | Illumina Cambridge Limited | Sukibimą išsauganti transpozicija |
IL299976B1 (en) * | 2014-10-17 | 2024-07-01 | Illumina Cambridge Ltd | Continuity-preserving transposition |
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
US11453875B2 (en) | 2015-05-28 | 2022-09-27 | Illumina Cambridge Limited | Surface-based tagmentation |
ES2864677T3 (es) | 2015-07-30 | 2021-10-14 | Illumina Inc | Desbloqueo ortogonal de nucleótidos |
CN108368545B (zh) * | 2015-10-09 | 2022-05-17 | 安可济控股有限公司 | 用于富集扩增产物的方法及组合物 |
EP3555305B1 (en) * | 2016-12-16 | 2021-02-17 | H. Hoffnabb-La Roche Ag | Method for increasing throughput of single molecule sequencing by concatenating short dna fragments |
US10844429B2 (en) | 2017-01-18 | 2020-11-24 | Illumina, Inc. | Methods and systems for generation and error-correction of unique molecular index sets with heterogeneous molecular lengths |
KR102607830B1 (ko) | 2017-02-21 | 2023-12-01 | 일루미나, 인코포레이티드 | 링커를 갖는 고정된 트랜스포좀을 사용한 태그먼트화 |
CA3060369A1 (en) | 2017-05-01 | 2018-11-08 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
AU2018266377B2 (en) | 2017-05-08 | 2024-06-20 | Illumina, Inc. | Universal short adapters for indexing of polynucleotide samples |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
IL271235B1 (en) | 2017-11-30 | 2024-08-01 | Illumina Inc | Validation methods and systems for detecting sequence variants |
WO2020014437A1 (en) | 2018-07-12 | 2020-01-16 | Levine Alison | Modular apparel |
-
2021
- 2021-10-20 MX MX2023004461A patent/MX2023004461A/es unknown
- 2021-10-20 CN CN202180071179.8A patent/CN116438319A/zh active Pending
- 2021-10-20 WO PCT/US2021/055878 patent/WO2022087150A2/en active Application Filing
- 2021-10-20 EP EP21807406.0A patent/EP4232600A2/en active Pending
- 2021-10-20 KR KR1020237016082A patent/KR20230091116A/ko unknown
- 2021-10-20 IL IL302207A patent/IL302207A/en unknown
- 2021-10-20 AU AU2021366658A patent/AU2021366658A1/en active Pending
- 2021-10-20 CA CA3198842A patent/CA3198842A1/en active Pending
- 2021-10-20 JP JP2023524116A patent/JP2023547366A/ja active Pending
-
2023
- 2023-04-20 US US18/303,905 patent/US20230407388A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4232600A2 (en) | 2023-08-30 |
AU2021366658A9 (en) | 2024-05-02 |
WO2022087150A3 (en) | 2022-06-30 |
US20230407388A1 (en) | 2023-12-21 |
AU2021366658A1 (en) | 2023-06-22 |
CA3198842A1 (en) | 2022-04-28 |
MX2023004461A (es) | 2023-05-03 |
WO2022087150A2 (en) | 2022-04-28 |
IL302207A (en) | 2023-06-01 |
CN116438319A (zh) | 2023-07-14 |
KR20230091116A (ko) | 2023-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2023547366A (ja) | 複数のインサートを含む配列決定鋳型、並びに配列決定スループットを改善するための組成物及び方法 | |
US20240175010A1 (en) | Methods of Library Preparation | |
KR102414127B1 (ko) | 고체 지지체 상의 샘플 제조법 | |
US9944924B2 (en) | Polynucleotide modification on solid support | |
US11306348B2 (en) | Complex surface-bound transposome complexes | |
CN112739830A (zh) | 使用单一表面引物进行配对末端测序的方法和组合物 | |
US20240026348A1 (en) | Methods of Preparing Directional Tagmentation Sequencing Libraries Using Transposon-Based Technology with Unique Molecular Identifiers for Error Correction | |
US20240271126A1 (en) | Oligo-modified nucleotide analogues for nucleic acid preparation | |
US20230416803A1 (en) | Methods of enriching a target sequence from a sequencing library using hairpin adaptors |