KR20240024835A - Methods and compositions for bead-based combinatorial indexing of nucleic acids - Google Patents
Methods and compositions for bead-based combinatorial indexing of nucleic acids Download PDFInfo
- Publication number
- KR20240024835A KR20240024835A KR1020237043987A KR20237043987A KR20240024835A KR 20240024835 A KR20240024835 A KR 20240024835A KR 1020237043987 A KR1020237043987 A KR 1020237043987A KR 20237043987 A KR20237043987 A KR 20237043987A KR 20240024835 A KR20240024835 A KR 20240024835A
- Authority
- KR
- South Korea
- Prior art keywords
- polynucleotide
- linker
- index
- indexed
- beads
- Prior art date
Links
- 239000011324 bead Substances 0.000 title claims abstract description 277
- 238000000034 method Methods 0.000 title claims abstract description 137
- 102000039446 nucleic acids Human genes 0.000 title claims description 55
- 108020004707 nucleic acids Proteins 0.000 title claims description 55
- 150000007523 nucleic acids Chemical class 0.000 title claims description 55
- 239000000203 mixture Substances 0.000 title abstract description 21
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 356
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 356
- 239000002157 polynucleotide Substances 0.000 claims abstract description 356
- 239000000126 substance Substances 0.000 claims abstract description 30
- 108091034117 Oligonucleotide Proteins 0.000 claims description 127
- 125000003729 nucleotide group Chemical group 0.000 claims description 92
- 239000002773 nucleotide Substances 0.000 claims description 78
- 239000000523 sample Substances 0.000 claims description 75
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical class N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 62
- 238000006243 chemical reaction Methods 0.000 claims description 42
- 230000000295 complement effect Effects 0.000 claims description 41
- 229960002685 biotin Drugs 0.000 claims description 32
- 239000011616 biotin Substances 0.000 claims description 32
- 238000012163 sequencing technique Methods 0.000 claims description 32
- 108010090804 Streptavidin Chemical class 0.000 claims description 31
- 235000020958 biotin Nutrition 0.000 claims description 31
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 claims description 16
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 claims description 16
- 102000003960 Ligases Human genes 0.000 claims description 13
- 108090000364 Ligases Proteins 0.000 claims description 13
- 239000012634 fragment Substances 0.000 claims description 13
- 230000000593 degrading effect Effects 0.000 claims description 12
- 230000006862 enzymatic digestion Effects 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 11
- 230000004048 modification Effects 0.000 claims description 10
- 150000001540 azides Chemical class 0.000 claims description 7
- 239000005546 dideoxynucleotide Substances 0.000 claims description 7
- 125000003342 alkenyl group Chemical group 0.000 claims description 6
- 125000000304 alkynyl group Chemical group 0.000 claims description 6
- SQDFHQJTAWCFIB-UHFFFAOYSA-N n-methylidenehydroxylamine Chemical compound ON=C SQDFHQJTAWCFIB-UHFFFAOYSA-N 0.000 claims description 6
- 150000003573 thiols Chemical class 0.000 claims description 6
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims description 4
- 229910052802 copper Inorganic materials 0.000 claims description 4
- 239000010949 copper Substances 0.000 claims description 4
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 3
- 108091007433 antigens Proteins 0.000 claims description 3
- 102000036639 antigens Human genes 0.000 claims description 3
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 claims description 3
- 150000001615 biotins Chemical class 0.000 claims description 3
- 125000001425 triazolyl group Chemical group 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 230000036961 partial effect Effects 0.000 abstract description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 51
- 108020004414 DNA Proteins 0.000 description 30
- 102000053602 DNA Human genes 0.000 description 30
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 27
- 238000003753 real-time PCR Methods 0.000 description 22
- 239000000758 substrate Substances 0.000 description 22
- 238000004925 denaturation Methods 0.000 description 18
- 230000036425 denaturation Effects 0.000 description 18
- 238000009396 hybridization Methods 0.000 description 18
- 230000015572 biosynthetic process Effects 0.000 description 16
- 238000003786 synthesis reaction Methods 0.000 description 14
- 238000001514 detection method Methods 0.000 description 13
- 230000003321 amplification Effects 0.000 description 11
- 238000003199 nucleic acid amplification method Methods 0.000 description 11
- 230000002829 reductive effect Effects 0.000 description 11
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical class O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 10
- 229930010555 Inosine Natural products 0.000 description 9
- 238000000137 annealing Methods 0.000 description 9
- 229960003786 inosine Drugs 0.000 description 9
- 238000003556 assay Methods 0.000 description 7
- -1 cyclic nucleic acids Chemical class 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- WREGKURFCTUGRC-POYBYMJQSA-N Zalcitabine Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO)CC1 WREGKURFCTUGRC-POYBYMJQSA-N 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 238000012937 correction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000011534 incubation Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 5
- 102000004190 Enzymes Human genes 0.000 description 5
- 108090000790 Enzymes Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000003205 genotyping method Methods 0.000 description 5
- 238000003752 polymerase chain reaction Methods 0.000 description 5
- 125000001494 2-propynyl group Chemical group [H]C#CC([H])([H])* 0.000 description 4
- 238000003491 array Methods 0.000 description 4
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 4
- 238000012650 click reaction Methods 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000002789 length control Methods 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 108091028732 Concatemer Proteins 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 241000289581 Macropus sp. Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 150000001345 alkine derivatives Chemical class 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000003505 heat denaturation Methods 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 150000003852 triazoles Chemical class 0.000 description 2
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- JTBBWRKSUYCPFY-UHFFFAOYSA-N 2,3-dihydro-1h-pyrimidin-4-one Chemical group O=C1NCNC=C1 JTBBWRKSUYCPFY-UHFFFAOYSA-N 0.000 description 1
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- KAIBIHADRGRWCL-HBNTYKKESA-N 5-(4-hydroxybut-1-ynyl)-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C#CCCO)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 KAIBIHADRGRWCL-HBNTYKKESA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical group CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 1
- 125000002777 acetyl group Chemical class [H]C([H])([H])C(*)=O 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000005336 allyloxy group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 125000001246 bromo group Chemical group Br* 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004182 chemical digestion Methods 0.000 description 1
- 230000001055 chewing effect Effects 0.000 description 1
- 125000001309 chloro group Chemical group Cl* 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- PGUYAANYCROBRT-UHFFFAOYSA-N dihydroxy-selanyl-selanylidene-lambda5-phosphane Chemical compound OP(O)([SeH])=[Se] PGUYAANYCROBRT-UHFFFAOYSA-N 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 125000001153 fluoro group Chemical group F* 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000011223 gene expression profiling Methods 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 239000008240 homogeneous mixture Substances 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000005389 magnetism Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 125000000951 phenoxy group Chemical group [H]C1=C([H])C([H])=C(O*)C([H])=C1[H] 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- HBCQSNAFLVXVAY-UHFFFAOYSA-N pyrimidine-2-thiol Chemical compound SC1=NC=CC=N1 HBCQSNAFLVXVAY-UHFFFAOYSA-N 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- JRPHGDYSKGJTKZ-UHFFFAOYSA-K selenophosphate Chemical compound [O-]P([O-])([O-])=[Se] JRPHGDYSKGJTKZ-UHFFFAOYSA-K 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 229960000523 zalcitabine Drugs 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6834—Enzymatic or biochemical coupling of nucleic acids to a solid phase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/10—Nucleotidyl transfering
- C12Q2521/101—DNA polymerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/501—Ligase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/149—Sequential reactions
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/149—Particles, e.g. beads
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biomedical Technology (AREA)
- Immunology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Medicinal Preparation (AREA)
Abstract
일부 실시형태는 조합 인덱싱된 비이드의 제조를 위한 방법 및 조성물에 관한 것이다. 일부 실시형태는 비이드에 부착된 폴리뉴클레오티드에 대한 상이한 인덱스의 순차적 부가를 포함한다. 일부 실시형태에서, 인덱스는 화학 결찰, 폴리머라아제 연장, 부분적 이중-가닥 어댑터의 결찰, 또는 짧은 스플린트 결찰에 의해 첨가된다.Some embodiments relate to methods and compositions for making combinatorial indexed beads. Some embodiments involve sequential addition of different indices to polynucleotides attached to beads. In some embodiments, the index is added by chemical ligation, polymerase extension, ligation of partial double-strand adapters, or short splint ligation.
Description
관련 출원Related applications
본 출원은 본원에서 그 전체가 참조 인용되는 "비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물(METHODS AND COMPOSITIONS FOR COMBINATORIAL INDEXING OF BEAD-BASED NUCLEIC ACIDS)"이라는 제목으로 2021년 6월 24일에 출원된 미국 가출원 제63/214,693호에 대한 우선권을 주장한다.This application is filed on June 24, 2021, entitled “METHODS AND COMPOSITIONS FOR COMBINATORIAL INDEXING OF BEAD-BASED NUCLEIC ACIDS,” which is incorporated herein by reference in its entirety. Priority is claimed on filed U.S. Provisional Application No. 63/214,693.
서열 목록의 참조Reference in Sequence Listing
본 출원은 전자 포맷의 서열 목록과 함께 출원된다. 서열 목록은 크기가 약 3.15 킬로바이트인, 2022년 6월 17일자로 생성된 ILLINC608WOSEQLIST라는 명칭의 파일로서 제공된다. 서열 목록의 전자 포맷의 정보는 본원에서 그 전체가 참조 인용된다.This application is filed with a sequence listing in electronic format. The sequence listing is provided as a file named ILLINC608WOSEQLIST, created on June 17, 2022, and is approximately 3.15 kilobytes in size. The information in electronic format of the sequence listing is incorporated herein by reference in its entirety.
기술분야Technology field
일부 실시형태는 조합 인덱싱된 비이드(combinatorially indexed bead)의 제조를 위한 방법 및 조성물에 관한 것이다. 일부 실시형태는 비이드에 부착된 폴리뉴클레오티드에 대한 상이한 인덱스의 순차적 부가를 포함한다. 일부 실시형태에서, 인덱스는 화학 결찰(ligation), 폴리머라아제 연장(extension), 부분적 이중-가닥 어댑터(adaptor)의 결찰, 또는 짧은 스플린트(splint) 결찰에 의해 첨가된다.Some embodiments relate to methods and compositions for making combinatorially indexed beads. Some embodiments involve sequential addition of different indices to polynucleotides attached to beads. In some embodiments, the index is added by chemical ligation, polymerase extension, ligation of a partial double-stranded adapter, or short splint ligation.
생물학적 샘플에 존재하는 특정 핵산 서열의 검출은 예를 들어 미생물의 식별 및 분류, 전염병 진단, 유전적 이상의 검출 및 특징분석, 암과 관련된 유전적 변이 식별, 질환에 대한 유전적 감수성 연구, 및 다양한 유형의 치료에 대한 반응 측정을 위한 방법으로 사용되어 왔다. 생물학적 샘플에서 특정 핵산 서열을 검출하는 통상적인 기술은 핵산 서열분석이다.Detection of specific nucleic acid sequences present in biological samples can be used, for example, to identify and classify microorganisms, diagnose infectious diseases, detect and characterize genetic abnormalities, identify genetic variants associated with cancer, study genetic susceptibility to diseases, and various other types of diseases. It has been used as a method to measure response to treatment. A common technique for detecting specific nucleic acid sequences in biological samples is nucleic acid sequencing.
핵산 서열분석 방법론은 Maxam 및 Gilbert에 의해 사용된 화학적 분해 방법 및 Sanger에 의해 사용된 가닥 신장 방법(strand elongation method)으로부터 상당히 진화되어 왔다. 현재는, 수천 개의 핵산을 단일 칩 상에서 모두 병행 처리(parallel processing)할 수 있게 하는 몇몇 서열분석 방법이 사용되고 있는 중이다. 일부 플랫폼은 비이드-기반 및 마이크로어레이 포맷을 포함하는데, 여기서 실리카 비이드는 서열분석, 유전자형 분석(genotyping), 유전자 발현 프로파일링을 포함한 적용에서 상기 포맷의 적용에 따라 프로브(probe)로 기능화된다.Nucleic acid sequencing methodologies have evolved significantly from the chemical digestion method used by Maxam and Gilbert and the strand elongation method used by Sanger. Currently, several sequencing methods are being used that allow parallel processing of thousands of nucleic acids all on a single chip. Some platforms include bead-based and microarray formats, where silica beads are functionalized with probes depending on the application of the format in applications including sequencing, genotyping, and gene expression profiling. .
현재의 비이드-기반 어레이 상에서의 상이한 샘플의 유전자형 분석 방법은, 비이드 칩의 상이한 영역을 다중 섹터로 물리적으로 세분화하기 위한 개스킷(gasket)을 필요로 할 수 있다. 개별적 샘플은 이후 개스킷에 의해 생성된 각각의 개별 섹션에 로딩된다. 그러나, 상기 방법은 비교적 낮은 샘플 수 입력과 함께 사용될 수 있지만, 비이드 칩당 샘플의 밀도가 비이드 칩당 24개로부터 96개, 384개, 1536개, 또는 그 이상의 샘플로 증가함에 따라 까다롭거나 다루기 어려운 것으로 입증되었다.Current methods for genotyping different samples on bead-based arrays may require gaskets to physically subdivide different regions of the bead chip into multiple sectors. Individual samples are then loaded into each individual section created by the gasket. However, although the method can be used with relatively low sample number inputs, it becomes challenging or unwieldy as the density of samples per bead chip increases from 24 to 96, 384, 1536, or more samples per bead chip. It has proven difficult.
본원에 제공된 방법 및 조성물의 일부 실시형태는 복수의 조합 인덱싱된 비이드의 제조 방법으로서: (a) 제1 인덱스를 포함하는 제1 폴리뉴클레오티드를 포함하는 1차 인덱싱된 비이드의 집단을 수득하는 단계, 여기서 1차 인덱싱된 비이드의 집단은 복수의 인덱싱된 비이드의 제1 하위집단을 포함하고, 인덱싱된 비이드의 제1 하위집단은 서로 상이한 제1 인덱스를 포함함; (b) 1차 인덱싱된 비이드의 집단을 복수의 비이드의 제2 하위집단으로 분할하는 단계; (c) 하기를 포함하는, 2차 인덱싱된 비이드의 집단을 수득하는 단계를 포함하고: (i) 제2 인덱스를 포함하는 제2 폴리뉴클레오티드로 복수의 비이드의 제2 하위집단의 제1 폴리뉴클레오티드를 연장하여, 인덱싱된 비이드의 제2 하위집단을 수득하는 것, 여기서 인덱싱된 비이드의 제2 하위집단은 서로 상이한 제2 인덱스를 포함함, 및 (ii) 인덱싱된 비이드의 제2 하위집단을 조합하여, 2차 인덱싱된 비이드의 집단을 수득하는 것; 선택적으로는, 추가로: (d) 2차 인덱싱된 비이드의 집단을 복수의 비이드의 제3 하위집단으로 분할하는 단계; 및 (e) 하기를 포함하는, 3차 인덱싱된 비이드의 집단을 수득하는 단계를 포함하는, 방법을 포함한다: (i) 제3 인덱스를 포함하는 제3 폴리뉴클레오티드로 복수의 비이드의 제3 하위집단의 제2 폴리뉴클레오티드를 연장시켜, 인덱싱된 비이드의 제3 하위집단을 수득하는 것, 여기서 인덱싱된 비이드의 제3 하위집단은 서로 상이한 제3 인덱스를 포함함, 및 (ii) 인덱싱된 비이드의 제3 하위집단을 조합하여, 3차 인덱싱된 비이드의 집단을 수득하는 것.Some embodiments of the methods and compositions provided herein are methods of making a plurality of combinatorial indexed beads, comprising: (a) obtaining a population of primary indexed beads comprising a first polynucleotide comprising a first index; A step, wherein the first population of indexed beads includes a first sub-population of the plurality of indexed beads, and the first sub-population of indexed beads includes first indices that are different from each other; (b) dividing the first indexed population of beads into a second subpopulation of a plurality of beads; (c) obtaining a second population of indexed beads, comprising: (i) a first portion of the second subpopulation of the plurality of beads with a second polynucleotide comprising a second index; extending the polynucleotide to obtain a second subpopulation of indexed beads, wherein the second subpopulation of indexed beads comprises a second index that is different from each other, and (ii) a second subpopulation of indexed beads. combining the two subpopulations to obtain a secondary population of indexed beads; Optionally, further: (d) dividing the secondary indexed population of beads into a third subpopulation of the plurality of beads; and (e) obtaining a population of tertiary indexed beads, comprising: (i) forming the plurality of beads with a third polynucleotide comprising a third index. extending the second polynucleotide of the three subpopulations to obtain a third subpopulation of indexed beads, wherein the third subpopulation of indexed beads comprises a third index that is different from each other, and (ii) Combining the third subpopulation of indexed beads to obtain a third population of indexed beads.
일부 실시형태에서, (c)는 화학 결찰에 의해 제2 폴리뉴클레오티드로 제1 폴리뉴클레오티드를 연장시키는 것을 포함한다.In some embodiments, (c) includes extending the first polynucleotide with a second polynucleotide by chemical ligation.
일부 실시형태에서, 제1 폴리뉴클레오티드는 클릭 화학 반응(click chemistry reaction)에 참여할 수 있는 3' 관능성 모이어티를 포함하는 말단 3' 개질된 데옥시뉴클레오티드(dNTP)를 포함하고; 제2 폴리뉴클레오티드는 3'-관능성 모이어티와의 클릭 화학 반응에 참여할 수 있는 상용성 5' 관능성 모이어티를 포함하는 말단 5' 개질된 dNTP를 포함하고; 3' 관능성 모이어티 및 5' 관능성 모이어티는 서로 반응하여 개질된 백본 연결을 형성할 수 있다.In some embodiments, the first polynucleotide comprises a terminal 3' modified deoxynucleotide (dNTP) comprising a 3' functional moiety capable of participating in a click chemistry reaction; the second polynucleotide comprises a terminal 5' modified dNTP comprising a compatible 5' functional moiety capable of participating in a click chemistry reaction with the 3'-functional moiety; The 3' functional moiety and the 5' functional moiety can react with each other to form a modified backbone linkage.
일부 실시형태에서, 제2 폴리뉴클레오티드로 제1 폴리뉴클레오티드를 연장시키는 것은 2차 인덱싱된 폴리뉴클레오티드를 수득하고, 방법은 또한 2차 인덱싱된 폴리뉴클레오티드를 개질시켜, 클릭 화학 반응에 참여할 수 있는 3' 관능성 모이어티를 포함하는 말단 3' 개질된 데옥시뉴클레오티드(dNTP)를 포함하는 개질된 폴리뉴클레오티드를 수득하는 것을 포함한다.In some embodiments, extending a first polynucleotide with a second polynucleotide yields a secondary indexed polynucleotide, and the method also modifies the secondary indexed polynucleotide to form a 3′ polynucleotide that can participate in a click chemistry reaction. and obtaining a modified polynucleotide comprising a terminal 3' modified deoxynucleotide (dNTP) comprising a functional moiety.
일부 실시형태에서, 개질은 2차 인덱싱된 폴리뉴클레오티드와 주형 독립적 폴리머라아제를 접촉시키는 것을 포함한다. 일부 실시형태에서, 주형 독립적 폴리머라아제는 말단 데옥시뉴클레오티딜 트랜스퍼라아제(TdT), 폴리A 폴리머라아제, 또는 CCA-첨가(adding) RNA 폴리머라아제로부터 선택된다. 일부 실시형태에서, 주형 독립적 폴리머라아제는 TdT이다.In some embodiments, the modification includes contacting the secondary indexed polynucleotide with a template-independent polymerase. In some embodiments, the template independent polymerase is selected from terminal deoxynucleotidyl transferase (TdT), polyA polymerase, or CCA-adding RNA polymerase. In some embodiments, the template independent polymerase is TdT.
일부 실시형태는 또한 화학 결찰 반응에 의해 제3 폴리뉴클레오티드로 개질된 폴리뉴클레오티드를 연장시키는 것을 포함하고, 여기서 제3 폴리뉴클레오티드는 3' 관능성 모이어티와의 클릭 화학 반응에 참여할 수 있는 상용성 5' 관능성 모이어티를 포함하는 말단 5' 개질된 dNTP를 포함한다.Some embodiments also include extending the modified polynucleotide by a chemical ligation reaction with a third polynucleotide, wherein the third polynucleotide is a compatible 5 polynucleotide capable of participating in a click chemistry reaction with the 3' functional moiety. It contains a 'terminal 5' modified dNTP containing a functional moiety.
일부 실시형태에서, 3' 관능성 모이어티는 아자이드, 알키닐, 알케닐, 티올, 및 니트론으로 이루어지는 군으로부터 선택된다.In some embodiments, the 3' functional moiety is selected from the group consisting of azide, alkynyl, alkenyl, thiol, and nitrone.
일부 실시형태에서, 5' 관능성 모이어티는 3' 관능성 모이어티와 상이하고 이와 상용성이고, 아자이드, 알키닐, 알케닐, 티올, 및 니트론으로 이루어지는 군으로부터 선택된다.In some embodiments, the 5' functional moiety is different from and compatible with the 3' functional moiety and is selected from the group consisting of azide, alkynyl, alkenyl, thiol, and nitrone.
일부 실시형태에서, 3' 관능성 모이어티 및 5' 관능성 모이어티는 하기 쌍으로부터 선택된다: (i) 3'-아자이도/5'-알키닐; (ii) 3'-알키닐/5' 아자이도; (iii) 3'-티올/5'-알키닐; (iv) 3'-티올/5'-알케닐; (v) 3'-알키닐/5'-티올; (vi) 3'-알케닐/5'-티올; (vii) 3'-아자이도/5'-시클로옥티닐; (viii) 3'-시클로옥틴/5'-아자이도; (ix) 3'-니트론/5'-시클로옥티닐; 및 (x) 3'-시클로옥티닐/5'-니트론. 일부 실시형태에서, 3' 관능성 모이어티는 3'-아자이도이고, 5' 관능성 모이어티는 5'-알키닐이다.In some embodiments, the 3' functional moiety and 5' functional moiety are selected from the following pairs: (i) 3'-azido/5'-alkynyl; (ii) 3'-alkynyl/5' azido; (iii) 3'-thiol/5'-alkynyl; (iv) 3'-thiol/5'-alkenyl; (v) 3'-alkynyl/5'-thiol; (vi) 3'-alkenyl/5'-thiol; (vii) 3'-azido/5'-cyclooctynyl; (viii) 3'-cyclooctyne/5'-azido; (ix) 3'-nitrone/5'-cyclooctynyl; and (x) 3'-cyclooctynyl/5'-nitrone. In some embodiments, the 3' functional moiety is 3'-azido and the 5' functional moiety is 5'-alkynyl.
일부 실시형태에서, 클릭 화학 반응은 트리아졸릴을 포함하는 개질된 백본 연결을 형성하기 위한 구리 촉매작용된 아자이드-알킨 부가환화(CuAAC)를 포함한다.In some embodiments, the click chemistry reaction includes copper catalyzed azide-alkyne addition (CuAAC) to form a modified backbone linkage comprising triazolyl.
일부 실시형태에서, (c)는 폴리머라아제 연장에 의해 제1 폴리뉴클레오티드를 연장하는 것을 포함하고, 여기서 제1 폴리뉴클레오티드는 제1 링커(linker)를 포함한다.In some embodiments, (c) includes extending the first polynucleotide by polymerase extension, wherein the first polynucleotide includes a first linker.
일부 실시형태는 또한 (i) 제1 링커에 혼성화될 수 있는 영역 및 제2 인덱스 또는 제2 인덱스의 상보체(complement)를 포함하는 영역을 포함하는 제1 어댑터를 수득하는 것; (ii) 제1 어댑터를 제1 링커에 혼성화시키는 것; 및 (iii) 제1 폴리뉴클레오티드를 연장시켜 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다.Some embodiments also include (i) obtaining a first adapter comprising a region capable of hybridizing to the first linker and a region comprising a second index or a complement of the second index; (ii) hybridizing the first adapter to the first linker; and (iii) extending the first polynucleotide to obtain a secondary indexed polynucleotide.
일부 실시형태에서, 제1 어댑터는 비연장성 3' 말단을 포함한다. 일부 실시형태에서, 비연장성 3' 말단은 3'2' 디데옥시 뉴클레오티드, 또는 C3 링커를 포함한다.In some embodiments, the first adapter comprises a non-extended 3' end. In some embodiments, the non-extended 3' end comprises a 3'2' dideoxy nucleotide, or a C3 linker.
일부 실시형태는 또한 2차 인덱싱된 폴리뉴클레오티드로부터 제1 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다.Some embodiments also include removing the first adapter from the secondary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion.
일부 실시형태에서, 제1 링커는 10개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제1 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다.In some embodiments, the first linker is less than 10 contiguous nucleotides in length. In some embodiments, the first linker is less than 5 consecutive nucleotides in length.
일부 실시형태에서, (e)는 폴리머라아제 연장에 의해 제2 폴리뉴클레오티드를 연장시키는 것을 포함한다.In some embodiments, (e) includes extending the second polynucleotide by polymerase extension.
일부 실시형태에서, 제1 어댑터는 제2 링커의 상보체를 포함하여, 2차 인덱싱된 폴리뉴클레오티드가 제2 링커를 포함한다.In some embodiments, the first adapter comprises the complement of a second linker, such that the secondary indexed polynucleotide comprises a second linker.
일부 실시형태는 또한 (i) 제2 링커에 혼성화될 수 있는 영역 및 제3 인덱스 또는 제3 인덱스의 상보체를 포함하는 영역을 포함하는 제2 어댑터를 수득하는 것; (ii) 제2 어댑터를 제2 링커에 혼성화시키는 것; 및 (iii) 2차 인덱싱된 폴리뉴클레오티드를 연장시켜 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다.Some embodiments also include (i) obtaining a second adapter comprising a region capable of hybridizing to a second linker and a region comprising a third index or a complement of the third index; (ii) hybridizing the second adapter to the second linker; and (iii) extending the secondary indexed polynucleotide to obtain a tertiary indexed polynucleotide.
일부 실시형태에서, 제2 어댑터는 비연장성 3' 말단을 포함한다.In some embodiments, the second adapter comprises a non-extended 3' end.
일부 실시형태에서, 비연장성 3' 말단은 3'2' 디데옥시 뉴클레오티드, 또는 C3 링커를 포함한다.In some embodiments, the non-extended 3' end comprises a 3'2' dideoxy nucleotide, or a C3 linker.
일부 실시형태는 또한 3차 인덱싱된 폴리뉴클레오티드로부터 제2 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다.Some embodiments also include removing the second adapter from the tertiary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion.
일부 실시형태에서, 제2 링커는 10개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제2 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다.In some embodiments, the second linker is less than 10 contiguous nucleotides in length. In some embodiments, the second linker is less than 5 consecutive nucleotides in length.
일부 실시형태에서, (c)는 결찰에 의해 제2 폴리뉴클레오티드로 제1 폴리뉴클레오티드를 연장시키는 것을 포함한다.In some embodiments, (c) includes extending the first polynucleotide with a second polynucleotide by ligation.
일부 실시형태는 또한 (i) 제1 폴리뉴클레오티드의 제1 링커에 혼성화될 수 있는 3' 단일 가닥 오버행(overhang) 및 제2 폴리뉴클레오티드를 포함하는 이중 가닥 제1 어댑터를 수득하는 것; (ii) 제1 링커에 제1 어댑터를 혼성화시키는 것; 및 (iii) 제2 폴리뉴클레오티드에 제1 폴리뉴클레오티드를 결찰시켜 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다.Some embodiments also include (i) obtaining a double-stranded first adapter comprising a second polynucleotide and a 3' single-stranded overhang capable of hybridizing to the first linker of the first polynucleotide; (ii) hybridizing the first adapter to the first linker; and (iii) ligating the first polynucleotide to a second polynucleotide to obtain a secondary indexed polynucleotide.
일부 실시형태는 또한 결찰에 의해 제3 폴리뉴클레오티드로 제2 폴리뉴클레오티드를 연장시키는 것을 포함한다.Some embodiments also include extending the second polynucleotide by ligation into a third polynucleotide.
일부 실시형태는 또한 (i) 제2 폴리뉴클레오티드의 제2 링커에 혼성화될 수 있는 3' 단일 가닥 오버행 및 제3 폴리뉴클레오티드를 포함하는 이중 가닥 제2 어댑터를 수득하는 것; (ii) 제2 링커에 제2 어댑터를 혼성화시키고, 선택적으로는 제1 인덱스에 추가적 올리고뉴클레오티드를 혼성화시키는 것; 및 (iii) 제3 폴리뉴클레오티드에 제2 폴리뉴클레오티드를 결찰시켜, 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다.Some embodiments also include (i) obtaining a double-stranded second adapter comprising a third polynucleotide and a 3' single-stranded overhang capable of hybridizing to a second linker of the second polynucleotide; (ii) hybridizing a second adapter to a second linker and, optionally, an additional oligonucleotide to the first index; and (iii) ligating the second polynucleotide to the third polynucleotide, thereby obtaining a tertiary indexed polynucleotide.
일부 실시형태에서, 결찰은 리가아제의 사용을 포함한다.In some embodiments, ligation involves the use of ligase.
일부 실시형태에서, 결찰은 화학 결찰 반응을 포함한다.In some embodiments, ligation involves a chemical ligation reaction.
일부 실시형태에서, (c)는 결찰에 의해 제1 폴리뉴클레오티드를 연장시키는 것을 포함하고, 여기서 제1 폴리뉴클레오티드는 제1 링커를 포함하고, 제2 폴리뉴클레오티드는 제2 링커를 포함한다.In some embodiments, (c) includes extending the first polynucleotide by ligation, wherein the first polynucleotide comprises a first linker and the second polynucleotide comprises a second linker.
일부 실시형태는 또한 (i) 제1 링커에 혼성화될 수 있는 영역 및 제2 링커에 혼성화될 수 있는 영역을 포함하는 제1 어댑터를 수득하는 것; (ii) 제1 어댑터를 제1 링커에 혼성화시키는 것; (iii) 제2 링커에 혼성화될 수 있는 영역에 제2 올리고뉴클레오티드를 혼성화시키는 것; 및 (iv) 제1 폴리뉴클레오티드를 제2 폴리뉴클레오티드에 결찰시켜, 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다.Some embodiments also include (i) obtaining a first adapter comprising a region hybridizable to a first linker and a region hybridizable to a second linker; (ii) hybridizing the first adapter to the first linker; (iii) hybridizing the second oligonucleotide to a region hybridizable to the second linker; and (iv) ligating the first polynucleotide to the second polynucleotide to obtain a secondary indexed polynucleotide.
일부 실시형태에서, 제1 링커 및/또는 제2 링커는 10개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제1 링커 및/또는 제2 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다.In some embodiments, the first linker and/or the second linker are less than 10 contiguous nucleotides in length. In some embodiments, the first linker and/or the second linker are less than 5 consecutive nucleotides in length.
일부 실시형태에서, 제1 링커 및/또는 제2 링커는 개질되어, 제1 어댑터와 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 Tm을 갖는다.In some embodiments, the first linker and/or the second linker are modified to have an increased Tm relative to an oligonucleotide of the same length as the first adapter.
일부 실시형태에서, 제1 링커 및/또는 제2 링커는 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 G/C 함량을 포함하거나, 개질된 뉴클레오티드를 포함한다.In some embodiments, the first linker and/or the second linker comprises increased G/C content compared to an oligonucleotide of the same length or comprises modified nucleotides.
일부 실시형태는 또한 2차 인덱싱된 폴리뉴클레오티드로부터 제1 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다.Some embodiments also include removing the first adapter from the secondary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion.
일부 실시형태에서, (e)는 결찰에 의해 제2 폴리뉴클레오티드를 연장시키는 것을 포함하고, 여기서 제2 올리고뉴클레오티드는 제3 링커를 포함하여, 2차 인덱싱된 폴리뉴클레오티드가 제3 링커를 포함하며, 제3 폴리뉴클레오티드는 제4 링커를 포함한다.In some embodiments, (e) comprises extending the second polynucleotide by ligation, wherein the second oligonucleotide comprises a third linker, and the secondary indexed polynucleotide comprises a third linker, and The third polynucleotide includes a fourth linker.
일부 실시형태는 또한 (i) 제3 링커에 혼성화될 수 있는 영역 및 제4 링커에 혼성화될 수 있는 영역을 포함하는 제2 어댑터를 수득하는 것; (ii) 제2 어댑터를 제3 링커에 혼성화시키는 것; (iii) 제4 인덱스에 혼성화될 수 있는 영역을 통해 제2 어댑터에 제3 폴리뉴클레오티드를 혼성화시키는 것; 및 (iv) 제3 폴리뉴클레오티드에 2차 인덱싱된 폴리뉴클레오티드를 결찰시켜, 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다.Some embodiments also include (i) obtaining a second adapter comprising a region hybridizable to a third linker and a region hybridizable to a fourth linker; (ii) hybridizing the second adapter to the third linker; (iii) hybridizing the third polynucleotide to the second adapter through a region hybridizable to the fourth index; and (iv) ligating the secondary indexed polynucleotide to a third polynucleotide to obtain a tertiary indexed polynucleotide.
일부 실시형태에서, 제3 링커 및/또는 제4 링커는 9개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제3 링커 및/또는 제4 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다.In some embodiments, the third linker and/or fourth linker is less than 9 consecutive nucleotides in length. In some embodiments, the third linker and/or fourth linker is less than 5 consecutive nucleotides in length.
일부 실시형태에서, 제3 링커 및/또는 제4 링커는 개질되어, 제2 어댑터와 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 Tm을 갖는다.In some embodiments, the third linker and/or fourth linker are modified to have an increased Tm relative to an oligonucleotide of the same length as the second adapter.
일부 실시형태에서, 제3 링커 및/또는 제4 링커는 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 G/C 함량을 포함하거나, 개질된 뉴클레오티드를 포함한다.In some embodiments, the third linker and/or fourth linker comprises increased G/C content compared to an oligonucleotide of the same length or comprises modified nucleotides.
일부 실시형태는 또한 3차 인덱싱된 폴리뉴클레오티드로부터 제2 어댑터를 제거하는 것을 포함한다.Some embodiments also include removing the second adapter from the tertiary indexed polynucleotide.
일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다.In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion.
일부 실시형태에서, (a)는 하기를 포함한다: (i) 제1 폴리뉴클레오티드를 복수의 비이드의 제1 하위집단에 부착하여, 인덱싱된 비이드의 제1 하위집단을 수득하는 것, 여기서 제1 폴리뉴클레오티드는 비이드의 제1 하위집단 각각에 대해 상이한 제1 인덱스를 포함함; 및 (ii) 인덱싱된 비이드의 제1 하위집단을 조합하여 1차 인덱싱된 비이드의 집단을 수득하는 것.In some embodiments, (a) comprises: (i) attaching a first polynucleotide to a first subpopulation of a plurality of beads to obtain a first subpopulation of indexed beads, wherein the first polynucleotide comprises a different first index for each first subpopulation of beads; and (ii) combining the first subpopulation of indexed beads to obtain a primary population of indexed beads.
일부 실시형태에서, 제1 폴리뉴클레오티드는 제1 결합 파트너 및 제2 결합 파트너를 통해 비이드에 부착된다. 일부 실시형태에서, 제1 결합 파트너 또는 제2 결합 파트너는 비오틴, 스트렙타비딘, 비오틴 유도체, 스트렙타비딘 유도체, 항체, 및 항체의 항원 결합 단편으로 이루어지는 군으로부터 선택된다.In some embodiments, the first polynucleotide is attached to the bead through a first binding partner and a second binding partner. In some embodiments, the first or second binding partner is selected from the group consisting of biotin, streptavidin, biotin derivatives, streptavidin derivatives, antibodies, and antigen-binding fragments of antibodies.
일부 실시형태는 또한 (d) 및 (e)를 반복하고, 추가적 인덱스를 비이드의 인덱싱된 하위집단에 첨가한다.Some embodiments also repeat (d) and (e) and add additional indices to the indexed subpopulation of beads.
일부 실시형태에서, 제1 폴리뉴클레오티드는 P5 서열, P5' 서열, P7 서열, 및 P7' 서열로 이루어지는 군으로부터 선택되는 프라이머(primer) 결합 부위를 포함한다.In some embodiments, the first polynucleotide comprises a primer binding site selected from the group consisting of a P5 sequence, a P5' sequence, a P7 sequence, and a P7' sequence.
일부 실시형태에서, 제1 인덱스, 제2 인덱스, 및/또는 제3 인덱스는 20개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제1 인덱스, 제2 인덱스, 및/또는 제3 인덱스는 10개 미만의 연속적 뉴클레오티드의 길이를 갖는다.In some embodiments, the first index, second index, and/or third index are less than 20 contiguous nucleotides in length. In some embodiments, the first index, second index, and/or third index are less than 10 consecutive nucleotides in length.
일부 실시형태에서, (b)는 1차 인덱싱된 비이드의 집단을 복수의 컴파트먼트(compartment)로 무작위로 분배(distributing)하는 것을 포함한다.In some embodiments, (b) includes randomly distributing the population of primary indexed beads into a plurality of compartments.
일부 실시형태에서, (d)는 2차 인덱싱된 비이드의 집단을 복수의 컴파트먼트로 무작위로 분배하는 것을 포함한다.In some embodiments, (d) includes randomly distributing the population of secondary indexed beads into a plurality of compartments.
일부 실시형태에서, 복수의 컴파트먼트는 웰, 채널 또는 액적으로부터 선택되는 컴파트먼트를 포함한다.In some embodiments, the plurality of compartments includes compartments selected from wells, channels, or droplets.
일부 실시형태에서, 복수의 조합 인덱싱된 비이드는 자성 비이드를 포함한다.In some embodiments, the plurality of combined indexed beads include magnetic beads.
일부 실시형태는 또한 어레이 상에서 복수의 조합 인덱싱된 비이드를 분배한다. 일부 실시형태는 또한 어레이 상에서 조합 인덱싱된 비이드를 서열분석한다.Some embodiments also distribute multiple combinatorial indexed beads on an array. Some embodiments also sequence combinatorially indexed beads on an array.
일부 실시형태는 또한 조합 인덱스(combinatorial index)를 기반으로 어레이 상에서 복수의 조합 인덱싱된 비이드의 비이드 위치를 디코딩(decoding)한다.Some embodiments also decode bead positions of a plurality of combinatorial indexed beads on an array based on a combinatorial index.
일부 실시형태에서, 복수의 조합 인덱싱된 비이드의 비이드 각각은 포획 프로브(capture probe)를 포함한다. 일부 실시형태에서, 제1 폴리뉴클레오티드, 제2 폴리뉴클레오티드 또는 제3 폴리뉴클레오티드는 포획 프로브를 포함한다. 일부 실시형태는 또한 복수의 표적 핵산을 포획 프로브에 혼성화시킨다. 일부 실시형태는 또한 포획 프로브를 연장시킨다.In some embodiments, each bead of the plurality of combinatorial indexed beads includes a capture probe. In some embodiments, the first polynucleotide, second polynucleotide, or third polynucleotide comprises a capture probe. Some embodiments also hybridize a plurality of target nucleic acids to a capture probe. Some embodiments also extend the capture probe.
도 1은 풀(pool) 및 분할 전략을 포함하는 조합 인덱싱의 예시적 실시형태를 도시한다.
도 2는 링커-스플린트와의 순차적 스플린트 결찰 반응(sequential splinted ligation reaction)에 의해 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)를 결합시키는 도식의 실시형태를 도시한다.
도 3은 클릭 화학 결찰에 의해 기질에 부착된 제1 인덱스(인덱스 A)에 제2 인덱스(인덱스 B)를 결합시키는 도식의 실시형태를 도시한다.
도 4는 순차적 폴리머라아제 연장 반응에 의해 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)를 첨가하는 도식의 실시형태를 도시한다.
도 5는 이중-가닥 영역 및 단일-가닥 오버행을 포함하는 어댑터를 사용하여 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)에 첨가하는 도식의 실시형태를 도시한다.
도 6은 짧은 링커-스플린트와의 순차적 스플린트 결찰 반응에 의해 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)에 첨가하는 도식의 실시형태를 도시한다.
도 7a는 폴리머라아제 연장을 위한 연장 주형(Link 1a'-인덱스 B'-Hyb')과 혼성화된 포획 올리고뉴클레오티드(P5-인덱스 A-Link 1a)를 갖는 비이드, 및 포획 올리고뉴클레오티드의 양을 측정하는 데 유용한 프라이머의 위치; 및 연장 생성물을 갖는 비이드, 및 전장 연장 생성물의 양을 측정하는 데 유용한 프라이머의 위치를 포함하는 도식을 도시한다.
도 7b는 다양한 조건 하의 포획 올리고뉴클레오티드의 결찰 연장 또는 포획 올리고뉴클레오티드의 폴리머라아제 연장으로부터의 전장 생성물 및 포획 올리고뉴클레오티드의 양에 관한 그래프를 도시한다.
도 8a는 폴리머라아제 연장 또는 결찰에 의한 포획 올리고뉴클레오티드의 연장을 포함하는 3-레벨 인덱싱 방법에서 시험된 단계 및 조건을 개괄하는 도식이다. 넘버링은 시험된 조건에 해당한다.
도 8b는 스플린트 결찰(SL) 및 폴리머라아제 연장(PE)을 비교하기 위한 다양한 실험 조건을 요약하는 표이고, 레벨 1 인덱싱(L1), 및 레벨 2 인덱싱(L2), 및 레벨 3 인덱싱(L3)에 관하여 도 8a에서 넘버링된 다양한 조건(cond)을 포함한다.
도 9는 다양한 조건 하에 포획 올리고뉴클레오티드(CO), 제2 레벨 연장 생성물, 및 제3 레벨 연장 생성물의 양을 나타내는 그래프이다.
도 10은 정량적 PCR에 의해 측정된, 비오틴 또는 이중 데스티오비오틴(dd비오틴)을 통해 비이드에 부착되고 다양한 변성 조건 하에 처리된 제1-연장 생성물을 갖는 포획 올리고뉴클레오티드의 농도의 그래프이다.
도 11a는 3-레벨 인덱싱 생성물을 포함하는 비이드 상의 합성 생성물, 합성 생성물로부터 유래된 PCR 생성물, 및 PCR 생성물로부터 유래된 서열분석 리드(read)에 관한 서열분석 리드 방향을 나타내는 도식이다.
도 11b는 완전히 정확하거나 두 인덱스 모두가 폴리머라아제 연장 또는 스플린트 결찰에 의해 생성된 연장 생성물에 유용한 서열을 포함하는 서열분석 리드의 백분율을 나타내는 그래프이다. 사용가능한 인덱스는, 인덱스 오류 수정 구현에 의해 수정된 디코딩될 수 있는 것을 포함하고, 3개의 뉴클레오티드 해밍 거리(Hamming distance)로 설계된 인덱스 내에 하나 이하의 'SNP'를 포함하고, 전체 '인덱스' 영역에 걸쳐 인델(indel)이 없고, 예를 들어 3-레벨 인덱스 올리고뉴클레오티드에서, 인덱스 영역은 3개의 인덱스를 포함한다.
도 11c는 완전히 정확하거나 인덱스 둘 모두가 폴리머라아제 연장 또는 스플린트 결찰에 의해 생성된 연장 생성물에 유용한 서열을 포함하는 서열분석 리드에 관한, 오류가 결실, 삽입 또는 염기 변화(SNP)인지 여부를 포함하는 염기당 오류율을 나타내는 그래프이다. 사용가능한 인덱스는, 인덱스 오류 수정 구현에 의해 수정된 디코딩될 수 있는 것을 포함하고, 3개의 뉴클레오티드 해밍 거리로 설계된 인덱스 내에 하나 이하의 'SNP'를 포함하고, 전체 '인덱스' 영역에 걸쳐 인델이 없고, 예를 들어 3-레벨 인덱스 올리고뉴클레오티드에서, 인덱스 영역은 3개의 인덱스를 포함한다.
도 12a는 표준 스플린트 결찰 방법(좌측 패널) 및 이중-가닥 스플린트 결찰 반응(우측 패널)에서 단계를 나타내는 도식이다. 일부 실시형태에서, 이중-가닥 스플린트 결찰 방법은 추가적 올리고뉴클레오티드(인덱스1')를 포함할 수 있다.
도 12b는 표준 스플린트 결찰 및 이중-가닥 스플린트 결찰 방법의 단계에서 시험된 조건을 나타내는 도식이다.
도 12c는 표준 결찰 또는 이중-가닥 결찰로부터의 연장 생성물을 측정하기 위한 정방향 또는 역방향 프라이머에 대한 위치를 나타내는 도식이다.
도 13a는 정량적 PCR에 의해 측정된, 연장 생성물의 농도를 나타내는 그래프이다. 포획 올리고뉴클레오티드는 F2 및 R1 프라이머를 사용하여 측정되었고, 전장 생성물은 도 12c에 도시된 F2 및 R2 또는 F3 및 R2 프라이머를 사용하여 측정되었다.
도 13b는 전장 대조군으로 정규화된 연장 생성물의 상대적 농도를 나타내는 그래프이다.
도 13c는 포획 올리고뉴클레오티드 농도로 정규화된 연장 생성물의 상대적 농도를 나타내는 그래프이다.
도 13d는 다양한 양의 이중-가닥 스플린트 oligo의 존재 하에 생성된 연장 생성물의 농도를 나타내는 그래프이다.
도 13e는 도 12a에 나타낸 바와 같은, 인덱스1에 상보적인 추가적 올리고뉴클레오티드의 존재 하에 생성된 연장 생성물의 농도를 나타내는 그래프이다.
도 13f는 비연장성 3'ddC 말단을 갖는 올리고뉴클레오티드의 존재 하에 생성된 연장 생성물의 농도를 나타내는 그래프이다.
도 13g는 실온 또는 75℃에서 사전-결찰 단계로 생성된 연장 생성물의 농도를 나타내는 그래프이다.
도 14a는 완전히 정확하거나 두 인덱스 모두가 스플린트 결찰 연장 또는 이중-가닥 스플린트 결찰에 의해 생성된 연장 생성물에 유용한 서열을 포함하는 서열분석 리드의 백분율을 나타내는 그래프이다. 사용가능한 인덱스는, 인덱스 오류 수정 구현으로 수정된 디코딩될 수 있는 것을 포함하고, 3개의 뉴클레오티드 해밍 거리로 설계된 인덱스 내의 하나 이하의 'SNP'를 포함하고, 전체 '인덱스' 영역에 걸쳐 인델이 없고 예를 들어 3-레벨 인덱스 올리고뉴클레오티드에서, 인덱스 영역은 3개의 인덱스를 포함한다.
도 14b는 스플린트 결찰 연장 또는 이중-가닥 스플린트 결찰에 의해 생성된 연장 생성물에 대한 서열분석 리드에 관한, 오류가 삭제, 삽입 또는 염기 변화(SNP)인지 여부를 포함하는 염기당 오류율을 나타내는 그래프이다.
도 15a는 표준 스플린트 결찰 방법(좌측 패널) 및 이중-가닥 스플린트 결찰 방법(우측 패널)에 관한 3-레벨 인덱싱에서의 단계를 나타내는 도식이다.
도 15b는 표준 스플린트 결찰 또는 이중-가닥 스플린트 결찰을 사용한 3-레벨 인덱싱 방법의 단계에서 시험된 조건을 나타내는 도식이다.
도 16a는 정량적 PCR에 의해 측정된, 포획 올리고뉴클레오티드, 제2-레벨 생성물, 및 제3 레벨 생성물에 관한 연장 생성물의 농도를 나타내는 그래프이다.
도 16b는 완전히 정확하거나 모든 3개의 인덱스가 스플린트 결찰 연장 또는 이중-가닥 스플린트 결찰에 의해 생성된 연장 생성물에 유용한 서열을 포함하는 서열분석 리드의 백분율을 나타내는 그래프이다. 사용가능한 인덱스는, 인덱스 오류 수정 구현에 의해 수정된 디코딩될 수 있는 것을 포함하고, 3개의 뉴클레오티드 해밍 거리로 설계된 인덱스 내에 하나 이하의 'SNP'를 포함하고, 전체 '인덱스' 영역에 걸쳐 인델이 없고, 예를 들어 3-레벨 인덱스 올리고뉴클레오티드에서, 인덱스 영역은 3개의 인덱스를 포함한다.
도 16c는 스플린트 결찰 연장 또는 이중-가닥 스플린트 결찰에 의해 생성된 연장 생성물에 대한 서열분석 리드에 관한, 오류가 삭제, 삽입 또는 염기 변화(SNP)인지 여부를 포함하는 염기당 오류율을 나타내는 그래프이다.
도 17은 표준 스플린트 결찰에 의해, 또는 짧아진 스플린트를 사용한 스플린트 결찰에 의한 포획 올리고뉴클레오티드의 연장을 나타내는 도식이다(상부 패널). 하부 패널은 연장 생성물을 측정하기 위한 프라이머의 위치를 도시한다.
도 18a는 다양한 스플린트 올리고뉴클레오티드를 나타내는 도식이다. 도 18a에 도시된 서열은 서열 번호:07-16을 포함한다.
도 18b는 레벨 1 인덱스를 갖는 포획 올리고뉴클레오티드(L1 oligo), 스플린트 올리고뉴클레오티드(스플린트), 및 레벨 2 올리고뉴클레오티드(L2 oligo)를 포함하는 다양한 실험 조건을 나타내는 표이다.
도 18c는 다양한 스플린트 올리고뉴클레오티드를 사용한 스플린트 결찰 연장에 의해 생성된 연장 생성물에 관한 대조군 전장 연장 생성물에 대한 전장 연장 생성물의 그래프이다.
도 19a는 링커 서열 "KS-3'" 및 "MS-3'"을 포함하는 이중-가닥 스플린트 결찰을 포함하는 조합 인덱싱 방법에 관한 도식이다.
도 19b는 이중-가닥 스플린트 결찰을 포함하는 조합 인덱싱 방법에 관한 예시적 작업흐름의 개괄에 관한 도식이다.1 shows an example embodiment of combination indexing including pool and split strategies.
Figure 2 shows a linker-splint linking a first index (Index A), a second index (Index B), and a third index (Index C) attached to a substrate by a sequential splinted ligation reaction. A schematic embodiment is shown.
Figure 3 shows an embodiment of a schematic linking a second index (Index B) to a first index (Index A) attached to a substrate by click chemical ligation.
Figure 4 shows an embodiment of the scheme for adding a first index (Index A), a second index (Index B) and a third index (Index C) attached to a substrate by sequential polymerase extension reactions.
Figure 5 is a schematic of adding a first index (Index A), a second index (Index B), and a third index (Index C) attached to a substrate using an adapter comprising a double-stranded region and a single-stranded overhang. An embodiment of is shown.
Figure 6 shows a schematic embodiment of the addition of a first index (Index A), a second index (Index B), and a third index (Index C) attached to a substrate by sequential splint ligation reactions with short linker-splints. It shows.
Figure 7A shows beads with a capture oligonucleotide (P5-index A-Link 1a) hybridized with an extension template for polymerase extension (
Figure 7B shows a graph of the amount of capture oligonucleotide and full-length product from ligation extension of a capture oligonucleotide or polymerase extension of a capture oligonucleotide under various conditions.
Figure 8A is a schematic outlining the steps and conditions tested in the 3-level indexing method involving extension of capture oligonucleotides by polymerase extension or ligation. Numbering corresponds to the conditions tested.
Figure 8B is a table summarizing various experimental conditions for comparing splint ligation (SL) and polymerase extension (PE),
Figure 9 is a graph showing the amount of capture oligonucleotide (CO), second level extension product, and third level extension product under various conditions.
Figure 10 is a graph of the concentration of capture oligonucleotides with first-extension products attached to beads via biotin or dual desthiobiotin (ddbiotin) and processed under various denaturing conditions, as measured by quantitative PCR.
Figure 11A is a schematic showing sequencing read orientation relative to the synthesis product, PCR product derived from the synthesis product, and sequencing reads derived from the PCR product on beads containing a 3-level indexing product.
Figure 11B is a graph showing the percentage of sequencing reads that are either completely correct or contain useful sequences for extension products produced by polymerase extension or splint ligation for both indices. Available indices include those that can be decoded corrected by an index error correction implementation, contain no more than one 'SNP' within the index designed with a Hamming distance of 3 nucleotides, and contain no more than one 'SNP' in the entire 'index' region. There are no indels throughout, for example in a 3-level index oligonucleotide, the index region contains three indices.
Figure 11C relates sequencing reads that are completely correct or both index contain sequences useful for extension products produced by polymerase extension or splint ligation, including whether the errors are deletions, insertions, or base changes (SNPs). This is a graph showing the error rate per base. Available indices include those that can be decoded corrected by an index error correction implementation, contain no more than one 'SNP' within the index designed with a Hamming distance of 3 nucleotides, and have no indels across the entire 'index' region. , for example in a 3-level index oligonucleotide, the index region contains three indices.
Figure 12A is a schematic showing the steps in a standard splint ligation method (left panel) and a double-strand splint ligation reaction (right panel). In some embodiments, the double-strand splint ligation method may include an additional oligonucleotide (Index1').
Figure 12B is a schematic showing the conditions tested in the steps of the standard splint ligation and double-strand splint ligation methods.
Figure 12C is a schematic showing positions for forward or reverse primers for measuring extension products from standard ligation or double-strand ligation.
Figure 13A is a graph showing the concentration of extension product, as measured by quantitative PCR. Capture oligonucleotides were determined using F2 and R1 primers, and full-length products were determined using F2 and R2 or F3 and R2 primers shown in Figure 12C.
Figure 13B is a graph showing relative concentrations of extension products normalized to full length control.
Figure 13C is a graph showing the relative concentration of extension product normalized to capture oligonucleotide concentration.
Figure 13D is a graph showing the concentration of extension products produced in the presence of various amounts of double-stranded splint oligo.
Figure 13E is a graph showing the concentration of extension products produced in the presence of additional oligonucleotides complementary to
Figure 13F is a graph showing the concentration of extension products produced in the presence of oligonucleotides with non-extendable 3'ddC termini.
Figure 13G is a graph showing the concentration of extension product produced by the pre-ligation step at room temperature or 75°C.
Figure 14A is a graph showing the percentage of sequencing reads that are either completely correct or contain sequences for which both indices are useful for the extension product generated by splint ligation extension or double-strand splint ligation. Available indices include those that can be decoded corrected by an index error correction implementation, contain no more than one 'SNP' within the index designed with a Hamming distance of 3 nucleotides, have no indels across the entire 'index' region, and yes For example, in a 3-level index oligonucleotide, the index region contains three indices.
Figure 14B is a graph showing the error rate per base for sequencing reads for extension products generated by splint ligation extension or double-strand splint ligation, including whether the errors were deletions, insertions, or base changes (SNPs).
Figure 15A is a schematic showing the steps in 3-level indexing for the standard splint ligation method (left panel) and the double-strand splint ligation method (right panel).
Figure 15B is a schematic showing the conditions tested in the steps of the 3-level indexing method using standard splint ligation or double-strand splint ligation.
Figure 16A is a graph showing the concentration of extension product relative to capture oligonucleotide, second-level product, and third-level product, as measured by quantitative PCR.
Figure 16B is a graph showing the percentage of sequencing reads that are completely correct or for which all three indices contain sequences useful for splint ligation extension or extension products generated by double-strand splint ligation. Available indices include those that can be decoded corrected by an index error correction implementation, contain no more than one 'SNP' within the index designed with a Hamming distance of 3 nucleotides, and have no indels across the entire 'index' region. , for example in a 3-level index oligonucleotide, the index region contains three indices.
Figure 16C is a graph showing the error rate per base for sequencing reads for extension products generated by splint ligation extension or double-strand splint ligation, including whether the errors were deletions, insertions, or base changes (SNPs).
Figure 17 is a schematic showing extension of capture oligonucleotides by standard splint ligation or by splint ligation using shortened splints (upper panel). The lower panel shows the positions of primers for measuring extension products.
Figure 18A is a schematic representing various splint oligonucleotides. The sequence shown in Figure 18A includes SEQ ID NOs: 07-16.
Figure 18B is a table showing various experimental conditions including capture oligonucleotides with
Figure 18C is a graph of the full-length extension product relative to the control full-length extension product relative to the extension product generated by splint ligation extension using various splint oligonucleotides.
Figure 19A is a schematic of a combinatorial indexing method involving double-stranded splint ligation comprising linker sequences "KS-3'" and "MS-3'".
Figure 19B is a schematic outlining an example workflow for a combinatorial indexing method involving double-strand splint ligation.
일부 실시형태는 조합 인덱싱된 비이드의 제조를 위한 방법 및 조성물에 관한 것이다. 일부 실시형태는 비이드에 부착된 폴리뉴클레오티드에 대한 상이한 인덱스의 순차적 부가를 포함한다. 일부 실시형태에서, 인덱스는 화학 결찰, 폴리머라아제 연장, 부분적 이중-가닥 어댑터의 결찰, 또는 짧은 스플린트 결찰에 의해 첨가된다.Some embodiments relate to methods and compositions for making combinatorial indexed beads. Some embodiments involve sequential addition of different indices to polynucleotides attached to beads. In some embodiments, the index is added by chemical ligation, polymerase extension, ligation of partial double-strand adapters, or short splint ligation.
각각의 비이드가 단일 올리고뉴클레오티드 서열로 균일하게 코팅되는 비이드-연결된 올리고뉴클레오티드의 풀은, 합성 긴 리드 서열분석과 같은 서열분석 방법의 구성성분이다. 상기 비이드 풀의 조합 조립은 충분한 인덱스 다양성을 달성하는 데 사용될 수 있지만; 일부 방법은 인덱스의 연속적 레벨을 결합하기 위해 스플린트 결찰 전략에 의존한다. 스플린트 결찰은 비이드 코드에 불변(invariant) 염기를 도입하고 완전한 비이드 코드를 리드하는 데 필요한 합성에 의한 서열분석(SBS) 사이클의 수를 증가시키는 단점을 갖는다. 본원에 제공된 특정 실시형태는, 비이드 코드의 불변 염기의 수를 감소시키고, 비이드-코드 정보 밀도를 증가시키고, 더 효율적인 비이드 코드 서열분석을 허용하는 표준 스플린트 결찰 비이드 코드 합성 전략에 대한 여러 대안을 포함한다.Pools of bead-linked oligonucleotides, in which each bead is uniformly coated with a single oligonucleotide sequence, are a component of sequencing methods, such as synthetic long read sequencing. Combinatorial assembly of the above bead pools can be used to achieve sufficient index diversity; Some methods rely on a splint ligation strategy to join successive levels of the index. Splint ligation has the disadvantage of introducing invariant bases into the bead code and increasing the number of sequencing by synthesis (SBS) cycles required to read the complete bead code. Certain embodiments provided herein describe standard splint ligation bead code synthesis strategies that reduce the number of constant bases in the bead code, increase bead-code information density, and allow for more efficient bead code sequencing. Includes several alternatives.
비이드-연결 올리고뉴클레오티드의 조합 조립은 다수의 고유 인덱스를 함유하는 비이드 풀의 생성을 허용하고, 여기서 각각의 비이드는 단일, 고유한 인덱스 올리고뉴클레오티드로 균일하게 코팅된다. 표면-부착된 스트렙타비딘과 같은 올리고뉴클레오티드 포획을 위해 유래된 자성 비이드의 공동 풀로 시작하여, 비이드는 다중웰 플레이트의 'M'개의 웰에 분취되고, 각각의 웰은 비오틴과 같은 비이드-포획 모이어티로 합성된 단일 올리고뉴클레오티드 서열을 함유한다. 결합 이후, 비이드는 또다시 풀링되고, 혼합되고, 다중웰 플레이트의 'N'개의 웰로 분할되어, 제2-레벨 인덱스를 부착한다. 제2 인덱스 반응의 각각의 웰은 제1-레벨 올리고뉴클레오티드의 균일한 혼합물을 함유하여, 고유 인덱스의 총 수는 제2 인덱스가 부착된 이후 'M' x 'N'이 된다. 이러한 방법을 다수 회 반복하는 것은, 표준 다중웰 플레이트, 예컨대 96- 192- 또는 384-웰 플레이트에 쉽게 피팅될 수 있는 개별 인덱스 올리고뉴클레오티드의 작은 세트로부터 수 백만개의 고유한 인덱스를 갖는 비이드 풀을 수득할 수 있다. 풀 및 분할 전략을 포함하여 조합 인덱싱의 예시적 실시형태는 도 1에 도시된다.Combinatorial assembly of bead-linked oligonucleotides allows for the creation of a pool of beads containing multiple unique indices, where each bead is uniformly coated with a single, unique index oligonucleotide. Starting with a common pool of magnetic beads derived for capture of surface-attached oligonucleotides such as streptavidin, the beads are aliquoted into 'M' wells of a multiwell plate, each well containing a bead such as biotin. -Contains a single oligonucleotide sequence synthesized with a capture moiety. After binding, the beads are pooled again, mixed and split into 'N' wells of a multiwell plate to attach a second-level index. Each well of the second index reaction contains a homogeneous mixture of first-level oligonucleotides, so that the total number of unique indices is 'M' x 'N' after the second index is attached. Repeating this method multiple times generates a pool of beads with millions of unique indices from a small set of individual index oligonucleotides that can be easily fitted into standard multiwell plates, such as 96-, 192- or 384-well plates. It can be obtained. An example embodiment of combination indexing, including pool and split strategies, is shown in Figure 1.
직접 포획된 제1 레벨을 넘어서는 인덱스의 경우, 방법은 비이드-결합 인덱스에 단일-가닥 인덱스 올리고뉴클레오티드를 공유결합 부착하는 것을 필요로 한다. 이는 긴 스플린트 결찰 접근을 사용하여 수행될 수 있다(도 2). 직접 포획된 제1-레벨 올리고뉴클레오티드는 이의 3' 말단에 8개의 뉴클레오티드 포획 서열(L1A) 을 갖도록 설계되고, 들어오는 인덱스 올리고뉴클레오티드는 이의 5' 말단 상에 제2 8개의 뉴클레오티드 포획 서열(L1B), 뿐만 아니라 5' 말단 상에 포스페이트를 갖는다. 일부 실시형태에서, LIA 및/또는 LIB는 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 이상의 뉴클레오티드의 길이를 가질 수 있다. 이러한 2개의 조각은 이후 3' 말단에 L1A 및 5' 말단에 L1B에 상보적인 16개의 뉴클레오티드 스플린트 올리고뉴클레오티드와의 결찰 반응에서 조립되고; 결합된 스플린트는 비이드-결합된 포획 올리고뉴클레오티드 및 용액중 인덱스 올리고뉴클레오티드 둘 모두와 혼성화되어 두 조각의 3' 및 5' 말단을 서로 직접 인접하게 만든다. 반응에서 리가아제 효소는 이후 포획 oligo의 3' 말단에 대해 인덱스 올리고뉴클레오티드의 인산화된 5' 말단을 공유결합적으로 연결한다. 표 1은 특정 방법에서 12-, 96-, 192-, 또는 384- 및 768- 다중웰 플레이트를 사용하여 수득될 수 있는 고유한 비이드 코드의 수를 열거한다. 일부 상기 방법은 하기를 포함한다: (a) 제1 다중웰 플레이트의 웰에 비이드를 분배하고, 각각의 웰은 상이한 인덱스 A를 함유하고; 인덱스 A를 비이드에 부착하고; 비이드를 풀링하는 것; (b) 제2 다중웰 플레이트의 웰에 비이드를 재분배하고, 각각의 웰은 상이한 인덱스 B를 함유하고, 인덱스 B를 비이드에 부착하는 것; (c) 제3 다중웰 플레이트의 웰에 비이드를 재분배하고, 각각의 웰은 상이한 인덱스 C를 함유하고, 인덱스 C를 비이드에 부착하는 것.For indices beyond the first level of direct capture, the method requires covalently attaching a single-stranded index oligonucleotide to the bead-bound index. This can be performed using a long splint ligation approach (Figure 2). The direct captured first-level oligonucleotide is designed to have an 8 nucleotide capture sequence (L1A) on its 3' end, the incoming index oligonucleotide has a second 8 nucleotide capture sequence (L1B) on its 5' end, It also has a phosphate on the 5' end. In some embodiments, LIA and/or LIB are 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, or 20 or more nucleotides in length. You can have These two fragments are then assembled in a ligation reaction with a 16 nucleotide splinted oligonucleotide complementary to L1A at the 3' end and L1B at the 5' end; The bound splint hybridizes with both the bead-bound capture oligonucleotide and the index oligonucleotide in solution, bringing the 3' and 5' ends of the two fragments directly adjacent to each other. In the reaction, the ligase enzyme then covalently links the phosphorylated 5' end of the index oligonucleotide to the 3' end of the capture oligo. Table 1 lists the number of unique bead codes that can be obtained using 12-, 96-, 192-, or 384-, and 768-multiwell plates in a particular method. Some of the above methods include: (a) dispensing beads into wells of a first multiwell plate, each well containing a different index A; Attach index A to the bead; pulling beads; (b) redistributing the beads into the wells of a second multiwell plate, each well containing a different index B, and attaching the index B to the beads; (c) Redistributing the beads to the wells of a third multiwell plate, each well containing a different index C, and attaching the index C to the beads.
[표 1][Table 1]
스플린트 결찰 접근은 비이드 코드에서 인덱스의 레벨 각각에 대해 가변 인덱스 영역 사이에 16개의 뉴클레오티드 불변 스플린트 서열을 필요로 한다. 비이드 코드는 전형적으로 단일 리드로 서열분석되므로, 이러한 불변 영역은 SBS 동안 '암흑(dark)' 주기와 같이 화학-단독(chemistry-only)으로 리드되어야 한다. 예를 들어, 불변 영역에서 각각의 염기는 정확한 페이징(phasing)을 유지하기 위하여 추가적 SBS 주기를 필요로 한다. 이는 전형적으로 중합 화학 단계가 이미지화 단계 없이 사용되는 '화학-단독' 또는 '암흑' SBS 주기이다. 8개의 뉴클레오티드 개별적 하위-인덱스를 갖는 3개의 레벨 인덱스의 경우, 이는 적어도 32개의 총 암흑 주기가 정보적 인덱스 서열의 단지 24개의 뉴클레오티드를 서열분석하는 데 요구된다는 것을 의미한다. 이러한 다수의 주기는, 인덱스 서열 및 임의의 후속 삽입 서열 리드 둘 모두에 대하여, 감소된 리드 품질을 야기하는 것으로 관찰되었다.The splint ligation approach requires a 16 nucleotide constant splint sequence between the variable index regions for each level of index in the bead code. Since the bead code is typically sequenced as a single read, these constant regions must be read as chemistry-only, such as the 'dark' cycle during SBS. For example, each base in the constant region requires an additional SBS cycle to maintain correct phasing. This is typically a 'chemistry-only' or 'dark' SBS cycle in which the polymerization chemistry step is used without an imaging step. For a three level index with eight nucleotide individual sub-indexes, this means that at least 32 total dark cycles are required to sequence just 24 nucleotides of the informative index sequence. These multiple cycles were observed to result in reduced read quality, for both the index sequence and any subsequent insertion sequence reads.
본원에 제공된 특정 실시형태는 다수의 불변 염기를 감소시키고 결과적으로 비이드 코드를 리드하는 데 요구되는 화학-단독 SBS 주기를 감소시키기 위해 긴 스플린트 결찰 전략 이외에 비이드 코드 합성 전략을 포함한다. 일부 상기 실시형태는 아자이드-알킨 클릭 화학을 사용한 화학 결찰에 의한 비이드 코드 합성; 주형 폴리머라아제 연장에 의한 비이드 코드 합성; 이중-가닥 단편의 효소적 결찰에 의한 비이드 코드 합성; 및 비표준 뉴클레오티드를 함유하는 짧은 스플린트를 사용한 스플린트 결찰에 의한 비이드 코드 합성을 포함한다.Certain embodiments provided herein include bead code synthesis strategies in addition to long splint ligation strategies to reduce the number of constant bases and consequently the chemical-only SBS cycle required to lead the bead code. Some of the above embodiments include bead cord synthesis by chemical ligation using azide-alkyne click chemistry; Bead code synthesis by template polymerase extension; Bead code synthesis by enzymatic ligation of double-stranded fragments; and bead code synthesis by splint ligation using short splints containing non-standard nucleotides.
본원에 제공된 일부 실시형태는 어레이 상에서의 고처리량 유전자형 분석(high-throughput genotyping)에 관한 것이다. 일부 실시형태는 어레이에서 미세특징부(microfeature)의 위치를 디코딩하는 것에 관한 것이다. 일부 실시형태에서, 미세특징부는 바코드 및 인덱스를 갖는 폴리뉴클레오티드를 포함한다. 일부 실시형태는 바코드 및 인덱스를 서열분석하여 어레이에서 폴리뉴클레오티드의 위치를 식별하는 것을 포함한다. 본원에 개시된 방법 및 조성물과 유용할 수 있는 특정 양태는 본원에서 그 전체가 참조 인용되는 국제공개 WO 2020/086746호에 개시된다.Some embodiments provided herein relate to high-throughput genotyping on arrays. Some embodiments relate to decoding the location of microfeatures in an array. In some embodiments, microfeatures include polynucleotides with barcodes and indices. Some embodiments include sequencing barcodes and indices to identify the location of the polynucleotide in the array. The methods and compositions disclosed herein and certain embodiments that may be useful are disclosed in International Publication No. WO 2020/086746, which is incorporated herein by reference in its entirety.
혼성화에 의한 디코딩은, 포획 프로브의 무작위로 분배된 어레이에서 포획 프로브의 위치를 식별하는 것을 포함한다. 방법은 전형적으로 포획 프로브의 하나 이상의 부분에 대한 라벨링된 혼성화 프로브의 혼성화, 혼성화 이벤트의 이미지화, 및 혼성화 프로브의 제거의 수 회의 연속적 사이클을 수반한다. 혼성화에 의한 디코딩은 특수 시약, 특수 유체 장치 및 특수 검출기를 필요로 한다. 일부 실시형태에서, 혼성화에 의한 디코딩은 7 내지 8회의 연속 사이클로 최대 8시간이 걸릴 수 있다.Decoding by hybridization involves identifying the location of a capture probe in a randomly distributed array of capture probes. The method typically involves several sequential cycles of hybridization of a labeled hybridization probe to one or more portions of a capture probe, imaging of the hybridization event, and removal of the hybridization probe. Decoding by hybridization requires special reagents, special fluidic devices, and special detectors. In some embodiments, decoding by hybridization can take up to 8 hours with 7 to 8 consecutive cycles.
본원에 제공된 실시형태는 프라이머 결합 부위 및 바코드를 포함하는 폴리뉴클레오티드의 무작위-분배된 어레이를 포함한다. 일부 실시형태에서, 바코드는 고처리량 서열분석 시스템을 사용하여 어레이를 디코딩하기 위해 용이하게 서열분석될 수 있다. 일부 실시형태는 추가적 시약, 혼성화 프로브, 또는 특수 디코딩 장비 없이 어레이를 디코딩하는 데 걸리는 시간을 상당히 감소시킬 수 있다.Embodiments provided herein include randomly-distributed arrays of polynucleotides comprising primer binding sites and barcodes. In some embodiments, barcodes can be easily sequenced to decode the array using high-throughput sequencing systems. Some embodiments can significantly reduce the time it takes to decode an array without the need for additional reagents, hybridization probes, or special decoding equipment.
일부 실시형태는 차세대 서열분석(NGS: next generation sequencing) 기술 및 비이드-기반 마이크로어레이의 사용을 포함한다. 일부 상기 실시형태는 고성능, 저가 및 고처리량 유전자형 분석 검정을 제공하는데, 이는 기질 및 시약에 대한 부수적 변형으로 일반적인 NGS 서열분석 플랫폼 상에서 실행될 수 있다.Some embodiments include the use of next generation sequencing (NGS) technology and bead-based microarrays. Some of the above embodiments provide high-throughput, low-cost, and high-throughput genotyping assays that can be run on common NGS sequencing platforms with minor modifications to substrates and reagents.
일부 실시형태는 유전자형 분석 검정을 수행하는 것을 포함하는데, 여기서 'S'개의 웰을 함유하는 멀티웰 플레이트에 S개의 비이드 풀이 로딩되며, 이때 각각의 비이드 풀은 고유한 샘플 인덱스를 갖고, 각각의 웰은 'N'개의 고유한 비이드 유형을 함유한다. 핵산 샘플을 무작위 프라이머 증폭 이후 효소적 단편화 및 정화(clean up)를 포함하는 단계로 처리하는 것과 같은, 샘플로부터의 핵산 라이브러리 생성 이후, 각각의 샘플 라이브러리는 인덱싱된 웰에 첨가되고 포획 프로브에 혼성화되게 한다. 혼성화가 완료된 이후, 관심대상인 SNP를 프로브하기 위한 단일 염기 연장 검정은, 형광 뉴클레오티드 및 적절한 폴리머라아제를 포함하는 혼입 믹스(incorporation mix)를 첨가함으로써 실행된다. 혼입의 종료시에, 플레이트에서 모든 비이드-포획 샘플이 풀링되고 플로우셀(flowcell)에 로딩된다. 플로우셀은 평탄(plain)하거나 패턴화될 수 있고, 표면은 원하는 밀도에서 비이드의 고정화를 지원하도록 적절하게 개질될 수 있다. 일부 실시형태에서, 비이드 고정화 시에, SNP 부위에서의 형광 혼입으로부터 유래되는 신호를 리드하기 위해 단일 스캔 사이클을 포함하는 SNP 판독이 수행된다. 이러한 사이클은 장비에서의 SBS 사이클을 포함할 수 있다. 비이드 풀 플렉시티(plexity)에 따라 12 내지 20회의 SBS 사이클을 포함하는 바코드 판독이 또한 수행되어, 플로우셀 내의 특정 비이드의 위치 및 포획 프로브를 식별한다. 일부 실시형태에서, 이러한 단계는 식별된 SNP를 지나서 추가적 서열분석의 사이클로 대체될 수 있다. 6 내지 12회의 SBS 사이클을 포함하는 샘플 인덱스 판독이 또한 수행되어, 샘플 인덱스를 리드한다. 일부 실시형태에서, 플로우셀 상에서의 검정 전체는 약 30회 미만의 SBS 사이클을 포함할 수 있고, 4시간 미만에 실행될 수 있다.Some embodiments include performing a genotyping assay, wherein a multiwell plate containing 'S' wells is loaded with S pools of beads, each pool of beads having a unique sample index, each The wells of contain 'N' unique bead types. After generating a nucleic acid library from the sample, such as subjecting the nucleic acid sample to steps including random primer amplification followed by enzymatic fragmentation and clean up, each sample library is added to an indexed well and hybridized to a capture probe. do. After hybridization is complete, a single base extension assay to probe the SNP of interest is performed by adding an incorporation mix containing fluorescent nucleotides and an appropriate polymerase. At the end of incorporation, all bead-capture samples from the plate are pooled and loaded into the flowcell. The flow cell can be plain or patterned, and the surface can be suitably modified to support immobilization of beads at the desired density. In some embodiments, upon bead immobilization, a SNP readout comprising a single scan cycle is performed to read the signal resulting from fluorescence incorporation at the SNP site. These cycles may include SBS cycles in the equipment. A barcode read comprising 12 to 20 SBS cycles depending on bead pool plexity is also performed to identify the capture probe and location of specific beads within the flowcell. In some embodiments, this step can be replaced by a cycle of additional sequencing past the identified SNPs. A sample index read comprising 6 to 12 SBS cycles is also performed to read the sample index. In some embodiments, the entire assay on the flow cell may include less than about 30 SBS cycles and may be run in less than 4 hours.
정의Justice
본원에 사용된 바와 같은, "핵산"은 당업계에서의 그의 사용과 일치하도록 의도되며, 자연 발생 고리 핵산 또는 이의 기능적 유사체를 포함한다. 특히 유용한 기능적 유사체는 서열 특이적 방식으로 핵산에 혼성화할 수 있거나 특정 뉴클레오티드 서열의 복제를 위한 주형으로 사용될 수 있다. 자연 발생 핵산은 일반적으로 포스포디에스테르 결합을 포함하는 백본을 갖는다. 유사체 구조는 당업계에 알려진 임의의 다양한 것을 포함하는 대안적 백본 연결을 가질 수 있다. 자연 발생 핵산은 일반적으로 데옥시리보오스 당(예를 들어, 데옥시리보핵산(DNA)에서 발견됨) 또는 리보오스 당(예를 들어, 리보핵산(RNA)에서 발견됨)을 갖는다. 핵산은 당업계에 알려진 이러한 당 모이어티의 다양한 유사체 중 어느 하나를 함유할 수 있다. 핵산은 천연 또는 비(非)천연 염기를 포함할 수 있다. 이와 관련하여, 천연 데옥시리보핵산은 아데닌, 티민, 시토신 또는 구아닌으로 이루어지는 군으로부터 선택되는 하나 이상의 염기를 가질 수 있고, 리보핵산은 우라실, 아데닌, 시토신 또는 구아닌으로 이루어지는 군으로부터 선택되는 하나 이상의 염기를 가질 수 있다. 핵산에 포함될 수 있는 유용한 비천연 염기는 당업계에 알려져 있다. 비천연 염기의 예는 잠금 핵산(LNA) 및 가교 핵산(BNA)을 포함한다. LNA 및 BNA 염기는 DNA 올리고뉴클레오티드에 혼입되고 올리고뉴클레오티드 혼성화 강도 및 특이성을 증가시킬 수 있다. LNA 및 BNA 염기 및 상기 염기의 용도는 당업자에게 알려져 있고, 통상적이다.As used herein, “nucleic acid” is intended to be consistent with its use in the art and includes naturally occurring cyclic nucleic acids or functional analogs thereof. Particularly useful functional analogs can hybridize to nucleic acids in a sequence-specific manner or can be used as templates for the replication of specific nucleotide sequences. Naturally occurring nucleic acids generally have backbones containing phosphodiester linkages. Analog structures may have alternative backbone linkages, including any of a variety known to those skilled in the art. Naturally occurring nucleic acids generally have either a deoxyribose sugar (e.g., found in deoxyribonucleic acid (DNA)) or a ribose sugar (e.g., found in ribonucleic acid (RNA)). The nucleic acid may contain any of a variety of analogs of these sugar moieties known in the art. Nucleic acids may contain natural or non-natural bases. In this regard, natural deoxyribonucleic acids may have one or more bases selected from the group consisting of adenine, thymine, cytosine, or guanine, and ribonucleic acids may have one or more bases selected from the group consisting of uracil, adenine, cytosine, or guanine. You can have Useful non-natural bases that can be included in nucleic acids are known in the art. Examples of non-natural bases include locked nucleic acids (LNA) and bridged nucleic acids (BNA). LNA and BNA bases can be incorporated into DNA oligonucleotides and increase oligonucleotide hybridization strength and specificity. LNA and BNA bases and their uses are known and routine to those skilled in the art.
본원에서 사용된, 용어 "뉴클레오티드 유사체"는 개질된 뉴클레오티드 염기 부분, 개질된 펜토오스 부분 및/또는 개질된 포스페이트 부분, 및 폴리뉴클레오티드의 경우, 개질된 뉴클레오티드간 연결을 갖는 합성 유사체를 나타낸다. 개질된 뉴클레오티드간 연결은 포스페이트 유사체, 아키랄 및 비하전 서브유닛간 연결을 갖는 유사체, 및 아키랄 서브유닛간 연결을 갖는 비하전 모르폴리노-기반 중합체를 포함한다. 일부 뉴클레오티드간 연결 유사체는 모르폴리데이트, 아세탈, 및 폴리아미드-연결된 헤테로사이클을 포함한다. 포스페이트 유사체의 예는, 연관된 반대이온, 예를 들어 H+, NH4+, Na+를 포함하여(상기 반대이온이 존재하는 경우), 비제한적으로 포스포로티오에이트, 포스포로디티오에이트, 포스포로셀레노에이트, 포스포로디셀레노에이트, 포스포로아닐로티오에이트, 포스포로아닐리데이트, 포스포르아미데이트, 보로노포스페이트를 포함한다. 개질된 뉴클레오티드 염기 부분의 예는 비제한적으로 5-메틸시토신(5mC); 비제한적으로 C-5 프로피닐-C 및 C-5 프로피닐-U를 포함하여, C-5-프로피닐 유사체; 2-아미노 아데닌 또는 2-아미노-dA)로 또한 알려진 2,6-디아미노푸린; 하이포잔틴, 슈도우리딘, 2-티오피리미딘, 이소시토신(이소C), 5-메틸 이소C, 및 이소구아닌(이소G)을 포함한다. 개질된 펜토오스 부분의 예는 비제한적으로 Bz-A-LNA, 5-Me-Bz-C-LNA, dmf-G-LNA, 및 T-LNA, 및 2'-또는 3'-개질을 제한 없이 포함하는 잠금 핵산(LNA) 유사체를 포함하고, 여기서 2'- 또는 3'-위치는 수소, 히드록시, 알콕시(예를 들어, 메톡시, 메톡시-에틸, --O-메틸, 에톡시, 알릴옥시, 이소프로폭시, 부톡시, 이소부톡시 및 페녹시), 아자이도, 아미노, 알킬아미노, 플루오로, 클로로, 또는 브로모를 포함한다. 다른 예는 2-아미노푸린; 5-브로모 du; 데옥시우리딘; 데옥시이노신; 히드록시메틸 dC; 5-메틸 dC; 5-니트로인돌; 5-히드록시부티닐-2'-데옥시우리딘; 및 8-아자-7-데아자구아노신을 포함한다.As used herein, the term “nucleotide analog” refers to a synthetic analog having a modified nucleotide base moiety, a modified pentose moiety and/or a modified phosphate moiety, and, in the case of a polynucleotide, modified internucleotide linkages. Modified internucleotide linkages include phosphate analogs, analogs with achiral and uncharged intersubunit linkages, and uncharged morpholino-based polymers with achiral intersubunit linkages. Some internucleotide linkage analogs include morpholidate, acetal, and polyamide-linked heterocycles. Examples of phosphate analogs include, but are not limited to, phosphorothioate, phosphorodithioate, phosphoroselenoate, including associated counterions such as H+, NH4+, Na+ (if such counterions are present). , phosphorodiselenoate, phosphoroanilothioate, phosphoroanilidate, phosphoramidate, and boronophosphate. Examples of modified nucleotide base moieties include, but are not limited to, 5-methylcytosine (5mC); C-5-propynyl analogs, including but not limited to C-5 propynyl-C and C-5 propynyl-U; 2,6-diaminopurine, also known as 2-amino adenine or 2-amino-dA); Includes hypoxanthine, pseudouridine, 2-thiopyrimidine, isocytosine (isoC), 5-methyl isoC, and isoguanine (isoG). Examples of modified pentose moieties include, but are not limited to, Bz-A-LNA, 5-Me-Bz-C-LNA, dmf-G-LNA, and T-LNA, and 2'- or 3'-modifications. Locked nucleic acid (LNA) analogs comprising: allyloxy, isopropoxy, butoxy, isobutoxy and phenoxy), azido, amino, alkylamino, fluoro, chloro, or bromo. Other examples include 2-aminopurine; 5-bromo du; deoxyuridine; deoxyinosine; hydroxymethyl dC; 5-methyl dC; 5-nitroindole; 5-hydroxybutynyl-2'-deoxyuridine; and 8-aza-7-deazaguanosine.
본원에 사용되는, "표적"은 핵산에 관하여 사용되는 경우, 본원에 제시된 방법 또는 조성물의 맥락에서 핵산에 대한 의미적 식별자로서 의도되며, 달리 명백하게 나타낸 것 이상으로 핵산의 구조 또는 기능을 반드시 제한할 필요는 없다. 표적 핵산은 본질적으로 알려진 또는 알려지지 않은 서열의 임의의 핵산일 수 있다. 이는, 예를 들어, 게놈 DNA 또는 cDNA의 단편일 수 있다. 서열분석은 표적 분자의 전체 또는 일부의 서열의 결정을 야기할 수 있다. 표적은 핵과 같은 1차 핵산 샘플 또는 무세포 샘플로부터 유래될 수 있다. 한 실시형태에서, 표적은 각각의 표적 단편의 말단에 범용 서열(universal sequence)의 배치에 의해 증폭에 적합한 주형으로 처리될 수 있다. 표적은 또한 cDNA로의 역전사에 의해 1차 RNA 샘플로부터 수득될 수 있다.As used herein, “target,” when used in reference to a nucleic acid, is intended as a semantic identifier for the nucleic acid in the context of the methods or compositions presented herein and will not necessarily limit the structure or function of the nucleic acid beyond what is otherwise explicitly indicated. There is no need. The target nucleic acid can be essentially any nucleic acid of known or unknown sequence. This may be, for example, a fragment of genomic DNA or cDNA. Sequencing can result in the determination of the sequence of all or part of a target molecule. The target may be derived from a primary nucleic acid sample, such as a nucleus, or a cell-free sample. In one embodiment, targets can be processed into templates suitable for amplification by placement of a universal sequence at the end of each target fragment. Targets can also be obtained from primary RNA samples by reverse transcription into cDNA.
본원에서 사용되는, "범용"은 뉴클레오티드 서열을 기재하는 데 사용될 때, 분자가 또한 서로 상이한 서열의 영역을 갖는 2개 이상의 핵산 분자에 통상적인 서열의 영역을 나타낸다. 분자의 집합의 상이한 구성원에 존재하는 범용 서열은, 범용 포획 핵산의 집단, 예를 들어 범용 서열의 일부, 예를 들어 범용 포획 서열에 상보적인 포획 올리고뉴클레오티드를 사용하여 다수의 상이한 핵산의 포획을 허용할 수 있다. 범용 포획 서열의 비제한적인 예는 P5 및 P7 프라이머와 동일하거나 상보적인 서열을 포함한다. 유사하게, 분자의 집합의 상이한 구성원에 존재하는 범용 서열은 범용 서열의 일부, 예를 들어 범용 앵커 서열에 상보적인 범용 프라이머의 집단을 사용하여 다수의 상이한 핵산의 증폭 또는 복제(예를 들어, 서열분석)를 허용할 수 있다. 따라서 포획 올리고뉴클레오티드 또는 범용 프라이머는 범용 서열에 특이적으로 혼성화될 수 있는 서열을 포함한다. 혼성화되는 2개의 범용 서열은 범용 결합 쌍으로서 나타내어진다. 예를 들어, 혼성화되는 포획 올리고뉴클레오티드 및 범용 포획 서열은 범용 결합 쌍이다.As used herein, “universal,” when used to describe a nucleotide sequence, refers to a region of sequence that is common to two or more nucleic acid molecules in which the molecule also has regions of sequence that are different from each other. A universal sequence present in different members of a set of molecules allows capture of a large number of different nucleic acids using a population of universal capture nucleic acids, e.g., a capture oligonucleotide complementary to a portion of the universal sequence, e.g., a universal capture sequence. can do. Non-limiting examples of universal capture sequences include sequences identical to or complementary to the P5 and P7 primers. Similarly, a universal sequence present in different members of a set of molecules can be used for the amplification or replication of a number of different nucleic acids (e.g., sequences analysis) can be permitted. Therefore, a capture oligonucleotide or universal primer contains a sequence that can specifically hybridize to a universal sequence. Two universal sequences that hybridize are represented as a universal binding pair. For example, a capture oligonucleotide and a universal capture sequence that hybridize are a universal binding pair.
본원에서 사용된, "P5" 및 "P7"은 프라이머 서열 또는 프라이머 결합 부위를 참조로 할 때 사용될 수 있다. 용어 "P5'"(P5 prime) 및 "P7'"(P7 prime)은 각각 P5 및 P7의 상보체를 나타낸다. 임의의 적합한 증폭 프라이머는 본원에 제시된 방법에 사용될 수 있고, P5 및 P7의 사용은 오로지 예시적인 실시형태라는 것이 이해될 것이다. 플로우셀 상의 P5 및 P7과 같은 증폭 프라이머의 사용은, 그 전체가 본원에서 각각 참조 인용되는 국제공개 WO 2007/010251호, WO 2006/064199호, WO 2005/065814호, WO 2015/106941호, WO 1998/044151호, 및 WO 2000/018957호의 개시내용에 의해 예시되는 바와 같이, 당업계에 알려져 있다. 예를 들어, 임의의 적합한 순방향 증폭 프라이머는, 고정화되든 용액 중에 있든, 상보적 서열에 대한 혼성화 및 서열의 증폭에 관해 본원에 제시된 방법에서 유용할 수 있다. 유사하게, 임의의 적합한 역방향 증폭 프라이머는, 고정화되든 용액 중에 있든, 상보적 서열에 대한 혼성화 및 서열의 증폭에 관해 본원에 제시된 방법에서 유용할 수 있다. 당업자는 본원에 제시된 바와 같은 핵산의 포획 및/또는 증폭에 적합한 프라이머 서열을 어떻게 설계하고 사용하는지를 이해할 것이다.As used herein, “P5” and “P7” may be used when referring to a primer sequence or primer binding site. The terms "P5'" (P5 prime) and "P7'" (P7 prime) refer to the complements of P5 and P7, respectively. It will be understood that any suitable amplification primer may be used in the methods presented herein, and that the use of P5 and P7 is an exemplary embodiment only. The use of amplification primers such as P5 and P7 on a flow cell is described in International Publication Nos. WO 2007/010251, WO 2006/064199, WO 2005/065814, WO 2015/106941, WO, each of which is incorporated herein by reference in its entirety. It is known in the art, as exemplified by the disclosures of 1998/044151, and WO 2000/018957. For example, any suitable forward amplification primer, whether immobilized or in solution, can be useful in the methods presented herein for hybridization to a complementary sequence and amplification of the sequence. Similarly, any suitable reverse amplification primer, whether immobilized or in solution, may be useful in the methods presented herein for hybridization to a complementary sequence and amplification of the sequence. Those skilled in the art will understand how to design and use primer sequences suitable for the capture and/or amplification of nucleic acids as set forth herein.
본원에 사용되는, "컴파트먼트"는 다른 것으로부터 어떤 것을 분리 또는 격리시키는 면적 또는 체적을 의미하는 것으로 의도된다. 예시적인 컴파트먼트는 바이알, 튜브, 웰, 액적, 볼루스, 비이드, 용기, 표면 특징부, 또는 유량, 자력, 전류 등과 같은 물리적인 힘에 의해 분리된 면적 또는 체적을 포함한다. 한 실시형태에서, 컴파트먼트는 96-웰 플레이트 또는 384-웰 플레이트와 같은 다중-웰 플레이트의 웰이다.As used herein, “compartment” is intended to mean an area or volume that separates or isolates something from another. Exemplary compartments include vials, tubes, wells, droplets, boluses, beads, containers, surface features, or areas or volumes separated by physical forces such as flow, magnetism, electric current, etc. In one embodiment, the compartments are wells of a multi-well plate, such as a 96-well plate or a 384-well plate.
본원에 사용되는, 용어 "프라이머" 및 이의 유도체는 일반적으로 관심 대상인 표적 서열에 혼성화될 수 있는 임의의 핵산을 나타낸다. 전형적으로, 프라이머는 뉴클레오티드가 폴리머라아제에 의해 중합될 수 있는 기질로서 기능하지만; 일부 실시형태에서, 프라이머는 합성된 핵산 가닥에 혼입되고 또 다른 프라이머가 혼성화되어 합성된 핵산 분자에 상보적인 새로운 가닥의 합성을 프라이밍할 수 있는 부위를 제공할 수 있다. 프라이머는 뉴클레오티드 또는 이의 유사체의 임의의 조합을 포함할 수 있다. 일부 실시형태에서, 프라이머는 단일-가닥 올리고뉴클레오티드 또는 폴리뉴클레오티드이다. 용어 "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 임의의 길이의 뉴클레오티드의 중합체성 형태를 나타내기 위해 본원에서 상호 교환적으로 사용되며, 리보뉴클레오티드, 데옥시리보뉴클레오티드, 이의 유사체, 또는 이의 혼합물을 포함할 수 있다. 용어는 동등물로서, 뉴클레오티드 유사체로부터 제조된 DNA 또는 RNA의 유사체를 포함하고, 단일 가닥(예컨대, 센스 또는 안티센스) 및 이중 가닥 폴리뉴클레오티드에 적용가능한 것으로 이해되어야 한다. 본원에서 사용된 용어는 또한 예를 들어 역전사효소의 작용에 의해 RNA 주형으로부터 생성된 상보적 또는 복제 DNA인 cDNA를 포함한다. 이러한 용어는 분자의 1차 구조만을 나타낸다. 따라서, 용어는 삼중-, 이중- 및 단일-가닥 데옥시리보핵산("DNA")뿐만 아니라 삼중-, 이중- 및 단일-가닥 리보핵산("RNA")을 포함한다.As used herein, the term “primer” and derivatives thereof generally refers to any nucleic acid capable of hybridizing to a target sequence of interest. Typically, primers function as substrates on which nucleotides can be polymerized by polymerases; In some embodiments, a primer can be incorporated into a synthesized nucleic acid strand and provide a site where another primer can hybridize to prime the synthesis of a new strand complementary to the synthesized nucleic acid molecule. Primers may include any combination of nucleotides or analogs thereof. In some embodiments, primers are single-stranded oligonucleotides or polynucleotides. The terms “polynucleotide” and “oligonucleotide” are used interchangeably herein to refer to polymeric forms of nucleotides of any length and may include ribonucleotides, deoxyribonucleotides, analogs thereof, or mixtures thereof. You can. The term is to be understood, as equivalents, to include analogs of DNA or RNA prepared from nucleotide analogs, and to be applicable to single-stranded (e.g., sense or antisense) and double-stranded polynucleotides. As used herein, the term also includes cDNA, which is complementary or replicating DNA produced from an RNA template, for example, by the action of reverse transcriptase. These terms refer only to the primary structure of the molecule. Accordingly, the term includes triple-, double-, and single-stranded deoxyribonucleic acids (“DNA”) as well as triple-, double-, and single-stranded ribonucleic acids (“RNA”).
본원에서 사용되는, "어댑터(adaptor)" 또는 "어댑터(adapter)" 및 이의 변형, 예를 들어 범용 어댑터(universal adaptor)는, 일반적으로 핵산 분자로 결찰되거나 결찰 반응에서 스플린트를 형성할 수 있는 임의의 선형 올리고뉴클레오티드를 나타낸다. 일부 실시형태에서, 어댑터 또는 어댑터의 일부는 표적 서열의 3' 말단 또는 5' 말단, 예컨대 표적 핵산의 링커 영역에 실질적으로 상보적이거나 상보적이다. 일반적으로, 어댑터는 뉴클레오티드 및/또는 핵산의 임의의 조합을 포함할 수 있다. 일부 양태에서, 어댑터는 하나 이상의 위치에 하나 이상의 절단가능한 기를 포함할 수 있다. 또 다른 양태에서, 어댑터는 프라이머, 예를 들어 범용 프라이머의 적어도 일부와 실질적으로 동일하거나, 실질적으로 상보적인 서열을 포함할 수 있다. 일부 실시형태에서, 어댑터는 다운스트림 오류 수정, 식별 또는 서열분석을 지원하도록 바코드 또는 태그를 포함할 수 있다. 용어 "어댑터" 또는 "어댑터"는 상호교환가능하게 사용된다.As used herein, “adaptor” or “adapter” and variations thereof, such as a universal adapter, generally refers to any nucleic acid molecule that can be ligated or form a splint in a ligation reaction. represents a linear oligonucleotide. In some embodiments, the adapter or portion of the adapter is substantially complementary to the 3' end or 5' end of the target sequence, such as a linker region of the target nucleic acid. In general, adapters can include any combination of nucleotides and/or nucleic acids. In some aspects, an adapter may include one or more cleavable groups at one or more positions. In another aspect, the adapter may comprise a sequence that is substantially identical to or substantially complementary to at least a portion of a primer, such as a universal primer. In some embodiments, adapters may include barcodes or tags to assist with downstream error correction, identification, or sequencing. The terms “adapter” or “adapter” are used interchangeably.
본원에 사용되는, "어레이"는 상대적 위치에 따라 서로 구별될 수 있는 부위의 집단을 나타낸다. 어레이의 상이한 부위에 있는 상이한 분자는 어레이 내의 부위의 위치에 따라 서로 구별될 수 있다. 어레이의 개별 부위는 특정 유형의 하나 이상의 분자를 포함할 수 있다. 예를 들어, 부위는 특정 서열을 갖는 단일 표적 핵산 분자를 포함할 수 있거나, 부위는 동일한 서열(및/또는 이의 상보적 서열)을 갖는 몇몇 핵산 분자를 포함할 수 있다. 어레이의 부위는 동일한 기질 상에 위치된 상이한 특징부일 수 있다. 예시적인 특징부는, 제한 없이, 기질 내의 웰, 기질 내의 또는 기질 상의 비이드(또는 다른 입자), 기질로부터의 돌출부, 기질 상의 릿지(ridge) 또는 기질 내의 채널을 포함한다. 어레이의 부위는 각각 상이한 분자를 갖는 별도의 기질일 수 있다. 별도의 기질에 부착된 상이한 분자는 기질이 연관된 표면 상의 기질의 위치에 따라 또는 액체 또는 겔 중의 기질의 위치에 따라 식별될 수 있다. 별도의 기질이 표면에 배치되는 예시적 어레이는 웰에 비이드를 갖는 것을 포함한다. 일부 실시형태에서, 어레이는 플로우셀 상에 배치될 수 있다.As used herein, “array” refers to a group of sites that can be distinguished from each other based on their relative positions. Different molecules in different regions of the array can be distinguished from each other depending on the location of the regions within the array. Individual regions of the array may contain one or more molecules of a particular type. For example, a region may comprise a single target nucleic acid molecule with a particular sequence, or a region may comprise several nucleic acid molecules with the same sequence (and/or its complementary sequence). Regions of the array can be different features located on the same substrate. Exemplary features include, without limitation, wells in the substrate, beads (or other particles) in or on the substrate, protrusions from the substrate, ridges on the substrate, or channels in the substrate. The regions of the array can be separate substrates, each with a different molecule. Different molecules attached to separate substrates can be identified depending on the location of the substrate on the surface with which it is associated or based on the location of the substrate in the liquid or gel. Exemplary arrays in which separate substrates are disposed on the surface include those with beads in wells. In some embodiments, the array can be placed on a flow cell.
조합 인덱싱combination indexing
본원에 제공된 방법 및 조성물의 일부 실시형태는 비이드에 부착된 제1 폴리뉴클레오티드가 인덱스의 순차적 부가에 의해 연장되는 조합 인덱싱에 의해 인덱싱된 비이드의 제조를 포함한다. 일부 실시형태에서, 제1 폴리뉴클레오티드, 예컨대 단일-가닥 DNA 폴리뉴클레오티드는, 화학 결찰, 폴리머라아제 연장, 제2 폴리뉴클레오티드 및 단일-가닥 오버행을 포함하는 이중 가닥 어댑터의 결찰, 또는 스플린트 결찰에 의한 것을 포함하는 다양한 방법에 의해 인덱스를 포함하는, 단일-가닥 DNA 폴리뉴클레오티드와 같은 제2 폴리뉴클레오티드로 연장된다.Some embodiments of the methods and compositions provided herein involve the preparation of indexed beads by combinatorial indexing where the first polynucleotide attached to the bead is extended by sequential addition of an index. In some embodiments, the first polynucleotide, such as a single-stranded DNA polynucleotide, is ligated by chemical ligation, polymerase extension, ligation of a second polynucleotide and a double-stranded adapter comprising a single-stranded overhang, or splint ligation. extended to a second polynucleotide, such as a single-stranded DNA polynucleotide, comprising an index by a variety of methods, including:
일부 실시형태는 분할 및 풀 인덱싱을 포함한다. 예를 들어, 비이드의 제1 집단은 제1 복수의 하위집단으로 분할되고, 상이한 제1 인덱스는 제1 인덱스를 포함하는 제1 폴리뉴클레오티드를 비이드에 부착하는 것에 의해 각각의 하위집단에 첨가되고, 하위집단은 조합되어 비이드의 제2 집단을 수득한다. 비이드의 제2 집단은 제2 복수의 하위집단으로 분할되고, 상이한 제2 인덱스는 제2 인덱스를 포함하는 폴리뉴클레오티드로 부착된 제1 폴리뉴클레오티드를 연장하여 각각의 하위집단에 첨가되고, 하위집단은 조합되어 비이드의 제3 집단을 수득한다. 비이드의 제3 집단은 제3 복수의 하위집단으로 분할하고, 상이한 제3 인덱스는 제3 인덱스를 포함하는 폴리뉴클레오티드로 제2 폴리뉴클레오티드를 연장시킴으로써 각각의 하위집단에 첨가되고, 하위집단은 조합되어 비이드의 제4 집단을 수득한다. 집단의 하위집단으로의 분할 및 각각의 하위집단에 대한 상이한 인덱스의 첨가는 반복되어 보다 더 다양한 조합 인덱스를 생성할 수 있다.Some embodiments include split and full indexing. For example, a first population of beads is divided into a first plurality of subpopulations and a different first index is added to each subpopulation by attaching a first polynucleotide comprising the first index to the beads. and the subpopulations are combined to obtain a second population of beads. The second population of beads is divided into a second plurality of subpopulations, and a different second index is added to each subpopulation by extending the first polynucleotide attached with a polynucleotide comprising the second index, and the subpopulation are combined to obtain a third population of beads. The third population of beads is divided into a third plurality of subpopulations, a different third index is added to each subpopulation by extending the second polynucleotide with a polynucleotide comprising the third index, and the subpopulations are combined. to obtain the fourth population of beads. The division of a population into subgroups and the addition of a different index for each subgroup can be repeated to create a more diverse combination of indices.
복수의 조합 인덱싱된 비이드의 제조에 관한 일부 실시형태는 하기 단계를 포함한다: (a) 제1 인덱스를 포함하는 제1 폴리뉴클레오티드를 포함하는 1차 인덱싱된 비이드의 집단을 수득하는 단계, 여기서 1차 인덱싱된 비이드의 집단은 복수의 인덱싱된 비이드의 제1 하위집단을 포함하고, 인덱싱된 비이드의 제1 하위집단은 서로 상이한 제1 인덱스를 포함함; (b) 1차 인덱싱된 비이드의 집단을 복수의 비이드의 제2 하위집단으로 분할하는 단계; (c) 하기를 포함하는, 2차 인덱싱된 비이드의 집단을 수득하는 단계: (i) 제2 인덱스를 포함하는 제2 폴리뉴클레오티드로 복수의 비이드의 제2 하위집단의 제1 폴리뉴클레오티드를 연장하여, 인덱싱된 비이드의 제2 하위집단을 수득하는 것, 여기서 인덱싱된 비이드의 제2 하위집단은 서로 상이한 제2 인덱스를 포함함, 및 (ii) 인덱싱된 비이드의 제2 하위집단을 조합하여 2차 인덱싱된 비이드의 집단을 수득하는 것.Some embodiments of making a plurality of combinatorial indexed beads include the following steps: (a) obtaining a population of primary indexed beads comprising a first polynucleotide comprising a first index, wherein the population of primary indexed beads includes a first sub-population of a plurality of indexed beads, wherein the first sub-population of indexed beads includes first indices that are different from each other; (b) dividing the first indexed population of beads into a second subpopulation of a plurality of beads; (c) obtaining a secondary population of indexed beads, comprising: (i) separating a first polynucleotide of a second subpopulation of the plurality of beads with a second polynucleotide comprising a second index; By extension, obtaining a second subpopulation of indexed beads, wherein the second subpopulation of indexed beads comprises a second index that is different from each other, and (ii) the second subpopulation of indexed beads. Combining to obtain a population of secondary indexed beads.
일부 실시형태는 또한 하기 단계를 포함한다: (d) 2차 인덱싱된 비이드의 집단을 복수의 비이드의 제3 하위집단으로 분할하는 단계; 및 (e) 하기를 포함하는, 3차 인덱싱된 비이드의 집단을 수득하는 단계: (i) 제3 인덱스를 포함하는 제3 폴리뉴클레오티드로 복수의 비이드의 제3 하위집단의 제2 폴리뉴클레오티드를 연장시켜, 인덱싱된 비이드의 제3 하위집단을 수득하는 것, 여기서 인덱싱된 비이드의 제3 하위집단은 서로 상이한 제3 인덱스를 포함함, 및 (ii) 인덱싱된 비이드의 제3 하위집단을 조합하여 3차 인덱싱된 비이드의 집단을 수득하는 것. 일부 실시형태는 또한 (d) 및 (e)를 반복하고 추가적 인덱스를 비이드의 인덱싱된 하위집단에 첨가하여, 보다 더 다양한 보다 더 다양한 조합 인덱스를 생성한다.Some embodiments also include the steps of: (d) dividing the secondary indexed population of beads into a third subpopulation of the plurality of beads; and (e) obtaining a third population of indexed beads, comprising: (i) a second polynucleotide of the third subpopulation of the plurality of beads with a third polynucleotide comprising a third index. extending to obtain a third subpopulation of indexed beads, wherein the third subpopulation of indexed beads comprises a third index that is different from each other, and (ii) a third subpopulation of indexed beads. Combining the populations to obtain a population of tertiary indexed beads. Some embodiments also repeat (d) and (e) and add additional indices to the indexed subpopulation of beads, creating even more diverse combinatorial indices.
일부 실시형태에서, 제1 인덱스를 포함하는 제1 폴리뉴클레오티드를 포함하는 1차 인덱싱된 비이드의 집단을 수득하는 것은 하기를 포함한다: (i) 제1 폴리뉴클레오티드를 복수의 비이드의 제1 하위집단에 부착하여, 인덱싱된 비이드의 제1 하위집단을 수득하는 것, 여기서 제1 폴리뉴클레오티드는 비이드의 제1 하위집단 각각에 대해 상이한 제1 인덱스를 포함함; 및 (ii) 인덱싱된 비이드의 제1 하위집단을 조합하여 1차 인덱싱된 비이드의 집단을 수득하는 것. 일부 실시형태에서, 제1 폴리뉴클레오티드는 제1 결합 파트너 및 제2 결합 파트너를 통해 복수의 비이드의 제1 하위집단의 비이드에 부착된다. 일부 실시형태에서, 제1 결합 파트너 또는 제2 결합 파트너는 비오틴, 스트렙타비딘, 비오틴 유도체, 스트렙타비딘 유도체, 항체, 및 항체의 항원 결합 단편으로 이루어지는 군으로부터 선택된다. 일부 실시형태에서, 제1 폴리뉴클레오티드는 공유결합 부착에 의해, 예를 들어 화학 반응을 통해 비이드에 부착된다.In some embodiments, obtaining a population of primary indexed beads comprising a first polynucleotide comprising a first index comprises: (i) dividing the first polynucleotide into the first of the plurality of beads. Attaching to the subpopulation, obtaining a first subpopulation of indexed beads, wherein the first polynucleotide comprises a different first index for each of the first subpopulation of beads; and (ii) combining the first subpopulation of indexed beads to obtain a primary population of indexed beads. In some embodiments, the first polynucleotide is attached to a bead of a first subpopulation of the plurality of beads through a first binding partner and a second binding partner. In some embodiments, the first or second binding partner is selected from the group consisting of biotin, streptavidin, biotin derivatives, streptavidin derivatives, antibodies, and antigen-binding fragments of antibodies. In some embodiments, the first polynucleotide is attached to the bead by covalent attachment, such as through a chemical reaction.
일부 실시형태에서, 제1 폴리뉴클레오티드는 프라이머 결합 부위를 포함한다. 프라이머 결합 부위의 예는 P5 서열, P5' 서열, P7 서열, 및 P7' 서열을 포함할 수 있다. P5 서열: AAT GAT ACG GCG ACC ACC GA(서열 번호:01); 및 P7 서열: CAA GCA GAA GAC GGC ATA CGA GAT(서열 번호:02). 일부 실시형태에서, 제1 폴리뉴클레오티드는 절단가능한 링커를 포함한다. 일부 실시형태에서, 제1 폴리뉴클레오티드는 범용 서열을 포함한다.In some embodiments, the first polynucleotide includes a primer binding site. Examples of primer binding sites may include the P5 sequence, P5' sequence, P7 sequence, and P7' sequence. P5 sequence: AAT GAT ACG GCG ACC ACC GA (SEQ ID NO:01); and P7 sequence: CAA GCA GAA GAC GGC ATA CGA GAT (SEQ ID NO:02). In some embodiments, the first polynucleotide comprises a cleavable linker. In some embodiments, the first polynucleotide comprises a universal sequence.
일부 실시형태에서, 제1 인덱스, 제2 인덱스, 및/또는 제3 인덱스는 100, 90, 80, 70, 60, 50, 40, 30, 25, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2개 초과, 미만 또는 이하의 연속적 뉴클레오티드의 길이, 또는 상기 숫자 중 어느 2개의 범위 이내의 길이를 갖는다. 일부 실시형태에서, 인덱스 또는 인덱스의 조합은 부착된 핵산, 또는 비이드와 같은 요소를 태그하는 데 사용될 수 있다. 본원에 제공된 실시형태에 유용한 특정 방법 및 조성물은, 각각 본원에서 그 전체가 참조 인용되는 미국특허 U.S. 20180023119호 및 미국특허 U.S. 20180355348호에 개시되어 있다.In some embodiments, the first index, second index, and/or third index are 100, 90, 80, 70, 60, 50, 40, 30, 25, 20, 19, 18, 17, 16, 15, has a length of 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, more than, less than or equal to 2 consecutive nucleotides, or a length within the range of any two of the foregoing numbers . In some embodiments, an index or combination of indices can be used to tag attached nucleic acids, or elements such as beads. Certain methods and compositions useful in the embodiments provided herein are described in U.S. Patents, each of which is incorporated herein by reference in its entirety. No. 20180023119 and U.S. Patent U.S. It is disclosed in No. 20180355348.
일부 실시형태에서, 인덱싱된 비이드의 집단, 예컨대 1차 인덱싱된 비이드의 집단 또는 2차 인덱싱된 비이드의 집단의 분할은, 인덱싱된 비이드의 집단을 복수의 컴파트먼트로 무작위로 분배하는 것을 포함할 수 있다. 일부 실시형태에서, 복수의 컴파트먼트는 웰, 채널 또는 액적으로부터 선택되는 컴파트먼트를 포함한다. 일부 실시형태에서, 복수의 컴파트먼트는 96-웰 플레이트, 192-웰 플레이트, 또는 384-웰 플레이트를 포함한다. 일부 실시형태에서, 플로우셀은 복수의 컴파트먼트를 포함한다.In some embodiments, partitioning of a population of indexed beads, such as a population of primary indexed beads or a population of secondary indexed beads, comprises randomly distributing the population of indexed beads into a plurality of compartments. It may include: In some embodiments, the plurality of compartments includes compartments selected from wells, channels, or droplets. In some embodiments, the plurality of compartments includes a 96-well plate, a 192-well plate, or a 384-well plate. In some embodiments, the flow cell includes a plurality of compartments.
일부 실시형태에서, 복수 비이드는 자성 비이드를 포함한다.In some embodiments, the plurality of beads include magnetic beads.
일부 실시형태는 또한 복수의 조합 인덱싱된 비이드를 어레이 상에 분배하는 것을 포함한다. 일부 실시형태에서, 복수의 조합 인덱싱된 비이드는 어레이 상에 무작위로 분배된다.Some embodiments also include distributing a plurality of combinatorial indexed beads onto an array. In some embodiments, a plurality of combinatorial indexed beads are randomly distributed on the array.
일부 실시형태는 또한 조합 인덱싱된 비이드를 서열분석하는 것을 포함한다. 예를 들어, 비이드의 조합 인덱스 또는 이의 상보체는 서열분석될 수 있다. 일부 실시형태에서, 조합 인덱스 또는 이의 상보체는 어레이 상에서 서열분석될 수 있다. 일부 실시형태에서, 서열분석은 합성에 의한 서열분석(SBS)을 포함할 수 있다. 본원에 제공된 방법 및 조성물과 함께 사용하기 위해 용이하게 적합화될 수 있는 예시적인 SBS 절차, 유체 시스템 및 검출 플랫폼은 예를 들어 문헌[Bentley et al., Nature 456:53-59 (2008)], 국제공개 WO 04/018497호; 미국 특허 제7,057,026호; 미국 특허 제7,329,492호; 미국 특허 제7,211,414호; 미국 특허 제7,315,019호; 미국 특허 제7,405,281호에 기재되어 있으며, 이들 각각은 본원에서 참조 인용된다. 일부 실시형태는 또한 비이드의 조합 인덱스를 기반으로 어레이 상에 복수의 조합 인덱싱된 비이드의 비이드 위치를 디코딩하는 것을 포함한다.Some embodiments also include sequencing the combinatorial indexed beads. For example, the combinatorial index of beads or their complements can be sequenced. In some embodiments, the combinatorial index or its complement can be sequenced on an array. In some embodiments, sequencing may include sequencing by synthesis (SBS). Exemplary SBS procedures, fluidic systems and detection platforms that can be readily adapted for use with the methods and compositions provided herein are described, for example, in Bentley et al., Nature 456:53-59 (2008), International Publication No. WO 04/018497; US Patent No. 7,057,026; US Patent No. 7,329,492; US Patent No. 7,211,414; US Patent No. 7,315,019; No. 7,405,281, each of which is incorporated herein by reference. Some embodiments also include decoding bead positions of a plurality of combinatorially indexed beads on an array based on the combinatorial indices of the beads.
일부 실시형태에서, 복수의 조합 인덱싱된 비이드의 비이드는 포획 프로브를 포함한다. 일부 실시형태에서, 제1 폴리뉴클레오티드, 제2 폴리뉴클레오티드 또는 제3 폴리뉴클레오티드는 포획 프로브를 포함한다. 일부 실시형태는 또한 복수의 표적 핵산을 포획 프로브에 혼성화시키는 것을 포함한다. 일부 실시형태는 또한 포획 프로브를 연장시키는 것을 포함한다.In some embodiments, the beads of the plurality of combinatorial indexed beads include capture probes. In some embodiments, the first polynucleotide, second polynucleotide, or third polynucleotide comprises a capture probe. Some embodiments also include hybridizing a plurality of target nucleic acids to a capture probe. Some embodiments also include extending the capture probe.
화학 결찰을 포함하는 조합 인덱싱Combinatorial indexing involving chemical ligation
본원에 제공된 방법 및 조성물의 일부 실시형태는 비이드에 부착된 폴리뉴클레오티드가 화학 결찰을 사용한 인덱스의 순차적 부가에 의해 연장되는 조합 인덱싱에 의해 인덱싱된 비이드의 제조를 포함한다. 본원에 제공된 실시형태에 유용한 특정 방법 및 조성물은, 본원에서 그 전체가 참조 인용되는 미국특허 U.S. 20180127816호에 개시되어 있다.Some embodiments of the methods and compositions provided herein involve the preparation of indexed beads by combinatorial indexing in which the polynucleotides attached to the beads are extended by sequential addition of the index using chemical ligation. Certain methods and compositions useful in the embodiments provided herein are described in U.S. Patents, which are incorporated herein by reference in their entirety. It is disclosed in No. 20180127816.
일부 실시형태에서, 화학 결찰에 의한 인덱스의 순차적 부가는, 연속적 레벨의 인덱스 올리고뉴클레오티드 또는 폴리뉴클레오티드를 공유 결합시키는 구리-촉매작용된 아자이드-알킨 부가환화 "클릭" 반응(CuAAC)을 포함한다(도 3). 클릭 화학은 DNA 올리고뉴클레오티드와 상용성이고, 시클릭 트리아졸 생성물은 DNA에 존재하는 포스포디에스테르 결합과 유사한 치수를 갖는다. DNA에 존재하는 포스포디에스테르 결합과 유사한 시클릭 트리아졸 생성물의 치수는 트리아졸 연결을 많은 DNA 폴리머라아제에 실행가능한 주형으로 만들고, 트리아졸-함유 DNA 가닥은 폴리머라아제 사슬 반응(PCR)을 포함하는 방법에 의해 증폭될 수 있다. 화학 결찰의 이점은, 상이한 단일-가닥 폴리뉴클레오티드의 말단이 스플린트 올리고뉴클레오티드 또는 스플린트 어댑터의 부재 하에, 과량의 인덱스 올리고뉴클레오티드 또는 폴리뉴클레오티드를 사용하고, 최종 비이드 코드 또는 조합 인덱스 내의 모든 또는 단지 소수의 불변 염기 위치를 제거함으로써, 결합될 수 있는 방법을 포함한다. 또한, 효소적 결찰 단계의 부재는 CuAAC 반응이 대안적 용매 중에서 및 비표준 온도에서 수행될 수 있으므로, 반응 조건에서 가요성을 증가시킨다.In some embodiments, sequential addition of an index by chemical ligation involves a copper-catalyzed azide-alkyne addition "click" reaction (CuAAC) that covalently links successive levels of index oligonucleotides or polynucleotides (CuAAC) Figure 3). Click chemistry is compatible with DNA oligonucleotides, and the cyclic triazole product has dimensions similar to the phosphodiester bonds present in DNA. The dimensions of the cyclic triazole product, similar to the phosphodiester linkages present in DNA, make the triazole linkage a viable template for many DNA polymerases, and triazole-containing DNA strands can be subjected to the polymerase chain reaction (PCR). It can be amplified by a method including: The advantage of chemical ligation is that, in the absence of splinted oligonucleotides or splinted adapters, the ends of different single-stranded polynucleotides can be linked to all or only a few of the index oligonucleotides or polynucleotides within the final bead code or combination index. Methods by which the binding can be achieved by removing the constant base position are included. Additionally, the absence of an enzymatic ligation step increases flexibility in reaction conditions, as the CuAAC reaction can be performed in alternative solvents and at non-standard temperatures.
일부 실시형태에서, 비이드 코드 또는 조합 인덱스 합성을 위한 화학 결찰은 2단계 합성 전략을 포함한다. 비이드 코드의 제1 레벨의 경우, 초기 포획 올리고뉴클레오티드, 예컨대 제1 인덱스를 포함하는 제1 폴리뉴클레오티드는, 3' 말단에서 CuAAC 핸들(아자이드 또는 알킨)에 의해 생성되고, 이러한 올리고뉴클레오티드는 결합 파트너 예컨대 5'-비오틴 / 스트렙타비딘을 통해 자성 비이드에 결합된다. 비이드 코드의 제2 레벨의 경우, 동족 CuAAC 핸들, 예컨대 3'-아자이드 / 5' 알킨 또는 3'-알킨 / 5'-아자이드를 갖는, 과량의 인덱스 올리고뉴클레오티드, 예컨대 제2 인덱스를 포함하는 제2 폴리뉴클레오티드는, 비이드-결합 제1 폴리뉴클레오티드에 구리 촉매와 함께 첨가된다. 일부 실시형태에서, 제2 인덱스를 포함하는 폴리뉴클레오티드는 오로지 5' 말단에 클릭 핸들을 가질 것이다. 반응이 완료되는 경우, 비이드는 펠릿화되고, 임의의 나머지 CuAAC 시약이 세척된다. 이는 레벨을 분리하는 불변 염기 없이, 인덱스 레벨, 예컨대 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드 사이의 본질적으로 '무흉터(scar-less)' 접합을 야기한다.In some embodiments, chemical ligation for bead code or combinatorial index synthesis involves a two-step synthetic strategy. For the first level of bead code, an initial capture oligonucleotide, such as a first polynucleotide comprising a first index, is generated by a CuAAC handle (azide or alkyne) at the 3' end, and this oligonucleotide binds It is coupled to the magnetic beads through a partner such as 5'-biotin/streptavidin. For the second level of the bead code, it contains an excess of index oligonucleotides, such as a second index, with a cognate CuAAC handle, such as 3'-azide / 5' alkyne or 3'-alkyne / 5'-azide. A second polynucleotide is added to the bead-bound first polynucleotide along with a copper catalyst. In some embodiments, the polynucleotide comprising the second index will have a click handle only at the 5' end. When the reaction is complete, the beads are pelleted and any remaining CuAAC reagent is washed away. This results in essentially 'scar-less' conjugation between the index levels, such as the first polynucleotide and the second polynucleotide, without invariant bases separating the levels.
일부 실시형태에서, 제3 인덱스를 포함하는 제3 폴리뉴클레오티드의 부착은 5' 및 3' 말단 둘 모두 상의 상보적 클릭 핸들로 합성된 제2 폴리뉴클레오티드의 사용을 포함할 수 있지만; 이는 긴 연쇄체(concatemer)의 형성을 야기할 수 있다. 연쇄체의 형성을 회피하면서 추가적 인덱스 레벨을 첨가하기 위해, 효소 예컨대 말단 데옥시뉴클레오티딜 트랜스퍼라아제(TdT)는, 조립된 2-레벨 비이드 코드의 3' 말단에, 데옥시리보오스의 3' OH 위치에서 클릭 핸들을 함유하는, 단일 염기를 삽입하는 데 사용된다. TdT는 작은 특이성과 함께 뉴클레오티드 트리포스페이트를 단일-가닥 올리고뉴클레오티드의 3' 말단에 부착하지만, 클릭 핸들이 3'OH를 차단하기 때문에 단일 염기만이 각각의 oligo에 부착된다. TdT를 세척한 이후, 추가적 인덱스 레벨은 처음 2개의 올리고뉴클레오티드의 연결과 동일한 절차를 사용하여 첨가된다. 클릭 반응은 100% 효율성을 갖지 않을 수 있기 때문에, 추가 결찰은 '건너뛴(skipped)' 레벨로 조합 인덱스를 회피하도록 차단될 수 있다. 이는 미반응 3' 기를 차단하기 위해 상보적 클릭 핸들을 함유하는 소분자를 첨가함으로써 달성된다.In some embodiments, attachment of a third polynucleotide comprising a third index may include the use of a second polynucleotide synthesized with complementary click handles on both the 5' and 3' ends; This can lead to the formation of long concatemers. To add additional index levels while avoiding the formation of concatemers, enzymes such as terminal deoxynucleotidyl transferase (TdT) are added to the 3' end of the assembled two-level bead code by adding a 3-linked molecule of deoxyribose. ' is used to insert a single base, containing a click handle at the OH position. TdT attaches nucleotide triphosphates with little specificity to the 3' end of single-stranded oligonucleotides, but because the click handle blocks the 3'OH, only a single base is attached to each oligo. After washing the TdT, additional index levels are added using the same procedure as the ligation of the first two oligonucleotides. Since the click response may not be 100% efficient, further ligation can be blocked to avoid combining indexes with 'skipped' levels. This is achieved by adding a small molecule containing a complementary click handle to block unreacted 3' groups.
일부 실시형태에서, 화학 결찰은 반응에 필요한 올리고뉴클레오티드의 양을 감소시키기 위해 스플린트 결찰 전략에서 사용될 수 있다. 화학 결찰은 비표준 뉴클레오티드의 사용과 상용성이다. 더 높은 혼성화 특이성을 갖는 특정 비표준 뉴클레오티드의 사용은 더 짧은 스플린트 올리고뉴클레오티드를 허용한다. 예를 들어, 개질된 뉴클레오티드 예컨대 펩티드 핵산(PNA), 잠금 핵산(LNA), 또는 2'-OMe 염기는 길이를 추가하지 않으면서 올리고뉴클레오티드의 용융 온도를 증가시킬 수 있다.In some embodiments, chemical ligation can be used in a splint ligation strategy to reduce the amount of oligonucleotide required for the reaction. Chemical ligation is compatible with the use of non-standard nucleotides. The use of certain non-standard nucleotides with higher hybridization specificity allows for shorter splint oligonucleotides. For example, modified nucleotides such as peptide nucleic acids (PNAs), locked nucleic acids (LNA), or 2'-OMe bases can increase the melting temperature of an oligonucleotide without adding length.
도 3은 클릭 화학 결찰에 의해 기질에 부착된 제1 인덱스(인덱스 A)에 제2 인덱스(인덱스 B)를 결합시키는 도식의 실시형태를 도시한다. 도 3에 나타낸 바와 같이, P5 서열 및 인덱스 A를 포함하는 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 예를 들어, 비이드는 비오틴으로 코팅되고, 제1 폴리뉴클레오티드는 스트렙타비딘에 연결된 5' 말단을 포함하거나; 비이드는 스트렙타비딘으로 코팅되고, 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함한다. 제1 폴리뉴클레오티드는 프로파르길 모이어티를 갖는 3' 말단을 포함한다. 제2 폴리뉴클레오티드는 아자이드 모이어티를 갖는 인덱스 B 및 5' 말단을 포함한다. 구리 촉매작용된 클릭 반응은 제1 및 제2 폴리뉴클레오티드의 결합을 야기한다. 추가적 폴리뉴클레오티드는, 프로파르길 모이어티를 포함하는 단일 뉴클레오티드를 첨가하기 위해 TdT로 비이드-연결된 폴리뉴클레오티드를 먼저 처리함으로써 제2 폴리뉴클레오티드의 3' 말단에 첨가된다. 아자이드 모이어티를 갖는 5' 말단을 포함하는 추가적 폴리뉴클레오티드는 추가적 클릭 반응을 통해 비이드-연결된 폴리뉴클레오티드를 추가로 연장시키는 데 사용될 수 있다.Figure 3 shows an embodiment of a schematic linking a second index (Index B) to a first index (Index A) attached to a substrate by click chemical ligation. As shown in Figure 3, the first polynucleotide comprising the P5 sequence and index A is bound to the beads via a biotin/streptavidin binding pair. For example, the beads are coated with biotin and the first polynucleotide comprises a 5' end linked to streptavidin; The beads are coated with streptavidin, and the first polynucleotide includes a 5' end linked to biotin. The first polynucleotide includes a 3' end with a propargyl moiety. The second polynucleotide includes an index B and a 5' end with an azide moiety. A copper-catalyzed click reaction results in the joining of the first and second polynucleotides. Additional polynucleotides are added to the 3' end of the second polynucleotide by first treating the bead-linked polynucleotide with TdT to add a single nucleotide containing a propargyl moiety. Additional polynucleotides comprising a 5' end with an azide moiety can be used to further extend the bead-linked polynucleotide via additional click reactions.
일부 실시형태는 화학 결찰 반응에 의해 제2 폴리뉴클레오티드로, 제1 폴리뉴클레오티드, 예컨대 비이드-연결된 제1 폴리뉴클레오티드를 연장시키는 것을 포함한다. 일부 실시형태에서, 제1 폴리뉴클레오티드는 클릭 화학 반응에 참여할 수 있는 3' 관능성 모이어티를 포함하는 말단 3'-개질된 데옥시뉴클레오티드(dNTP)를 포함한다. 일부 실시형태에서, 제2 폴리뉴클레오티드는 3' 관능성 모이어티와의 클릭 화학 반응에 참여할 수 있는 상용성 5'-관능성 모이어티를 포함하는 말단 5' 개질된 뉴클레오티드를 포함한다. 일부 실시형태에서, 3' 관능성 모이어티 및 5' 관능성 모이어티는 서로 반응하여, 개질된 백본 연결을 형성할 수 있다.Some embodiments include extending a first polynucleotide, such as a bead-linked first polynucleotide, to a second polynucleotide by a chemical ligation reaction. In some embodiments, the first polynucleotide comprises a terminal 3'-modified deoxynucleotide (dNTP) comprising a 3' functional moiety capable of participating in a click chemistry reaction. In some embodiments, the second polynucleotide comprises a terminal 5' modified nucleotide comprising a compatible 5'-functional moiety capable of participating in a click chemistry reaction with the 3' functional moiety. In some embodiments, the 3' functional moiety and the 5' functional moiety can react with each other to form a modified backbone linkage.
일부 실시형태에서, 제2 폴리뉴클레오티드로 제1 폴리뉴클레오티드를 연장시키는 것은 2차 인덱싱된 폴리뉴클레오티드를 수득하고, 방법은 또한 2차 인덱싱된 폴리뉴클레오티드를 개질시켜 클릭 화학 반응에 참여할 수 있는 3' 관능성 모이어티를 포함하는 말단 3' 개질된 뉴클레오티드를 포함하는 개질된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태에서, 개질은 2차 인덱싱된 폴리뉴클레오티드와 주형 독립적 폴리머라아제를 접촉시키는 것을 포함한다. 일부 실시형태에서, 주형 독립적 폴리머라아제는 말단 데옥시뉴클레오티딜 트랜스퍼라아제(TdT), 폴리A 폴리머라아제, 또는 CCA-첨가 RNA 폴리머라아제로부터 선택된다. 일부 실시형태에서, 주형 독립적 폴리머라아제는 TdT이다.In some embodiments, extending a first polynucleotide with a second polynucleotide yields a secondary indexed polynucleotide, and the method also modifies the secondary indexed polynucleotide to provide a 3′ functionality that can participate in a click chemistry reaction. and obtaining a modified polynucleotide comprising a terminal 3' modified nucleotide comprising a sexual moiety. In some embodiments, the modification includes contacting the secondary indexed polynucleotide with a template-independent polymerase. In some embodiments, the template independent polymerase is selected from terminal deoxynucleotidyl transferase (TdT), polyA polymerase, or CCA-addition RNA polymerase. In some embodiments, the template independent polymerase is TdT.
일부 실시형태는 또한 화학 결찰 반응에 의해 제3 폴리뉴클레오티드로 개질된 폴리뉴클레오티드를 연장시키는 것을 포함하고, 여기서 제3 폴리뉴클레오티드는 3' 관능성 모이어티와의 클릭 화학 반응에 참여할 수 있는 상용성 5' 관능성 모이어티를 포함하는 말단 5' 개질된 뉴클레오티드를 포함한다.Some embodiments also include extending the modified polynucleotide by a chemical ligation reaction with a third polynucleotide, wherein the third polynucleotide is a compatible 5 polynucleotide capable of participating in a click chemistry reaction with the 3' functional moiety. It contains a 'terminal 5' modified nucleotide containing a functional moiety.
일부 실시형태에서, 3' 관능성 모이어티는 아자이드, 알키닐, 알케닐, 티올, 및 니트론으로 이루어지는 군으로부터 선택된다. 일부 실시형태에서, 5' 관능성 모이어티는 3' 관능성 모이어티와 상이하고 이와 상용성이고, 아자이드, 알키닐, 알케닐, 티올, 및 니트론으로 이루어지는 군으로부터 선택된다. 일부 실시형태에서, 3' 관능성 모이어티 및 5' 관능성 모이어티는 하기 쌍으로부터 선택된다: (i) 3'-아자이도/5'-알키닐; (ii) 3'-알키닐/5' 아자이도; (iii) 3'-티올/5'-알키닐; (iv) 3'-티올/5'-알케닐; (v) 3'-알키닐/5'-티올; (vi) 3'-알케닐/5'-티올; (vii) 3'-아자이도/5'-시클로옥티닐; (viii) 3'-시클로옥틴/5'-아자이도; (ix) 3'-니트론/5'-시클로옥티닐; 및 (x) 3'-시클로옥티닐/5'-니트론. 일부 실시형태에서, 3' 관능성 모이어티는 3'-아자이도이고, 5' 관능성 모이어티는 5'-알키닐이다. 일부 실시형태에서, TdT 단계는 직교 클릭 반응이 L1/L2 인덱스 및 L2/L3 인덱스 사이에서 사용되는 경우 회피될 수 있다.In some embodiments, the 3' functional moiety is selected from the group consisting of azide, alkynyl, alkenyl, thiol, and nitrone. In some embodiments, the 5' functional moiety is different from and compatible with the 3' functional moiety and is selected from the group consisting of azide, alkynyl, alkenyl, thiol, and nitrone. In some embodiments, the 3' functional moiety and 5' functional moiety are selected from the following pairs: (i) 3'-azido/5'-alkynyl; (ii) 3'-alkynyl/5' azido; (iii) 3'-thiol/5'-alkynyl; (iv) 3'-thiol/5'-alkenyl; (v) 3'-alkynyl/5'-thiol; (vi) 3'-alkenyl/5'-thiol; (vii) 3'-azido/5'-cyclooctynyl; (viii) 3'-cyclooctyne/5'-azido; (ix) 3'-nitrone/5'-cyclooctynyl; and (x) 3'-cyclooctynyl/5'-nitrone. In some embodiments, the 3' functional moiety is 3'-azido and the 5' functional moiety is 5'-alkynyl. In some embodiments, the TdT step can be avoided if an orthogonal click response is used between the L1/L2 index and the L2/L3 index.
일부 실시형태에서, 클릭 화학 반응은 트리아졸릴을 포함하는 개질된 백본 연결을 형성하기 위한 구리 촉매작용된 아자이드-알킨 부가환화(CuAAC)를 포함한다.In some embodiments, the click chemistry reaction includes copper catalyzed azide-alkyne addition (CuAAC) to form a modified backbone linkage comprising triazolyl.
폴리머라아제 연장을 포함하는 조합 인덱싱Combinatorial indexing with polymerase extension
본원에 제공된 방법 및 조성물의 일부 실시형태는 비이드에 부착된 폴리뉴클레오티드가 폴리머라아제 연장에 의한 인덱스의 순차적 부가에 의해 연장되는 조합 인덱싱에 의해 인덱싱된 비이드의 제조를 포함한다.Some embodiments of the methods and compositions provided herein involve the preparation of indexed beads by combinatorial indexing in which the polynucleotides attached to the beads are extended by sequential addition of the index by polymerase extension.
일부 실시형태에서, 어댑터는 제1 인덱스를 포함하는 비이드-결합된 제1 폴리뉴클레오티드의 3' 링커(L1A) 영역에 상보적인 3' 영역, 및 제2 인덱스 서열의 역상보체 둘 모두를 함유하는 올리고뉴클레오티드를 포함한다(도 4). 어댑터 올리고뉴클레오티드는 비이드-결합된 제1 폴리뉴클레오티드에 혼성화되고, DNA 폴리머라아제 및 dNTP는 제1 폴리뉴클레오티드를 연장시켜, 그 3' 말단에 어댑터의 상보체를 함유하는 공유 결합된, 비이드-결합 올리고뉴클레오티드를 야기한다. 어댑터는 제1 폴리뉴클레오티드에 직접 혼성화되기 때문에, 염기의 수의 절반은 유사한 결합 특이성, 예컨대 현재의 스플린트 결찰 작업흐름의 경우 16개의 염기에 대해 8개의 염기를 달성하는 데 충분하다. 중합이 완료되면, 어댑터는 예를 들어 어댑터가 티민 대신 데옥시우라실 잔기를 포함하는 경우, 열, 염기(NaOH), 또는 USER 효소를 사용한 처리를 사용한 변성에 의해 제거될 수 있다. 추가적 인덱스 레벨은, 연장된 제1 폴리뉴클레오티드의 3' 말단에 제3 인덱스를 포함하는 제2 어댑터를 혼성화하고, 연장된 제1 폴리뉴클레오티드를 추가로 중합 반응 및 혼성화된 제2 어댑터로 연장시킴으로써 첨가될 수 있다. 일부 실시형태에서, 폴리머라아제가 프라이머로서 어댑터의 3' 말단을 사용하고 원치 않는 생성물을 생성하는 것을 방지하기 위해, 어댑터의 3' 말단은 예를 들어 3' 2' 디데옥시 뉴클레오티드, C3 링커, 또는 다른 표준 차단 화학에 의해 차단될 수 있다.In some embodiments, the adapter contains both a 3' region complementary to the 3' linker (L1A) region of the first bead-bound polynucleotide comprising the first index, and the reverse complement of the second index sequence. Contains oligonucleotides (Figure 4). The adapter oligonucleotide is hybridized to the bead-bound first polynucleotide, and DNA polymerase and dNTP extend the first polynucleotide to form a covalently linked bead containing the complement of the adapter at its 3' end. -Results in binding oligonucleotides. Because the adapter hybridizes directly to the first polynucleotide, half the number of bases is sufficient to achieve similar binding specificity, such as 8 bases versus 16 bases for the current splint ligation workflow. Once polymerization is complete, the adapter can be removed by denaturation using heat, base (NaOH), or treatment with the USER enzyme, for example, if the adapter contains a deoxyuracil moiety instead of thymine. Additional index levels are added by hybridizing a second adapter comprising a third index to the 3' end of the extended first polynucleotide, and further polymerizing and extending the extended first polynucleotide with the hybridized second adapter. It can be. In some embodiments, to prevent the polymerase from using the 3' end of the adapter as a primer and generating undesired products, the 3' end of the adapter is conjugated with, for example, a 3' 2' dideoxy nucleotide, a C3 linker, Alternatively, it can be blocked by other standard blocking chemistries.
도 4는 순차적 폴리머라아제 연장 반응에 의해 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)를 첨가하는 도식의 실시형태를 도시한다. 도 4에 나타낸 바와 같이, P5 서열, 인덱스 A 및 제1 링커(Link 1a)를 포함하는 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 예를 들어, 비이드는 비오틴으로 코팅되고, 제1 폴리뉴클레오티드는 스트렙타비딘에 연결된 5' 말단을 포함하거나; 비이드는 스트렙타비딘으로 코팅되고, 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함한다. 제1 링커, 인덱스 B', 및 링커 2a'에 혼성화될 수 있는 영역을 포함하는 제1 어댑터는 제1 링커에 혼성화되고, 제1 폴리뉴클레오티드는 폴리머라아제의 존재 하에 연장되어, 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제1 어댑터는 제거된다. 링커 2a, 인덱스 C', 및 포획 프로브'(Hyb')에 혼성화될 수 있는 영역을 포함하는 제2 어댑터는 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드의 링커 2a 영역에 혼성화되고, 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드는 폴리머라아제의 존재 하에 추가로 연장되어, 인덱스 A, B, 및 C, 및 포획 프로브(Hyb)를 포함하는 연장된 폴리뉴클레오티드를 수득한다.Figure 4 shows an embodiment of the scheme for adding a first index (Index A), a second index (Index B) and a third index (Index C) attached to a substrate by sequential polymerase extension reactions. As shown in Figure 4, the first polynucleotide comprising the P5 sequence, index A, and the first linker (
일부 실시형태는 폴리머라아제 연장에 의해 제1 폴리뉴클레오티드를 연장시키는 것을 포함한다. 일부 실시형태에서, 제1 폴리뉴클레오티드는 제1 링커를 포함한다. 일부 실시형태는 또한 (i) 제1 링커에 혼성화될 수 있는 영역 및 제2 인덱스 또는 제2 인덱스의 상보체를 포함하는 영역을 포함하는 제1 어댑터를 수득하는 것; (ii) 제1 어댑터를 제1 링커에 혼성화시키는 것; 및 (iii) 제1 폴리뉴클레오티드를 연장시켜 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태에서, 제1 어댑터는 비연장성 3' 말단을 포함한다. 일부 실시형태에서, 비연장성 3' 말단은 3'2' 디데옥시 뉴클레오티드, 또는 C3 링커, 예컨대 3-탄소 스페이서 암을 포함한다. 일부 실시형태는 또한 2차 인덱싱된 폴리뉴클레오티드로부터 제1 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다. 일부 실시형태에서, 제1 링커는 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제1 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다.Some embodiments include extending the first polynucleotide by polymerase extension. In some embodiments, the first polynucleotide comprises a first linker. Some embodiments also include (i) obtaining a first adapter comprising a region capable of hybridizing to the first linker and a region comprising the second index or the complement of the second index; (ii) hybridizing the first adapter to the first linker; and (iii) extending the first polynucleotide to obtain a secondary indexed polynucleotide. In some embodiments, the first adapter comprises a non-extended 3' end. In some embodiments, the non-extended 3' end comprises a 3'2' dideoxy nucleotide, or a C3 linker, such as a 3-carbon spacer arm. Some embodiments also include removing the first adapter from the secondary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion. In some embodiments, the first linker is less than 10, 9, 8, 7, 6, 5, 4, 3, or 2 consecutive nucleotides in length. In some embodiments, the first linker is less than 5 consecutive nucleotides in length.
일부 실시형태에서, 3차 인덱싱된 비이드의 집단의 수득은 폴리머라아제 연장에 의해 제2 폴리뉴클레오티드를 연장시키는 것을 포함한다. 일부 실시형태에서, 제1 어댑터는 제2 링커의 상보체를 포함하여, 2차 인덱싱된 폴리뉴클레오티드가 제2 링커를 포함한다. 일부 실시형태는 또한 (i) 제2 링커에 혼성화될 수 있는 영역 및 제3 인덱스 또는 제3 인덱스의 상보체를 포함하는 영역을 포함하는 제2 어댑터를 수득하는 것; (ii) 제2 어댑터를 제2 링커에 혼성화시키는 것; 및 (iii) 2차 인덱싱된 폴리뉴클레오티드를 연장시켜 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태에서, 제2 어댑터는 비연장성 3' 말단을 포함한다. 일부 실시형태에서, 비연장성 3' 말단은 3'2' 디데옥시 뉴클레오티드, 또는 C3 링커를 포함한다. 일부 실시형태는 또한 3차 인덱싱된 폴리뉴클레오티드로부터 제2 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다. 일부 실시형태에서, 제2 링커는 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제2 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다.In some embodiments, obtaining the population of tertiary indexed beads includes extending the second polynucleotide by polymerase extension. In some embodiments, the first adapter comprises the complement of a second linker, such that the secondary indexed polynucleotide comprises a second linker. Some embodiments also include (i) obtaining a second adapter comprising a region capable of hybridizing to a second linker and a region comprising a third index or a complement of the third index; (ii) hybridizing the second adapter to the second linker; and (iii) extending the secondary indexed polynucleotide to obtain a tertiary indexed polynucleotide. In some embodiments, the second adapter comprises a non-extended 3' end. In some embodiments, the non-extended 3' end comprises a 3'2' dideoxy nucleotide, or a C3 linker. Some embodiments also include removing the second adapter from the tertiary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion. In some embodiments, the second linker is less than 10, 9, 8, 7, 6, 5, 4, 3, or 2 consecutive nucleotides in length. In some embodiments, the second linker is less than 5 consecutive nucleotides in length.
이중-가닥 단편의 결찰을 포함하는 조합 인덱싱Combinatorial indexing involving ligation of double-stranded fragments
본원에 제공된 방법 및 조성물의 일부 실시형태는, 비이드에 부착된 폴리뉴클레오티드가 제2 폴리뉴클레오티드 및 이중-가닥 영역을 포함하는 어댑터의 결찰에 의한 인덱스의 순차적 부가에 의해 연장되는, 조합 인덱싱에 의한 인덱싱된 비이드의 제조를 포함한다. 일부 실시형태에서, 일부 이중-가닥 어댑터의 사용은, 단일 링커 서열이 추가적 인덱스를 비이드-연결된 올리고뉴클레오티드에 결찰시키는 데 사용될 수 있고, 이에 따라 조합 인덱싱된 올리고뉴클레오티드의 링커 서열의 길이를 일부 다른 방법에 비해 감소시킴을 의미한다. 예를 들어, 도 15a(좌측 패널)는, 스플린트가 각각 비이드-연결된 올리고뉴클레오티드에서 "KS-3'" 서열에 그리고 인덱스2를 함유하는 어댑터 서열에서 "KS-5'" 서열에 어닐링(annealing)되는 2개의 링커 서열 "KS-3" 및 "KS-5"를 함유하는, 표준 스플린트 결찰에 대한 예시적 실시형태를 나타낸다. 대조적으로, 도 15a(우측 패널)에 나타낸 이중 가닥 스플린트 결찰의 예시적 실시형태는 비이드-연결된 올리고뉴클레오티드에 인덱스를 함유하는 어댑터 서열을 결찰시키는 데 충분한 단일 링커 서열 "KS-3"을 함유하는 이중-가닥 스플린트를 나타낸다.Some embodiments of the methods and compositions provided herein include combinatorial indexing, wherein a polynucleotide attached to a bead is extended by sequential addition of an index by ligation of a second polynucleotide and an adapter comprising a double-stranded region. Including the preparation of indexed beads. In some embodiments, the use of some double-stranded adapters allows a single linker sequence to be used to ligate an additional index to a bead-linked oligonucleotide, thereby extending the length of the linker sequence of the combinatorial indexed oligonucleotide to some other index. This means that it is reduced compared to the method. For example, Figure 15A (left panel) shows a splint annealing to the "KS-3'" sequence in a bead-linked oligonucleotide and to the "KS-5'" sequence in an adapter
일부 실시형태는 이중가닥의 두 가닥 모두의 3' 말단으로부터 연장되는 상보적 오버행을 갖는 인덱스 올리고뉴클레오티드를 포함하는 이중 가닥 어댑터의 사용을 포함한다(예를 들어, 도 5, 도 15a, 및 도 19a 참조). 일부 상기 실시형태는, 상보적 염기의 단일 영역만이 조립에 충분하므로 비이드 코드에서의 불변 염기의 수를 50%까지 감소시킨다. 제1 인덱스를 포함하는 비이드-결합된 제1 폴리뉴클레오티드로 시작하여, 제1 폴리뉴클레오티드의 3' 말단에 상보적인 3' 오버행을 갖는 이중-가닥 단편을 포함하는 어댑터는 비이드에 첨가되고 혼성화되는 것이 허용된다. 인덱스 서열 및 다음 인덱스 레벨을 위한 3' 혼성화 서열을 함유하는, '상부' 단편은, 이후 효소적 또는 화학 결찰에 의해 제1 폴리뉴클레오티드에 연결된다. 결찰이 완료되면, 어댑터의 이중-가닥 인덱스 부분의 하부 가닥은 변성에 의해 제거될 수 있고, 추가적 인덱스 레벨은 동일한 과정에 의해 첨가될 수 있다. 일부 실시형태에서, 추가적 단일-가닥 올리고뉴클레오티드는 결찰 동안 존재할 수 있다(예를 들어, 도 12, 우측 패널 '인덱스1' oligo'를 참조함). 추가적 올리고뉴클레오티드는 비이드-결합된 폴리뉴클레오티드의 인덱스 서열에 혼성화될 수 있다. 일부 상기 실시형태에서, 추가적 올리고뉴클레오티드는 결찰 복합체를 추가로 안정화시키고 결찰을 촉진시킬 수 있다.Some embodiments include the use of double-stranded adapters comprising index oligonucleotides with complementary overhangs extending from the 3' ends of both strands of the double strand (e.g., Figures 5, 15A, and 19A reference). Some of these embodiments reduce the number of constant bases in the bead code by up to 50% since only a single region of complementary bases is sufficient for assembly. Starting with a bead-bound first polynucleotide comprising a first index, an adapter comprising a double-stranded fragment having a 3' overhang complementary to the 3' end of the first polynucleotide is added to the bead and hybridized. It is allowed to be. The 'top' fragment, containing the index sequence and the 3' hybridization sequence for the next index level, is then linked to the first polynucleotide by enzymatic or chemical ligation. Once ligation is complete, the lower strand of the double-stranded index portion of the adapter can be removed by denaturation and additional index levels can be added by the same process. In some embodiments, additional single-stranded oligonucleotides may be present during ligation (see, e.g., Figure 12, right panel 'Index1' oligo'). Additional oligonucleotides can hybridize to the index sequence of the bead-bound polynucleotide. In some of the above embodiments, additional oligonucleotides may further stabilize the ligation complex and promote ligation.
도 5는 이중-가닥 영역 및 단일-가닥 오버행을 포함하는 어댑터를 사용하여 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)에 첨가하는 도식의 실시형태를 도시한다. 도 5에 나타낸 바와 같이, P5 서열, 인덱스 A 및 제1 링커(Link 1a)를 포함하는 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 예를 들어, 비이드는 비오틴으로 코팅되고, 제1 폴리뉴클레오티드는 스트렙타비딘에 연결된 5' 말단을 포함하거나; 비이드는 스트렙타비딘으로 코팅되고, 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함한다. 제1 링커에 혼성화될 수 있는 영역, 인덱스 B를 포함하는 이중 가닥 영역, 및 제2 링커(link 2a)를 포함하는 영역을 포함하는 단일 가닥 5' 오버행을 포함하는 제1 어댑터는 제1 링커에 혼성화된다. 제1 어댑터는, 각각 리가아제를 사용한 결찰에 의해, 또는 화학 결찰에 의해, 제1 폴리뉴클레오티드 및 어댑터의 링커 1a 및 인덱스 B 영역을 통해 제1 폴리뉴클레오티드에 공유 결합되어, 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제1 폴리뉴클레오티드에 공유 결합되지 않은 제1 어댑터의 가닥이 제거된다. 제2 링커에 혼성화될 수 있는 영역을 포함하는 단일 가닥 5' 오버행, 인덱스 C를 포함하는 이중 가닥 영역 및 포획 프로브(Hyb)를 포함하는 제2 어댑터는 제2 링커에 혼성화된다. 제2 어댑터는 각각 리가아제를 사용한 결찰에 의해, 또는 화학 결찰에 의해, 제1 폴리뉴클레오티드 및 어댑터의 링커 1a 및 인덱스 B 영역을 통해 연장된 제1 폴리뉴클레오티드에 공유 결합되어, 인덱스 A, B, 및 C 및 포획 프로브(Hyb)를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 인덱스 A, B, 및 C 및 포획 프로브(Hyb)를 포함하는 연장된 폴리뉴클레오티드에 공유 결합되지 않은 제2 어댑터의 가닥이 제거된다.Figure 5 is a schematic of adding a first index (Index A), a second index (Index B), and a third index (Index C) attached to a substrate using an adapter comprising a double-stranded region and a single-stranded overhang. An embodiment of is shown. As shown in Figure 5, the first polynucleotide comprising the P5 sequence, index A, and the first linker (
도 19a는 비이드에 부착된 폴리뉴클레오티드가 제2 폴리뉴클레오티드 및 이중-가닥 영역을 포함하는 어댑터의 결찰에 의한 인덱스의 순차적 부가에 의해 연장되는, 조합 인덱싱의 추가적인 예시적 실시형태를 도시한다. 도 19a에 나타낸 바와 같이, P5 서열, 인덱스1, 및 KS-3' 서열을 포함하는 올리고뉴클레오티드는 비오틴(B) 및 스트렙타비딘(SA)을 통해 비이드에 연결된다. 한 가닥이 KS-3 서열, 인덱스2' 및 MS-3 서열을 포함하고, 다른 가닥이 인덱스2 서열 및 MS-3' 서열을 포함하는 일부 이중-가닥 어댑터는, KS-3 및 KS-3' 서열을 통해 비이드-연결된 올리고뉴클레오티드에 어닐링된다. 어댑터 서열은 어댑터의 가닥에 혼성화된 연장된 비이드-연결된 올리고뉴클레오티드를 형성하기 위해 비이드-연결된 서열에 결찰된다. 어댑터의 가닥은 변성에 의해 제거된다. 인덱싱의 제2 라운드가 수행된다.Figure 19A depicts a further exemplary embodiment of combinatorial indexing, wherein a polynucleotide attached to a bead is extended by sequential addition of an index by ligation of a second polynucleotide and an adapter comprising a double-stranded region. As shown in Figure 19A, oligonucleotides containing the P5 sequence, Index1, and KS-3' sequence are linked to beads via biotin (B) and streptavidin (SA). Some double-stranded adapters have one strand comprising the KS-3 sequence, Index2' and MS-3 sequences, and the other strand comprising the Index2 sequence and the MS-3' sequence, KS-3 and KS-3'. Annealed to bead-linked oligonucleotides through the sequence. The adapter sequence is ligated to the bead-linked sequence to form an extended bead-linked oligonucleotide that hybridizes to the strand of the adapter. The adapter strand is removed by denaturation. A second round of indexing is performed.
일부 실시형태는 결찰에 의해 제2 폴리뉴클레오티드로 제1 폴리뉴클레오티드를 연장시키는 것을 포함한다. 일부 실시형태는 또한 (i) 제1 폴리뉴클레오티드의 제1 링커에 혼성화될 수 있는 3' 단일 가닥 오버행 및 제2 폴리뉴클레오티드를 포함하는 이중 가닥 제1 어댑터를 수득하는 것; (ii) 제1 링커에 제1 어댑터를 혼성화시키는 것; 및 (iii) 제2 폴리뉴클레오티드에 제1 폴리뉴클레오티드를 결찰시켜 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태는 또한 결찰에 의해 제3 폴리뉴클레오티드로 제2 폴리뉴클레오티드를 연장시키는 것을 포함한다. 일부 실시형태는 또한 (i) 제2 폴리뉴클레오티드의 제2 링커에 혼성화될 수 있는 3' 단일 가닥 오버행 및 제3 폴리뉴클레오티드를 포함하는 이중 가닥 제2 어댑터를 수득하는 것; (ii) 제2 링커에 제2 어댑터를 혼성화시키는 것; 및 (iii) 제3 폴리뉴클레오티드에 제2 폴리뉴클레오티드를 결찰시켜 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태에서, 결찰은 리가아제의 사용을 포함한다. 일부 실시형태에서, 결찰은 화학 결찰 반응, 예컨대 본원에 개시된 클릭 화학 반응을 포함한다.Some embodiments include extending a first polynucleotide into a second polynucleotide by ligation. Some embodiments also include (i) obtaining a double-stranded first adapter comprising a second polynucleotide and a 3' single-stranded overhang capable of hybridizing to the first linker of the first polynucleotide; (ii) hybridizing the first adapter to the first linker; and (iii) ligating the first polynucleotide to a second polynucleotide to obtain a secondary indexed polynucleotide. Some embodiments also include extending the second polynucleotide by ligation into a third polynucleotide. Some embodiments also include (i) obtaining a double-stranded second adapter comprising a third polynucleotide and a 3' single-stranded overhang capable of hybridizing to a second linker of the second polynucleotide; (ii) hybridizing the second adapter to the second linker; and (iii) ligating the second polynucleotide to the third polynucleotide to obtain a tertiary indexed polynucleotide. In some embodiments, ligation involves the use of ligase. In some embodiments, ligation comprises a chemical ligation reaction, such as a click chemistry reaction disclosed herein.
스플린트 결찰을 포함하는 조합 인덱싱Combination indexing with splint ligation
본원에 제공된 방법 및 조성물의 일부 실시형태는, 비이드에 부착된 폴리뉴클레오티드가 스플린트 결찰에 의한 인덱스의 순차적 부가에 의해 연장되고, 여기서 스플린트가 증가된 혼성화 특이성을 갖는 뉴클레오티드를 포함하는, 조합 인덱싱에 의한 인덱싱된 비이드의 제조를 포함한다. 일부 실시형태에서, 스플린트는, 상보적 서열, 예를 들어 뉴클레오티드 서열에 대한 증가된 Tm을 야기하는 뉴클레오티드를 포함하는 뉴클레오티드 서열과 더 강한 결합을 갖는 뉴클레오티드를 포함한다. 일부 실시형태에서, 스플린트는 하나 이상의 개질된 뉴클레오티드, 또는 뉴클레오티드 유사체를 포함한다. 일부 실시형태에서, 스플린트는 잠금 핵산(LNA)을 포함한다. 일부 실시형태에서, 스플린트는 하나 이상의 이노신 뉴클레오티드를 포함한다.Some embodiments of the methods and compositions provided herein provide for combinatorial indexing, wherein polynucleotides attached to beads are extended by sequential addition of indices by splint ligation, wherein the splints comprise nucleotides with increased hybridization specificity. It includes the preparation of indexed beads by. In some embodiments, the splint comprises a nucleotide that has a stronger binding to a complementary sequence, e.g., a nucleotide sequence comprising a nucleotide that results in an increased Tm for the nucleotide sequence. In some embodiments, the splint includes one or more modified nucleotides, or nucleotide analogs. In some embodiments, the splint comprises a locked nucleic acid (LNA). In some embodiments, the splint includes one or more inosine nucleotides.
일부 실시형태는 스플린트와 인덱스/포획 올리고뉴클레오티드 사이의 혼성화의 강도를 증가시키는 화학적으로 개질된 염기를 포함하는 스플린트에 감소된 수의 염기를 갖는 인덱스의 연속적 레벨을 연결하기 위한 스플린트 결찰의 사용을 포함한다(도 6). 이의 현재 형태에서, 스플린트 서열은 실온(~25℃)에 가까운 변성 중간점(Tm)을 갖는 8개의 뉴클레오티드 길이이다. 이는 스플린트가 실온 결찰 반응 동안 포획 올리고뉴클레오티드 및 인덱스 올리고뉴클레오티드 둘 모두를 결합시킬 수 있음을 보장한다.Some embodiments include the use of splint ligation to link successive levels of an index with a reduced number of bases to a splint containing chemically modified bases that increase the strength of hybridization between the splint and the index/capture oligonucleotide. (Figure 6). In its current form, the splint sequence is 8 nucleotides long with a denaturation midpoint (Tm) close to room temperature (~25°C). This ensures that the splint can bind both the capture oligonucleotide and the index oligonucleotide during the room temperature ligation reaction.
도 6은 짧은 링커-스플린트와의 순차적 스플린트 결찰 반응에 의해 기질에 부착된 제1 인덱스(인덱스 A), 제2 인덱스(인덱스 B) 및 제3 인덱스(인덱스 C)에 첨가하는 도식의 실시형태를 도시한다. 도 6에 나타낸 바와 같이, P5 서열, 인덱스 A 및 제1 링커(Link 1a)를 포함하는 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 예를 들어, 비이드는 비오틴으로 코팅되고, 제1 폴리뉴클레오티드는 스트렙타비딘에 연결된 5' 말단을 포함하거나; 비이드는 스트렙타비딘으로 코팅되고, 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함한다. 제2 폴리뉴클레오티드는 제2 링커(Link1b), 인덱스 B, 및 제3 링커(Link 2a)를 포함한다. 제1 링커에 혼성화될 수 있는 영역 및 제2 링커에 혼성화될 수 있는 영역을 포함하는, 단일-가닥 제1 어댑터, 예컨대 스플린트는, 제1 폴리뉴클레오티드의 제1 링커, 및 제2 폴리뉴클레오티드의 제2 링커 둘 모두에 혼성화된다. 제1 폴리뉴클레오티드는 결찰에 의해, 예컨대 리가아제의 사용에 의해 제2 폴리뉴클레오티드에 공유 결합되어, 인덱스 A 및 B 및 제3 링커(Link 2a)를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제1 어댑터는 제거된다. 제3 폴리뉴클레오티드는 제4 링커(Link 2b), 인덱스 C, 및 포획 프로브(Hyb)를 포함한다. 제3 링커에 혼성화될 수 있는 영역 및 제4 링커에 혼성화될 수 있는 영역을 포함하는, 단일-가닥 제2 어댑터, 예컨대 스플린트는, 연장된 폴리뉴클레오티드의 제3 링커 및 제3 폴리뉴클레오티드의 제4 링커 둘 모두에 혼성화된다. 제3 폴리뉴클레오티드는 결찰에 의해, 예컨대 리가아제의 사용에 의해 연장된 폴리뉴클레오티드에 공유 결합되어, 인덱스 A, B, 및 C, 및 캡처 프로브를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제2 어댑터는 제거된다.Figure 6 shows a schematic embodiment of the addition of a first index (Index A), a second index (Index B), and a third index (Index C) attached to a substrate by sequential splint ligation reactions with short linker-splints. It shows. As shown in Figure 6, the first polynucleotide comprising the P5 sequence, index A, and the first linker (
일부 실시형태는 결찰에 의한 제1 폴리뉴클레오티드의 연장을 포함하고, 여기서 제1 폴리뉴클레오티드는 제1 링커를 포함하고, 제2 폴리뉴클레오티드는 제2 링커를 포함한다. 일부 실시형태는 또한 (i) 제1 링커에 혼성화될 수 있는 영역 및 제2 링커에 혼성화될 수 있는 영역을 포함하는 제1 어댑터를 수득하는 것; (ii) 제1 어댑터를 제1 링커에 혼성화시키는 것; (iii) 제2 링커에 혼성화될 수 있는 영역에 제2 올리고뉴클레오티드를 혼성화시키는 것; 및 (iv) 제1 폴리뉴클레오티드를 제2 폴리뉴클레오티드에 결찰시켜, 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태에서, 제1 링커 및/또는 제2 링커는 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제1 링커 및/또는 제2 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제1 링커 및/또는 제2 링커는 개질되어, 제1 어댑터와 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 Tm을 갖는다. 일부 실시형태에서, 제1 링커 및/또는 제2 링커는 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 G/C 함량을 포함하거나, 개질된 뉴클레오티드를 포함한다. 일부 실시형태는 또한 2차 인덱싱된 폴리뉴클레오티드로부터 제1 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다.Some embodiments include extension of a first polynucleotide by ligation, wherein the first polynucleotide comprises a first linker and the second polynucleotide comprises a second linker. Some embodiments also include (i) obtaining a first adapter comprising a region hybridizable to a first linker and a region hybridizable to a second linker; (ii) hybridizing the first adapter to the first linker; (iii) hybridizing the second oligonucleotide to a region hybridizable to the second linker; and (iv) ligating the first polynucleotide to the second polynucleotide to obtain a secondary indexed polynucleotide. In some embodiments, the first linker and/or second linker are less than 10, 9, 8, 7, 6, 5, 4, 3, or 2 contiguous nucleotides in length. In some embodiments, the first linker and/or the second linker are less than 5 consecutive nucleotides in length. In some embodiments, the first linker and/or the second linker are modified to have an increased Tm relative to an oligonucleotide of the same length as the first adapter. In some embodiments, the first linker and/or the second linker comprises increased G/C content compared to an oligonucleotide of the same length or comprises modified nucleotides. Some embodiments also include removing the first adapter from the secondary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion.
일부 실시형태에서, 3차 인덱싱된 비이드의 집단을 수득하는 것은 결찰에 의해 제2 폴리뉴클레오티드를 연장하는 것을 포함하고, 여기서 제2 올리고뉴클레오티드는 제3 링커를 포함하여, 2차 인덱싱된 폴리뉴클레오티드가 제3 링커를 포함하고, 여기서 제3 폴리뉴클레오티드는 제4 링커를 포함한다. 일부 실시형태는 또한 (i) 제3 링커에 혼성화될 수 있는 영역 및 제4 링커에 혼성화될 수 있는 영역을 포함하는 제2 어댑터를 수득하는 것; (ii) 제2 어댑터를 제3 링커에 혼성화시키는 것; (iii) 제4 인덱스에 혼성화될 수 있는 영역을 통해 제2 어댑터에 제3 폴리뉴클레오티드를 혼성화시키는 것; 및 (iv) 제3 폴리뉴클레오티드에 2차 인덱싱된 폴리뉴클레오티드를 결찰시켜, 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것을 포함한다. 일부 실시형태에서, 제3 링커 및/또는 제4 링커는 9, 8, 7, 6, 5, 4, 3, 또는 2개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제3 링커 및/또는 제4 링커는 5개 미만의 연속적 뉴클레오티드의 길이를 갖는다. 일부 실시형태에서, 제3 링커 및/또는 제4 링커는 개질되어, 제2 어댑터와 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 Tm을 갖는다. 일부 실시형태에서, 제3 링커 및/또는 제4 링커는 동일한 길이를 갖는 올리고뉴클레오티드에 비해 증가된 G/C 함량을 포함하거나, 개질된 뉴클레오티드를 포함한다. 일부 실시형태는 또한 3차 인덱싱된 폴리뉴클레오티드로부터 제2 어댑터를 제거하는 것을 포함한다. 일부 실시형태에서, 제거는 열 또는 염기에 의해 제1 어댑터를 변성시키거나, 효소적 분해에 의해 제1 어댑터를 분해하는 것을 포함한다.In some embodiments, obtaining a population of tertiary indexed beads comprises extending a second polynucleotide by ligation, wherein the second oligonucleotide comprises a third linker, such that the secondary indexed polynucleotide comprises a third linker, wherein the third polynucleotide comprises a fourth linker. Some embodiments also include (i) obtaining a second adapter comprising a region hybridizable to a third linker and a region hybridizable to a fourth linker; (ii) hybridizing the second adapter to the third linker; (iii) hybridizing the third polynucleotide to the second adapter through a region hybridizable to the fourth index; and (iv) ligating the secondary indexed polynucleotide to a third polynucleotide to obtain a tertiary indexed polynucleotide. In some embodiments, the third linker and/or fourth linker is less than 9, 8, 7, 6, 5, 4, 3, or 2 consecutive nucleotides in length. In some embodiments, the third linker and/or fourth linker is less than 5 consecutive nucleotides in length. In some embodiments, the third linker and/or fourth linker are modified to have an increased Tm relative to an oligonucleotide of the same length as the second adapter. In some embodiments, the third linker and/or fourth linker comprises increased G/C content compared to an oligonucleotide of the same length or comprises modified nucleotides. Some embodiments also include removing the second adapter from the tertiary indexed polynucleotide. In some embodiments, removal includes denaturing the first adapter with heat or base, or degrading the first adapter by enzymatic digestion.
표적 핵산의 서열분석 및 분석Sequencing and analysis of target nucleic acids
일부 실시형태는 표적 핵산의 서열분석 및/또는 분석을 포함한다. 본원에 제공된 실시형태에 유용한 특정 방법 및 조성물은, 본원에서 그 전체가 참조 인용되는 미국 특허출원공개 U.S. 2021/0087613호에 개시되어 있다. 일부 실시형태는 본원에 제공된 방법에 따라 어레이에서 폴리뉴클레오티드의 위치를 디코딩하는 것; 포획 프로브에 표적 핵산을 혼성화시키는 것; 포획 프로브를 연장시키는 것; 및 어레이 상의 위치에서 표적 핵산에 혼성화된 포획 프로브의 연장을 검출하는 것을 포함한다. 일부 실시형태에서, 어레이 상의 폴리뉴클레오티드의 위치는 표적 핵산을 폴리뉴클레오티드에 혼성화시키기 이전에 디코딩될 수 있다. 일부 실시형태에서, 어레이 상의 폴리뉴클레오티드의 위치는 표적 핵산에 혼성화된 포획 프로브의 연장을 검출한 이후에 디코딩될 수 있다. 일부 상기 실시형태에서, 각각의 폴리뉴클레오티드는 공통 요소를 통해 포획 프로브와 회합될 수 있다. 예를 들어, 폴리뉴클레오티드 및 포획 프로브는 각각 동일한 미세특징부, 예컨대 비이드에 결합될 수 있다. 더 많은 상기 실시형태에서, 각각의 폴리뉴클레오티드는 포획 프로브를 포함할 수 있다.Some embodiments include sequencing and/or analysis of target nucleic acids. Certain methods and compositions useful in the embodiments provided herein are described in U.S. Patent Application Publication No. 149, which is incorporated herein by reference in its entirety. It is disclosed in No. 2021/0087613. Some embodiments include decoding the position of a polynucleotide in an array according to the methods provided herein; hybridizing the target nucleic acid to the capture probe; extending the capture probe; and detecting extension of the capture probe hybridized to the target nucleic acid at a location on the array. In some embodiments, the positions of polynucleotides on the array can be decoded prior to hybridizing the target nucleic acid to the polynucleotide. In some embodiments, the positions of polynucleotides on the array can be decoded after detecting extension of the capture probe hybridized to the target nucleic acid. In some of the above embodiments, each polynucleotide may be associated with a capture probe through a common element. For example, the polynucleotide and capture probe can each be bound to the same microfeature, such as a bead. In still more of the above embodiments, each polynucleotide may include a capture probe.
일부 실시형태는 포획 프로브의 단일 염기 연장(SBE)을 포함한다. 일부 실시형태에서, SBE는 표적 핵산 내의 대립유전자, 돌연변이 또는 다른 특징부의 검출에 사용될 수 있다. 간략하게 말하면, SBE는 검출 위치에 근접하거나 인접한 위치에서 표적 게놈 단편에 혼성화되는 포획 프로브를 이용하고, 검출 위치는 특정 유전자좌를 가리킨다. 폴리머라아제는 검출 라벨로 라벨링된 뉴클레오티드 유사체로 포획 프로브의 3' 말단을 연장시키는 데 사용될 수 있다. 효소의 충실도에 기초하여, 뉴클레오티드는 이것이 표적 핵산 내의 검출 위치에 상보적인 경우 포획 프로브 내로만 혼입된다. 원하는 경우, 뉴클레오티드는 가역적 차단 기를 포함한 차단 기를 사용하여 추가의 연장이 일어날 수 없도록 유도체화될 수 있고, 이에 따라 오로지 단일 뉴클레오티드가 첨가된다. 연장된 포획 프로브에서 라벨링된 뉴클레오티드의 존재는, 예를 들어 어레이에서 특정 위치에서 검출될 수 있고, 첨가된 뉴클레오티드를 확인하여 유전자좌 또는 대립유전자의 정체를 결정할 수 있다. SBE는 각각 그 전체가 참조 인용되는 미국 특허 제9,441,267호 및 미국 특허 제9,045,796호에 기재된 것과 같은 알려진 조건 하에 수행될 수 있다.Some embodiments include single base extension (SBE) of the capture probe. In some embodiments, SBE can be used for detection of alleles, mutations, or other features within a target nucleic acid. Briefly, SBE utilizes a capture probe that hybridizes to a target genomic fragment at a location close to or adjacent to the detection site, with the detection site pointing to a specific locus. Polymerase can be used to extend the 3' end of the capture probe with a nucleotide analog labeled with a detection label. Based on the fidelity of the enzyme, a nucleotide is incorporated into the capture probe only if it is complementary to the detection site within the target nucleic acid. If desired, nucleotides can be derivatized using blocking groups, including reversible blocking groups, such that further extension cannot occur, so that only single nucleotides are added. The presence of a labeled nucleotide in an extended capture probe can, for example, be detected at a specific position in an array and identify the added nucleotide to determine the identity of the locus or allele. SBE can be performed under known conditions such as those described in U.S. Patent No. 9,441,267 and U.S. Patent No. 9,045,796, each of which is incorporated by reference in its entirety.
일부 실시형태는 대립유전자 특이적 프라이머 연장(ASPE)을 포함한다. 일부 실시형태에서, ASPE는 3' 말단에서 뉴클레오티드 조성이 상이한 포획 프로브의 연장을 포함할 수 있다. ASPE 방법은 절단가능한 링커를 함유하는 뉴클레오시드 또는 뉴클레오티드를 사용하여 수행될 수 있으며, 이에 따라 프로브가 검출된 이후에 라벨은 제거될 수 있다. 이는 프로브의 추가 사용, 또는 검출된 신호가 현재 제거된 라벨로 인한 것이었다는 검증을 가능하게 한다. 간략하게 말하면, ASPE는 표적 핵산을 검출 위치에 상보적인 3' 서열 부분 및 검출 위치에 인접한 서열에 상보적인 5' 부분을 갖는 포획 프로브에 혼성화함으로써 수행될 수 있다. 예를 들어 폴리머라아제에 의한 라벨링된 뉴클레오티드의 부가에 의해 포획 프로브의 3' 부분의 주형 유도된 개질은, 라벨링된 연장 생성물을 생성하지만, 이는 주형이 표적 서열을 포함하는 경우에만 그러하다. 상기 라벨링된 프라이머-연장 생성물의 존재는 이후 예를 들어 특정 대립유전자의 존재를 나타내는 어레이 내의 이의 위치를 기반으로 검출될 수 있다. 일부 실시형태에서, ASPE는, 유사한 5' 말단을 가져 이것이 표적 핵산 내의 동일한 검출 위치에 인접하게 어닐링되게 되지만, 상이한 3' 말단을 가져 검출 위치를 보완하는 3' 말단을 갖는 포획 프로브만이 폴리머라아제에 의해 개질되게 되는 다수의 포획 프로브를 사용하여 수행될 수 있다. 특정 검출 위치에 상보적인 3' 말단 염기를 갖는 포획 프로브는 위치에 대한 완전한 일치(PM) 프로브로서 나타내어지는 반면, 3' 말단 불일치 염기를 갖고 ASPE 반응에서 연장될 수 없는 포획 프로브는 위치에 대한 불일치(MM) 프로브이다. PM 프로브에서 라벨링된 뉴클레오티드의 존재가 검출될 수 있고, 포획 프로브의 3' 서열은 검출 위치에서 특정 대립유전자를 식별하기 위해 측정될 수 있다.Some embodiments include allele-specific primer extension (ASPE). In some embodiments, ASPE may comprise an extension of a capture probe with a different nucleotide composition at the 3' end. The ASPE method can be performed using nucleosides or nucleotides containing a cleavable linker so that the label can be removed after the probe has been detected. This allows further use of the probe or verification that the detected signal was due to the now-removed label. Briefly, ASPE can be performed by hybridizing a target nucleic acid to a capture probe having a 3' portion of sequence complementary to the detection site and a 5' portion complementary to a sequence adjacent to the detection site. Template-directed modification of the 3' portion of a capture probe, for example by addition of a labeled nucleotide by a polymerase, produces a labeled extension product, but only if the template contains the target sequence. The presence of the labeled primer-extension product can then be detected based on its position in the array, for example, indicating the presence of a particular allele. In some embodiments, ASPE is a polymer that has a similar 5' end so that it anneals adjacent to the same detection site in the target nucleic acid, but has a different 3' end so that only capture probes with the 3' end complementary to the detection site are polymers. It can be performed using multiple capture probes that are modified by enzymes. Capture probes with 3' terminal bases that are complementary to a particular detection site are referred to as perfect match to position (PM) probes, whereas capture probes that have 3' terminal mismatched bases and cannot be extended in the ASPE reaction are mismatched to position. (MM) probe. The presence of labeled nucleotides in the PM probe can be detected, and the 3' sequence of the capture probe can be measured to identify the specific allele at the detection site.
키트 및 시스템kits and systems
본원에 제공된 일부 실시형태는 키트 및 시스템을 포함한다. 일부 상기 실시형태는 비이드, 다중웰 플레이트, 효소, 예컨대 리가아제 및 폴리머라아제, 폴리뉴클레오티드, 결합-쌍 예컨대 비오틴 및 스트렙타비딘 또는 이의 유도체, 및 클릭 화학 시약을 포함하는 본원에 제공된 특정 방법을 수행하기 위한 시약을 포함할 수 있다.Some embodiments provided herein include kits and systems. Some of the above embodiments include certain methods provided herein comprising beads, multiwell plates, enzymes such as ligases and polymerases, polynucleotides, binding-pairs such as biotin and streptavidin or derivatives thereof, and click chemistry reagents. It may contain reagents to perform.
실시예Example
실시예 1-클릭 화학 결찰에 의한 비이드 코드 합성Example 1-Bead code synthesis by click chemical ligation
복수의 비이드는 스트렙타비딘으로 코팅되고, 제1 96 웰 플레이트의 웰에 분배된다. 상이한 제1 폴리뉴클레오티드는 각각의 웰에 분배된다. 각각의 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함하여, 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 제1 폴리뉴클레오티드는 프로파르길 모이어티를 갖는 P5 서열, 인덱스 A, 및 3' 말단을 포함한다. 각각의 웰에서 제1 폴리뉴클레오티드는 상이한 웰에 제1 폴리뉴클레오티드와 상이한 인덱스 A를 갖는다. 비이드는 풀링되고 제2 96 웰 플레이트의 웰에 분배된다.A plurality of beads are coated with streptavidin and dispensed into wells of a first 96 well plate. A different first polynucleotide is distributed to each well. Each first polynucleotide includes a 5' end linked to biotin, such that the first polynucleotide is bound to the bead via a biotin/streptavidin binding pair. The first polynucleotide includes a P5 sequence with a propargyl moiety, index A, and a 3' end. The first polynucleotide in each well has a different index A than the first polynucleotide in a different well. Beads are pooled and dispensed into wells of a second 96 well plate.
제2 폴리뉴클레오티드는 제2 96 웰 플레이트의 웰 각각에 첨가된다. 제2 폴리뉴클레오티드는 아자이드 모이어티를 갖는 인덱스 B 및 5' 말단을 포함한다. 인덱스 B는 각각의 웰에 대해 상이하다. 구리 촉매작용된 클릭 반응은 각각의 웰에서 수행되고, 제1 및 제2 폴리뉴클레오티드의 결합을 야기한다. 비이드-연결된 폴리뉴클레오티드는 프로파르길 모이어티를 포함하는 단일 뉴클레오티드를 첨가하기 위해 TdT로 처리된다. 비이드는 풀링되고 제3 96 웰 플레이트의 웰에 분배된다.A second polynucleotide is added to each well of a second 96 well plate. The second polynucleotide includes an index B and a 5' end with an azide moiety. Index B is different for each well. A copper-catalyzed click reaction is performed in each well, resulting in the binding of the first and second polynucleotides. Bead-linked polynucleotides are treated with TdT to add a single nucleotide containing a propargyl moiety. Beads are pooled and dispensed into wells of a third 96 well plate.
추가적 폴리뉴클레오티드는 제2 폴리뉴클레오티드의 3' 말단에 첨가된다. 인덱스 C 및 아자이드 모이어티를 갖는 5' 말단을 포함하는 제3 폴리뉴클레오티드는 추가적 클릭 반응을 통해 비이드-연결된 폴리뉴클레오티드를 추가로 연장시키는 데 사용될 수 있다. 인덱스 C는 각각의 웰에 대해 상이하다.Additional polynucleotides are added to the 3' end of the second polynucleotide. A third polynucleotide comprising index C and a 5' end with an azide moiety can be used to further extend the bead-linked polynucleotide via an additional click reaction. Index C is different for each well.
실시예 2-폴리머라아제 연장을 포함하는 조합 인덱싱Example 2 - Combination Indexing Including Polymerase Extension
복수의 비이드는 스트렙타비딘으로 코팅되고, 제1 96 웰 플레이트의 웰에 분배된다. 상이한 제1 폴리뉴클레오티드는 각각의 웰에 분배된다. 각각의 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함하여, 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 제1 폴리뉴클레오티드는 P5 서열, 인덱스 A, 및 8개의 뉴클레오티드 제1 링커를 포함한다. 각각의 웰에서 제1 폴리뉴클레오티드는 상이한 웰에 제1 폴리뉴클레오티드와 상이한 인덱스 A를 갖는다. 비이드는 풀링되고 제2 96 웰 플레이트의 웰에 분배된다.A plurality of beads are coated with streptavidin and dispensed into wells of a first 96 well plate. A different first polynucleotide is distributed to each well. Each first polynucleotide includes a 5' end linked to biotin, such that the first polynucleotide is bound to the bead via a biotin/streptavidin binding pair. The first polynucleotide includes a P5 sequence, index A, and an 8 nucleotide first linker. The first polynucleotide in each well has a different index A than the first polynucleotide in a different well. Beads are pooled and dispensed into wells of a second 96 well plate.
제1 어댑터는 제2 96 웰 플레이트의 웰 각각에 첨가된다. 제1 어댑터는 제1 링커, 인덱스 B' 서열, 및 링커 2a'에 혼성화될 수 있는 영역을 포함한다. 인덱스 B' 서열은 각각의 웰에 대해 상이하다. 제1 어댑터는 제1 링커에 혼성화되고, 제1 폴리뉴클레오티드는 폴리머라아제의 존재 하에 연장되어 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제1 어댑터는 비이드로부터 제거된다. 비이드는 풀링되고, 제3 96 웰 플레이트의 웰에 분배된다.The first adapter is added to each well of a second 96 well plate. The first adapter includes a first linker, an index B' sequence, and a region capable of hybridizing to
제2 어댑터는 제3 96 웰 플레이트의 웰 각각에 첨가된다. 제2 어댑터는 링커 2a, 인덱스 C', 및 포획 프로브'(Hyb')에 혼성화될 수 있는 영역을 포함한다. 일부 실시형태에서, 포획 프로브는, 범용 트랜스포좀이 비이드-연결된 oligo의 3' 말단에 부착되고, 인덱싱과 관련이 없을 수 있는 특정 적용에 유용하다(즉, 이는 적용에 따라 임의의 서열일 수 있음). 인덱스 C' 서열은 각각의 웰에 대해 상이하다. 제2 어댑터는 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드의 링커 2a 영역에 혼성화되고, 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드는 폴리머라아제의 존재 하에 추가로 연장되어 인덱스 A, B, 및 C, 및 포획 프로브(Hyb)를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제2 어댑터는 비이드로부터 제거된다.A second adapter is added to each well of a third 96 well plate. The second adapter includes
실시예 3-이중-가닥 단편의 결찰을 포함하는 조합 인덱싱Example 3 - Combinatorial indexing involving ligation of double-stranded fragments
복수의 비이드는 스트렙타비딘으로 코팅되고, 제1 96 웰 플레이트의 웰에 분배된다. 상이한 제1 폴리뉴클레오티드는 각각의 웰에 분배된다. 각각의 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함하여, 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 제1 폴리뉴클레오티드는 P5 서열, 인덱스 A, 및 8개의 뉴클레오티드 제1 링커를 포함한다. 각각의 웰에서 제1 폴리뉴클레오티드는 상이한 웰에 제1 폴리뉴클레오티드와 상이한 인덱스 A를 갖는다. 비이드는 풀링되고 제2 96 웰 플레이트의 웰에 분배된다.A plurality of beads are coated with streptavidin and dispensed into wells of a first 96 well plate. A different first polynucleotide is distributed to each well. Each first polynucleotide includes a 5' end linked to biotin, such that the first polynucleotide is bound to the bead via a biotin/streptavidin binding pair. The first polynucleotide includes a P5 sequence, index A, and an 8 nucleotide first linker. The first polynucleotide in each well has a different index A than the first polynucleotide in a different well. Beads are pooled and dispensed into wells of a second 96 well plate.
제1 어댑터는 제2 96 웰 플레이트의 웰 각각에 첨가된다. 제1 어댑터는 제1 링커에 혼성화될 수 있는 영역, 인덱스 B를 포함하는 이중 가닥 영역, 및 제2 링커(link 2a)를 포함하는 영역을 포함하는 단일 가닥 5' 오버행을 포함한다. 인덱스 B는 각각의 웰에 대해 상이하다. 제1 어댑터는 제1 링커에 혼성화된다. 제1 어댑터는, 각각 리가아제를 사용한 결찰에 의해, 또는 화학 결찰에 의해, 제1 폴리뉴클레오티드 및 어댑터의 링커 1a 및 인덱스 B 영역을 통해 제1 폴리뉴클레오티드에 공유 결합되어, 인덱스 A 및 B를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제1 폴리뉴클레오티드에 공유 결합되지 않은 제1 어댑터의 가닥이 제거된다. 비이드는 풀링되고, 제3 96 웰 플레이트의 웰에 분배된다.The first adapter is added to each well of a second 96 well plate. The first adapter comprises a single stranded 5' overhang comprising a region hybridizable to the first linker, a double stranded region comprising index B, and a region comprising the second linker (
제2 어댑터는 제3 96 웰 플레이트의 웰 각각에 첨가된다. 제2 어댑터는 제2 링커에 혼성화될 수 있는 영역을 포함하는 단일 가닥 5' 오버행, 인덱스 C를 포함하는 이중 가닥 영역 및 포획 프로브(Hyb)를 포함한다. 제2 어댑터는 제2 링커에 혼성화된다. 제2 어댑터는 각각 리가아제를 사용한 결찰에 의해, 또는 화학 결찰에 의해, 제1 폴리뉴클레오티드 및 어댑터의 링커 1a 및 인덱스 B 영역을 통해 연장된 제1 폴리뉴클레오티드에 공유 결합되어, 인덱스 A, B, 및 C 및 포획 프로브(Hyb)를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 인덱스 A, B, 및 C 및 포획 프로브(Hyb)를 포함하는 연장된 폴리뉴클레오티드에 공유 결합되지 않은 제2 어댑터의 가닥은 비이드로부터 제거된다.A second adapter is added to each well of a third 96 well plate. The second adapter includes a single stranded 5' overhang comprising a region hybridizable to the second linker, a double stranded region comprising index C, and a capture probe (Hyb). The second adapter hybridizes to the second linker. The second adapter is covalently linked to the first polynucleotide and the first polynucleotide extending through the
실시예 4-스플린트 결찰을 포함하는 조합 인덱싱Example 4 - Combination Indexing Including Splint Ligation
복수의 비이드는 스트렙타비딘으로 코팅되고, 제1 96 웰 플레이트의 웰에 분배된다. 상이한 제1 폴리뉴클레오티드는 각각의 웰에 분배된다. 각각의 제1 폴리뉴클레오티드는 비오틴에 연결된 5' 말단을 포함하여, 제1 폴리뉴클레오티드는 비오틴/스트렙타비딘 결합 쌍을 통해 비이드에 결합된다. 제1 폴리뉴클레오티드는 P5 서열, 인덱스 A, 및 제1 링커를 포함한다. 각각의 웰에서 제1 폴리뉴클레오티드는 상이한 웰에 제1 폴리뉴클레오티드와 상이한 인덱스 A를 갖는다. 비이드는 풀링되고 제2 96 웰 플레이트의 웰에 분배된다.A plurality of beads are coated with streptavidin and dispensed into wells of a first 96 well plate. A different first polynucleotide is distributed to each well. Each first polynucleotide includes a 5' end linked to biotin, such that the first polynucleotide is bound to the bead via a biotin/streptavidin binding pair. The first polynucleotide includes a P5 sequence, index A, and a first linker. The first polynucleotide in each well has a different index A than the first polynucleotide in a different well. Beads are pooled and dispensed into wells of a second 96 well plate.
제2 폴리뉴클레오티드는 제2 96 웰 플레이트의 웰 각각에 첨가된다. 제2 폴리뉴클레오티드는 제2 링커(Link1b), 인덱스 B, 및 제3 링커(Link 2a)를 포함한다. 인덱스 B는 각각의 웰에 대해 상이하다. 제1 링커에 혼성화될 수 있는 영역 및 제2 링커에 혼성화될 수 있는 영역을 포함하는, 단일-가닥 제1 어댑터, 예컨대 스플린트는 각각의 웰에 첨가된다. 제1 어댑터는 제1 폴리뉴클레오티드의 제1 링커, 및 제2 폴리뉴클레오티드의 제2 링커 둘 모두에 혼성화된다. 제1 폴리뉴클레오티드는 결찰에 의해, 예컨대 리가아제의 사용에 의해 제2 폴리뉴클레오티드에 공유 결합되어, 인덱스 A 및 B 및 제3 링커(Link 2a)를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제1 어댑터는 제거된다. 비이드는 풀링되고, 제3 96 웰 플레이트의 웰에 분배된다.A second polynucleotide is added to each well of a second 96 well plate. The second polynucleotide includes a second linker (Link1b), index B, and a third linker (
제3 폴리뉴클레오티드는 제3 96 웰 플레이트의 웰 각각에 첨가된다. 제3 폴리뉴클레오티드는 제4 링커(Link 2b), 인덱스 C, 및 포획 프로브(Hyb)를 포함한다. 인덱스 B는 각각의 웰에 대해 상이하다. 제3 링커에 혼성화될 수 있는 영역 및 제4 링커에 혼성화될 수 있는 영역을 포함하는, 단일-가닥 제2 어댑터, 예컨대 스플린트는 각각의 웰에 첨가된다. 제2 어댑터는 연장된 폴리뉴클레오티드의 제3 링커, 및 제3 폴리뉴클레오티드의 제4 링커 둘 모두에 혼성화된다. 제3 폴리뉴클레오티드는 결찰에 의해, 예컨대 리가아제의 사용에 의해 연장된 폴리뉴클레오티드에 공유 결합되어, 인덱스 A, B, 및 C, 및 캡처 프로브를 포함하는 연장된 폴리뉴클레오티드를 수득한다. 제2 어댑터는 비이드로부터 제거된다.A third polynucleotide is added to each well of a third 96 well plate. The third polynucleotide includes a fourth linker (Link 2b), index C, and a capture probe (Hyb). Index B is different for each well. A single-stranded second adapter, such as a splint, comprising a region hybridizable to a third linker and a region hybridizable to a fourth linker is added to each well. The second adapter hybridizes to both the third linker of the extended polynucleotide and the fourth linker of the third polynucleotide. A third polynucleotide is covalently linked to the extended polynucleotide by ligation, such as by use of a ligase, to obtain an extended polynucleotide comprising indices A, B, and C, and a capture probe. The second adapter is removed from the bead.
실시예 5-폴리머라아제 연장을 포함하는 조합 인덱싱Example 5 - Combination Indexing Including Polymerase Extension
폴리머라아제 연장을 포함하는 조합 인덱싱(예를 들어, 도 4 참조)은 스플린트 결찰을 포함하는 조합 인덱싱(예를 들어, 도 2 참조)과 비교되었다. 폴리머라아제 연장에 의한 2-레벨 인덱싱 프로토콜은 포획 올리고뉴클레오티드(P5-인덱스 A-Link 1a), 및 연장 주형(Link 1a'-인덱스 B'-Hyb')을 갖는 비이드를 사용하여 수행되었다. 폴리머라아제 연장은 엑소뉴클레아제 활성과 함께 및 없이 상이한 양의 주형, 및 T4 폴리머라아제로 수행되었다. 포획 프로브의 수 및 전장 생성물의 수는 도 7a에 나타낸 위치에서 프라이머로 정량적 PCR(qPCR)을 사용하여 측정되었다. 도 7b에 나타낸 바와 같이, (1) T4 폴리머라아제(Exo+)는 포획 프로브 및 연장 주형을 분해시키고; (2) T4 폴리머라아제(Exo-)는 감소된 포획 올리고뉴클레오티드의 분해를 나타내고; (3) 포획 oligo에 대한 50X 과량의 연장 주형(330 fmol/ug)은, T4 폴리머라아제(Exo-)를 사용한 전장 연장에 충분하였다.Combinatorial indexing involving polymerase extension (see, e.g., Figure 4) was compared to combinatorial indexing involving splint ligation (see, e.g., Figure 2). The two-level indexing protocol by polymerase extension was performed using beads with capture oligonucleotides (P5-
도 8a 및 도 8b는 3-레벨 인덱싱 프로토콜에서 시험된 다양한 조건을 요약한다. 부피는 중복으로 25 μl/조건이었다. 폴리머라아제 연장은 20℃(회전 없음)에서 15분 동안 및 NaOH 연장 oligo 변성과 함께 수행되었다. 스플린트 결찰은 밤새 및 4시간(회전 없음) 동안 그리고 60℃ 스플린트 변성과 함께 수행되었다. 판독은 정량적 PCR(qPCR) 검정, 및 직접적 비이드코드 서열분석을 포함하였다. qPCR의 경우, 화학적으로 합성된 전장 대조군 oligo(상응하는 3-레벨 PE 또는 SL oligo와 동일한 서열)가 사용되어 정량화를 위한 표준 곡선을 생성하였다. 스플린트 결찰(SL) 제2-레벨 및 제3-레벨 앰플리콘의 농도는 크기 차이에 대해 조정되었다.Figures 8A and 8B summarize the various conditions tested in the 3-level indexing protocol. The volume was 25 μl/condition in duplicate. Polymerase extension was performed at 20°C (no rotation) for 15 min and with NaOH extension oligo denaturation. Splint ligation was performed overnight and for 4 h (no rotation) and at 60°C with splint denaturation. Reads included quantitative PCR (qPCR) assays, and direct Beadcode sequencing. For qPCR, a chemically synthesized full-length control oligo (same sequence as the corresponding 3-level PE or SL oligo) was used to generate a standard curve for quantification. Concentrations of splint ligation (SL) second-level and third-level amplicons were adjusted for size differences.
도 9는 qPCR 결과를 요약하고 PE(8)가 SL(12)보다 더 적은 전장 oligo를 제공한다는 것을 나타낸다. 합성의 효능은 SL에 비해 PE에 관하여 더 낮았고, 예를 들어 PE: oligo의 20%가 전장이고, SL: oligo의 40%가 전장이며, 이는 제2 결찰이 제1 결찰(12)보다 훨씬 덜 효율적이기 때문이고/이거나 회전 없이 20℃ 인큐베이션으로 인한 것일 수 있다. PE를 겪은 샘플은 전장(FL) PE(1) 및 SL(10-12)에 비해 더 낮은 포획 oligo(CO) 분자/비이드(3-8)를 나타냈다. 각각의 연장은 CO 분자/비이드(3-5 대 6-8)를 감소시켰다. 일부 상실은 비이드에서 Bio-oligo를 스트리핑(stripping)하는 NaOH 세척으로 인한 것이었다. 일부 상실은 (6) 대 (7&8), 및 (3) 대 (5)에서와 같이 oligo를 츄잉백(chewing back)하는 T4 폴리머라아제로 인한 것이었을 수 있지만, 이는 (3) 대 (4)에서 관찰되지 않았다.Figure 9 summarizes the qPCR results and shows that PE(8) provides less full-length oligo than SL(12). The efficacy of the synthesis was lower for PE compared to SL, e.g. PE: 20% of the oligo is full length, SL: 40% of the oligo is full length, meaning that the second ligation is much less efficient than the first ligation (12). This may be due to efficiency and/or due to incubation at 20°C without rotation. Samples that underwent PE showed lower captured oligo(CO) molecules/beads (3-8) compared to full-length (FL) PE (1) and SL (10-12). Each extension reduced CO molecules/beads (3-5 vs. 6-8). Some loss was due to NaOH washing, stripping the Bio-oligo from the beads. Some loss may have been due to T4 polymerase chewing back the oligo, as in (6) vs. (7&8), and (3) vs. (5), but this was not observed in
변성 단계에서 0.2 N NaOH의 효과가 시험되었다. 5' 비오틴 또는 5' dd비오틴을 통해 비이드에 결합된 6.6 fmol 제1 레벨 oligo(B1 인덱스)를 갖는 비이드는 5가지 상이한 변성 처리 및 대조군에서 연장 / 결찰 없이 사용되었다: 없음(- 대조군); 변성 없음, 단지 세척 단계(레벨마다 2회 세척, 총 4회); 2x 60℃ 열 변성 + 세척; 2x 80℃ 열 변성 + 세척; 1x 0.2 N NaOH 변성 + 세척; 및 2x 0.2 N NaOH 변성 + 세척. 남은 oligo는 qPCR w/ 제1 레벨 프라이머에 의해 측정되었다. 결과는 도 10에 요약되어 있고, 이는 0.2 N NaOH 변성이 비오틴-특이적 CO 상실을 야기하였음을 나타낸다.The effect of 0.2 N NaOH in the denaturation step was tested. Beads with 6.6 fmol first level oligo (B1 index) bound to the beads via 5' biotin or 5' dd biotin were used without extension/ligation in five different denaturation treatments and controls: none (- control) ; No denaturation, just washing steps (2 washes per level, 4 total);
직접적 비이드코드 서열분석은 3-레벨 인덱싱에 대해 수행되었다. 간략하게, 이러한 검정은 Hyb 영역을 표적으로 하는 역방향 프라이머 및 P5 정방향 프라이머를 사용하여, PCR에 의해 비이드의 합성된 비이드코드 oligo를 증폭시키는 것을 포함한다. 역방향 프라이머는 클러스터링(clustering)을 가능하게 하기 위해 샘플 인덱스, ME_V2_B15 서열분석 프라이머에 대한 결합 영역, 및 P7' 서열을 도입한다. 도 11a는 분석에 대한 리드 방향을 개괄한다. 분석은 서열의 염기 변화 오류를 나타내는 결실 및 추정 'SNP'의 식별을 포함하는 오류 콜링(calling)을 갖는 예상된 서열에 대한 각각의 리드의 트리밍 및 쌍별 정렬을 포함한다. 완전히 정확한 인덱스는 인덱스 영역에 걸쳐, 예를 들어 3-레벨 인덱스: 인덱스 1, 인덱스 2, 및 인덱스 3에서 오류(SNP, 인델)를 포함하지 않았다. 모든 이용가능한 인덱스는 인덱스 오류 수정 구현에 의해 정확하게 디코딩될 수 있는 인덱스를 포함하였다. 도 11b 및 도 11c는 완전히 정확한 서열, 이용가능한 인덱스, 및 염기당 오류율에 대한 레벨을 나타낸다. 스플린트 결찰은 폴리머라아제 연장보다 더 효율적인 한편, 둘 모두가 유사한 오류 레벨을 가졌다.Direct beadcode sequencing was performed for 3-level indexing. Briefly, this assay involves amplifying the synthesized Beadcode oligo of beads by PCR, using a reverse primer targeting the Hyb region and a P5 forward primer. The reverse primer introduces a sample index, a binding region for the ME_V2_B15 sequencing primer, and a P7' sequence to enable clustering. Figure 11A outlines the lead directions for analysis. Analysis involves trimming and pairwise alignment of each read to the expected sequence with error calling, including identification of deletions and putative 'SNPs' that represent base change errors in the sequence. A completely accurate index contained no errors (SNPs, indels) across the index region, for example, in a 3-level index:
상기 연구로부터, 3-레벨 폴리머라아제 연장은 스플린트 결찰보다 더 적은 전장 분자를 생성하였다. 0.2 N NaOH 변성 및 T4 폴리머라아제 엑소뉴클레아제 활성의 부가는 전체 포획 oligo의 감소에 기여한 것으로 보인다. 폴리머라아제 연장은 이러한 실험에서 스플린트 결찰보다 덜 유효한 것으로 드러났다. 0.2 N NaOH 변성은 비이드로부터 비오티닐화 oligo의 상실을 야기하였지만, 이는 단일 5' 비오틴을 5' 이중 데스티오비오틴으로 대체함으로써 완화될 수 있다. 합성된 폴리머라아제 연장 oligo는 스플린트 결찰 방법에 비해 유사한 오류 레벨을 가졌다.From the above study, 3-level polymerase extension produced fewer full-length molecules than splint ligation. 0.2 N NaOH denaturation and addition of T4 polymerase exonuclease activity appear to have contributed to the reduction of total captured oligo. Polymerase extension proved to be less effective than splint ligation in these experiments. 0.2 N NaOH denaturation resulted in loss of biotinylated oligo from the beads, but this could be alleviated by replacing single 5' biotin with 5' double desthiobiotin. The synthesized polymerase-extended oligo had similar error levels compared to the splint ligation method.
실시예 6-이중-가닥 스플린트 결찰을 갖는 2-레벨 인덱싱Example 6 - Two-level indexing with double-strand splint ligation
이중-가닥 스플린트 결찰을 포함하는 2-레벨 인덱싱은 스플린트 결찰을 포함하는 2-레벨 인덱싱(표준)과 비교되었다. 스플린트 결찰, 및 이중-가닥 스플린트 결찰에 의한 표준 조합 인덱싱의 개괄은 도 12a에 나타나 있다. 이중-가닥 방법에서 표준 스플린트 결찰과 비교하여, 스플린트의 5' 절반은 제2 레벨 인덱스에 상보적일 수 있어, 인덱스 사이의 공통 서열 길이를 절반으로 감소시킬 수 있다. 시험된 프로토콜 및 조건의 개괄은 도 12b에 도시되어 있다.Two-level indexing with double-strand splint ligation was compared to two-level indexing with splint ligation (standard). An overview of standard combinatorial indexing by splint ligation, and double-strand splint ligation is shown in Figure 12A. Compared to standard splint ligation in the double-stranded method, the 5' half of the splint can be complementary to the second level index, reducing the common sequence length between the indexes by half. An overview of the protocols and conditions tested is shown in Figure 12B.
qPCR 검정이 수행되었고, 전장 스플린트 결찰 및 이중-가닥 결찰 oligo가 사용되어 표준 곡선을 생성하였다. 프라이머 위치는, 생성물이 F2 및 R2 또는 F3 및 R2를 포함하는 프라이머 조합을 사용하여 측정되는 이중 가닥 스플린트 결찰(ds인덱스 결찰)을 포함하는 조합 인덱싱, 및 스플린트 결찰(표준)을 포함하는 조합 인덱싱에 관하여 도 12c에 나타나 있다. 농도는 각각의 샘플에 대해 적절한 표준 곡선을 사용하여 측정되었다. 도 13a는 qPCR의 결과를 도시하고, 도 13b 및 도 13c는 합성된 ds 인덱스 결찰 oligo가 스플린트 결찰 oligo와 유사한 정규화된 qPCR에 관한 결과를 도시한다. SL 및 DS 전장 대조군 oligo 사이의 차등 증폭을 위해 정규화한 이후, DS-결찰된 및 스플린트-결찰된 oligo는 유사한 성능을 나타냈다.qPCR assays were performed and full-length splint ligation and double-strand ligation oligos were used to generate standard curves. Primer positions are divided into combinatorial indexing, which includes double-stranded splint ligation (dsindex ligation), where the product is determined using primer combinations containing F2 and R2 or F3 and R2, and combinatorial indexing, which includes splint ligation (standard). This is shown in Figure 12c. Concentrations were determined using the appropriate standard curve for each sample. Figure 13A shows the results of qPCR, and Figures 13B and 13C show the results for normalized qPCR where the synthesized ds index ligation oligo is similar to the splint ligation oligo. After normalizing for differential amplification between SL and DS full-length control oligos, DS-ligated and splint-ligated oligos showed similar performance.
이중-가닥 스플린트 결찰은 ds 인덱스 oligo의 양을 증가시키면서 수행되었고, 생성물은 qPCR로 측정하였다. 도 13d에 도시된 바와 같이, 생성물의 양의 실질적인 증가가 없었다. 이중-가닥 스플린트 결찰은 인덱스 1에 상보적인 oligo의 존재 하에 수행되었고, 생성물은 qPCR로 측정하였다. 도 13e에 도시된 바와 같이, 이중-가닥 스플린트 결찰이 인덱스 1에 상보적인 oligo의 존재 하에 수행되는 생성물의 양의 실질적인 증가는 없었다. 이중-가닥 스플린트 결찰은 3'ddC를 갖는 oligo로 수행되었고, 생성물은 qPCR로 측정하였다. 도 13f에 도시된 바와 같이, 이중-가닥 스플린트 결찰이 3'ddC를 갖는 oligo로 수행된 생성물의 양의 실질적인 증가가 없었다. 이중-가닥 스플린트 결찰은 실온 또는 75℃에서 결찰전 인큐베이션을 포함하여 수행되었고, 생성물은 qPCR로 측정하였다. 도 13g에 도시된 바와 같이, 이중-가닥 스플린트 결찰이 실온 또는 75℃에서 결찰전 인큐베이션으로 수행되는 생성물의 양의 실질적인 증가가 없었다.Double-strand splint ligation was performed with increasing amounts of ds index oligo, and the products were measured by qPCR. As shown in Figure 13D, there was no substantial increase in the amount of product. Double-strand splint ligation was performed in the presence of an oligo complementary to
2-레벨 이중-가닥 인덱스 결찰에 관한 직접적 비이드코드 서열분석이 수행되었다. 결과는 도 14a 및 도 14b에 요약된다.Direct beadcode sequencing of two-level double-stranded index ligation was performed. The results are summarized in Figures 14A and 14B.
상기 2-레벨 실험으로부터, 이중-가닥 인덱스 결찰은 qPCR에 의해 측정된 스플린트 결찰과 유사한 결과를 제공하였다. 33 fmol/μg 비이드 초과의 이중-가닥 인덱스 양의 경우, 단일 결찰을 사용한 전장 생성물의 실질적인 증가 또는 비이드코드 내의 오류의 증가가 없었다. 하기 조작은 거의 효과가 없었다: (1) 인덱스1에 상보적인 oligo의 부가; (2) 3' ddC 개질의 제거; 또는 (3) 실온 인큐베이션에 의한 75℃에서 결찰전 인큐베이션의 대체. 또한, 비이드코드 서열분석은 스플린트 결찰에 비해 이중-가닥 결찰에 의해 더 적은 오류를 나타냈다.From the above two-level experiments, double-strand index ligation gave similar results to splint ligation as measured by qPCR. For double-strand index amounts above 33 fmol/μg beads, there was no substantial increase in full-length product using single ligation or an increase in errors within the beadcode. The following manipulations had little effect: (1) addition of an oligo complementary to
실시예 7-이중-가닥 스플린트 결찰을 갖는 3-레벨 인덱싱Example 7 - 3-Level Indexing with Double-Strand Splint Ligation
이중-가닥 스플린트 결찰을 포함하는 3-레벨 인덱싱은 스플린트 결찰(표준)을 포함하는 3-레벨 인덱싱과 비교되었다. 실험 설계의 개괄은 도 15a 및 도 15b에 나타나 있다.3-level indexing with double-strand splint ligation was compared to 3-level indexing with splint ligation (standard). An overview of the experimental design is shown in Figures 15A and 15B.
qPCR은 이중-가닥 스플린트 결찰 또는 스플린트 결찰을 사용하여 3-레벨 인덱싱된 생성물에서 수행되었다. 전장 이중-가닥 결찰 인덱스 대조군은 표준 곡선(고순도)으로서 사용되었고, 스플린트 결찰 앰플리콘(amplicon)의 농도는 크기-조정되었다. 결과는 도 16a에 요약되어 있다. 스플린트 결찰의 경우, 80℃에서의 변성은 oligo의 총 수를 감소시켰고(2 대 3), 50℃에서의 어닐링은 oligo의 총 수를 약간 증가시켰다(3 대 4). 스플린트 결찰 대 ds 결찰의 경우, 50℃에서의 어닐링 및 80C에서의 변성은 스플린트 및 ds 결찰 방법을 사용하여 필적하는 수의 전장 oligo를 제공하였고(4 대 7), oligo는 전장이었고(제3-레벨 대 bio-oligo), ds 결찰은 제2 레벨 oligo의 더 적은 수를 나타냈다. 전장 대조군의 경우, 아마도 순도 문제로 인해 더 적은 분자의 총 수가 존재할 수 있다.qPCR was performed on 3-level indexed products using double-strand splint ligation or splint ligation. The full-length double-strand ligation index control was used as a standard curve (high purity), and the concentration of splint ligation amplicons was size-adjusted. The results are summarized in Figure 16A. For splint ligation, denaturation at 80°C decreased the total number of oligos (2 vs. 3), and annealing at 50°C slightly increased the total number of oligos (3 vs. 4). For splint ligation versus ds ligation, annealing at 50°C and denaturation at 80°C gave comparable numbers of full-length oligos (4 vs. 7) using the splint and ds ligation methods, and the oligos were full-length (3-4%). level vs. bio-oligo), ds ligation revealed lower numbers of second level oligo. For the full-length control, there may be a lower total number of molecules, possibly due to purity issues.
3-레벨 이중-가닥 인덱스 결찰에 관한 직접적 비이드코드 서열분석이 수행되었다. 결과는 도 16b 및 도 16c에 요약된다.Direct beadcode sequencing of 3-level double-stranded index ligation was performed. The results are summarized in Figures 16B and 16C.
상기 이중-가닥 스플린트 결찰 연구로부터, 스플린트 결찰 및 ds 결찰은 필적하는 수의 전장 oligo를 제공하였고, 80℃에서의 변성은 일부 포획 올리고뉴클레오티드(CO)의 상실을 야기하였으나, 50℃에서의 어닐링은 CO의 수를 약간 증가시켰다. ds 결찰에 의해 합성된 CO는 스플린트 결찰에 의해 합성된 CO보다 더 적은 오류를 가졌다.From the above double-strand splint ligation studies, splint ligation and ds ligation gave comparable numbers of full-length oligos, denaturation at 80°C resulted in loss of some capture oligonucleotides (CO), but annealing at 50°C resulted in The number of CO was slightly increased. CO synthesized by ds ligation had fewer errors than CO synthesized by splint ligation.
실시예Example 8-LNA-함유 8-LNA-containing 스플린트splint oligooligo
짧아진 제1 스플린트(캥거루 스플린트(kangaroo splint))는 잠금 핵산 뉴클레오티드(LNA)를 함유하도록 설계된다. 캥거루 스플린트는 하기 서열을 기반으로 한다: (서열 번호:03) ATGCTCTAGACAAGT/3ddC, 여기서 '3ddC'는 3' 디데옥시시티딘임. 생성된 스플린트는 5' 말단 및 3' 말단 둘 모두로부터 짧아진 것(모두 마지막 염기 디데옥시-시티딘(ddC)을 유지함), 및 모든 가능한 LNA 치환을 함유하는 것을 포함한다. 생성된 oligo는 IDT의 OligoAnalyzer(Integrated DNA Technologies™, 아이오와주 코랄빌 소재)로 분석된다. 생성된 oligo는 하기를 포함하는 LNA oligo에 대한 Qiagen의 설계 가이드라인을 따라 선택된다: 30-60% 사이의 GC 함량; <4개의 연속 LNA 염기; <3개의 연속 Gs 또는 Cs. 생성된 oligo는 본래의 스플린트와 유사한 Tm을 갖고 결찰 부위에 상보적인 염기 위치에 임의의 LNA를 갖지 않도록 선택된다. 생성된 oligo는 실온에서 2차 구조 또는 자가-혼성화가 없고, P5 또는 Hyb 서열에 상보적이지 않도록 선택된다. 표 2는 3개의 예시적 oligo를 열거한다.The shortened first splint (kangaroo splint) is designed to contain locked nucleic acid nucleotides (LNA). The kangaroo splint is based on the following sequence: (SEQ ID NO:03) ATGCTCTAGACAAGT/3ddC, where '3ddC' is 3' dideoxycytidine. The resulting splints include shortening from both the 5' and 3' ends (all retaining the last base dideoxy-cytidine (ddC)), and containing all possible LNA substitutions. The resulting oligos are analyzed with IDT's OligoAnalyzer (Integrated DNA Technologies™, Coralville, Iowa). The resulting oligos are selected following Qiagen's design guidelines for LNA oligos, including: GC content between 30-60%; <4 consecutive LNA bases; <3 consecutive Gs or Cs. The resulting oligo is selected to have a Tm similar to the native splint and not to have any LNA at base positions complementary to the ligation site. The resulting oligo is selected to be free of secondary structure or self-hybridization at room temperature and not complementary to the P5 or Hyb sequence. Table 2 lists three example oligos.
[표 2][Table 2]
5' 및 3' TM은 하기 설정(결찰 반응 기준)으로 IDT의 oligo 분석기를 사용하여 계산된다: 1.98 μM oligo, 100 mM Na+, 7.9 mM Mg++. 전장 TM은 하기 설정(스플린트 변성 기준)으로 IDT의 oligo 분석기를 사용하여 계산된다: 0.05 μM oligo, 100 mM Na+. 실험의 개괄은 도 17에 나타나 있다.5' and 3' TMs are calculated using IDT's oligo analyzer with the following settings (based on ligation reaction): 1.98 μM oligo, 100 mM Na + , 7.9 mM Mg ++ . Full-length TM is calculated using IDT's oligo analyzer with the following settings (based on splint denaturation): 0.05 μM oligo, 100 mM Na + . An overview of the experiment is shown in Figure 17.
실시예Example 9-링커 서열 길이를 감소시키기 위한 To reduce 9-linker sequence length 개질된reformed 스플린트splint 올리고뉴클레오티드 oligonucleotide
Phos-oligo 스플린트 혼성화 서열이 6개의 뉴클레오티드로 감소되고 G/C 함량이 증가된 추가 스플린트가 설계되었다. 다중 스플린트는 신규한 phos-oligo에 대해 설계되었다. 설계된 스플린트의 개괄은 도 18a에 나타나 있고, 이는 표 3에 열거된 서열을 나타내고, 여기서 X는 이노신이다.Additional splints were designed with the Phos-oligo splint hybridization sequence reduced to 6 nucleotides and the G/C content increased. Multiple splints were designed for the novel phos-oligo. An overview of the designed splints is shown in Figure 18A, which represents the sequences listed in Table 3, where X is inosine.
[표 3][Table 3]
실험 조건의 요약은 도 18b에 나타나 있다. 시험된 조건은 열 순환기(회전 없음)에서 밤새 수행된 20℃ 대 12℃ 스플린트 결찰을 포함하였다. DS oligo 어닐링은 스냅-냉각 프로토콜(75℃에서 인큐베이션, 얼음에 즉시 전달됨) 또는 느린 어닐링(샘플은 열순환기에서 75℃에서 인큐베이션된 후, 혼도는 1℃/30s의 감소 속도로 낮춰짐)을 사용하여 수행되었다. qPCR은 포획 및 전장 oligo를 측정하였다. 결과는 도 18c에 요약되고, 이는 재설계된 6개의 뉴클레오티드 p-oligo/스플린트를 사용하여 약 10-20% 적은 결찰이 존재하였음을 나타낸다. 재설계된 4개의 뉴클레오티드 스플린트를 사용하여 약 40-50% 적은 결찰이 존재하였다. 시험된 스플린트의 가장 짧은 스플린트의 3' 부분을 갖는 도 18a에 나타낸 '6bp_New_6bp-K 스플린트'를 사용한 결과로부터, 스플린트의 3' 절반의 단지 6개의 뉴클레오티드로의 감소가 결찰 효율을 ~90% 감소시킨 것으로 추론되었다. 느린 어닐링은 전장 oligo의 수에 대해 거의 영향을 미치지 않았다. 이노신 염기의 첨가는 개선된 결찰 효능을 갖지 않을 수 있다. 염기를 이노신으로 대체하는 것은 감소된 결찰 효율을 가질 수 있다. 요약하면, 스플린트 서열의 재설계 및 스플린트의 5' 말단의 6개의 뉴클레오티드 및 4개의 뉴클레오티드로의 짧아짐은, 심지어 결찰이 스플린트 Tm 미만에서 수행된 경우에도 결찰 효율을 감소시켰다. 스플린트의 5' 말단에 대한 이노신의 첨가는 결찰 효율을 개선시키지 않았다. 스플린트의 5' 말단에서의 염기의 이노신으로의 대체는 결찰 효율을 감소시켰다. 느린 어닐링은 결찰 효율에 대해 거의 영향을 미치지 않는 것으로 밝혀졌다. 짧아진 링커 서열을 갖는 비이드-연결된 인덱싱된 올리고뉴클레오티드의 제조에서의 결찰 효율의 감소는, 감소된 길이를 갖는 링커 서열의 사용을 포함하는 서열분석 작업흐름의 증가된 효율보다 더 중요할 수 있다.A summary of the experimental conditions is shown in Figure 18b. Conditions tested included 20°C versus 12°C splint ligation performed overnight in a thermal cycler (no rotation). DS oligo annealing uses either a snap-cooling protocol (incubation at 75 °C, immediately transferred on ice) or slow annealing (samples are incubated at 75 °C in a thermocycler, then the Hondo is lowered at a decay rate of 1 °C/30 s). It was carried out. qPCR measured captured and full-length oligo. The results are summarized in Figure 18C, which shows that there was approximately 10-20% less ligation using the redesigned 6 nucleotide p-oligo/splint. There was approximately 40-50% less ligation using the redesigned 4 nucleotide splint. From the results using the '6bp_New_6bp-K splint' shown in Figure 18A with the 3' portion of the shortest splint tested, it can be seen that reduction of the 3' half of the splint to just 6 nucleotides reduced ligation efficiency by ~90%. It was inferred that Slow annealing had little effect on the number of full-length oligos. Addition of inosine base may not result in improved ligation efficacy. Replacing a base with inosine may have reduced ligation efficiency. In summary, redesign of the splint sequence and shortening of the 5' end of the splint to 6 nucleotides and 4 nucleotides reduced ligation efficiency even when ligation was performed below the splint Tm. Addition of inosine to the 5' end of the splint did not improve ligation efficiency. Replacement of the base at the 5' end of the splint with inosine reduced ligation efficiency. Slow annealing was found to have little effect on ligation efficiency. The reduction in ligation efficiency in the preparation of bead-linked indexed oligonucleotides with shortened linker sequences may be more important than the increased efficiency of the sequencing workflow involving the use of linker sequences with reduced length. .
실시예Example 10-이중-가닥 10-double-strand 스플린트splint 결찰을ligation 사용한 인덱싱에 관한 About indexing used 작업흐름Workflow
이중-가닥 스플린트 결찰을 사용한 인덱싱의 개괄은 도 19a에 나타나 있고, 예시적 작업흐름은 도 19b에 나타나 있다. 도 19a에 도시된 도식에서, 어닐링은 하기를 포함하고: 3분 동안 60℃, 얼음에 전달; 결찰은 하기를 포함하고: 제1 결찰: O/N, 및 제2 결찰: 5시간; 변성은 2분 동안 80℃를 포함하고, 즉시 완충액을 제거한다. 하기는 이중-가닥 스플린트 결찰에 의해 인덱싱된 비이드풀의 제조를 위한 단계를 요약한다.An overview of indexing using double-strand splint ligation is shown in Figure 19A, and an example workflow is shown in Figure 19B. In the scheme shown in Figure 19A, annealing includes: 60°C for 3 minutes, transfer to ice; Ligation includes: first ligation: O/N, and second ligation: 5 hours; Denaturation includes 80°C for 2 minutes, and buffer is removed immediately. The following summarizes the steps for the preparation of indexed bead pools by double-strand splint ligation.
하기는 정량적 PCR(qPCR)에 대한 단계를 요약한다.The steps for quantitative PCR (qPCR) are summarized below.
본원에 사용되는, 용어 "포함하는"은 "포함한", "함유하는", 또는 "특징으로 하는"과 동의어이며, 포괄적 또는 개방형이고 추가적, 언급되지 않은 요소 또는 방법 단계를 배제하지 않는다.As used herein, the term “comprising” is synonymous with “comprising,” “containing,” or “characterized by” and is inclusive or open-ended and does not exclude additional, unstated elements or method steps.
상기 상세한 설명은 본 발명의 몇몇 방법 및 물질을 개시한다. 본 발명은 방법 및 물질에 있어서의 변형뿐만 아니라, 제조 방법 및 장비의 변경도 용이하다. 상기 변형은 본 개시내용의 고려로부터 또는 본원에 개시된 본 발명의 실시로부터 당업자에게 명백할 것이다. 결과적으로, 본 발명은 본원에 개시된 특정 실시형태로 제한되는 것으로 의도되지 않지만, 본 발명의 진정한 범주 및 취지 내에 있는 모든 변형 및 대안을 포함하는 것으로 의도된다.The above detailed description discloses some of the methods and materials of the invention. The present invention is easy not only to modifications in methods and materials, but also to modifications in manufacturing methods and equipment. Such modifications will be apparent to those skilled in the art from consideration of this disclosure or from practice of the invention disclosed herein. Consequently, the present invention is not intended to be limited to the specific embodiments disclosed herein, but is intended to cover all modifications and alternatives that fall within the true scope and spirit of the invention.
공개 및 비공개 출원, 특허, 및 서적 참고문헌을 포함하지만 이로 한정되지는 않는 본원에 인용된 모든 참고문헌은 본원에서 그 전체가 참조 인용되고, 이로써 본 명세서의 일부를 구성한다. 참조 인용되는 간행물 및 특허 또는 특허 출원이 본 명세서에 포함된 개시내용과 모순되는 경우, 본 명세서는 임의의 상기 모순된 자료를 대체하고/하거나 그보다 우선되는 것으로 의도된다.All references cited herein, including but not limited to published and unpublished applications, patents, and book references, are hereby incorporated by reference in their entirety and are hereby constituted a part of this specification. To the extent publications and patents or patent applications incorporated by reference conflict with the disclosure contained herein, this specification is intended to supersede and/or supersede any such contradictory material.
SEQUENCE LISTING <110> ILLUMINA, INC. <120> METHODS AND COMPOSITIONS FOR COMBINATORIAL INDEXING OF BEAD-BASED NUCLEIC ACIDS <130> ILLINC.608WO <140> PCT/US2022/034734 <141> 2022-06-23 <150> US63/214,693 <151> 2021-06-24 <160> 14 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 1 aatgatacgg cgaccaccga 20 <210> 2 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 2 caagcagaag acggcatacg agat 24 <210> 3 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 3 atgctctaga caagtc 16 <210> 4 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 4 tgctctacaa gc 12 <210> 5 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 5 gctctaacaa gc 12 <210> 6 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 6 gctctaacaa gc 12 <210> 7 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 7 gacttgtccg gtgg 14 <210> 8 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 8 ctgaacaggc cacc 14 <210> 9 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 9 ctgaacaggc ca 12 <210> 10 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 10 gaacaggcca cc 12 <210> 11 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <220> <221> misc_feature <222> 15 <223> N is inosine <400> 11 ctgaacaggc caccn 15 <210> 12 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> CTGAACAGGCCACCNN <220> <221> misc_feature <222> 15, 16 <223> N is Inosine <400> 12 ctgaacaggc caccnn 16 <210> 13 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <220> <221> misc_feature <222> 13, 14 <223> N is inosine <400> 13 ctgaacaggc cann 14 <210> 14 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <220> <221> misc_feature <222> 13, 14, 15, 16 <223> N is inosine <400> 14 ctgaacaggc cannnn 16 SEQUENCE LISTING <110> ILLUMINA, INC. <120> METHODS AND COMPOSITIONS FOR COMBINATORIAL INDEXING OF BEAD-BASED NUCLEIC ACIDS <130> ILLINC.608WO <140> PCT/US2022/034734 <141> 2022-06-23 <150> US63/214,693 <151> 2021-06-24 <160> 14 <170> FastSEQ for Windows Version 4.0 <210> 1 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 1 aatgatacgg cgaccaccga 20 <210> 2 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 2 caagcagaag acggcatacg agat 24 <210> 3 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 3 atgctctaga caagtc 16 <210> 4 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 4 tgctctacaa gc 12 <210> 5 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 5 gctctaaaaaa gc 12 <210> 6 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 6 gctctaaaaaa gc 12 <210> 7 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 7 gacttgtccg gtgg 14 <210> 8 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 8 ctgaacaggc cacc 14 <210> 9 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 9 ctgaacaggc ca 12 <210> 10 <211> 12 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <400> 10 gaacagggcca cc 12 <210> 11 <211> 15 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <220> <221> misc_feature <222> 15 <223> N is inosine <400> 11 ctgaacaggc caccn 15 <210> 12 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> CTGAACAGGGCCACCNN <220> <221> misc_feature <222> 15, 16 <223> N is Inosine <400> 12 ctgaacaggc caccnn 16 <210> 13 <211> 14 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <220> <221> misc_feature <222> 13, 14 <223> N is inosine <400> 13 ctgaacaggc cann 14 <210> 14 <211> 16 <212> DNA <213> Artificial Sequence <220> <223> Artificial oligonucleotides <220> <221> misc_feature <222> 13, 14, 15, 16 <223> N is inosine <400> 14 ctgaacaggc cannnn 16
Claims (70)
(a) 제1 인덱스를 포함하는 제1 폴리뉴클레오티드를 포함하는 1차 인덱싱된 비이드의 집단을 수득하는 단계, 여기서 1차 인덱싱된 비이드의 집단은 복수의 인덱싱된 비이드의 제1 하위집단을 포함하고, 인덱싱된 비이드의 제1 하위집단은 서로 상이한 제1 인덱스를 포함함;
(b) 1차 인덱싱된 비이드의 집단을 복수의 비이드의 제2 하위집단으로 분할하는 단계;
(c) 하기를 포함하는, 2차 인덱싱된 비이드의 집단을 수득하는 단계를 포함하고:
(i) 제2 인덱스를 포함하는 제2 폴리뉴클레오티드로 복수의 비이드의 제2 하위집단의 제1 폴리뉴클레오티드를 연장하여, 인덱싱된 비이드의 제2 하위집단을 수득하는 것, 여기서 인덱싱된 비이드의 제2 하위집단은 서로 상이한 제2 인덱스를 포함함, 및
(ii) 인덱싱된 비이드의 제2 하위집단을 조합하여, 2차 인덱싱된 비이드의 집단을 수득하는 것; 선택적으로는, 추가로:
(d) 2차 인덱싱된 비이드의 집단을 복수의 비이드의 제3 하위집단으로 분할하는 단계; 및
(e) 하기를 포함하는, 3차 인덱싱된 비이드의 집단을 수득하는 단계를 포함하는, 방법:
(i) 제3 인덱스를 포함하는 제3 폴리뉴클레오티드로 복수의 비이드의 제3 하위집단의 제2 폴리뉴클레오티드를 연장시켜, 인덱싱된 비이드의 제3 하위집단을 수득하는 것, 여기서 인덱싱된 비이드의 제3 하위집단은 서로 상이한 제3 인덱스를 포함함, 및
(ii) 인덱싱된 비이드의 제3 하위집단을 조합하여, 3차 인덱싱된 비이드의 집단을 수득하는 것.A method for manufacturing a plurality of combinatorially indexed beads:
(a) obtaining a population of primary indexed beads comprising a first polynucleotide comprising a first index, wherein the population of primary indexed beads is a first subpopulation of the plurality of indexed beads. wherein the first subpopulation of indexed beads comprises a first index that is different from each other;
(b) dividing the first indexed population of beads into a second subpopulation of a plurality of beads;
(c) obtaining a secondary population of indexed beads comprising:
(i) extending the first polynucleotide of the second subpopulation of the plurality of beads with a second polynucleotide comprising a second index to obtain a second subpopulation of indexed beads, wherein the indexed ratio The second subgroup of id includes a second index different from each other, and
(ii) combining the second subpopulation of indexed beads to obtain a second population of indexed beads; Optionally, additionally:
(d) dividing the secondary indexed population of beads into a third subpopulation of a plurality of beads; and
(e) obtaining a population of tertiary indexed beads comprising:
(i) extending the second polynucleotide of the third subpopulation of the plurality of beads with a third polynucleotide comprising a third index, thereby obtaining a third subpopulation of indexed beads, wherein the indexed ratio A third subgroup of id includes a different third index, and
(ii) combining the third subpopulation of indexed beads to obtain a third population of indexed beads.
제1 폴리뉴클레오티드는 클릭 화학 반응(click chemistry reaction)에 참여할 수 있는 3' 관능성 모이어티를 포함하는 말단 3' 개질된 데옥시뉴클레오티드(dNTP)를 포함하고;
제2 폴리뉴클레오티드는 3'-관능성 모이어티와의 클릭 화학 반응에 참여할 수 있는 상용성 5' 관능성 모이어티를 포함하는 말단 5' 개질된 dNTP를 포함하고;
3' 관능성 모이어티 및 5' 관능성 모이어티는 서로 반응하여, 개질된 백본 연결을 형성할 수 있음.The method of claim 2, wherein:
The first polynucleotide comprises a terminal 3' modified deoxynucleotide (dNTP) comprising a 3' functional moiety capable of participating in a click chemistry reaction;
the second polynucleotide comprises a terminal 5' modified dNTP comprising a compatible 5' functional moiety capable of participating in a click chemistry reaction with the 3'-functional moiety;
The 3' functional moiety and the 5' functional moiety can react with each other to form a modified backbone linkage.
(i) 제1 링커에 혼성화될 수 있는 영역 및 제2 인덱스 또는 제2 인덱스의 상보체를 포함하는 영역을 포함하는 제1 어댑터를 수득하는 것;
(ii) 제1 어댑터를 제1 링커에 혼성화시키는 것; 및
(iii) 제1 폴리뉴클레오티드를 연장시켜, 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것.15. The method of claim 14, further comprising:
(i) obtaining a first adapter comprising a region hybridizable to the first linker and a region comprising the second index or the complement of the second index;
(ii) hybridizing the first adapter to the first linker; and
(iii) extending the first polynucleotide to obtain a secondary indexed polynucleotide.
(i) 제2 링커에 혼성화될 수 있는 영역 및 제3 인덱스 또는 제3 인덱스의 상보체를 포함하는 영역을 포함하는 제2 어댑터를 수득하는 것;
(ii) 제2 어댑터를 제2 링커에 혼성화시키는 것; 및
(iii) 2차 인덱싱된 폴리뉴클레오티드를 연장시켜, 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것.24. The method of claim 23, further comprising:
(i) obtaining a second adapter comprising a region hybridizable to the second linker and a region comprising the third index or the complement of the third index;
(ii) hybridizing the second adapter to the second linker; and
(iii) extending the secondary indexed polynucleotide to obtain a tertiary indexed polynucleotide.
(i) 제1 폴리뉴클레오티드의 제1 링커에 혼성화될 수 있는 3' 단일 가닥 오버행(overhang) 및 제2 폴리뉴클레오티드를 포함하는 이중 가닥 제1 어댑터를 수득하는 것;
(ii) 제1 어댑터를 제1 링커에 혼성화시키고, 선택적으로는, 추가적 올리고뉴클레오티드를 제1 인덱스에 혼성화시키는 것; 및
(iii) 제1 폴리뉴클레오티드를 제2 폴리뉴클레오티드에 결찰시켜, 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것.32. The method of claim 31 further comprising:
(i) obtaining a double-stranded first adapter comprising a second polynucleotide and a 3' single-stranded overhang capable of hybridizing to the first linker of the first polynucleotide;
(ii) hybridizing the first adapter to the first linker and, optionally, an additional oligonucleotide to the first index; and
(iii) ligating the first polynucleotide to the second polynucleotide to obtain a secondary indexed polynucleotide.
(i) 제2 폴리뉴클레오티드의 제2 링커에 혼성화될 수 있는 3' 단일 가닥 오버행 및 제3 폴리뉴클레오티드를 포함하는 이중 가닥 제2 어댑터를 수득하는 것;
(ii) 제2 어댑터를 제2 링커에 혼성화시키는 것; 및
(iii) 제2 폴리뉴클레오티드를 제3 폴리뉴클레오티드에 결찰시켜, 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것.34. The method of claim 33, further comprising:
(i) obtaining a double-stranded second adapter comprising a third polynucleotide and a 3' single-stranded overhang capable of hybridizing to the second linker of the second polynucleotide;
(ii) hybridizing the second adapter to the second linker; and
(iii) ligating the second polynucleotide to the third polynucleotide to obtain a tertiary indexed polynucleotide.
(i) 제1 링커에 혼성화될 수 있는 영역 및 제2 링커에 혼성화될 수 있는 영역을 포함하는 제1 어댑터를 수득하는 것;
(ii) 제1 어댑터를 제1 링커에 혼성화시키는 것;
(iii) 제2 올리고뉴클레오티드를 제2 링커에 혼성화될 수 있는 영역에 혼성화시키는 것; 및
(iv) 제1 폴리뉴클레오티드를 제2 폴리뉴클레오티드에 결찰시켜, 2차 인덱싱된 폴리뉴클레오티드를 수득하는 것.38. The method of claim 37, further comprising:
(i) obtaining a first adapter comprising a region hybridizable to a first linker and a region hybridizable to a second linker;
(ii) hybridizing the first adapter to the first linker;
(iii) hybridizing the second oligonucleotide to a region hybridizable to the second linker; and
(iv) ligating the first polynucleotide to the second polynucleotide to obtain a secondary indexed polynucleotide.
(i) 제3 링커에 혼성화될 수 있는 영역 및 제4 링커에 혼성화될 수 있는 영역을 포함하는 제2 어댑터를 수득하는 것;
(ii) 제2 어댑터를 제3 링커에 혼성화시키는 것;
(iii) 제4 인덱스에 혼성화될 수 있는 영역을 통해 제3 폴리뉴클레오티드를 제2 어댑터에 혼성화시키는 것; 및
(iv) 2차 인덱싱된 폴리뉴클레오티드를 제3 폴리뉴클레오티드에 결찰시켜, 3차 인덱싱된 폴리뉴클레오티드를 수득하는 것.46. The method of claim 45, further comprising:
(i) obtaining a second adapter comprising a region hybridizable to a third linker and a region hybridizable to a fourth linker;
(ii) hybridizing the second adapter to the third linker;
(iii) hybridizing the third polynucleotide to the second adapter through a region hybridizable to the fourth index; and
(iv) ligating the secondary indexed polynucleotide to a third polynucleotide to obtain a tertiary indexed polynucleotide.
(i) 제1 폴리뉴클레오티드를 복수의 비이드의 제1 하위집단에 부착하여, 인덱싱된 비이드의 제1 하위집단을 수득하는 것, 여기서 제1 폴리뉴클레오티드는 비이드의 제1 하위집단 각각에 대해 상이한 제1 인덱스를 포함함; 및
(ii) 인덱싱된 비이드의 제1 하위집단을 조합하여, 1차 인덱싱된 비이드의 집단을 수득하는 것.53. The method of any one of claims 1-52, wherein (a) comprises:
(i) attaching a first polynucleotide to a first subpopulation of a plurality of beads to obtain a first subpopulation of indexed beads, wherein the first polynucleotide is attached to each of the first subpopulations of beads. contains a different first index for; and
(ii) combining the first subpopulation of indexed beads to obtain a primary population of indexed beads.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163214693P | 2021-06-24 | 2021-06-24 | |
US63/214,693 | 2021-06-24 | ||
PCT/US2022/034734 WO2022271954A1 (en) | 2021-06-24 | 2022-06-23 | Methods and compositions for combinatorial indexing of bead-based nucleic acids |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240024835A true KR20240024835A (en) | 2024-02-26 |
Family
ID=84544839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237043987A KR20240024835A (en) | 2021-06-24 | 2022-06-23 | Methods and compositions for bead-based combinatorial indexing of nucleic acids |
Country Status (11)
Country | Link |
---|---|
US (1) | US20240287505A1 (en) |
EP (1) | EP4359557A1 (en) |
JP (1) | JP2024523570A (en) |
KR (1) | KR20240024835A (en) |
CN (1) | CN117580959A (en) |
AU (1) | AU2022297521A1 (en) |
BR (1) | BR112023026984A2 (en) |
CA (1) | CA3223500A1 (en) |
IL (1) | IL309566A (en) |
MX (1) | MX2023014950A (en) |
WO (1) | WO2022271954A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116287124A (en) * | 2023-05-24 | 2023-06-23 | 中国农业科学院农业基因组研究所 | Single-stranded joint pre-connection method, library construction method of high-throughput sequencing library and kit |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117822128A (en) * | 2016-07-22 | 2024-04-05 | 俄勒冈健康与科学大学 | Single-cell whole genome library and combined indexing method for preparing same |
WO2020214642A1 (en) * | 2019-04-19 | 2020-10-22 | Becton, Dickinson And Company | Methods of associating phenotypical data and single cell sequencing data |
CA3142535A1 (en) * | 2019-09-20 | 2021-03-25 | Illumina, Inc. | Methods and compositions for identifying ligands on arrays using indexes and barcodes |
WO2021127436A2 (en) * | 2019-12-19 | 2021-06-24 | Illumina, Inc. | High-throughput single-cell libraries and methods of making and of using |
-
2022
- 2022-06-23 KR KR1020237043987A patent/KR20240024835A/en unknown
- 2022-06-23 EP EP22829309.8A patent/EP4359557A1/en active Pending
- 2022-06-23 WO PCT/US2022/034734 patent/WO2022271954A1/en active Application Filing
- 2022-06-23 US US18/567,697 patent/US20240287505A1/en active Pending
- 2022-06-23 IL IL309566A patent/IL309566A/en unknown
- 2022-06-23 CA CA3223500A patent/CA3223500A1/en active Pending
- 2022-06-23 JP JP2023579590A patent/JP2024523570A/en active Pending
- 2022-06-23 CN CN202280044218.XA patent/CN117580959A/en active Pending
- 2022-06-23 BR BR112023026984A patent/BR112023026984A2/en unknown
- 2022-06-23 AU AU2022297521A patent/AU2022297521A1/en active Pending
- 2022-06-23 MX MX2023014950A patent/MX2023014950A/en unknown
Also Published As
Publication number | Publication date |
---|---|
JP2024523570A (en) | 2024-06-28 |
IL309566A (en) | 2024-02-01 |
MX2023014950A (en) | 2024-03-14 |
AU2022297521A1 (en) | 2024-01-04 |
BR112023026984A2 (en) | 2024-03-12 |
EP4359557A1 (en) | 2024-05-01 |
CN117580959A (en) | 2024-02-20 |
WO2022271954A1 (en) | 2022-12-29 |
CA3223500A1 (en) | 2022-12-29 |
US20240287505A1 (en) | 2024-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10995369B2 (en) | Compositions and methods for improving sample identification in indexed nucleic acid libraries | |
CN110036117B (en) | Method for increasing throughput of single molecule sequencing by multiple short DNA fragments | |
TWI797118B (en) | Compositions and methods for library construction and sequence analysis | |
CN105917004B (en) | polynucleotide modification on solid supports | |
EP3129505B1 (en) | Methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications | |
JP7240337B2 (en) | LIBRARY PREPARATION METHODS AND COMPOSITIONS AND USES THEREOF | |
CN114829623A (en) | Methods and compositions for high throughput sample preparation using dual unique dual indices | |
AU2021209101A1 (en) | Methods of targeted sequencing | |
EP3126524A1 (en) | Improved compositions and methods for molecular inversion probe assays | |
US20200299764A1 (en) | System and method for transposase-mediated amplicon sequencing | |
CN111801427B (en) | Generation of single-stranded circular DNA templates for single molecules | |
EP3956445B1 (en) | Multiplex assembly of nucleic acid molecules | |
KR20240024835A (en) | Methods and compositions for bead-based combinatorial indexing of nucleic acids | |
DK2456892T3 (en) | Procedure for sequencing of a polynukleotidskabelon | |
KR20230124636A (en) | Compositions and methods for highly sensitive detection of target sequences in multiplex reactions | |
JP2022546485A (en) | Compositions and methods for tumor precision assays | |
CN117940577A (en) | Periodate compositions and methods for chemically cleaving surface-bound polynucleotides | |
WO2024192290A9 (en) | Click-chemistry based barcoding | |
CN117881796A (en) | Detection of analytes using targeted epigenetic assays, proximity-induced tagging, strand invasion, restriction or ligation | |
CN117813390A (en) | Method for metal directed cleavage of surface-bound polynucleotides | |
CN115279918A (en) | Novel nucleic acid template structure for sequencing | |
CN112424378A (en) | Method for nucleic acid amplification using endonuclease-mediated mobile equilibrium (EM-SEq) |