JP2019528059A - バーコード化ゲノムdna断片のデノボアセンブリの方法 - Google Patents
バーコード化ゲノムdna断片のデノボアセンブリの方法 Download PDFInfo
- Publication number
- JP2019528059A JP2019528059A JP2019507862A JP2019507862A JP2019528059A JP 2019528059 A JP2019528059 A JP 2019528059A JP 2019507862 A JP2019507862 A JP 2019507862A JP 2019507862 A JP2019507862 A JP 2019507862A JP 2019528059 A JP2019528059 A JP 2019528059A
- Authority
- JP
- Japan
- Prior art keywords
- genomic dna
- transposome
- transposase
- dna
- transposomes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 198
- 239000012634 fragment Substances 0.000 title claims abstract description 193
- 108020004414 DNA Proteins 0.000 claims description 445
- 210000004027 cell Anatomy 0.000 claims description 141
- 108010020764 Transposases Proteins 0.000 claims description 117
- 102000008579 Transposases Human genes 0.000 claims description 117
- 230000027455 binding Effects 0.000 claims description 98
- 239000011859 microparticle Substances 0.000 claims description 68
- 239000003153 chemical reaction reagent Substances 0.000 claims description 57
- 238000003776 cleavage reaction Methods 0.000 claims description 55
- 230000007017 scission Effects 0.000 claims description 55
- 238000006243 chemical reaction Methods 0.000 claims description 52
- 238000012163 sequencing technique Methods 0.000 claims description 44
- 239000012071 phase Substances 0.000 claims description 33
- 108091093088 Amplicon Proteins 0.000 claims description 30
- 239000000203 mixture Substances 0.000 claims description 25
- 102000004190 Enzymes Human genes 0.000 claims description 24
- 108090000790 Enzymes Proteins 0.000 claims description 24
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 206010028980 Neoplasm Diseases 0.000 claims description 15
- 108010012306 Tn5 transposase Proteins 0.000 claims description 15
- 238000011049 filling Methods 0.000 claims description 14
- 239000008346 aqueous phase Substances 0.000 claims description 12
- 201000011510 cancer Diseases 0.000 claims description 11
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 claims description 8
- 239000012736 aqueous medium Substances 0.000 claims description 8
- 239000004094 surface-active agent Substances 0.000 claims description 8
- 108010009127 mu transposase Proteins 0.000 claims description 7
- 238000007702 DNA assembly Methods 0.000 claims description 6
- 102000054766 genetic haplotypes Human genes 0.000 claims description 6
- 239000000710 homodimer Substances 0.000 claims description 6
- 238000005215 recombination Methods 0.000 claims description 5
- 230000006798 recombination Effects 0.000 claims description 5
- 230000002934 lysing effect Effects 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 3
- 238000002493 microarray Methods 0.000 claims description 3
- 239000000427 antigen Substances 0.000 claims description 2
- 108091007433 antigens Proteins 0.000 claims description 2
- 102000036639 antigens Human genes 0.000 claims description 2
- 238000000354 decomposition reaction Methods 0.000 claims description 2
- 230000000593 degrading effect Effects 0.000 claims description 2
- 239000000017 hydrogel Substances 0.000 claims description 2
- 210000000265 leukocyte Anatomy 0.000 claims description 2
- 238000002156 mixing Methods 0.000 claims description 2
- 230000003321 amplification Effects 0.000 description 73
- 238000003199 nucleic acid amplification method Methods 0.000 description 73
- 150000007523 nucleic acids Chemical class 0.000 description 64
- 125000003729 nucleotide group Chemical group 0.000 description 53
- 239000011324 bead Substances 0.000 description 44
- 239000002773 nucleotide Substances 0.000 description 44
- 102000039446 nucleic acids Human genes 0.000 description 41
- 108020004707 nucleic acids Proteins 0.000 description 41
- 239000000523 sample Substances 0.000 description 38
- 102000040430 polynucleotide Human genes 0.000 description 29
- 108091033319 polynucleotide Proteins 0.000 description 29
- 239000002157 polynucleotide Substances 0.000 description 29
- 239000003921 oil Substances 0.000 description 28
- 229940088598 enzyme Drugs 0.000 description 23
- 108700028369 Alleles Proteins 0.000 description 21
- 238000003780 insertion Methods 0.000 description 21
- 230000037431 insertion Effects 0.000 description 21
- 102000053602 DNA Human genes 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 18
- 239000004365 Protease Substances 0.000 description 16
- 230000000295 complement effect Effects 0.000 description 16
- 108091005804 Peptidases Proteins 0.000 description 15
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 15
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 14
- 235000019419 proteases Nutrition 0.000 description 14
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 13
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 13
- 238000013467 fragmentation Methods 0.000 description 13
- 238000006062 fragmentation reaction Methods 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 108090000623 proteins and genes Proteins 0.000 description 13
- 230000017105 transposition Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000013412 genome amplification Methods 0.000 description 11
- 239000000839 emulsion Substances 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 230000037452 priming Effects 0.000 description 10
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 9
- 239000000539 dimer Substances 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 8
- 238000000137 annealing Methods 0.000 description 8
- 239000013592 cell lysate Substances 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- -1 deoxyribonucleotide triphosphates Chemical class 0.000 description 8
- 230000002209 hydrophobic effect Effects 0.000 description 8
- 239000002777 nucleoside Substances 0.000 description 8
- 239000011541 reaction mixture Substances 0.000 description 8
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 239000003814 drug Substances 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 230000004544 DNA amplification Effects 0.000 description 6
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 6
- 208000037065 Subacute sclerosing leukoencephalitis Diseases 0.000 description 6
- 206010042297 Subacute sclerosing panencephalitis Diseases 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 238000011160 research Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 230000000692 anti-sense effect Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000007899 nucleic acid hybridization Methods 0.000 description 5
- 238000005096 rolling process Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 239000007864 aqueous solution Substances 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 239000005547 deoxyribonucleotide Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012268 genome sequencing Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000011780 sodium chloride Substances 0.000 description 4
- 229940035893 uracil Drugs 0.000 description 4
- WRDABNWSWOHGMS-UHFFFAOYSA-N AEBSF hydrochloride Chemical compound Cl.NCCC1=CC=C(S(F)(=O)=O)C=C1 WRDABNWSWOHGMS-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 241000972773 Aulopiformes Species 0.000 description 3
- 108010077544 Chromatin Proteins 0.000 description 3
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 210000003483 chromatin Anatomy 0.000 description 3
- 238000010367 cloning Methods 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 238000012350 deep sequencing Methods 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 239000004205 dimethyl polysiloxane Substances 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 238000004945 emulsification Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 239000012139 lysis buffer Substances 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 3
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000008707 rearrangement Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 235000019515 salmon Nutrition 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000013518 transcription Methods 0.000 description 3
- 230000035897 transcription Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical class NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical class NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 2
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical class C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- ZRALSGWEFCBTJO-UHFFFAOYSA-N Guanidine Chemical compound NC(N)=N ZRALSGWEFCBTJO-UHFFFAOYSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 238000001574 biopsy Methods 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 230000006037 cell lysis Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000009089 cytolysis Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 238000002032 lab-on-a-chip Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000007481 next generation sequencing Methods 0.000 description 2
- 150000003833 nucleoside derivatives Chemical class 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 230000002974 pharmacogenomic effect Effects 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000003752 polymerase chain reaction Methods 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 238000006462 rearrangement reaction Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 238000003756 stirring Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- VAALWQXPFZVPFE-TURQNECASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-prop-1-enylpyrimidine-2,4-dione Chemical compound O=C1NC(=O)C(C=CC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 VAALWQXPFZVPFE-TURQNECASA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- UHUHBFMZVCOEOV-UHFFFAOYSA-N 1h-imidazo[4,5-c]pyridin-4-amine Chemical class NC1=NC=CC2=C1N=CN2 UHUHBFMZVCOEOV-UHFFFAOYSA-N 0.000 description 1
- PJDOLCGOTSNFJM-UHFFFAOYSA-N 2,2,3,3,4,4,5,5,6,6,7,7,8,8,8-pentadecafluorooctan-1-ol Chemical compound OCC(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F PJDOLCGOTSNFJM-UHFFFAOYSA-N 0.000 description 1
- HTOVHZGIBCAAJU-UHFFFAOYSA-N 2-amino-2-propyl-1h-purin-6-one Chemical compound CCCC1(N)NC(=O)C2=NC=NC2=N1 HTOVHZGIBCAAJU-UHFFFAOYSA-N 0.000 description 1
- KZEYUNCYYKKCIX-UMMCILCDSA-N 2-amino-8-chloro-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Cl)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O KZEYUNCYYKKCIX-UMMCILCDSA-N 0.000 description 1
- GNYDOLMQTIJBOP-UMMCILCDSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-8-fluoro-3h-purin-6-one Chemical compound FC1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GNYDOLMQTIJBOP-UMMCILCDSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- USCCECGPGBGFOM-UHFFFAOYSA-N 2-propyl-7h-purin-6-amine Chemical compound CCCC1=NC(N)=C2NC=NC2=N1 USCCECGPGBGFOM-UHFFFAOYSA-N 0.000 description 1
- HHBBIOLEJRWIGU-UHFFFAOYSA-N 4-ethoxy-1,1,1,2,2,3,3,4,5,6,6,6-dodecafluoro-5-(trifluoromethyl)hexane Chemical compound CCOC(F)(C(F)(C(F)(F)F)C(F)(F)F)C(F)(F)C(F)(F)C(F)(F)F HHBBIOLEJRWIGU-UHFFFAOYSA-N 0.000 description 1
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 1
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical class O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 1
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 1
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical class O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- PFUVOLUPRFCPMN-UHFFFAOYSA-N 7h-purine-6,8-diamine Chemical compound C1=NC(N)=C2NC(N)=NC2=N1 PFUVOLUPRFCPMN-UHFFFAOYSA-N 0.000 description 1
- ASUCSHXLTWZYBA-UMMCILCDSA-N 8-Bromoguanosine Chemical compound C1=2NC(N)=NC(=O)C=2N=C(Br)N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ASUCSHXLTWZYBA-UMMCILCDSA-N 0.000 description 1
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical class NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical class NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- HDZZVAMISRMYHH-UHFFFAOYSA-N 9beta-Ribofuranosyl-7-deazaadenin Natural products C1=CC=2C(N)=NC=NC=2N1C1OC(CO)C(O)C1O HDZZVAMISRMYHH-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 1
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000721047 Danaus plexippus Species 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- 108010067770 Endopeptidase K Proteins 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000701959 Escherichia virus Lambda Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 108010034143 Inflammasomes Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 238000007397 LAMP assay Methods 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- CHJJGSNFBQVOTG-UHFFFAOYSA-N N-methyl-guanidine Natural products CNC(N)=N CHJJGSNFBQVOTG-UHFFFAOYSA-N 0.000 description 1
- RSPURTUNRHNVGF-UHFFFAOYSA-N N2,N2-Dimethylguanosine (incomplete stereochemisrty) Chemical compound C1=2NC(N(C)C)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O RSPURTUNRHNVGF-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- 241000605862 Porphyromonas gingivalis Species 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical group C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241000282898 Sus scrofa Species 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000001464 adherent effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 239000012472 biological sample Substances 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 230000003196 chaotropic effect Effects 0.000 description 1
- 210000003467 cheek Anatomy 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 239000013611 chromosomal DNA Substances 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000003040 circulating cell Anatomy 0.000 description 1
- 238000004581 coalescence Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- SWSQBOPZIKWTGO-UHFFFAOYSA-N dimethylaminoamidine Natural products CN(C)C(N)=N SWSQBOPZIKWTGO-UHFFFAOYSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 238000011978 dissolution method Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 210000003780 hair follicle Anatomy 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000003494 hepatocyte Anatomy 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 210000002752 melanocyte Anatomy 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 239000002991 molded plastic Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000002445 nipple Anatomy 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 238000001821 nucleic acid purification Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 210000004248 oligodendroglia Anatomy 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 239000003960 organic solvent Substances 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 238000000059 patterning Methods 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 239000002685 polymerization catalyst Substances 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000003793 prenatal diagnosis Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical group N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000007790 scraping Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 239000000377 silicon dioxide Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000018412 transposition, RNA-mediated Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- HDZZVAMISRMYHH-KCGFPETGSA-N tubercidin Chemical compound C1=CC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O HDZZVAMISRMYHH-KCGFPETGSA-N 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
- C12N15/1031—Mutagenizing nucleic acids mutagenesis by gene assembly, e.g. assembly by oligonucleotide extension PCR
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B50/00—Methods of creating libraries, e.g. combinatorial synthesis
- C40B50/14—Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support
- C40B50/18—Solid phase synthesis, i.e. wherein one or more library building blocks are bound to a solid support during library creation; Particular methods of cleavage from the solid support using a particular method of attachment to the solid support
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Virology (AREA)
- Structural Engineering (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
本開示は、バーコード化断片を用いてゲノムDNAをデノボアセンブリするための方法を提供する。
Description
関連出願情報
本出願は、2016年8月10日に出願された米国仮特許出願第62/373,057号の優先権を主張するものであり、これはあらゆる目的のためにその全体が参照により本明細書に組み込まれる。
本出願は、2016年8月10日に出願された米国仮特許出願第62/373,057号の優先権を主張するものであり、これはあらゆる目的のためにその全体が参照により本明細書に組み込まれる。
政府の利益に関する声明
本発明は、国立衛生研究所からの5DP1CA186693に基づく政府の支援を受けてなされた。政府は本発明においてある特定の権利を有する。
本発明は、国立衛生研究所からの5DP1CA186693に基づく政府の支援を受けてなされた。政府は本発明においてある特定の権利を有する。
本発明の実施形態は、概して、単一細胞由来のDNAなどのゲノム核酸のデノボアセンブリのための方法及び組成物に関する。
デノボゲノムアセンブリは、参照配列の助けを借りずに個々の短い配列リードをより長い配列にアセンブリするプロセスである。現在、ほとんどのハイスループット配列は、ほんの数百塩基対の配列長を生成する。次いで、短い断片は、これらの断片がどこで重なり合うかを決定することによって互いに再構築される。しかし、人間などの複雑な生物のゲノムには、非常に多くの反復配列がある。それらの反復領域の多くはDNAシーケンサーの読み出し長よりも長いため、ギャップなしでゲノム全体をアセンブルすることは困難である。
単一細胞ゲノム配列決定を実行する能力は、腫瘍成長、幹細胞再プログラミング、胚発生など、細胞間変動及び集団の不均一性が重要な役割を果たす研究において重要である。単一細胞ゲノム配列決定はまた、配列決定の対象となる細胞試料が貴重であるか、又は稀であるか、又は微量である場合にも重要である。正確な単一細胞ゲノム配列決定にとって重要なことは、微量となり得るゲノムDNAの初期増幅である。
増幅及び配列決定後のデノボゲノムアセンブリは、全ゲノム配列決定と共に使用される多くの方法の重要な側面である。全ゲノム増幅法は、配列決定及び他の分析の前に単一細胞由来のゲノムDNAを用いて当該分野で使用される一般的な方法である多重置換増幅(multiple displacement amplification;MDA)を含む。この方法では、ランダムプライマーアニーリングに続いて、強い鎖置換活性を有するDNAポリメラーゼを利用して伸長が行われる。単一細胞由来の元のゲノムDNAは、カスケードのように指数関数的に増幅されて超分岐DNA構造を形成する。単一細胞からゲノムDNAを増幅する別の方法は、Zong,C.、Lu,S.、Chapman,A.R.、及びXie,X.S.(2012)、Genome−wide detection of single−nucleotide and copy−number variations of a single human cell、Science 338、1622〜1626に記載されており、これは多重アニーリング及びループに基づく増幅サイクル(Multiple Annealing and Looping−Based Amplification Cycles;MALBAC)を説明している。当技術分野において公知の別の方法は、縮重オリゴヌクレオチドプライムPCR(Degenerated oligonucleotide−primed PCR)すなわちDOP−PCRである。単一細胞ゲノムDNAと共に使用される他のいくつかの方法には、Cheung,V.G.及びS.F.Nelson、Whole genome amplification using a degenerate oligonucleotide primer allows hundreds of genotypes to be performed on less than one nanogram of genomic DNA、Proceedings of the National Academy of Sciences of the United States of America、1996.93(25):p.14676−9;Telenius,H.ら、Degenerate oligonucleotide−primed PCR: general amplification of target DNA by a single degenerate primer、Genomics、1992.13(3):p.718−25;Zhang,L.ら、Whole genome amplification from a single cell:implications for genetic analysis.Proceedings of the National Academy of Sciences of the United States of America、1992、89(13):p.5847−51;Lao,K.、N.L.Xu、及びN.A.Straus、Whole genome amplification using single−primer PCR、Biotechnology Journal、2008、3(3):p.378−82;Dean,F.B.ら、Comprehensive human genome amplification using multiple displacement amplification、Proceedings of the National Academy of Sciences of the United States of America、2002.99(8):p.5261−6;Lage,J.M.ら、Whole genome analysis of genetic alterations in small DNA samples using hyperbranched strand displacement amplification and array−CGH、Genome Research、2003、13(2):p.294−307;Spits,C.ら、Optimization and evaluation of single−cell whole−genome multiple displacement amplification、Human Mutation、2006、27(5):p.496−503;Gole,J.ら、Massively parallel polymerase cloning and genome sequencing of single cells using nanoliter microwells、Nature Biotechnology、2013.31(12):p.1126−32;Jiang,Z.ら、Genome amplification of single sperm using multiple displacement amplification、Nucleic Acids Research、2005、33(10):p.e91;Wang,J.ら、Genome−wide Single−Cell Analysis of Recombination Activity and De Novo Mutation Rates in Human Sperm、Cell、2012.150(2):p.402−12;Ni,X.、Reproducible copy number variation patterns among single circulating tumor cells of lung cancer patients、PNAS、2013、110、21082−21088;Navin,N.、Tumor evolution inferred by single cell sequencing、Nature、2011、472(7341):90−94;Evrony,G.D.ら、Single−neuron sequencing analysis of l1 retrotransposition and somatic mutation in the human brain、Cell、2012.151(3):p.483−96;並びにMcLean,J.S.ら、Genome of the pathogen Porphyromonas gingivalis recovered from a biofilm in a hospital sink using a high−throughput single−cell genomics platform、Genome Research、2013.23(5):p.867−77が含まれる。全ゲノム増幅の態様に関する方法は、国際公開第2012/166425号パンフレット、米国特許第7,718,403号明細書、米国特許出願公開第2003/0108870号明細書及び米国特許第7,402,386号明細書に報告されている。
しかしながら、アンプリコンがゲノムDNAにデノボアセンブルされ得る、単一細胞又は少数の細胞群からなどの少量のゲノムDNAを増幅するさらなる方法が必要とされている。
本開示は、断片化プロセス中に断片の隣接する末端が同じ固有の末端バーコード配列でバーコード化され、したがって配列決定された断片が後に同じ固有の末端バーコード配列を有する断片を連結することによってより大きな配列に計算的にアセンブルされ得る、ゲノムDNA断片化方法を提供する。一態様によれば、トランスポソームライブラリーは、水性媒体中でゲノムDNAの断片を作製するために使用され、固有のバーコード配列が、トランスポソームのトランスポザーゼにより切断された部位で、ゲノムDNAの各末端に挿入されている、又は結合している。本開示は、本明細書に記載のトランスポソームライブラリーを用いて、ゲノムDNAを複数の断片、例えば5以上の断片、10以上の断片、100以上の断片、1000以上の断片、10,000以上の断片、100,000以上の断片、1,000,000以上の断片、又は10,000,000以上の断片に断片化することを企図する。一態様によれば、トランスポソームライブラリーは、5〜10のトランスポソームメンバー、10〜100のトランスポソームメンバー、100以上のトランスポソームメンバー、1000以上のトランスポソームメンバー、10,000以上のトランスポソームメンバー、100,000以上のトランスポソームメンバー、1,000,000以上のトランスポソームメンバー、又は、10,000,00以上のトランスポソームメンバーを含む。一態様によれば、各トランスポソームは、2つのトランスポザーゼ及び2つのトランスポゾンDNAを含む。トランスポゾンDNAは、トランスポザーゼ結合部位、バーコード及びプライマー結合部位を含む。一態様によれば、トランスポゾンDNAは、単一のトランスポザーゼ結合部位、バーコード及びプライマー結合部位を含む。各トランスポゾンDNAは、トランスポザーゼ結合部位でトランスポザーゼに結合した別々の核酸である。トランスポソームは、それぞれがそれ自身のトランスポゾンDNAに結合した2つの別々のトランスポザーゼの二量体である。一態様によれば、トランスポソームは、それぞれがそれ自体の対応するトランスポザーゼに結合した2つの別々の個々のトランスポゾンDNAを含む。一態様によれば、トランスポソームは、わずか2つのトランスポザーゼ及びわずか2つのトランスポゾンDNAを含む。一態様によれば、トランスポソームの一部としての2つのトランスポゾンDNAは、それぞれがそれ自身の対応するトランスポザーゼに結合している、別々の、個々の又は連結していないトランスポゾンDNAである。一例として、単一のトランスポゾン結合部位、バーコード及びプライマー結合部位を有する本明細書に記載される別個の個々のトランスポゾンDNAは、トランスポソームが、対応するトランスポゾンDNAに結合する、トランスポザーゼの個々の部分によってアセンブルされ得、2つのトランスポザーゼが二量体化してトランスポソームを形成し、またトランスポソームの2つのトランスポゾンDNAが同じバーコード配列を有するため、微小液滴アプローチを用いて何百万ものトランスポソームの作製を可能にする。
一態様によれば、ライブラリーの各トランスポソームメンバーは、トランスポソームの各トランスポゾンDNA上に同じ配列の固有のバーコードを含む。このようにして、各トランスポソームは、トランスポソームライブラリー内の他の任意のトランスポソームのバーコード配列とは異なる一対の固有のバーコード配列を含む。一態様によれば、トランスポソームライブラリーは、同じバーコードを有するトランスポソームメンバーを含み得るが、同じバーコードを有するメンバーの数は比較的少ないか又はわずかである。このようにして、トランスポソームライブラリーは調製されたトランスポソームの集合のサブセットであると考えることができ、各断片切断部位が固有のバーコード配列で表されるようにゲノムDNAを断片化することが目的であるため、サブセットは固有のバーコード配列を有するトランスポソームのみを含む。トランスポソームライブラリーの調製により、わずかな数の切断部位が同じバーコード配列を共有し得ることが理解されるべきである。例えば、所与のライブラリー調製方法について、同じバーコード対を有するトランスポソームの複数の分子が存在することが数学的に可能であるが、ライブラリーは、異なるバーコード配列の数が実際に標的ゲノムに挿入されるトランスポソーム分子の数を有意に超えるように調製される。例えば、6,000,000,000塩基対長である単一のヒト細胞全ゲノムの場合、6,000bpの平均断片長を得るためには、1,000,000トランスポソームが全ゲノムに挿入される必要がある。この6000bpの挿入密度に達するために、少なくとも3,000,000,000分子のトランスポソームが反応混合物に添加される。14bpのランダムに合成されたバーコードの場合、4^14=268,435,456の異なるバーコード配列があり、これはそれぞれの特定のバーコードに対して3,000,000,000/268,435,456=11.2の分子のコピーがあることを意味する。しかし、同じバーコード配列を共有する分子のコピー数がいくつであっても、断片を作成するために同じバーコード配列がゲノムに挿入されたトランスポソームの2つの分子を有する可能性は、1,000,000/268,435,456=0.0037である。この例を使用すると、同じバーコードタグ又は配列を有する2つの異なるゲノムDNA断片に遭遇する前に、平均して268の断片がバーコードによって連結され得る。トランスポソームライブラリー内の各バーコード配列が固有であることを確実にするための方法、すなわち、3,000,000,000を超えるバーコード配列をはじめとする方法が存在する。
一態様によれば、他のサイズのゲノムについては、使用されるバーコードの数はそれに応じて増減することができ、ゲノム中の塩基対の総数を所望の断片サイズで割ったものによって決定される。例えば、約50,000塩基対を有するラムダファージなどの小さなゲノムの場合、6,000bpの平均断片長を有する場合には9つのバーコードのみがゲノムへの挿入に必要であり、したがってそれぞれ固有に紐付けされたバーコードを有する9つのトランスポソームのみがゲノムへの挿入に必要である。一態様によれば、平均断片長はまた、より多い又はより少ない数のトランスポソームを使用することによってより小さく又はより大きくなるように調整することもでき、これは、それぞれより高濃度又はより低濃度のトランスポソーム溶液を使用することによって達成され得る。目標平均断片長がより短く、したがって総断片数が大きくなると予測される場合、使用されるべきバーコードの数は、固有のバーコード化を達成するためにより大きくなるように調整され得、またその逆も可能である。
したがって、一態様によれば、実質的に全ての切断部位が固有のバーコード配列によって表され、したがって、実質的に全ての断片がデノボアセンブルされ得る。一態様によれば、切断部位の90%超が固有のバーコード配列によって表され、切断部位の95%超が固有のバーコード配列によって表され、切断部位の96%が固有のバーコード配列によって表され、切断部位の97%が固有のバーコード配列によって表され、切断部位の98%が固有のバーコード配列によって表され、切断部位の99%が固有のバーコード配列によって表され、切断部位の99.5%が固有のバーコード配列によって表され、又は切断部位の100%が固有のバーコード配列によって表される。
次いで、トランスポソームライブラリーを使用してゲノムDNAが切断され、各トランスポソームは、トランスポゾンDNA内のバーコード配列(固有のバーコード配列など)を切断部位の両端に挿入又は結合させる。このようにして、切断部位の隣接する末端は、バーコード配列をマッチングさせることによって後に識別され得、隣接する末端は、計算的に互いに結合され得る。一態様によれば、トランスポソームライブラリーによって産生される断片は、断片の各末端に、固有のバーコード配列対などのバーコード配列対のうちの一方を有する。一態様によれば、トランスポソームライブラリーによって産生される断片はそれぞれ、断片の各末端に、固有のバーコード配列対などのバーコード配列対のうちの一方を有する。断片が増幅され配列決定された後、断片の末端は、ゲノムDNAをデノボアセンブルするためにバーコードをマッチングさせることにより計算的に互いに連結され得る。したがって、トランスポザーゼを使用して断片に結合したバーコード配列をマッチングさせることにより核酸断片を連結するための方法が提供される。
一態様によれば、トランスポソームのトランスポゾンDNAは、増幅方法を容易にする配列、例えば、断片が当業者に公知の方法を使用したPCR又はRNA転写などにより配列決定の前に増幅され得るように、断片に結合され得る特定のプライマー配列又は転写配列を含み得る。本開示は、断片を増幅するための様々な増幅方法及びアンプリコンを配列決定するための様々な配列決定方法を企図し、デノボゲノムアセンブリのための方法は、いかなる特定の増幅又は配列決定方法にも限定されないことが理解されるべきである。
本開示の実施形態は、少量のゲノムDNA又は限られた量のDNA、例えば単一細胞か、同じ細胞型の複数の細胞から得られた、又は個体若しくは基質から得られた組織、体液若しくは血液試料から得られた、ゲノム配列(単数又は複数)などのDNAのデノボアセンブリの方法に関する。本開示のある特定の態様によれば、本明細書に記載の方法は、単一の反応混合物を用いて単一の管内で行うことができる。本開示のある特定の態様によれば、核酸試料は、単一細胞由来の未精製又は未処理の溶解物中にあってもよい。本明細書に開示されている方法に供される核酸は、様々な試薬と接触させる前及び本明細書に記載されている様々な条件下で、例えばカラム精製によって精製される必要はない。本明細書に記載のバーコード方法は、ハイスループット配列決定のための増幅されたDNAを産生する、単一細胞の全ゲノムの実質的かつ均一な範囲を提供するのを助けるために、断片化DNAのデノボアセンブリを補助する。
本発明の実施形態は、一般に、DNA断片、例えば単一細胞の全ゲノム由来のDNA断片を作製するための方法及び組成物に関し、これらは次いで、当業者に公知の、及び本明細書に記載の増幅及び配列決定法に供され得る。ある特定の態様によれば、本明細書に記載の核酸断片を作製する方法は、トランスポソームライブラリーを利用する。一態様によれば、トランスポソームの一部としてのトランスポザーゼは、一組の二本鎖ゲノムDNA断片を形成するために使用される。ある特定の態様によれば、トランスポザーゼは、トランスポゾンDNAに結合し、反応容器内又は反応容積内に配置される場合など、互いに接触したときに二量体化して、トランスポソームと呼ばれるトランスポザーゼ/トランスポゾンDNA複合体二量体を形成する能力を有する。トランスポソームの各トランスポゾンDNAは、二本鎖トランスポザーゼ結合部位と、トランスポソームに固有のバーコード配列及び増幅促進配列(例えば特異的プライミング部位(「プライマー結合部位」)又は転写プロモーター部位)を含む第1の核酸配列と、を含む。第1の核酸配列は、一本鎖伸長の形態であってもよい。トランスポソームライブラリーの各トランスポソームは、トランスポソームライブラリーの残りの各メンバーのバーコード配列とは異なる固有のバーコード配列を含む。
トランスポソームは、二本鎖ゲノムDNAなどの二本鎖核酸に沿って並ぶ標的位置群にランダムに結合し、トランスポソーム及び二本鎖ゲノムDNAを含む複合体を形成する能力を有する。トランスポソーム中のトランスポザーゼは二本鎖ゲノムDNAを切断し、1つのトランスポザーゼが上側の鎖を切断し、1つのトランスポザーゼが下の鎖を切断する。トランスポソーム中の各トランスポゾンDNAは、切断部位の各末端で二本鎖ゲノムDNAに結合しており、すなわち、トランスポソームの一方のトランスポゾンDNAは左側の切断部位に結合し、トランスポソームの他方のトランスポゾンDNAは右側の切断部位に結合している。このようにして、左側の切断部位及び右側の切断部位は、切断部位に固有の同じバーコード配列でバーコード化される。したがって、バーコード配列は、左側の切断部位及び右側の切断部位を、デノボゲノムアセンブリのために互いに直接隣接しているものとして識別する。
ある特定の態様によれば、複数のトランスポザーゼ/トランスポゾンDNA複合体二量体、すなわちトランスポソームは、例えば二本鎖ゲノムDNAに沿って並ぶ対応する複数の標的位置に結合し、次いで二本鎖ゲノムDNAを複数の二本鎖断片に切断するが、各断片は、異なるバーコード配列が二本鎖断片の各末端に結合したトランスポゾンDNAを有する。このようにして、上記の説明と一致して、同じバーコード配列を有する断片の対応する末端を同定し、断片の末端を互いに計算的に連結することにより、各断片が計算的に順番に配置され得る。
一態様によれば、トランスポゾンDNAは、二本鎖ゲノムDNAに結合しており、ゲノムDNAの1つの鎖とトランスポゾンDNAの1つの鎖との間に一本鎖ギャップが存在する。一態様によれば、ギャップを埋めて二本鎖ゲノムDNAと二本鎖トランスポゾンDNAとの間に二本鎖接続を形成するために、ギャップ伸長が行われる。一態様によれば、トランスポザーゼ結合部位、バーコード配列、及びトランスポゾンDNAの増幅促進配列を含む核酸配列が、二本鎖断片の各末端に結合している。ある特定の態様によれば、トランスポザーゼは、二本鎖断片の各末端に結合しているトランスポゾンDNAに結合している。一態様によれば、トランスポザーゼは、二本鎖ゲノムDNA断片の各末端に結合しているトランスポゾンDNAから除去される。
本開示の一態様によれば、異なるバーコード配列が二本鎖ゲノムDNA断片の各末端に結合したトランスポゾンDNAを有するトランスポザーゼによって産生される二本鎖ゲノムDNA断片は、次いで、トランスポゾンDNAをテンプレートとして用いてギャップが埋められ伸長される。したがって、二本鎖ゲノムDNA断片、並びに二本鎖ゲノムDNAの両端に異なるバーコード配列及び増幅促進配列を含む二本鎖トランスポゾンDNAを含む二本鎖核酸伸長産物が生成される。
この段階で、ゲノムDNA断片、各末端の異なるバーコード、及び増幅促進配列を含む二本鎖核酸伸長産物は、ゲノムDNA断片及び各末端の異なるバーコードのアンプリコンを生成するために当業者に知られている方法を用いて増幅され得る。増幅促進配列は、二本鎖ゲノムDNAの各末端の特異的プライマー結合部位であってもよい。「特異的」プライマー結合部位への言及は、2つのプライマー結合部位が同じ配列を有し、したがって共通の配列のプライマーが全ての断片の増幅に使用され得ることを示す。PCRプライマー配列及び試薬が増幅に使用され得る。増幅促進配列は、RNA転写物の産生のためのRNAポリメラーゼ結合部位であってもよく、次いでRNA転写物は線形増幅のためにcDNAに逆転写されてもよい。ゲノムDNA断片、各末端の異なるバーコード及び増幅促進配列を含む二本鎖核酸伸長産物は、増幅試薬と組み合わされてもよく、次いで二本鎖ゲノム核酸断片は、二本鎖ゲノム核酸断片のアンプリコンを製造するために、当業者に公知の方法を用いて増幅されてもよい。
次いで、アンプリコンは、さらなる分析の前に収集及び/又は精製され得る。アンプリコンは、当業者に公知の方法を用いて配列決定され得る。一旦配列決定されると、配列は、同じバーコード配列を有する断片末端を同定するために計算的に分析され得、断片末端は、ゲノムDNAのデノボアセンブリのためのより長い配列を形成するために互いに計算的に結合され得る。一実施形態において、ゲノムDNAが2つ以上の倍数性を有する単一細胞に由来する場合、ゲノムのデノボアセンブリは、固有のバーコード配列が2つの対立遺伝子の各断片の各断片末端に挿入される際、ハプロタイプ分解デノボアセンブリを達成することができる。
本開示の実施形態は、本明細書に記載のバーコード化断片を使用してDNAを増幅する方法に関し、DNAは、少量のゲノムDNA又は限られた量のDNA、例えば単一細胞か、同じ細胞型の複数の細胞から得られた、又は個体若しくは基質から得られた組織、体液若しくは血液試料から得られた、ゲノム配列(単数又は複数)である。本開示のある特定の態様によれば、本明細書に記載の方法は、バーコード化断片を形成するために単一管内で行われてもよく、次いでバーコード化断片は、当業者に公知のハイスループット配列決定プラットフォームを使用して増幅及び配列決定され、次いで、当業者に公知の方法及びソフトウェアを使用して、元の核酸配列の隣接する断片間の切断部位又は断片化部位を指定するバーコード配列をマッチングさせることによって計算的に末端同士が結合される。
本明細書に記載のトランスポソーム断片化及びバーコード化方法は、少量の又は限られた量のDNAの増幅、配列決定及びデノボアセンブリに有用である。本明細書に記載の方法は、腫瘍及び神経塊などの極めて不均一な細胞集団を特徴とする生物系又は組織試料において特に用途がある。バーコード化ゲノムDNA断片を増幅及び配列決定するための本明細書に記載の方法は、当業者に公知及び本明細書に記載の次世代配列決定技術を使用して、そのような増幅DNAの分析及びデノボアセンブリを容易にする。本明細書に記載の方法は、遺伝的に不均一な組織(例えばがん)、希少かつ貴重な試料(例えば胚性幹細胞)、及び非分裂細胞(例えばニューロン)などを含む様々なDNA材料源、並びに当業者に公知の配列決定プラットフォーム及び遺伝子型決定方法を利用することができる。
本開示のある特定の実施形態のさらなる特徴及び利点は、以下の実施形態の説明及びその図面、並びに特許請求の範囲からより完全に明らかとなる。
本発明の前述及び他の特徴及び利点は、添付の図面と併せて以下の例示的な実施形態の詳細な説明からより完全に理解される。
ある特定の実施形態の実践又はある特定の実施形態の特徴は、他に示されない限り、当技術分野の通常の技術内である分子生物学、微生物学、組換えDNAなどの従来の技術を使用し得る。そのような技術は、文献において十分に説明されている。例えば、Sambrook、Fritsch、及びManiatis、MOLECULAR CLONING:A LABORATORY MANUAL、Second Edition(1989)、OLIGONUCLEOTIDE SYNTHESIS(M.J.Gait編、1984)、ANIMAL CELL CULTURE(R.I.Freshney編、1987)、METHODS IN ENZYMOLOGYシリーズ(Academic Press,Inc.)、GENE TRANSFER VECTORS FOR MAMMALIAN CELLS(J.M.Miller及びM.P.Calos編、1987)、HANDBOOK OF EXPERIMENTAL IMMUNOLOGY(D.M.Weir及びC.C.Blackwell編)、CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel、R.Brent、R.E.Kingston、D.D.Moore、J.G.Siedman、J.A.Smith及びK.Struhl編、1987)、CURRENT PROTOCOLS IN IMMUNOLOGY(J.E.coligan、A.M.Kruisbeek、D.H.Margulies、E.M.Shevach及びW.Strober編、1991)、ANNUAL REVIEW OF IMMUNOLOGY、並びにADVANCES IN IMMUNOLOGYなどの雑誌のモノグラフを参照されたい。上記及び下記の本明細書に記載の全ての特許、特許出願、及び刊行物は、参照により本明細書に組み込まれる。
本明細書において使用される核酸化学、生化学、遺伝学、及び分子生物学の用語及び記号は、当分野における標準的な論文及びテキスト、例えば、Kornberg及びBaker、DNA Replication、Second Edition(W.H.Freeman、New York、1992)、Lehninger、Biochemistry、Second Edition(Worth Publishers、New York、1975)、Strachan及びRead、Human Molecular Genetics、Second Edition(Wiley−Liss、New York、1999)、Eckstein、編集者、Oligonucleotides and Analogs:A Practical Approach(Oxford University Press、New York、1991)、Gait、編集者、Oligonucleotide Synthesis:A Practical Approach(IRL Press,Oxford,1984)などのものに従う。
本発明は、トランスポザーゼ又はトランスポソームを用いて、ゲノムDNAなどの元の又は出発核酸配列を断片化し、バーコード配列を切断又は断片化部位の各末端に結合させ、デノボアセンブリプロセスの一部としての後の断片配列の計算的再結合を容易にするために、DNA又はゲノムDNAなどから核酸断片鋳型を作製する方法の発見に部分的に基づく。本明細書に記載の方法は、「トランスポゾン挿入を介したチェーンアノテーション(chain annotation)」又は「CHIANTI」と呼ばれることがある。バーコード化核酸断片鋳型は、アンプリコンを生成するために増幅される。核酸断片鋳型のアンプリコンは、収集及び配列決定され得る。収集されたアンプリコンは、ゲノムDNAなどの元の核酸の断片のアンプリコンのライブラリーを形成する。
一態様によれば、溶解した単一細胞から得られるゲノム核酸などのゲノムDNAが得られる。ゲノムDNAを二本鎖断片に切断するために、複数のトランスポソーム又はトランスポソームのライブラリーが使用される。複数のトランスポソーム又はトランスポソームのライブラリーの各トランスポソームは、トランスポゾンDNAに結合したトランスポザーゼの二量体であり、すなわち、各トランスポソームは2つの別々のトランスポゾンDNAを含む。トランスポソームの各トランスポゾンDNAは、トランスポザーゼ結合部位、トランスポソームに固有のバーコード配列、及び特異的プライマー結合部位などの増幅促進配列を含む。
トランスポソームの各トランスポゾンDNAのバーコード配列は同じ配列であり、トランスポソームに固有のものである。複数のトランスポソーム又はトランスポソームのライブラリーの各トランスポソームは、複数のトランスポソーム又はトランスポソームライブラリーの残りのメンバーとは異なるそれ自身の固有の代表的バーコード配列を有する。トランスポゾンDNAは、各切断部位又は断片化部位で各二本鎖断片の上下の鎖に結合するようになる。バーコード配列は各トランスポゾンDNAに対して同じであるため、切断部位又は断片化部位は、切断部位又は断片化部位に計算的に再結合するために後で同定され得る同じバーコード配列でタグ付けされる。各トランスポソームはそれ自身の固有のバーコード配列を有し、またトランスポソームのライブラリーは多くの切断又は断片化部位を形成するために使用されるため、各切断又は断片化部位はそれ自身の固有のバーコード配列を有する。したがって、元の核酸配列由来の多くの断片がトランスポソームのライブラリーによって形成され、各断片はその断片の各末端に異なるバーコードを有する。次いで、ギャップを埋めるように二本鎖断片が処理される。断片は、特定のプライマー配列、DNAポリメラーゼ及びPCR増幅用のヌクレオチドなどの適切な増幅試薬を使用して増幅され、当業者に公知の方法を使用して配列決定される。切断部位又は断片化部位を示すマッチするバーコードが同定され、マッチするバーコードは、元の核酸配列を再現するために断片を計算的に再結合するために使用される。
本明細書に記載のトランスポザーゼ法を用いて作製されたDNA断片鋳型は、当業者に公知の方法を用いて微小液滴内で増幅され得る。微小液滴は、油相及び水相のエマルションとして形成されてもよい。エマルションは、連続油相内に水性液滴又は隔離された水性体積を含んでもよい。単一細胞のゲノムの均一な増幅のために、各断片を単離するために油中の小体積水性液滴を使用する、エマルション全ゲノム増幅法が説明されている。各断片をそれ自身の液滴又は隔離された水性反応容積に分配することによって、各液滴はDNA増幅の飽和に達することが可能になる。各液滴内のアンプリコンは次いで解乳化によって併合され、その結果、単一細胞の全ゲノムの全断片の均一な増幅がもたらされる。
ある特定の態様において、増幅は、PCRを用いて達成される。PCRは、上流及び下流プライマーからなる一対のプライマー又は一組のプライマー、並びにDNAポリメラーゼなどの重合触媒、並びに典型的には熱安定性ポリメラーゼ酵素を用いて標的ポリヌクレオチドの複製コピーが作られる反応である。PCRの方法は当技術分野において周知であり、例えば、MacPhersonら(1991)PCR 1:A Practical Approach(IRL Press at Oxford University Press)に教示されている。Mullis(米国特許第4,683,195号明細書、第4,683,202号明細書、及び第4,965,188号明細書)の用語「ポリメラーゼ連鎖反応」(「PCR」)は、クローニング又は精製なしに標的配列のセグメントの濃度を増加させるための方法を指す。標的配列を増幅するためのこのプロセスは、所望の標的配列及び増幅試薬を有するオリゴヌクレオチドプライマーを提供し、続いてポリメラーゼ(例えばDNAポリメラーゼ)の存在下で正確な一連の熱サイクルを行うことを含む。プライマーは、二本鎖標的配列のそれらのそれぞれの鎖(「プライマー結合配列」)に相補的である。増幅を達成するために、二本鎖標的配列が変性され、次いでプライマーが標的分子内のそれらの相補配列にアニーリングされる。アニーリング後、プライマーは、新しい対の相補鎖を形成するようにポリメラーゼで伸長される。所望の標的配列の高濃度の増幅セグメントを得るために、変性、プライマーアニーリング、及びポリメラーゼ伸長の工程を何回も繰り返すことができる(すなわち、変性、アニーリング、及び伸長が1つの「サイクル」を構成し、多数の「サイクル」があり得る)。所望の標的配列の増幅セグメントの長さは、互いに対するプライマーの相対位置によって決定され、したがってこの長さは制御可能なパラメータである。このプロセスの繰り返しの態様によって、方法は、「ポリメラーゼ連鎖反応」(以後「PCR」)と呼ばれ、標的配列は「PCR増幅された」と言われる。二本鎖DNA増幅産物が、DNAポリメラーゼの活性が阻害されるある特定の量まで蓄積すると、PCR増幅は飽和に達する。一旦飽和すると、PCR増幅はプラトーに達し、そこで増幅産物はより多くのPCRサイクルで増加しない。
PCRにより、ゲノムDNA中の特定の標的配列の単一コピーをいくつかの異なる方法論(例えば、標識プローブとのハイブリダイゼーション、ビオチン化プライマーの組込みとそれに続くアビジン−酵素複合体検出;dCTP又はdATPなどの32P標識デオキシヌクレオチド三リン酸の増幅セグメントへの組込み)によって検出可能なレベルまで増幅することができる。ゲノムDNAに加えて、任意のオリゴヌクレオチド又はポリヌクレオチド配列が、適切な一組のプライマー分子を用いて増幅され得る。特に、各微小液滴内でPCRプロセス自体によって形成された増幅セグメントは、それ自体、その後のPCR増幅のための効率的な鋳型である。PCRを実行するための方法及びキットは、当技術分野において周知である。PCR又は遺伝子クローニングなどのポリヌクレオチドの複製コピーを製造する全てのプロセスは、本明細書において集合的に複製と呼ばれる。サザンブロット又はノーザンブロット分析などのハイブリダイゼーション反応において、プライマーをプローブとして使用することもできる。
表現「増幅」又は「増幅する」は、それによって特定のポリヌクレオチドの余分なコピー又は複数のコピーが形成されるプロセスを指す。増幅は、PCR、ライゲーション増幅(又はリガーゼ連鎖反応、LCR)などの方法及び他の増幅方法を含む。これらの方法は当技術分野において公知であり、広く実践されている。例えば、米国特許第4,683,195号明細書及び同第4,683,202号明細書、並びにInnisら、「PCR protocols:a guide to method and applications」Academic Press,Incorporated(1990)(PCRに関する)、及びWuら(1989)Genomics 4:560〜569(LCRに関する)を参照されたい。一般に、PCR手順は、(i)DNA試料(又はライブラリー)内の特定の遺伝子へのプライマーの配列特異的ハイブリダイゼーション、(ii)DNAポリメラーゼを用いた、複数ラウンドのアニーリング、伸長、及び変性を含むその後の増幅、並びに(iii)正しいサイズのバンドについてのPCR産物のスクリーニングを含む遺伝子増幅方法を説明している。使用されるプライマーは、重合の開始をもたらすのに十分な長さ及び適切な配列のオリゴヌクレオチドである、すなわち、各プライマーは、増幅されるゲノム遺伝子座の各鎖に相補的であるように特別に設計されている。
増幅反応を行うための試薬及びハードウェアは市販されている。特定の遺伝子領域からの配列を増幅するのに有用なプライマーは、好ましくは標的領域又はその隣接領域の配列に相補的であり、かつ特異的にハイブリダイズし、そして当業者に公知の方法を使用して調製され得る。増幅によって生成された核酸配列は直接配列決定され得る。
2つの一本鎖ポリヌクレオチド間で逆平行の配置でハイブリダイゼーションが起こる場合、その反応は「アニーリング」と呼ばれ、それらのポリヌクレオチドは「相補的」と説明される。ハイブリダイゼーションが第1のポリヌクレオチドの鎖と第2のポリヌクレオチドの鎖との間で生じ得る場合、二本鎖ポリヌクレオチドは別のポリヌクレオチドに対して相補的又は相同であり得る。相補性又は相同性(あるポリヌクレオチドが別のポリヌクレオチドと相補的である程度)は、一般に認められている塩基対合規則に従って、互いに水素結合を形成すると予想される対向鎖中の塩基の割合に関して定量化可能である。
「PCR産物」、「PCR断片」、及び「増幅産物」という用語は、変性、アニーリング及び伸長のPCR工程の2つ以上のサイクルが完了した後に得られる化合物の混合物を指す。これらの用語は、1又は複数の標的配列の1又は複数のセグメントの増幅があった場合を包含する。本開示の一態様によれば、各微小液滴は、単一の鋳型DNA断片のPCR産物を含む。
「増幅試薬」という用語は、プライマー、核酸鋳型、及び増幅酵素を除いて、増幅に必要とされるそれらの試薬(デオキシリボヌクレオチド三リン酸、緩衝液など)を指す場合がある。典型的には、増幅試薬は、他の反応成分と共に反応容器(試験管、マイクロウェルなど)内に配置及び収納される。増幅方法としては、当業者に公知のPCR法が含まれ、またローリングサークル増幅(Blancoら、J.Biol.Chem.、264、8935〜8940、1989)、超分岐ローリングサークル増幅(Lizardら、Nat.Genetics、19、225〜232、1998)、及びループ媒介等温増幅(Notomiら、Nuc.Acids Res.、28、e63、2000)などが含まれ、これらはそれぞれ参照によりその全体が本明細書に組み込まれる。
エマルションPCRの場合、エマルションPCR反応は、「油中水」混合物を激しく振盪又は撹拌して、数百万ものミクロンサイズの水性区画を生成することによって形成される。マイクロ流体チップは、油相及び水相を振盪又は撹拌することによってエマルションを形成するためのデバイスを備えていてもよい。あるいは、水滴は、ある特定の油を水相と合わせること、又は水相を油相に導入することによって自発的に形成され得る。増幅されるDNAライブラリーは、乳化前に限界希釈で混合される。区画サイズ、すなわち微小液滴サイズ、及び増幅されるDNA断片ライブラリーの限界希釈を形成した微小液滴の量の組み合わせは、平均して、ただ1つのDNA分子を含有する区画を生成するために使用される。微小液滴形成又は乳化工程中に生成される水性区画のサイズに応じて、1μl当たり最大3×109個の個々のPCR反応が、同じ管内で同時に実行され得る。本質的に、エマルション中のそれぞれの小さな水性区画微小液滴が、マイクロPCR反応器を形成する。エマルション中の区画の平均サイズは、乳化条件に依存して、直径がサブミクロン〜100ミクロン超、又は1ピコリットル〜1000ピコリットル、又は1ナノリットル〜1000ナノリットル、又は1ピコリットル〜1ナノリットル、又は1ピコリットル〜1000ナノリットルの範囲である。
それぞれ参照により本明細書に組み込まれる英国特許出願第2,202,328号明細書及びPCT特許出願第PCT/US89/01025号明細書に記載されているような他の増幅方法が、本開示に従って使用されてもよい。前者の出願では、「修飾された」プライマーがPCR様鋳型及び酵素依存的合成において使用される。プライマーは、捕捉部分(例えば、ビオチン)及び/又は検出部分(例えば、酵素)で標識することによって修飾され得る。後者の出願では、過剰の標識プローブが試料に添加される。標的配列の存在下で、プローブは結合し、触媒的に切断される。切断後、標的配列は無傷で放出され、過剰のプローブに結合される。標識プローブの切断は標的配列の存在を知らせる。
他の適切な増幅方法には、「race」及び「片側PCR」が含まれる。(Frohman、In:PCR Protocols:A Guide to Methods and Applications、Academic Press、N.Y.、1990、それぞれ参照により本明細書に組み込まれる。)得られた「ジ−オリゴヌクレオチド」の配列を有する核酸の存在下で2つ(又はそれ以上)のオリゴヌクレオチドをライゲーションし、それによってジ−オリゴヌクレオチドを増幅することに基づく方法もまた、本開示に従ってDNAを増幅するために使用され得る(Wuら、Genomics 4:560〜569、1989(参照により本明細書に組み込まれる))。
ある特定の態様によれば、例示的なトランスポゾン系は、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼなどを含む。他の有用なトランスポゾン系は当業者に知られており、Tn3トランスポゾン系(Maekawa,T.、Yanagihara,K.、及びOhtsubo,E.(1996)、A cell−free system of Tn3 transposition and transposition immunity、Genes Cells 1、1007〜1016を参照されたい)、Tn7トランスポゾン系(Craig,N.L.(1991)、Tn7:a target site−specific transposon、Mol.Microbiol.5、2569〜2573を参照されたい)、Tn10トランスポゾン系(Chalmers,R.、Sewitz,S.、Lipkow,K.、及びCrellin,P.(2000)、Complete nucleotide sequence of Tn10、J.Bacteriol 182、2970〜2972を参照されたい)、Piggybacトランスポゾン系(Li,X.、Burnight,E.R.、Cooney,A.L.、Malani,N.、Brady,T.、Sander,J.D.、Staber,J.、Wheelan,S.J.、Joung,J.K.、McCray,P.B.,Jr.ら(2013)、PiggyBac transposase tools for genome engineering、Proc.Natl.Acad.Sci.USA 110、E2279〜2287を参照されたい)、Sleeping beautyトランスポゾン系(Ivics,Z.、Hackett,P.B.、Plasterk,R.H.、及びIzsvak,Z.(1997)、Molecular reconstruction of Sleeping Beauty,a Tc1−like transposon from fish,and its transposition in human cells、Cell 91、501〜510を参照されたい)、Tol2トランスポゾンシステム(Kawakami,K.(2007)、Tol2:a versatile gene transfer vector in vertebrates、Genome Biol.8 Suppl.1、S7を参照されたい)を含む。
増幅されるDNAは、単一細胞又は少数の細胞集団から得られてもよい。本明細書に記載される方法は、単一の反応容器内で行われる単一の反応混合物などの反応混合物中の任意の種又は生物からDNAを増幅することを可能にする。一態様では、本明細書に記載の方法は、ヒト、動物、植物、酵母、ウイルス、真核生物及び原核生物のDNAを含むがこれらに限定されない任意の源からのDNAの配列非依存的増幅を含む。
一態様によれば、単一細胞由来の二本鎖ゲノムDNAをそれぞれトランスポゾンDNAに結合したTn5トランスポザーゼと接触させることを含む、単一細胞全ゲノム増幅、配列決定及びデノボアセンブリの方法が提供され、トランスポゾンDNAは、トランスポソームと呼ばれるトランスポザーゼ/トランスポゾンDNA複合体二量体を形成するための、二本鎖の19bpトランスポザーゼ(Tnp)結合部位と、1又は複数のバーコード配列及びプライマー結合部位を含む第1の核酸配列と、を含む。第1の核酸配列は、一本鎖伸長の形態であってもよい。一態様によれば、第1の核酸配列は、5’オーバーハングなどのオーバーハングであってもよく、オーバーハングは、バーコード領域及びプライミング部位を含む。オーバーハングは、必要に応じてバーコード領域及びプライミング部位を含むのに適した任意の長さであってもよい。トランスポソームは、二本鎖ゲノムDNAに沿った標的位置に結合し、二本鎖ゲノムDNAを複数の二本鎖断片に切断し、各二本鎖断片は、Tnp結合部位により上鎖に結合した第1の複合体及びTnp結合部位により下鎖に結合した第2の複合体を有する。トランスポゾン結合部位、すなわちトランスポゾンDNAは、二本鎖断片の各5’末端に結合している。一態様によれば、Tn5トランスポザーゼは、複合体から除去される。二本鎖断片は、二本鎖伸長産物の各末端に異なるバーコード配列及び特異的プライマー結合部位を有する二本鎖伸長産物を作製するために、トランスポゾンDNAに沿って伸長される。一態様によれば、Tn5トランスポザーゼ結合部位の二本鎖ゲノムDNA断片への結合から生じ得るギャップが埋められ得る。ギャップが埋められた二本鎖伸長産物は、増幅試薬と混合され、二本鎖ゲノムDNA断片が増幅される。各末端に異なるバーコード配列を含むアンプリコンは、例えば、当業者に公知のハイスループット配列決定法を用いて配列決定される。
特定の態様では、実施形態は、特定部位の表示を欠くことなく実質的に全ゲノムを増幅、配列決定及びデノボアセンブリする方法(本明細書では「全ゲノム増幅」と定義される)に関する。特定の実施形態では、全ゲノム増幅は、ゲノムライブラリーの実質的に全ての断片又は全ての断片の増幅を含む。さらなる特定の実施形態では、「実質的に全体」又は「実質的に全て」とは、ゲノム内の全配列の約80%、約85%、約90%、約95%、約97%、又は約99%を指す。
一態様によれば、DNA試料は、ゲノムDNA、ミクロ解剖染色体DNA、酵母人工染色体(YAC)DNA、プラスミドDNA、コスミドDNA、ファージDNA、P1由来人工染色体(PAC)DNA、又は細菌人工染色体(BAC)DNA、ミトコンドリアDNA、葉緑体DNA、法医学試料DNA、又は試験対象の天然若しくは人工の源からのその他のDNAである。別の好ましい実施形態では、DNA試料は、哺乳動物DNA、植物DNA、酵母DNA、ウイルスDNA、又は原核生物DNAである。さらに別の好ましい実施形態では、DNA試料は、ヒト、ウシ、ブタ、ヒツジ、ウマ、げっ歯類、鳥類、魚、エビ、植物、酵母、ウイルス、又は細菌から得られる。好ましくは、DNA試料は、ゲノムDNAである。
ある特定の例示的な態様によれば、必要に応じて増幅、配列決定、及びデノボアセンブリのための核酸断片を作製するために、転位方式が使用される。一態様によれば、同じバーコードが挿入されたトランスポゾンDNAを用いてゲノムDNAを二本鎖ゲノムDNA断片に断片化するために、転位方式が使用される。図1に示されるように、トランスポゾンDNAは、二本鎖トランスポザーゼ結合部位、バーコード配列B及びプライミング部位Pを含む。二本鎖トランスポザーゼ結合部位は、オーバーハングの一方の末端にバーコード領域及びプライミング部位を含む一本鎖オーバーハングに共有結合などによって連結又は接続された二本鎖19bp Tn5トランスポザーゼ(Tnp)結合部位であってもよい。トランスポザーゼを用いて数百万の小さな断片を形成しながら、トランスポゾンDNAは単一細胞のゲノムDNAに挿入される。トランスポザーゼ除去及びギャップフィリングの後、断片の各末端に異なるバーコード配列及び特異的プライマー配列を有するゲノムDNA断片は、DNAポリメラーゼ、ヌクレオチド及び増幅試薬と共に特異的プライマーを用いて増幅され、単一細胞の全ゲノムがPCR増幅される。
単一細胞からのDNAなどの少量のDNAを増幅する場合のある特定の態様によれば、増幅前の単一細胞内から得ることができる少量(約6pg)のゲノムDNAを最大にするようにDNAカラム精製工程は行われない。DNAは、細胞溶解物又は他の不純な条件から直接増幅され得る。したがって、DNA試料は、不純であってもよく、未精製であってもよく、又は単離されていなくてもよい。したがって、本方法の態様は、増幅のためにゲノムDNAを最大化し、また精製による損失を減少させることを可能にする。さらなる態様によれば、本明細書に記載の方法は、PCR以外の増幅方法を利用してもよい。
一態様によれば、図2に一般的に示されるように、トランスポザーゼ(Tnp)及びトランスポゾンDNAは、例えば微小液滴内で合わされ、Tnp及びトランスポゾンDNAは、互いに結合及び二量体化してトランスポソームを形成する。
図3に示されるように、トランスポソームライブラリーのトランスポソームは、二量体として、標的の単一細胞ゲノムDNAをランダムに捕捉するか、又は他の方法で結合する。図示されているトランスポソームには1、2及び3の番号が付されているが、トランスポソームの数は、数千、数万、数十万、数百万などであってもよい。各トランスポソームは、固有のバーコード配列、例えばバーコード配列1、バーコード配列2、バーコード配列3などによって表される。固有のバーコード配列は、トランスポソームの各トランスポゾンDNA内にある。トランスポソーム当たり2つのトランスポゾンDNAがあるため、2つのトランスポゾンDNAはホモ二量体と考えることができ、これは1つのトランスポゾンDNA二量体が同じバーコード情報を有する2つのDNA配列を有することを意味する。トランスポソームライブラリーの各トランスポソーム(及びトランスポゾンDNA二量体)は、トランスポソームに固有の異なるバーコードを有する。トランスポソーム内のトランスポザーゼは、1つのトランスポザーゼが上鎖を切断し、1つのトランスポザーゼが下鎖を切断することによってゲノムDNAを切断し、ゲノムDNA断片を形成する。複数のトランスポソームは、複数のゲノムDNA断片を形成する。したがって、トランスポゾンDNA二量体からの1つのトランスポゾンDNAは切断部位又は断片化部位の各末端に結合しており、すなわち、トランスポソーム1からの一方のトランスポゾンDNAは左側の切断部位に結合し、トランスポソーム1からの他方のトランスポゾンDNAは右側の切断部位に結合する。トランスポソームライブラリーは核酸を断片に切断するので、各断片は断片の各末端に異なるバーコード配列を有する、すなわち各断片は異なるバーコード配列を含むトランスポソームライブラリーの2つの異なるトランスポソームによって切断される2つの異なる切断部位によって産生される。これは2つの例示的な断片によって示されており、上の断片は一方の末端にバーコード配列1を、また他方の末端にバーコード配列2を有する。同様に、下の断片は一方の末端にバーコード配列2を、また他方の末端にバーコード配列3を有する。図示されるように、2つの断片間の切断部位はトランスポソーム2によって生成され、左側の切断部位(すなわち図3の上の断片の右側を参照)はバーコード配列2を有する1つのトランスポゾンを含み、一方右側の切断部位(すなわち図3の下の断片の左側を参照)は、バーコード配列2を有する他方のトランスポゾンを含む。
図4に示されるように、ゲノムDNAの断片化は転位/挿入部位の両端にギャップを残す。ギャップは任意の長さを有し得るが、9塩基ギャップが例示的である。その結果、上鎖の5’位にトランスポゾンDNA Tnp結合部位が結合し、下鎖の5’位にトランスポゾンDNA Tnp結合部位が結合したゲノムDNA断片が得られる。トランスポゾンDNAの結合又は挿入から生じるギャップが示されている。図4に示されるように、転位後、トランスポザーゼが除去され、ギャップを埋めてトランスポゾンDNAに元々設計されていた一本鎖オーバーハングを補完するために、ギャップ伸長が行われる。
さらに図5に示されるように、複数の断片を形成するために、対応するバーコード配列Bnを有する複数のトランスポソームnが使用され、短い配列決定リードをより長い連続配列に連鎖するためにバーコード配列が使用される。それぞれ同じバーコードB(n)を有する2つのトランスポゾンDNAを有するトランスポソームのライブラリー(例えば数百万程度)がゲノムDNAに挿入され、ゲノムDNAを数百万の異なる断片(F1、F2、F3・・・)に切断する。全ゲノム増幅及び配列決定の後、同じバーコードでタグ付けされた断片は、より長い断片長を達成するために互いに計算的に連結され得る。
特定のTn5転位システムが説明されており、当業者に利用可能である。Goryshin,I.Y.及びW.S.Reznikoff、Tn5 in vitro transposition.The Journal of biological chemistry、1998.273(13):p.7367〜74;Davies,D.R.ら、Three−dimensional structure of the Tn5 synaptic complex transposition intermediate.Science、2000.289(5476):p.77〜85;Goryshin,I.Y.ら、Insertional transposon mutagenesis by electroporation of released Tn5 transposition complexes.Nature biotechnology、2000.18(1):p.97〜100;並びにSteiniger−White,M.、I.Rayment、及びW.S.Reznikoff、Structure/function insights into Tn5 transposition.Current opinion in structural biology、2004.14(1):p.50〜7を参照されたく、これらはそれぞれ参照することにより全ての目的においてその全体が本明細書に組み込まれる。DNAライブラリー調製及び他の使用のためのTn5転位方式を利用するキットが知られている。Adey,A.ら、Rapid,low−input,low−bias construction of shotgun fragment libraries by high−density in vitro transposition.Genome biology、2010.11(12):p.R119;Marine,R.ら、Evaluation of a transposase protocol for rapid generation of shotgun high−throughput sequencing libraries from nanogram quantities of DNA.Applied and environmental microbiology、2011.77(22):p.8071〜9;Parkinson,N.J.ら、Preparation of high−quality next−generation sequencing libraries from picogram quantities of target DNA.Genome research、2012.22(1):p.125〜33;Adey,A.及びJ.Shendure、Ultra−low−input,tagmentation−based whole−genome bisulfite sequencing.Genome research、2012.22(6):p.1139〜43;Picelli,S.ら、Full−length RNA−seq from single cells using Smart−seq2.Nature protocols、2014.9(1):p.171〜81;並びにBuenrostro,J.D.ら、Transposition of native chromatin for fast and sensitive epigenomic profiling of open chromatin、DNA−binding proteins and nucleosome position.Nature methods、2013を参照されたく、これらはそれぞれ、参照することにより全ての目的においてその全体が本明細書に組み込まれる。国際公開第98/10077号パンフレット、欧州特許出願公開第2527438号明細書及び欧州特許出願公開第2376517号明細書もまた参照されたく、これらはそれぞれ参照することによりその全体が本明細書に組み込まれる。市販の転位キットは、NEXTERAの商品名で販売されており、Illuminaから入手可能である。
本明細書で使用される場合、「ゲノム」という用語は、個体、細胞、又は細胞小器官が有する集合的遺伝子セットとして定義される。本明細書で使用される場合、「ゲノムDNA」という用語は、個体、細胞、又は細胞小器官が有する部分的又は完全な集合的遺伝子セットを含むDNA材料として定義される。
本明細書で使用される場合、「ヌクレオシド」という用語は、リボース又はデオキシリボース糖に共有結合したプリン又はピリミジン塩基を有する分子を指す。例示的なヌクレオシドには、アデノシン、グアノシン、シチジン、ウリジン及びチミジンが含まれる。さらなる例示的なヌクレオシドには、イノシン、1−メチルイノシン、シュードウリジン、5,6−ジヒドロウリジン、リボチミジン、2N−メチルグアノシン及び2,2N、N−ジメチルグアノシン(「レア」ヌクレオシドとも呼ばれる)が含まれる。「ヌクレオチド」という用語は、糖部分へのエステル結合で結合した1又は複数のリン酸基を有するヌクレオシドを指す。例示的なヌクレオチドには、ヌクレオシド一リン酸、ヌクレオシド二リン酸及びヌクレオシド三リン酸が含まれる。「ポリヌクレオチド」、「オリゴヌクレオチド」及び「核酸分子」という用語は、本明細書では同義的に使用され、5’と3’の炭素原子間のホスホジエステル結合によって互いに結合した任意の長さのヌクレオチド(デオキシリボヌクレオチド又はリボヌクレオチド)のポリマーを指す。ポリヌクレオチドは、任意の三次元構造を有し得、また既知又は未知の任意の機能を果たし得る。以下は、ポリヌクレオチドの限定されない例である:遺伝子又は遺伝子断片(例えば、プローブ、プライマー、EST又はSAGEタグ)、エクソン、イントロン、メッセンジャーRNA(mRNA)、トランスファーRNA、リボソームRNA、リボザイム、cDNA、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離DNA、任意の配列の単離RNA、核酸プローブ及びプライマー。ポリヌクレオチドは、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含み得る。この用語はまた、二本鎖及び一本鎖分子の両方を指す。他に特定又は要求されない限り、ポリヌクレオチドを含む本発明の任意の実施形態は、二本鎖形態、及び二本鎖形態を構成することが知られている又は予測される2つの相補的一本鎖形態のそれぞれ、の両方を包含する。ポリヌクレオチドは、アデニン(A)、シトシン(C)、グアニン(G)、チミン(T)、及びポリヌクレオチドがRNAである場合はチミンの代わりにウラシル(U)の4つのヌクレオチド塩基の特定の配列で構成される。したがって、ポリヌクレオチド配列という用語は、ポリヌクレオチド分子のアルファベット表示である。このアルファベット表示は、中央処理装置を有するコンピュータ内のデータベースに入力することができ、機能的ゲノム学及び相同性検索などのバイオインフォマティクス用途に使用することができる。
「DNA」、「DNA分子」及び「デオキシリボ核酸分子」という用語は、デオキシリボヌクレオチドのポリマーを指す。DNAは、天然で(例えばDNA複製により)合成されてもよい。RNAは、転写後修飾されてもよい。DNAはまた、化学合成されてもよい。DNAは、一本鎖(すなわちssDNA)又は多鎖(例えば二本鎖、すなわちdsDNA)であってもよい。
「ヌクレオチド類似体」、「改変ヌクレオチド」及び「修飾ヌクレオチド」という用語は、天然に存在しないリボヌクレオチド又はデオキシリボヌクレオチドを含む、非標準ヌクレオチドを指す。ある特定の例示的な実施形態では、ヌクレオチド類似体は、ヌクレオチドのある特定の化学的性質を改変するがその意図された機能を果たすヌクレオチド類似体の能力を保持するように、任意の位置で修飾される。誘導体化されてもよいヌクレオチドの位置の例には、5位、例えば、5−(2−アミノ)プロピルウリジン、5−ブロモウリジン、5−プロピンウリジン、5−プロペニルウリジンなど;6位、例えば6−(2−アミノ)プロピルウリジン;アデノシン及び/又はグアノシンの8位、例えば8−ブロモグアノシン、8−クロログアノシン、8−フルオログアノシンなどが含まれる。ヌクレオチド類似体にはまた、デアザヌクレオチド、例えば7−デアザ−アデノシン;O−及びN−修飾(例えばアルキル化、例えばN6−メチルアデノシン、又は他の当技術分野で公知の通り)ヌクレオチド;並びにHerdewijn、Antisense Nucleic Acid Drug Dev.、2000 Aug.10(4):297〜310に記載のものなどの他の複素環修飾ヌクレオチド類似体が含まれる。
ヌクレオチド類似体はまた、ヌクレオチドの糖部分に対する修飾を含んでもよい。例えば、2’OH基は、H、OR、R、F、Cl、Br、I、SH、SR、NH2、NHR、NR2、COOR、又はORから選択される基で置き換えられてもよい。ここで、Rは、置換又は非置換のC1〜C6アルキル、アルケニル、アルキニル、アリールなどである。他の可能な修飾には、米国特許第5,858,988号明細書及び同第6,291,438号明細書に記載のものが挙げられる。
ヌクレオチドのリン酸基はまた、例えばEckstein、Antisense Nucleic Acid Drug Dev.2000 Apr.10(2):117〜21、Rusckowskiら、Antisense Nucleic Acid Drug Dev.2000 Oct.10(5):333〜45、Stein、Antisense Nucleic Acid Drug Dev.2001 Oct.11(5):317〜25、Vorobjevら、Antisense Nucleic Acid Drug Dev.2001 Apr.11(2):77〜85、及び米国特許第5,684,143号明細書に記載されるように、例えばリン酸基の1又は複数の酸素を硫黄(例えば、ホスホロチオエート)で置換することによって、又はヌクレオチドがその意図される機能を果たすことを可能にする他の置換を行うことによって改変され得る。上記の修飾のいくつか(例えば、リン酸基修飾)は、インビボ又はインビトロで、例えば、前記類似体を含むポリヌクレオチドの加水分解速度を低下させる。
「インビトロ」という用語は、その当技術分野で認識されている意味を有し、例えば精製試薬又は細胞抽出物などの抽出物を含む。「インビボ」という用語もまた、その当技術分野において認識されている意味を有し、例えば、不死化細胞、初代細胞、細胞株、及び/又は生物内の細胞などの生細胞を含む。
本明細書で使用される場合、「相補的」及び「相補性」という用語は、塩基対合則によって関連しているヌクレオチド配列に関して使用される。例えば、配列5’−AGT−3’は、配列5’−ACT−3’に相補的である。相補性は部分的であっても、又は全体的であってもよい。部分的相補性は、1又は複数の核酸塩基が塩基対合則に従ってマッチしない場合に生じる。核酸間の全体的又は完全な相補性は、塩基対合則に従ってありとあらゆる核酸塩基が他の塩基とマッチする場合に生じる。核酸鎖間の相補性の程度は、核酸鎖間のハイブリダイゼーションの効率及び強度に大きな影響を与える。
「ハイブリダイゼーション」という用語は、相補的核酸の対合を指す。ハイブリダイゼーション及びハイブリダイゼーションの強度(すなわち、核酸間の会合の強度)は、核酸間の相補性の程度、関与する条件のストリンジェンシー、形成されたハイブリッドのTm、及び核酸内G:C比などの要因によって影響を受ける。その構造内に相補的核酸の対合を含む単一分子は、「自己ハイブリダイズした」と言われる。
「Tm」という用語は、核酸の融解温度を指す。融解温度は、二本鎖核酸分子の集団が一本鎖に半分解離する温度である。核酸のTmを計算するための式は、当技術分野において周知である。標準的な参考文献によって示されるように、核酸が1MのNaClの水溶液中にある場合、Tm値の簡単な推定は、式:Tm=81.5+0.41(%G+C)によって計算され得る(例えば、Anderson及びYoung、Quantitative Filter Hybridization,in Nucleic Acid Hybridization(1985)を参照されたい)。他の参考文献は、Tmの計算に構造的特徴及び配列特徴を考慮に入れる、より洗練された演算を含む。
「ストリンジェンシー」という用語は、核酸ハイブリダイゼーションが行われる温度、イオン強度、及び有機溶媒などの他の化合物の存在の条件を指す。
核酸ハイブリダイゼーションに関して使用される場合、「低ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブを用いる場合、5×SSPE(43.8g/lのNaCl、6.9g/lのNaH2PO4(H2O)及び1.85g/lのEDTA、NaOHでpH7.4に調整)、0.1%SDS、5×デンハルト試薬(50×デンハルトは500ml当たり5gのFicoll(Type 400、Pharmacia)、5gのBSA(Fraction V、Sigma)を含有する)、及び100mg/mlの変性サケ精子DNAからなる溶液中42℃での結合又はハイブリダイゼーション、並びにその後の5×SSPE、0.1%SDSを含む溶液中42℃での洗浄と等価の条件を含む。
核酸ハイブリダイゼーションに関して使用される場合、「中ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブを用いる場合、5×SSPE(43.8g/lのNaCl、6.9g/lのNaH2PO4(H2O)及び1.85g/lのEDTA、NaOHでpH7.4に調整)、0.5%SDS、5×デンハルト試薬、及び100mg/mlの変性サケ精子DNAからなる溶液中42℃での結合又はハイブリダイゼーション、並びにその後の1.0×SSPE、1.0%SDSを含む溶液中42℃での洗浄と等価の条件を含む。
核酸ハイブリダイゼーションに関して使用される場合、「高ストリンジェンシー条件」は、長さ約500ヌクレオチドのプローブを用いる場合、5×SSPE(43.8g/lのNaCl、6.9g/lのNaH2PO4(H2O)及び1.85g/lのEDTA、NaOHでpH7.4に調整)、0.5%SDS、5×デンハルト試薬、及び100mg/mlの変性サケ精子DNAからなる溶液中42℃での結合又はハイブリダイゼーション、並びにその後の0.1×SSPE、1.0%SDSを含む溶液中42℃での洗浄と等価の条件を含む。
ある特定の例示的な実施形態において、細胞が同定され、次いで単一細胞又は複数の細胞が単離される。本開示の範囲内の細胞は、DNA含有量を理解することが当業者によって有用であると考えられる任意の種類の細胞を含む。本開示による細胞は、任意の種類の癌細胞、肝細胞、卵母細胞、胚、幹細胞、iPS細胞、ES細胞、ニューロン、赤血球、メラニン細胞、アストロサイト、生殖細胞、希突起膠細胞、腎臓細胞などを含む。一態様によれば、本発明の方法は、単一細胞由来の細胞DNAを用いて実践される。複数の細胞は、約2〜約1,000,000個の細胞、約2〜約10個の細胞、約2〜約100個の細胞、約2〜約1,000個の細胞、約2〜約10,000個の細胞、約2〜約100,000個の細胞、約2〜約10個の細胞、又は約2〜約5個の細胞を含む。
本明細書に記載される方法によって処理される核酸はDNAであってもよく、それらは例えばヒト試料などの任意の有用な源から得ることができる。特定の実施形態では、二本鎖DNA分子は、さらに、例えばヒト由来の試料から得られたものなどのゲノムを含むと定義される。試料は、血液、血清、血漿、脳脊髄液、頬掻き取り、乳頭吸引液、生検材料、精液(射精液と呼ばれることもある)、尿、糞便、毛包、唾液、汗、免疫沈降又は物理的に単離されたクロマチンなどのヒト由来の任意の試料であってもよい。特定の実施形態では、試料は、単一細胞を含む。特定の実施形態では、試料は、単一細胞のみを含む。
特定の実施形態では、試料からの増幅及びデノボアセンブルされた核酸分子は、診断又は予後情報を提供する。例えば、試料から調製された核酸分子は、ゲノムコピー数及び/又は配列情報、対立遺伝子変異情報、がん診断、出生前診断、父性情報、疾患診断、検出、モニタリング、及び/又は治療情報、配列情報などを提供し得る。
本明細書で使用される場合、「単一細胞」は、1つの細胞を指す。本明細書に記載の方法において有用な単一細胞は、目的の組織から、又は生検材料、血液試料、若しくは細胞培養物から得られてもよい。さらに、特定の臓器、組織、腫瘍、新生物などからの細胞が取得され、本明細書に記載の方法において使用されてもよい。さらに、一般に、細菌又は酵母を含む原核生物又は真核生物の単一細胞生物の集団などの任意の集団からの細胞が、本方法において使用されてもよい。例えば、組織試料中の細胞を接続するタンパク質を消化するためのトリプシン又はパパインの酵素的使用、又は培養中の接着細胞の遊離、又は試料中の細胞の機械的分離を含む当技術分野で公知の標準的方法を用いて、単一細胞懸濁液が得られてもよい。単一細胞は、単一細胞が個々に処理され得る任意の適切な反応容器に配置されてもよい。例えば、各単一細胞が単一のウェルに配置されるような96ウェルプレート。
単一細胞を操作する方法は当技術分野において公知であり、蛍光活性化細胞選別(FACS)、フローサイトメトリー(Herzenberg、PNAS USA 76:1453〜55 1979)、マイクロマニピュレーション及び半自動細胞ピッカー(例えばStoelting Co.のQuixell(商標)細胞移入システム)の使用を含む。個々の細胞は、例えば、位置、形態、又はレポーター遺伝子発現などの顕微鏡観察によって検出可能な特徴に基づいて個々に選択され得る。さらに、勾配遠心分離及びフローサイトメトリーの組み合わせもまた、単離又は選別効率を高めるために使用され得る。
所望の細胞が同定されたら、当業者に公知の方法を用いて、細胞を溶解してDNAを含む細胞内容物を放出させる。細胞内容物は容器又は収集容積内に含まれる。本発明のいくつかの態様では、ゲノムDNAなどの細胞内容物は、細胞を溶解することによって細胞から放出され得る。溶解は、例えば、細胞を加熱することによって、又は界面活性剤若しくは他の化学的方法を使用することによって、又はこれらの組み合わせによって達成され得る。しかしながら、当技術分野において公知の任意の適切な溶解方法が使用され得る。例えば、Tween−20の存在下での72℃で2分間の細胞加熱が、細胞を溶解するのに十分である。あるいは、細胞を水中で10分間65℃に加熱してもよく(Esumiら、Neurosci Res 60(4):439〜51(2008))、0.5%のNP−40を添加したPCR緩衝液II(Applied Biosystems)中で90秒間70℃に加熱してもよく(Kurimotoら、Nucleic Acids Res 34(5):e42(2006))、又は、溶解は、プロテイナーゼKなどのプロテアーゼを用いて、若しくはグアニジンイソチオシアネートなどのカオトロピック塩を使用することによって達成されてもよい(米国特許出願公開第2007/0281313号明細書)。本明細書に記載の方法によるゲノムDNAの増幅は、反応混合物が細胞溶解物に添加され得るように、細胞溶解物に対して直接実施されてもよい。あるいは、細胞溶解物は、当業者に公知の方法を使用して、2つ以上の容積、例えば2つ以上の容器、管又は領域に分離されてもよく、細胞溶解物の一部が各容積の容器、管又は領域に含まれてもよい。次いで、各容器、管又は領域に含まれるゲノムDNAが、本明細書に記載の方法又は当業者に公知の方法によって増幅され得る。
本発明において使用される核酸はまた、天然又は非天然塩基を含んでもよい。これに関して、天然のデオキシリボ核酸は、アデニン、チミン、シトシン又はグアニンからなる群から選択される1又は複数の塩基を有してもよく、リボ核酸は、ウラシル、アデニン、シトシン又はグアニンからなる群から選択される1又は複数の塩基を有してもよい。核酸に含まれ得る例示的な非天然塩基は、天然骨格を有するか又は類似体構造を有するかにかかわらず、イノシン、キサタニン、ヒポキサタニン、イソシトシン、イソグアニン、5−メチルシトシン、5−ヒドロキシメチルシトシン、2−アミノアデニン、6−メチルアデニン、6−メチルグアニン、2−プロピルグアニン、2−プロピルアデニン、2−チオリラシル、2−チオチミン、2−チオシトシン、15−ハロウラシル、15−ハロシトシン、5−プロピニルウラシル、5−プロピニルシトシン、6−アゾウラシル、6−アゾシトシン、6−アゾチミン、5−ウラシル、4−チオウラシル、8−ハロアデニン又はグアニン、8−アミノアデニン又はグアニン、8−チオールアデニン又はグアニン、8−チオアルキルアデニン又はグアニン、8−ヒドロキシルアデニン又はグアニン、5−ハロ置換ウラシル又はシトシン、7−メチルグアニン、7−メチルアデニン、8−アザグアニン、8−アザアデニン、7−デアザグアニン、7−デアザアデニン、3−デアザグアニン、3−デアザアデニンなどを含むが、これらに限定されない。米国特許第5,681,702号明細書に概説されているように、特定の実施形態は、非特異的ハイブリダイゼーションを減少させるために核酸中にイソシトシン及びイソグアニンを利用することができる。
本明細書で使用される場合、用語「プライマー」は、一般に、例えば配列決定プライマーなど、ポリヌクレオチド鋳型と二本鎖を形成すると核酸合成の開始点として作用し、伸長した二本鎖が形成されるように鋳型に沿ってその3’末端から伸長することができる天然又は合成のオリゴヌクレオチドを含む。伸長過程中に付加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常プライマーは、DNAポリメラーゼにより伸長される。プライマーは、通常、3〜36ヌクレオチド、また5〜24ヌクレオチド、また14〜36ヌクレオチドの範囲内の長さを有する。本発明の範囲内のプライマーは、直交プライマー、増幅プライマー、構築用プライマーなどを含む。一対のプライマーは、目的の配列又は目的の配列のセットに隣接し得る。プライマー及びプローブは、縮重配列又は準縮重配列であってもよい。本発明の範囲内のプライマーは標的配列に隣接して結合する。「プライマー」は、標的とハイブリダイズすることにより目的の試料中に潜在的に存在する標的又は鋳型に結合し、その後標的と相補的なポリヌクレオチドの重合を促進する、一般的に遊離3’−OH基を有する短いポリヌクレオチドと考えることができる。本発明のプライマーは、17〜30ヌクレオチドの範囲のヌクレオチドを含む。一態様では、プライマーは、少なくとも17ヌクレオチド、あるいは少なくとも18ヌクレオチド、あるいは少なくとも19ヌクレオチド、あるいは少なくとも20ヌクレオチド、あるいは少なくとも21ヌクレオチド、あるいは少なくとも22ヌクレオチド、あるいは少なくとも23ヌクレオチド、あるいは少なくとも24ヌクレオチド、あるいは少なくとも25ヌクレオチド、あるいは少なくとも26ヌクレオチド、あるいは少なくとも27ヌクレオチド、あるいは少なくとも28ヌクレオチド、あるいは、少なくとも29ヌクレオチド、あるいは少なくとも30ヌクレオチド、あるいは少なくとも50ヌクレオチド、あるいは少なくとも75ヌクレオチド、あるいは少なくとも100ヌクレオチドである。
表現「増幅」又は「増幅する」は、それによって特定のポリヌクレオチドの余分なコピー又は複数のコピーが形成されるプロセスを指す。
本明細書に記載の方法に従って増幅されたDNAは、当業者に公知の方法を用いて配列決定及び分析され得る。目的の核酸配列の配列決定は、ハイブリダイゼーションによる配列決定(SBH)、ライゲーションによる配列決定(SBL)(Shendureら(2005)Science 309:1728)、定量的増分蛍光ヌクレオチド付加配列決定(QIFNAS)、段階的ライゲーション及び切断、蛍光共鳴エネルギー移動(FRET)、分子ビーコン、TaqManレポータープローブ消化、パイロシーケンシング、蛍光in situ配列決定(FISSEQ)、FISSEQビーズ(米国特許第7,425,431号明細書)、ウォブル配列決定(PCT/US05/27695)、マルチプレックス配列決定(2008年2月6日に出願された米国特許出願第12/027,039号明細書、Porrecaら(2007)Nat.Methods 4:931)、重合コロニー(POLONY)配列決定(米国特許第6,432,360号明細書、同第6,485,944号明細書及び同第6,511,803号明細書、並びにPCT/US05/06425)、ナノグリッドローリングサークル配列決定(ROLONY)(2008年5月14日に出願された米国特許出願第12/120,541号明細書)、対立遺伝子特異的オリゴライゲーションアッセイ(例えば、オリゴライゲーションアッセイ(OLA)、ライゲーションされた線形プローブとローリングサークル増幅(RCA)読み出しを用いる単一鋳型分子OLA、ライゲーションされたパドロックプローブ、及び/又はライゲーションされた円形パドロックプローブとローリングサークル増幅(RCA)読み出しを用いた単一鋳型分子OLA)などを含むがこれらに限定されない、当技術分野において公知の様々な配列決定方法を使用して実行することができる。例えば、Roche 454、Illumina Solexa、AB−SOLiD、Helicos、Polonatorプラットフォームなどのプラットフォームを使用するハイスループット配列決定法も利用され得る。様々な光に基づく配列決定技術が当技術分野において公知である(Landegrenら(1998)Genome Res.8:769〜76、Kwok(2000)Pharmacogenomics 1:95〜100、及びShi(2001)Clin.Chem.47:164〜172)。
増幅されたDNAは、任意の適切な方法により配列決定され得る。特に、増幅されたDNAは、Applied BiosystemsのSOLiD配列決定技術やIlluminaのGenome Analyzerなどのハイスループットスクリーニング法を使用して配列決定され得る。本発明の一態様では、増幅されたDNAは、ショットガン配列決定され得る。リード数は、少なくとも10,000、少なくとも100万、少なくとも1000万、少なくとも1億、又は少なくとも10億であってもよい。別の態様では、リード数は、10,000〜100,000、あるいは100,000〜100万、あるいは100万〜1000万、あるいは1000万〜1億、あるいは1億〜10億であってもよい。「リード」は、配列決定反応によって得られたある長さの連続核酸配列である。
「ショットガン配列決定」は、非常に大量のDNA(全ゲノムなど)を配列決定するために使用される方法を指す。この方法では、配列決定されるDNAは、最初に個々の配列決定が可能なより小さな断片に細断される。次に、これらの断片の配列がそれらの重複する配列に基づいてそれらの元の順序に再アセンブルされ、それにより完全な配列が得られる。DNAの「細断」は、制限酵素消化又は機械的剪断を含む種々の異なる技術を用いて行うことができる。重複配列は、典型的には適切にプログラムされたコンピュータにより整列される。cDNAライブラリーのショットガン配列決定のための方法及びプログラムは、当技術分野において周知である。
増幅及び配列決定方法は、診断アッセイ、予後アッセイ、薬理ゲノミクス、及びモニタリング臨床試験が予後(予測)目的に使用され、それによって個体を予防的に治療する予測医学の分野において有用である。したがって、本発明の一態様は、個体が障害及び/又は疾患を発症する危険性があるかどうかを判定するためにゲノムDNAを決定するための診断アッセイに関する。そのようなアッセイは、それによって障害及び/又は疾患の発生前に個体を予防的に治療するための予後又は予測目的に使用することができる。したがって、ある特定の例示的な実施形態において、本明細書に記載の1又は複数の発現プロファイリング方法を用いて1又は複数の疾患及び/又は障害を診断及び/又は予後診断する方法が提供される。
本明細書で使用される場合、「生物学的試料」という用語は、対象から単離された組織、細胞、生物学的流体及びそれらの単離物、並びに対象内に存在する組織、細胞及び液体を含むが、これらに限定されない。
ある特定の例示的な実施形態では、本明細書に記載の1つ又は複数のゲノムDNA配列を含む電子装置可読媒体が提供される。本明細書で使用される場合、「電子装置可読媒体」は、電子装置によって直接読み取られアクセスされ得るデータ又は情報を記憶、保持、又は含有するための任意の適切な媒体を指す。そのような媒体は、フロッピーディスク、ハードディスク記憶媒体、及び磁気テープなどの磁気記憶媒体;コンパクトディスクなどの光記憶媒体;RAM、ROM、EPROM、EEPROMなどの電子記憶媒体;一般的なハードディスク、及び磁気/光記憶媒体などのこれらのカテゴリのハイブリッドが含まれるが、これらに限定されない。媒体は、本明細書に記載の1又は複数の発現プロファイルが記録されているように適合又は構成されている。
本明細書で使用される場合、「電子装置」という用語は、データ又は情報を記憶するように構成又は適合された任意の適切な演算若しくは処理装置又は他のデバイスを含むことを意図している。本発明と共に使用するのに適した電子装置の例には、スタンドアロン演算装置;ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)インターネット、イントラネット、及びエクストラネットを含むネットワーク;携帯情報端末(PDA)、携帯電話、ポケットベルなどの電子機器;並びにローカル及び分散処理システムが含まれる。
本明細書で使用される場合、「記録された」とは、電子装置可読媒体上に情報を記憶又は符号化するためのプロセスを指す。当業者は、既知の媒体に情報を記録するための現在知られている任意の方法を容易に採用して、本明細書に記載の1又は複数の発現プロファイルを含む製品を製造することができる。
本発明のゲノムDNA情報を電子装置可読媒体に記憶させるために、様々なソフトウェアプログラム及びフォーマットが使用され得る。例えば、核酸配列は、WordPerfect及びMicroSoft Wordなどの市販のソフトウェアでフォーマットされたワープロテキストファイル、又はDB2、Sybase、Oracleなどのデータベースアプリケーションに記憶されたASCIIファイルの形式、及びその他の形式で表現され得る。本明細書に記載の1又は複数の発現プロファイルを記録した媒体を取得又は作製するために、任意の数のデータプロセッサ構造化フォーマット(例えば、テキストファイル又はデータベース)が使用され得る。
説明された本発明の実施形態は、本発明の原理のいくつかの用途の単なる例示であることが理解されるべきである。本発明の真の精神及び範囲から逸脱することなく、本明細書に提示された教示に基づいて当業者によって多数の修正がなされ得る。本出願を通して引用された全ての参考文献、特許及び公開特許出願の内容は、参照することにより全ての目的においてその全体が本明細書に組み込まれる。
以下の実施例は、本発明の代表例として記載される。これらの実施形態及び他の同等の実施形態は、本開示、図面及び添付の特許請求の範囲を考慮して明らかになるため、これらの実施例は本発明の範囲を限定するものとして解釈されるべきではない。
[実施例1]
一般的プロトコル
以下の一般的プロトコルは、全ゲノム増幅に有用である。単一細胞を溶解緩衝液中に溶解する。固有のバーコード対などの特定のバーコード対を有するトランスポソームを含むトランスポソームライブラリー、及び転位緩衝液を細胞溶解液に添加し、これをよく混合して、55℃で10分間インキュベートする。転位の後に1mg/mlのプロテアーゼを添加して、トランスポザーゼを単一細胞ゲノムDNAへの結合から除去する。Deepvent exo− DNAポリメラーゼ、dNTP、PCR反応緩衝液及びプライマーを反応混合物に添加し、トランスポゾン挿入から生じたギャップを埋めるために10分間72℃に加熱する。反応混合物を微小流体デバイスに投入して微小液滴を形成する。単一細胞ゲノムDNA鋳型、DNAポリメラーゼ、dNTP、反応緩衝液及びプライマーを含有する液滴を、PCR管に収集する。単一細胞ゲノムDNAを増幅するために、40〜60サイクルのPCR反応を行う。サイクル数は、液滴内の増幅反応を飽和まで推進するように選択される。液滴を溶解し、増幅産物を、ハイスループット深部配列決定などのさらなる分析のために精製する。
一般的プロトコル
以下の一般的プロトコルは、全ゲノム増幅に有用である。単一細胞を溶解緩衝液中に溶解する。固有のバーコード対などの特定のバーコード対を有するトランスポソームを含むトランスポソームライブラリー、及び転位緩衝液を細胞溶解液に添加し、これをよく混合して、55℃で10分間インキュベートする。転位の後に1mg/mlのプロテアーゼを添加して、トランスポザーゼを単一細胞ゲノムDNAへの結合から除去する。Deepvent exo− DNAポリメラーゼ、dNTP、PCR反応緩衝液及びプライマーを反応混合物に添加し、トランスポゾン挿入から生じたギャップを埋めるために10分間72℃に加熱する。反応混合物を微小流体デバイスに投入して微小液滴を形成する。単一細胞ゲノムDNA鋳型、DNAポリメラーゼ、dNTP、反応緩衝液及びプライマーを含有する液滴を、PCR管に収集する。単一細胞ゲノムDNAを増幅するために、40〜60サイクルのPCR反応を行う。サイクル数は、液滴内の増幅反応を飽和まで推進するように選択される。液滴を溶解し、増幅産物を、ハイスループット深部配列決定などのさらなる分析のために精製する。
[実施例2]
トランスポゾンDNAホモ二量体を有するトランスポソームの作製
トランスポゾンDNAホモ二量体を有するトランスポソーム(すなわち、各トランスポゾンDNA上に同じバーコード配列を有するトランスポソーム)、及び、これにより、固有に紐付けされたバーコードを有するトランスポソームのライブラリーを作製するために、切断部位(例えば、DNAヌクレアーゼ切断部位)、プライミング部位、固有のバーコード配列及びトランスポザーゼ結合部位を含む複数のトランスポゾンDNAを、単一の微粒子が同じ固有のバーコード配列を有し他のバーコードを有さない複数のトランスポゾンDNAを含むように、単一の微粒子又はビーズに結合させる。
トランスポゾンDNAホモ二量体を有するトランスポソームの作製
トランスポゾンDNAホモ二量体を有するトランスポソーム(すなわち、各トランスポゾンDNA上に同じバーコード配列を有するトランスポソーム)、及び、これにより、固有に紐付けされたバーコードを有するトランスポソームのライブラリーを作製するために、切断部位(例えば、DNAヌクレアーゼ切断部位)、プライミング部位、固有のバーコード配列及びトランスポザーゼ結合部位を含む複数のトランスポゾンDNAを、単一の微粒子が同じ固有のバーコード配列を有し他のバーコードを有さない複数のトランスポゾンDNAを含むように、単一の微粒子又はビーズに結合させる。
図6に示されるように、図1に示されるような複数のバーコード化トランスポゾンDNAは、リンカーを介してビーズなどの微粒子に結合する。トランスポゾンDNAが微粒子から切断され得る、又は別の方法で除去され得るように、切断部分又は部位もまた備えられる。
例示的な図7に示されるように、それ自身の固有のバーコード配列を有する複数のトランスポゾンDNAが結合しているライブラリー内の各微粒子を用いて、微粒子のライブラリーが作製される。各微粒子がそれ自身の固有の紐付けされたバーコード配列を有する何百万もの微粒子が企図される。本明細書に記載の方法は、何百万もの対称的に索引付けされたトランスポソームを別々ではなく同時に作製することを提供する。すなわち、トランスポソームの各トランスポゾンDNAが同一であり、単一の反応容積中に産生されるトランスポソームの数が数百万程度であるため、各トランスポソームはそれ自身の固有の紐付けされたバーコード配列を有する。バーコード化トランスポソームを作製する方法は、WO2012/2061832に記載されているが、そのような材料及び方法は、本明細書に記載のものとは異なり、作製され得るトランスポソームの数が制限される。一態様によれば、ライブラリーの同じ単一微粒子上のトランスポゾンDNAは全て同じバーコード配列を有するが、ライブラリー内の各微粒子又は実質的に各微粒子は、それ自身の固有の紐付けされたバーコード配列を有する、すなわち各微粒子はライブラリー内の残りの各微粒子とは異なるバーコード配列を有するトランスポゾンDNAを含む。一態様によれば、特定の微粒子上のトランスポゾンDNA分子の数は、トランスポソームを形成するためにトランスポゾンDNA分子と接触するトランスポザーゼ分子の数を超える。このようにして、各トランスポソームは2つの同一のトランスポゾンDNA分子を有することになり、したがって2つのトランスポゾンDNA分子のそれぞれに同じバーコード配列を有することにもなる。トランスポザーゼ分子よりも多くのトランスポゾンDNA分子を有することは、例えば、微小液滴内のトランスポソームの形成中にトランスポソームがトランスポゾンDNA分子を欠いていないことを確実にする。したがって、2つの異なるトランスポゾンDNA分子(したがって2つの異なるバーコード配列)とのトランスポソーム複合体の存在は、減少又は排除される。
次いで、各微小液滴が1つのビーズのみを含み、したがって1つの固有のバーコードのみを含むように、ビーズをトランスポザーゼ及びヌクレアーゼと共に微小液滴内に投入する。微小液滴内で、トランスポゾンDNAはビーズから切断され、同じ固有のバーコード配列を有するトランスポソーム(すなわちトランスポゾンDNAホモ二量体)が形成される。次いで、液滴を溶解又は破壊した後、ホモ二量体トランスポゾンDNAを有するトランスポソームは収集され、トランスポソームのライブラリーが形成される。
特に、各々がそれ自身の固有に紐付けされたバーコード配列を有する1,000を超えるトランスポソームを作製するためには、微粒子又はビーズ及び液滴マイクロ流体工学が利用される。固有のバーコードを有するDNA鎖をそれぞれ有するM個の微粒子又はビーズは、参照することによりその全体が本明細書に組み込まれるMacoskoら、Cell 161(5)、2015に記載の方法に従って合成され、その結果、各微粒子又はビーズ上に、その微粒子又はビーズに特異的に紐付けされた同じバーコードを共有するトランスポゾンDNA鎖が平均n個存在し、各微粒子又はビーズは、他の微粒子又はビーズとは異なるそれ自身の固有のバーコード配列を有する。各トランスポゾンDNA鎖はリンカー分子を介して微粒子又はビーズに結合しており、その配列は切断部位(例えば、New England BiolabsのUSER(商標)Enzymeによって切断され得る単一のウラシルヌクレオチド)、プライミング部位、固有のバーコード配列及びトランスポザーゼ結合部位を含み、全てのビーズ又は微粒子上の全てのDNA鎖は、切断部位について同じ配列、プライミング部位について同じ配列、及びトランスポザーゼ結合部位について同じ配列を共有する。次いで、全ての微粒子又はビーズが、ビーズ又は微粒子上のDNA鎖上のトランスポザーゼ結合部位に相補的である同じ配列の一本鎖DNA分子と混合され、その結果、図6に示されるように、ビーズ又は微粒子上に部分的に二本鎖であり部分的に一本鎖であるDNA分子が形成され得る。トランスポソームは、一本鎖DNAよりも二本鎖DNAにより効率的に挿入されるため、この部分的に一本鎖のDNA構造は、トランスポソーム分子間の挿入を妨げ得る。
固有にバーコード化されたトランスポソームを作製するために、それぞれ参照することによりその全体が本明細書に組み込まれるMacoskoら、Cell、2015、161(5):p.1202〜14及びKleinら、Cell、2015、161(5):p.1187〜1201に記載のデバイスなどの流動重点的なマイクロ流体デバイスを使用して、各液滴が0〜1個のビーズ又は微粒子を含有するように、各微粒子又はビーズが、トランスポザーゼ酵素及び切断酵素(New England BiolabsのUSER(商標)酵素など)の混合物と共に液滴に同時カプセル化される。
マイクロチャネルを介した流体連通において、水相酵素混合物入口、水相ビーズ入口、疎水性液体入口(油入口という)、酵素混合物をビーズと合わせるための組み合わせ領域、及びマイクロチャネルによってエマルション液滴出口領域にさらに流体連通している、水相を油相と合わせるための組み合わせ領域を含む、例示的な流動回路を図8に示す。酵素混合物はビーズと合わせられ、次いでその組み合わせが、微小液滴当たり1個のビーズを有する微小液滴に形成される。
マイクロチャネルを介した流体連通において、水相酵素混合物入口、水相ビーズ入口、疎水性液体入口(油入口という)、酵素混合物をビーズと合わせるための組み合わせ領域、及びマイクロチャネルによってエマルション液滴出口領域にさらに流体連通している、水相を油相と合わせるための組み合わせ領域を含む、例示的な流動回路を図8に示す。酵素混合物はビーズと合わせられ、次いでその組み合わせが、微小液滴当たり1個のビーズを有する微小液滴に形成される。
適切な疎水性相は、水性媒体が疎水性相に導入されたときに水性液滴を生成するものである。適切な油相は当業者に知られており、水相は自発的に油相に囲まれた水滴又は孤立した体積若しくは区画をもたらす。例示的な疎水性相は、3−エトキシペルフルオロ(2−メチルヘキサン)などのフッ素化油などの油などの疎水性液体、及び界面活性剤を含む。界面活性剤は当業者に周知である。適切な油及び界面活性剤を含む例示的な疎水性相としては、水溶液と混合しない、又は水溶液中で生化学反応に悪影響を及ぼさない疎水性界面活性剤含有液体であるEvagreen用QX200(商標)Droplet Generation Oil(Bio−Rad)、HFE7500中の008−FluoroSurfactant(RAN Biotechnologies)、Pico−Surf(商標)1(Dolomite Microfluidics)、Proprietary Oil Surfactants(RainDance Technologies)、Mazutis,L.ら、Single−cell analysis and sorting using droplet−based microfluidics、Nature Protocols、2013、8、p.870〜891において議論されているフッ素化油中として説明されるフッ素系界面活性剤、及びBaret,J.−C.、Lab on a Chip、2012、12、p.422〜433に記載の他の界面活性剤が挙げられ、これらはそれぞれ、参照することによりその全体が本明細書に組み込まれる。
油相及び水相が組み合わせ領域又はエマルション液滴出口領域で合わされると、水相は油相によって囲まれた液滴を自発的に形成する。一態様によれば、デッドボリュームを占有し得るような任意の水相を置き換えて、マイクロ流体チップ設計内に導入された元の水相の損失を最小限にするため、マイクロ流体設計内又は水性ビーズ相若しくは水性酵素混合物相をマイクロ流体設計内に入れるために使用されるシリンジ若しくはインジェクタ内の水相の上流側の、油などの疎水性流体のフラッシュ体積(フラッシュ体積には必要とされないため、界面活性剤を含まなくてもよい)が、使用される。有用なマイクロ流体チップ設計は、AutoCADソフトウェア(Autodesk Inc.)を使用して作成することができ、CAD Art Services Inc.によってマイクロ流体製造用のフォトマスクに印刷することができる。金型又はマスターは、参照することによりその全体が本明細書に組み込まれるMazutisら、Nature Protocols 8(5)、2013に記載のような従来の技術を使用して作製することができる。マイクロ流体チップは、マスター上に注がれた未硬化ポリジメチルシロキサン(PDMS)(Dow Corning Sylgard 184)を硬化させることによってマスターから作製することができ、溝又は回路を有する表面を形成するために硬化するまで加熱される。入口及び出口穴が形成され、回路を有する硬化表面がスライドガラスに対して配置され、固定されてマイクロチャネル及びマイクロ流体チップを形成する。使用前に、マイクロ流体チップの内部を、マイクロ流体チップの内部の疎水性を改善するための化合物で処理し、洗浄して潜在的な汚染を除去することができる。
一態様によれば、各液滴が単一のビーズを含むか、又はビーズを含まない液滴を形成するために、当業者に知られている一般的な方法が使用される。水性媒体中の酵素混合物及び水性媒体中のビーズを合わせ、その組み合わせを油中に導入すると、単一のビーズが十分な酵素と共に単一の液滴内に隔離されるように、液滴の数がビーズの数を超える液滴が得られる。
各液滴内で、微粒子に結合したn個のトランスポゾンDNA分子は、切断酵素によって微粒子又はビーズから切断され、微粒子内のトランスポザーゼ単量体と自発的にアセンブルして約n/2個のトランスポソームとなり、それぞれが、図7に示されるように、同じバーコードを有する2つのトランスポザーゼ一量体及び2つのトランスポゾンDNA分子で構成される。カプセル化された微粒子又はビーズの数(すなわちM)であるバーコードの数、及び各微粒子又はビーズ上のDNA鎖の平均数の半分(すなわちnの半分)である液滴中のトランスポソームの平均数は、切断部位での、すなわち隣接ゲノムDNA断片の各末端へのトランスポゾンDNAの切断及び挿入又は付加のために、統計的に固有のバーコードを有するトランスポソームを得ることができるようにスケールされる。
効果的に固有のバーコードを有するトランスポソームは、液滴を溶解、すなわち解乳化してトランスポソームを収集することで、M×n/2の数のトランスポソームを全てプールすること、及び、同じバーコードを有する2つ以上のトランスポソームがゲノムに挿入される可能性を統計的にわずかなものとするために、トランスポソームのプールの合計量(M個のバーコード及び各バーコードの平均n/2個のコピーを有する)の1/(n/2)より大幅に少ないわずかな部分がゲノムに挿入されるようにすることよって得られる。液滴の溶解又は解乳化は、液滴にペルフルオロオクタノール(TCI Chemicals)を添加することにより達成することができ、手動での振盪又はボルテックス及び遠心の後に、全ての液滴が溶解され、トランスポソームを含有する水溶液が収集される。
限定されない例として、約6,000,000,000塩基対を有するヒトゲノムをアセンブルするために、6000bpの平均挿入長を仮定すると、固有のバーコードを有する1,000,000のトランスポソームがゲノムへの挿入に必要とされ、したがってMは少なくとも106であり、これは例えば107となり得る。Macoskoら、Cell 161(5)、2015において説明されているように、典型的な微粒子又はビーズが約108のDNA分子を保持すると仮定すると、n=108が妥当な推定値である。その結果、M=107個の微粒子又はビーズを用いて5×1014(M×n/2)個のバーコード化トランスポソームを作製する場合、トランスポソームの全プールの1/166667を取り出してゲノムDNAに添加することができ、また添加されたトランスポソームの約1/3000がゲノムに挿入され得るため、ゲノムに挿入されるトランスポソームの最終的な数は、5×1014×1/166667×1/3000と推定され、これはおよそ1,000,000である。この例では、ゲノムに挿入されるトランスポソームは約1/500,000,000(1/166667×1/3000)であり、これは1/(n/2)より大幅に小さいため、ゲノムに挿入される2つの同一のバーコードを有する可能性は、統計的にわずかである。すなわち、6000bpの平均挿入長を用いてヒトゲノムをアセンブルするためには、1000万個の固有にバーコード化されたビーズをバーコード化トランスポソームの作製に用いることができ、この例では、全トランスポソームの1/166667を挿入のためにゲノムDNAに添加する必要がある。
一実施形態では、微粒子又はビーズ上の各DNA鎖の切断部位は、参照することによりその全体が本明細書に組み込まれるKlein,A.M.ら、Droplet barcoding for single−cell transcriptomics applied to embryonic stem cells.Cell、2015.161(5):p.1187〜1201に記載の切断部位などの、UV光曝露により切断され得る部位であってもよい。この例における酵素混合物のための水相は、微粒子又はビーズからDNA鎖を切断するための切断酵素を含まなくてもよい。
別の実施形態では、バーコード化ビーズ(又は粒子若しくは微粒子)は、DNA分子が材料上又は材料の多孔質ネットワーク内に結合することができるような多孔質ビーズであってもよい。酵素混合物用の緩衝液は、一旦ビーズが酵素混合物と一緒に液滴に封入されると、ビーズ上又はビーズの細孔内に結合したDNAがビーズから解放され、続いて液滴内でトランスポザーゼ一量体と共にトランスポソームにアセンブルするように選択され得る。緩衝液条件に応じて制御された方法でDNAを運搬及び解放することができる材料及び方法の例には、GemCode(商標)粒子(10X Genomics)が含まれ、DNA Clean&Concentrator(商標)−5(Zymo Research)、Monarch Nucleic Acid Purification Kits(New England Biolabs)、及びQIAquick PCR Purification Kit(Qiagen)などの核酸精製キット内のスピンカラムが含まれ、またそれぞれ参照することによりその全体が本明細書に組み込まれる、Boom,R.ら、Rapid and simple method for purification of nucleic acids.Journal of Clinical Microbiology、1990、28(3)、p.495〜503;Chen,C.W.及びThomas Jr.、C.A.Recovery of DNA segments from agarose gels.Analytical Biochemistry、1980、101(2)、p.339〜341;及びTian,H.ら、Evaluation of silica resins for direct and efficient extraction of DNA from complex biological matrices in a miniaturized format.Analytical Biochemistry、2000、283、p.175〜191に記載の材料及び方法が含まれる。
いくつかの態様では、バーコード化粒子は、参照によりその全体が本明細書に組み込まれる、Lan,F.ら、Droplet barcoding for massively parallel single−molecule deep sequencing.Nature Communications、2016、7:11784において例示及び説明されているバーコード化液滴によって置き換えられてもよい。次いで、酵素混合物は、それぞれ参照することによりその全体が本明細書に組み込まれる、Abate,A.ら、High−throughput injection with microfluidics using picoinjectors.Proceedings of the National Academy of Sciences of the united States of America、2010、107(45)、p.19163〜19166;Lan,F.ら、Droplet barcoding for massively parallel single−molecule deep sequencing.Nature Communications、2016、7:11784;及びRhee,M.ら、Pressure stabilizer for reproducible picoinjection in droplet microfluidic systems.Lab on a Chip、2014,14(23)、p.4533〜4539に記載のピコインジェクション又は液滴合体法を用いて、バーコード化液滴内に導入され得る。次いで、各液滴内で、導入されたトランスポザーゼ一量体は、液滴特異的バーコードを有するトランスポゾンDNA分子と共にトランスポソームへとアセンブルされ得る。次いで、バーコード化トランスポソームがバーコード化アノテーション付きのゲノムDNAへの挿入のためにプールされ得るように、全ての液滴が溶解され得る。
一態様によれば、本明細書に記載のトランスポゾンDNA配列を有するトランスポソームは、液滴マイクロ流体工学を使用して作製されたものではない別々の区画で合成されてもよい。そのようなプラットフォーム、機器、材料又は方法の例には、マルチウェルプレート、ハイスループットシンセサイザー、マイクロアレイ、マイクロウェル、マイクロリアクター、又は他の区画化方法、例えば、それぞれ参照することによりその全体が本明細書に組み込まれる、Sims,P.A.ら、Fluorogenic DNA sequencing in PDMS microreactors.Nature Methods、2011、8(7)、p.575〜580;Gole,J.ら、Massively parallel polymerase cloning and genome sequencing of single cells using nanoliter microwells.Nature Biotechnology、2013、31(12)、p.1126〜1132;Leung K.ら、Robust high−performance nanoliter−volume single−cell multiple displacement amplification on planar substrates.Proceedings of the National Academy of Sciences of the United States of America.2016、113(30)、p.8484〜8489;及びZarzar,L.D.ら、Dynamically reconfigurable complex emulsions via tunable interface tensions.Nature、2015、518、p.520〜524に記載のものなどが含まれる。
[実施例3]
細胞溶解
以下のように細胞を選択し、培養皿から切り出し、レーザー解剖顕微鏡(LMD−6500、Leica)を使用して管内に分配する。細胞を膜コート培養皿にプレーティングし、10倍対物レンズ(Leica)を有する明視野顕微鏡を用いて観察する。次に、UVレーザーを使用して、PCR管のキャップに入るように、個々に選択された細胞の周囲の膜を切断する。管を短時間遠心分離して細胞を管の底に移動させる。3〜5μlの溶解緩衝液(30mMのTris−Cl PH7.8、2mMのEDTA、20mMのKCl、0.2%のTriton X−100、500μg/mlのQiagen Protease)をPCR管の側面に加え、遠沈させる。次いで、捕捉した細胞をPCR機で以下の温度スケジュールを使用して熱的に溶解する:50℃で3時間、75℃で30分。あるいは、EDTA及びプロテアーゼ、例えばQIAGENプロテアーゼ(QIAGEN)を10〜5000μg/mLの濃度で含有する低塩溶解緩衝液中に単一細胞をピペットで移す。インキュベーション条件は、使用されるプロテアーゼによって異なる。QIAGENプロテアーゼの場合、インキュベーションは37〜55℃で1〜4時間である。次いで、プロテアーゼを80℃まで熱不活性化し、さらに4−(2−アミノエチル)ベンゼンスルホニルフルオリド塩酸塩(AEBSF)又はフェニルメタンスルホニルフルオリド(PMSF)(Sigma Aldrich)などの特定のプロテアーゼ阻害剤によって不活性化する。細胞溶解物を−80℃で保存する。
細胞溶解
以下のように細胞を選択し、培養皿から切り出し、レーザー解剖顕微鏡(LMD−6500、Leica)を使用して管内に分配する。細胞を膜コート培養皿にプレーティングし、10倍対物レンズ(Leica)を有する明視野顕微鏡を用いて観察する。次に、UVレーザーを使用して、PCR管のキャップに入るように、個々に選択された細胞の周囲の膜を切断する。管を短時間遠心分離して細胞を管の底に移動させる。3〜5μlの溶解緩衝液(30mMのTris−Cl PH7.8、2mMのEDTA、20mMのKCl、0.2%のTriton X−100、500μg/mlのQiagen Protease)をPCR管の側面に加え、遠沈させる。次いで、捕捉した細胞をPCR機で以下の温度スケジュールを使用して熱的に溶解する:50℃で3時間、75℃で30分。あるいは、EDTA及びプロテアーゼ、例えばQIAGENプロテアーゼ(QIAGEN)を10〜5000μg/mLの濃度で含有する低塩溶解緩衝液中に単一細胞をピペットで移す。インキュベーション条件は、使用されるプロテアーゼによって異なる。QIAGENプロテアーゼの場合、インキュベーションは37〜55℃で1〜4時間である。次いで、プロテアーゼを80℃まで熱不活性化し、さらに4−(2−アミノエチル)ベンゼンスルホニルフルオリド塩酸塩(AEBSF)又はフェニルメタンスルホニルフルオリド(PMSF)(Sigma Aldrich)などの特定のプロテアーゼ阻害剤によって不活性化する。細胞溶解物を−80℃で保存する。
[実施例4]
転位
単一細胞溶解物及びトランスポソームライブラリーを、1〜100mMのMg2+及び所望により1〜100mMのMn2+又はCo2+又はCa2+を含有する緩衝系中で混合し、37〜55℃で5〜240分間インキュベートする。反応量は、細胞溶解量によって異なる。反応に添加されるトランスポソームライブラリーの量は、所望の断片化サイズに応じて容易に調整可能である。転位反応は、EDTA及び所望によりEGTA又は他のイオン用キレート剤を用いてMg2+をキレート化することにより停止される。所望により、短い二本鎖DNAをスパイクインとして混合物に添加することができる。残留トランスポソームを、最終濃度1〜500μg/mLで37〜55℃で10〜60分間のQIAGENプロテアーゼなどのプロテアーゼ消化によって不活性化する。その後、プロテアーゼを、熱及び/又はAEBSFなどのプロテアーゼ阻害剤によって不活性化する。
転位
単一細胞溶解物及びトランスポソームライブラリーを、1〜100mMのMg2+及び所望により1〜100mMのMn2+又はCo2+又はCa2+を含有する緩衝系中で混合し、37〜55℃で5〜240分間インキュベートする。反応量は、細胞溶解量によって異なる。反応に添加されるトランスポソームライブラリーの量は、所望の断片化サイズに応じて容易に調整可能である。転位反応は、EDTA及び所望によりEGTA又は他のイオン用キレート剤を用いてMg2+をキレート化することにより停止される。所望により、短い二本鎖DNAをスパイクインとして混合物に添加することができる。残留トランスポソームを、最終濃度1〜500μg/mLで37〜55℃で10〜60分間のQIAGENプロテアーゼなどのプロテアーゼ消化によって不活性化する。その後、プロテアーゼを、熱及び/又はAEBSFなどのプロテアーゼ阻害剤によって不活性化する。
[実施例5]
ギャップフィリング
転位及びトランスポザーゼ除去の後、Mg2+、dNTP混合物、プライマー及びDeepvent exo−DNAポリメラーゼ(New England Biolabs)などの熱安定性DNAポリメラーゼを含むPCR反応混合物を、適切な温度で適切な期間にわたり溶液に添加し、転位反応によって残された9bpギャップを埋める。ギャップフィリングのインキュベーション温度及び時間は、使用される特定のDNAポリメラーゼに依存する。反応後、DNAポリメラーゼを所望により加熱及び/又はQIAGENプロテアーゼなどのプロテアーゼ処理により不活性化する。プロテアーゼを使用する場合は、プロテアーゼを次いで熱及び/又はプロテアーゼ阻害剤によって不活性化する。
ギャップフィリング
転位及びトランスポザーゼ除去の後、Mg2+、dNTP混合物、プライマー及びDeepvent exo−DNAポリメラーゼ(New England Biolabs)などの熱安定性DNAポリメラーゼを含むPCR反応混合物を、適切な温度で適切な期間にわたり溶液に添加し、転位反応によって残された9bpギャップを埋める。ギャップフィリングのインキュベーション温度及び時間は、使用される特定のDNAポリメラーゼに依存する。反応後、DNAポリメラーゼを所望により加熱及び/又はQIAGENプロテアーゼなどのプロテアーゼ処理により不活性化する。プロテアーゼを使用する場合は、プロテアーゼを次いで熱及び/又はプロテアーゼ阻害剤によって不活性化する。
[実施例6]
DNA断片増幅
一態様によれば、当業者に公知の一般的な方法を使用してDNA断片が増幅される。プライマー結合部位を有するDNA断片を含む上記の実施例からのギャップが埋められた二本鎖産生成物を、水性媒体中のPCR反応試薬に添加する。次いで、水性媒体をPCR条件に供して各DNA断片をPCR増幅する。
DNA断片増幅
一態様によれば、当業者に公知の一般的な方法を使用してDNA断片が増幅される。プライマー結合部位を有するDNA断片を含む上記の実施例からのギャップが埋められた二本鎖産生成物を、水性媒体中のPCR反応試薬に添加する。次いで、水性媒体をPCR条件に供して各DNA断片をPCR増幅する。
[実施例7]
DNA断片アンプリコンの配列決定、及びバーコードを用いたデノボゲノムアセンブリ
一態様によれば、断片は当業者に公知の方法を用いて配列決定され、配列はコンピュータ可読メモリーに記憶される。次いで、配列を比較することができ、マッチするバーコード配列を有する断片を同定することができる。次いで、マッチするバーコード配列を有する断片は、元のゲノムDNA配列において互いに隣接していた配列であると同定される。次いで、2つ以上の隣接する配列を計算的に、すなわちコンピュータソフトウェアを使用してインシリコで、相互に連結して、元のゲノムDNAより長い配列断片を形成することができる。この態様では、本開示は、トランスポソームバーコードを使用して形成されたゲノムDNAの断片をデノボアセンブリしてより長い断片を形成する方法を提供する。
DNA断片アンプリコンの配列決定、及びバーコードを用いたデノボゲノムアセンブリ
一態様によれば、断片は当業者に公知の方法を用いて配列決定され、配列はコンピュータ可読メモリーに記憶される。次いで、配列を比較することができ、マッチするバーコード配列を有する断片を同定することができる。次いで、マッチするバーコード配列を有する断片は、元のゲノムDNA配列において互いに隣接していた配列であると同定される。次いで、2つ以上の隣接する配列を計算的に、すなわちコンピュータソフトウェアを使用してインシリコで、相互に連結して、元のゲノムDNAより長い配列断片を形成することができる。この態様では、本開示は、トランスポソームバーコードを使用して形成されたゲノムDNAの断片をデノボアセンブリしてより長い断片を形成する方法を提供する。
一態様によれば、あらゆるゲノムDNA断片の各末端は、トランスポザーゼ結合部位配列、バーコード配列及びプライミング配列に加えてギャップが埋められた部分の配列を有する。ギャップが埋められた部分の配列は、トランスポソームによって切断された2つの断片に共通する重複配列であるため、異なる断片をより長いゲノム配列に連鎖させるための第2の組のバーコードとして機能し得る。例えば、Tn5トランスポソームが二本鎖ゲノムDNA鋳型に挿入されると、図3に示されるように、挿入部位の2つの末端のそれぞれに一本鎖の9bpギャップが残り、同じ挿入部位にわたる両方の9bpギャップは、図4に示されるギャップフィリング工程(ギャップ伸長工程としても知られる)の後に同じ配列を共有する。挿入部位にわたり複製されるそのような9bp配列は、デノボアセンブリのために断片を連鎖させるための追加のバーコードとして機能し得、これは同じバーコード配列を有する2つのトランスポソームの挿入が生じる場合に非常に有用である。
一態様によれば、断片は、全ゲノムDNAなどの元のゲノムDNA配列を再形成するためにバーコード配列をマッチングすることによってインシリコでデノボアセンブリされる。バーコード情報を使用して全ての断片を連鎖させた後、断片から構成される連鎖、連結、又はアセンブルされた連続又は隣接ゲノム配列(「コンティグ」としても知られる)を、相同染色体からの類似又は同一の配列を共有する別のコンティグと比較又はマッチングすることができ、相同染色体からのコンティグをマッチングすることによって、ゲノム配列又はコンティグは、最終的にゲノム全体にアセンブルされる、より長い配列又はコンティグにさらに連結することができる。当業者に公知のデノボアセンブリ方法には、オーバーラップ−レイアウト−コンセンサス(overlap−layout−consensus、OLC)、de Bruijn、ストリンググラフ法、及び参照することによりその全体が本明細書に組み込まれるChaisson、M.J.P.ら、Genetic variation and the de novo assembly of human genomes.Nature Review Genetics、2015.16:p.627〜640に概説されている他のアセンブリアルゴリズムが含まれる。
一態様によれば、固有のデノボアセンブリされたゲノムマップに到達するために、2、3、4又はそれ以上の娘細胞又は同一細胞からのゲノムが、バーコード化アノテーションにより個々に断片化及び増幅され、配列決定され、上述の方法を用いて別々にアセンブルされて、相互参照するための実質的な相同染色体対を効果的に提供することができる。これらの方法は、高品質の全ゲノムデノボアセンブリのための実質的な相同重複を提供するために、Millerら、Genomics、95(6)、2010に概説されているSSAKE、SHARCGS、VCAKE、Newbler、Celera Assembler、Euler、Velvet、ABySS、AllPath、及びSOAPdenovo;並びに、Chaissonら、Nature Reviews Genetics、16、2015に記載のアルゴリズムなどの相同体間の重複領域を利用するデノボアセンブリ手法と組み合わされてもよく、これらの文献はそれぞれ、参照することによりその全体が本明細書に組み込まれる。
標的ゲノムDNAが2つ以上の倍数性を有する単一細胞に由来する場合、ゲノムのデノボアセンブリはまた、図9に示されるようにハプロタイピングを達成し得る。倍数性は、細胞内の染色体のセット数である。例えば、ヒト体細胞は、各染色体の2組の相同コピーを有する。この2つのコピー、又は対立遺伝子は、父親及び母親から別々に由来し、細胞中の2つの物理的に別々のDNA分子である。2つのコピーは互いに結合せず、また転位のためのトランスポソームの使用、すなわちトランスポゾンDNAの挿入及び断片の産生は別々の各コピーに対して独立して生じるため、一方のコピーのどの部分も、もう一方のコピーのどの部分とも同じ挿入部位を共有しない。したがって1つのコピーからの断片は、もう一方のコピーの断片上の任意のバーコードとマッチし得るバーコードを含まず、よって一方のコピーからの断片はもう一方のコピーからの断片と連結又は連鎖することはない。例えば、図9に示されるように、トランスポソーム1及び2は、トランスポゾンDNAを第1の対立遺伝子に挿入し、トランスポソーム3及び4は、トランスポゾンDNAを第2の対立遺伝子に挿入する。独立したトランスポソームが各別々の対立遺伝子についてトランスポゾンDNAの挿入を開始した後、及び本明細書に記載の方法を用いた増幅、配列決定、及びデノボアセンブリの後、2つの対立遺伝子は別々にアセンブルされ、最終アセンブル産物は、ハプロタイプ分解されたゲノムである。これは、対立遺伝子1の断片が対立遺伝子2からの任意の断片と同じバーコードを共有していないためである。したがって、対立遺伝子1からの断片は対立遺伝子2の断片に連結又は連鎖されず、各対立遺伝子内の断片は、対立遺伝子2のいかなる情報とも無関係に連結又は連鎖され得、またその逆も同様である。したがって、結果的なデノボアセンブリは、連鎖された配列内のより長い鎖及び同じ対立遺伝子からの全染色体アセンブリをもたらし、よってゲノムDNAはハプロタイプ分解される。対照的に、ヒトゲノムがショットガン配列決定によってアセンブルされる場合、2つの対立遺伝子がほぼ同一であり、区別することができないため、これは一倍体ゲノムとみなされる。本明細書に記載のトランスポソーム法を使用すると、図9に示されるように、各対立遺伝子に紐付けされた固有のバーコード配列によって、2組の染色体が別々にアセンブルされる。この方法は、バーコードをマッチングすることによって全ての対立遺伝子1断片を1つずつ連結することにより、またバーコードをマッチングすることによって全ての対立遺伝子2断片を1つずつ連結することにより、対立遺伝子2から対立遺伝子1を区別することを可能にする。固有のバーコードのアセンブルは別々の対立遺伝子のデノボアセンブリをもたらし、その結果ハプロタイプ分解がもたらされる。
[実施例11]
キット
開示された増幅方法に必要な材料及び試薬は、キットとしてまとめられてもよい。本開示のキットは、一般に、少なくともトランスポソーム(トランスポザーゼ酵素及びトランスポゾンDNAからなる)、ヌクレオチド、並びに必要に応じて、プライマーセットと共に、特許請求された方法を実践するのに必要なDNAポリメラーゼを含む。好ましい実施形態では、キットはまた、DNA試料からDNAを増幅するための説明書を含む。例示的なキットとして、全ゲノムDNAの増幅における使用に適したものが挙げられる。それぞれの場合において、キットは、好ましくはそれぞれ個々の試薬、酵素又は反応物のための、異なる容器を有する。各薬剤は、一般にそれらのそれぞれの容器に適切に分けられる。キットの容器の手段としては、一般には少なくとも1つのバイアル又は試験管が挙げられる。試薬を入れて分けるためのフラスコ、ボトル、及び他の容器の手段も可能である。キットの個々の容器は、商業的販売のために厳密に密閉されて維持されることが好ましい。適切なより大きな容器としては、所望のバイアルが中に保持される射出成形又はブロー成形プラスチック容器が挙げられる。説明書は、好ましくはキットと共に提供される。
キット
開示された増幅方法に必要な材料及び試薬は、キットとしてまとめられてもよい。本開示のキットは、一般に、少なくともトランスポソーム(トランスポザーゼ酵素及びトランスポゾンDNAからなる)、ヌクレオチド、並びに必要に応じて、プライマーセットと共に、特許請求された方法を実践するのに必要なDNAポリメラーゼを含む。好ましい実施形態では、キットはまた、DNA試料からDNAを増幅するための説明書を含む。例示的なキットとして、全ゲノムDNAの増幅における使用に適したものが挙げられる。それぞれの場合において、キットは、好ましくはそれぞれ個々の試薬、酵素又は反応物のための、異なる容器を有する。各薬剤は、一般にそれらのそれぞれの容器に適切に分けられる。キットの容器の手段としては、一般には少なくとも1つのバイアル又は試験管が挙げられる。試薬を入れて分けるためのフラスコ、ボトル、及び他の容器の手段も可能である。キットの個々の容器は、商業的販売のために厳密に密閉されて維持されることが好ましい。適切なより大きな容器としては、所望のバイアルが中に保持される射出成形又はブロー成形プラスチック容器が挙げられる。説明書は、好ましくはキットと共に提供される。
[実施例12]
実施形態
本開示は、複数のトランスポゾンDNAを複数の微粒子のそれぞれに結合させる工程、ここで、単一の微粒子に結合した全てのトランスポゾンDNAは、前記複数の微粒子における各微粒子が固有の紐付けされたバーコード配列を有するように、前記単一の微粒子に紐付けされた共通の固有のバーコード配列を含む;前記トランスポゾンDNAが結合した前記複数の微粒子を、トランスポザーゼ及び切断酵素と一緒にして、水性混合物を形成する工程;複数の微小液滴が形成されるように前記水性混合物を油相と合わせる工程、ここで、前記複数の微粒子における各微粒子は、前記トランスポザーゼ及び前記切断酵素と共に、対応する単一の微小液滴内に単離される;対応する単一微小液滴ごとに、前記対応する単一微小液滴内の前記微粒子から前記複数のトランスポゾンDNAを切断し、前記微小液滴内に複数のトランスポソームを形成する工程、ここで、前記微小液滴内の各トランスポソームは、共通の固有のバーコード配列を有する2つのトランスポゾンDNAを有する;前記複数の微小液滴の各微小液滴を溶解する工程;並びに前記トランスポソームを収集して、トランスポソームライブラリーを生成する工程、を含む、トランスポソームライブラリーの作製方法を提供する。一態様によれば、前記トランスポソームライブラリーは、1,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、10,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、100,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、1,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、2,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、3,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、4,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、5,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、10,000,000を超えるトランスポソームを含む。一態様によれば、前記方法は、前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリーの各トランスポソームは、固有の紐付けされたバーコード配列を有する。一態様によれば、前記方法は、前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリー内の実質的に全てのトランスポソームは、固有の紐付けされたバーコード配列を有する。一態様によれば、各トランスポゾンDNAは、特異的プライマー結合部位及び二本鎖トランスポザーゼ結合部位を含む。一態様によれば、前記トランスポゾンDNAは、二本鎖トランスポザーゼ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む。一態様によれば、各トランスポゾンDNAは、リンカー及び切断部位によって、対応する微粒子に結合している。一態様によれば、各トランスポゾンDNAは、5’オーバーハングを含み、その対応する5’末端で、リンカー及び切断部位によって、対応する微粒子に結合している。一態様によれば、前記トランスポザーゼは、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである。一態様によれば、前記油相は、界面活性剤を含む。一態様によれば、前記油相内の前記複数の微小液滴は、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成される。一態様によれば、前記油相内の前記複数の微小液滴は、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成され、前記複数の微小液滴は、自発的に生成される。一態様によれば、前記油相内の前記複数の微小液滴は、マイクロ流体チップ内で前記油相と前記水性媒体とを合わせることによって生成される。一態様によれば、前記複数の微小液滴は、解乳化剤によって溶解される。
実施形態
本開示は、複数のトランスポゾンDNAを複数の微粒子のそれぞれに結合させる工程、ここで、単一の微粒子に結合した全てのトランスポゾンDNAは、前記複数の微粒子における各微粒子が固有の紐付けされたバーコード配列を有するように、前記単一の微粒子に紐付けされた共通の固有のバーコード配列を含む;前記トランスポゾンDNAが結合した前記複数の微粒子を、トランスポザーゼ及び切断酵素と一緒にして、水性混合物を形成する工程;複数の微小液滴が形成されるように前記水性混合物を油相と合わせる工程、ここで、前記複数の微粒子における各微粒子は、前記トランスポザーゼ及び前記切断酵素と共に、対応する単一の微小液滴内に単離される;対応する単一微小液滴ごとに、前記対応する単一微小液滴内の前記微粒子から前記複数のトランスポゾンDNAを切断し、前記微小液滴内に複数のトランスポソームを形成する工程、ここで、前記微小液滴内の各トランスポソームは、共通の固有のバーコード配列を有する2つのトランスポゾンDNAを有する;前記複数の微小液滴の各微小液滴を溶解する工程;並びに前記トランスポソームを収集して、トランスポソームライブラリーを生成する工程、を含む、トランスポソームライブラリーの作製方法を提供する。一態様によれば、前記トランスポソームライブラリーは、1,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、10,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、100,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、1,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、2,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、3,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、4,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、5,000,000を超えるトランスポソームを含む。一態様によれば、前記トランスポソームライブラリーは、10,000,000を超えるトランスポソームを含む。一態様によれば、前記方法は、前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリーの各トランスポソームは、固有の紐付けされたバーコード配列を有する。一態様によれば、前記方法は、前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリー内の実質的に全てのトランスポソームは、固有の紐付けされたバーコード配列を有する。一態様によれば、各トランスポゾンDNAは、特異的プライマー結合部位及び二本鎖トランスポザーゼ結合部位を含む。一態様によれば、前記トランスポゾンDNAは、二本鎖トランスポザーゼ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む。一態様によれば、各トランスポゾンDNAは、リンカー及び切断部位によって、対応する微粒子に結合している。一態様によれば、各トランスポゾンDNAは、5’オーバーハングを含み、その対応する5’末端で、リンカー及び切断部位によって、対応する微粒子に結合している。一態様によれば、前記トランスポザーゼは、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである。一態様によれば、前記油相は、界面活性剤を含む。一態様によれば、前記油相内の前記複数の微小液滴は、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成される。一態様によれば、前記油相内の前記複数の微小液滴は、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成され、前記複数の微小液滴は、自発的に生成される。一態様によれば、前記油相内の前記複数の微小液滴は、マイクロ流体チップ内で前記油相と前記水性媒体とを合わせることによって生成される。一態様によれば、前記複数の微小液滴は、解乳化剤によって溶解される。
本開示は、ゲノムDNAをトランスポソームのライブラリーと接触させる工程、ここで、前記ライブラリーの各トランスポソームはそれ自身の固有の紐付けされたバーコード配列を有し、前記ライブラリーの各トランスポソームは、トランスポザーゼ及びトランスポゾンDNAホモ二量体を含み、前記ホモ二量体の各トランスポゾンDNAは、トランスポザーゼ結合部位、固有のバーコード配列及びプライマー結合部位を含み、前記トランスポソームのライブラリーは、前記ゲノムDNAに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムDNAを、ゲノムDNA断片ライブラリーを表す複数の二本鎖ゲノムDNA断片に切断し、各二本鎖ゲノムDNA断片は、前記ゲノムDNA断片の各末端に固有のバーコード配列対のうちの一方を含む;前記トランスポゾンDNAと前記ゲノムDNA断片との間のギャップをギャップフィリングし、各末端にプライマー結合部位を有する二本鎖ゲノムDNA断片伸長産物のライブラリーを形成する工程;前記二本鎖ゲノムDNA断片伸長産物を増幅して、アンプリコンを生成する工程;前記アンプリコンを配列決定する工程;並びに前記ゲノムDNAをデノボアセンブリするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結する工程、を含む、デノボゲノムDNAアセンブリの方法を提供する。一態様によれば、前記ゲノムDNAは、単一細胞から得られた全ゲノムDNAである。一態様によれば、前記トランスポザーゼは、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである。一態様によれば、前記トランスポゾンDNAは、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む。一態様によれば、前記二本鎖ゲノムDNA断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される。一態様によれば、前記トランスポザーゼは、トランスポゾンDNAとそれぞれ複合体を形成したTn5トランスポザーゼであり、前記トランスポゾンDNAは、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む。一態様によれば、前記ゲノムDNAは、出生前細胞に由来する。一態様によれば、前記ゲノムDNAは、癌細胞に由来する。一態様によれば、前記ゲノムDNAは、循環腫瘍細胞に由来する。一態様によれば、前記ゲノムDNAは、単一の出生前細胞に由来する。一態様によれば、前記ゲノムDNAは、単一の癌細胞に由来する。一態様によれば、前記ゲノムDNAは、単一の循環腫瘍細胞に由来する。一態様によれば、前記プライマー結合部位は、特異的PCRプライマー結合部位である。一態様によれば、前記デノボアセンブリは、ハプロタイプ分解デノボアセンブリである。一態様によれば、前記ハプロタイプ分解デノボアセンブリは、ヒト単一細胞の、ヒト白血球抗原領域、V(D)J組換え領域、又は他の領域上にある。
本開示は、非水相中に複数の水性微小液滴を生成する工程、ここで、各微小液滴は、前記微小液滴内に形成された複数のトランスポソームを含み、全てのトランスポソームは、2つのトランスポザーゼ及び2つの同一のトランスポゾンDNAを有し、各トランスポゾンDNAは、トランスポザーゼ結合部位、バーコード配列及びプライマー結合部位を有する;各微小液滴から前記複数のトランスポソームを放出し、放出されたトランスポソームを収集してトランスポソームライブラリーとする工程;反応容積内の試薬トランスポソームライブラリーを形成する工程、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する;ゲノムDNAを前記反応容積内の前記試薬トランスポソームライブラリーと接触させる工程、ここで、前記トランスポソームは、前記ゲノムDNAに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムDNAを、ゲノムDNA断片ライブラリーを表す複数の二本鎖ゲノムDNA断片に切断し、各二本鎖ゲノムDNA断片は、前記ゲノムDNA断片の各末端に固有のバーコード配列対のうちの一方を含む;前記トランスポゾンDNAと前記ゲノムDNA断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムDNA断片伸長産物のライブラリーを形成する工程;前記二本鎖ゲノムDNA断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成する工程;前記反応容積内の前記アンプリコンを配列決定する工程;並びに前記ゲノムDNAをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結する工程、を含む、デノボゲノムDNAアセンブリの方法を提供する。一態様によれば、前記試薬トランスポソームライブラリーは、1,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、10,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、100,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、1,000,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、2,000,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、3,000,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、4,000,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、5,000,000を超えるトランスポソームを含む。一態様によれば、前記試薬トランスポソームライブラリーは、10,000,000を超えるトランスポソームを含む。一態様によれば、前記ゲノムDNAは、単一細胞から得られた全ゲノムDNAである。一態様によれば、前記トランスポザーゼは、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである。一態様によれば、前記トランスポゾンDNAは、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む。一態様によれば、前記二本鎖ゲノムDNA断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される。一態様によれば、前記トランスポザーゼは、トランスポゾンDNAとそれぞれ複合体を形成したTn5トランスポザーゼであり、前記トランスポゾンDNAは、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む。一態様によれば、前記ゲノムDNAは、出生前細胞に由来する。一態様によれば、前記ゲノムDNAは、癌細胞に由来する。一態様によれば、前記ゲノムDNAは、循環腫瘍細胞に由来する。一態様によれば、前記ゲノムDNAは、単一の出生前細胞に由来する。一態様によれば、前記ゲノムDNAは、単一の癌細胞に由来する。一態様によれば、前記ゲノムDNAは、単一の循環腫瘍細胞に由来する。一態様によれば、前記プライマー結合部位は、特異的PCRプライマー結合部位である。
本開示は、物理的に分離した複数の反応チャンバ内で、トランスポザーゼを複数のトランスポゾンDNAと接触させ、それぞれの物理的に分離した反応チャンバ内でトランスポソームを形成する工程、ここで、各トランスポゾンDNAは、共通のトランスポザーゼ結合部位、共通のプライマー結合部位及びバーコード配列を含み、前記バーコード配列は、同じ反応チャンバ内の全てのトランスポゾンDNAに対して同じであるが、他の反応チャンバ内のトランスポゾンDNAとは異なる;各反応チャンバから前記トランスポソームを集め、全ての前記トランスポソームを混合してトランスポソームライブラリーを形成する工程;反応容積内の試薬トランスポソームライブラリーを形成する工程、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する;ゲノムDNAを前記反応容積内の前記試薬トランスポソームライブラリーと接触させる工程、ここで、前記トランスポソームは、前記ゲノムDNAに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムDNAを、ゲノムDNA断片ライブラリーを表す複数の二本鎖ゲノムDNA断片に切断し、各二本鎖ゲノムDNA断片は、前記ゲノムDNA断片の各末端に固有のバーコード配列対のうちの一方を含む;前記トランスポゾンDNAと前記ゲノムDNA断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムDNA断片伸長産物のライブラリーを形成する工程;前記二本鎖ゲノムDNA断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成する工程;前記反応容積内の前記アンプリコンを配列決定する工程;並びに前記ゲノムDNAをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結する工程、を含む、デノボゲノムDNAアセンブリの方法を提供する。一態様によれば、前記反応チャンバは、管、マルチウェルプレート、マイクロアレイチップ、マイクロウェル、マイクロリアクター、微小液滴、微粒子ヒドロゲル、又は他の区画化方法である。
Claims (61)
- 複数のトランスポゾンDNAを複数の微粒子のそれぞれに結合させること、ここで、単一の微粒子に結合した全てのトランスポゾンDNAは、前記複数の微粒子における各微粒子が固有の紐付けされたバーコード配列を有するように、前記単一の微粒子に紐付けされた共通の固有のバーコード配列を含む;
前記トランスポゾンDNAが結合した前記複数の微粒子を、トランスポザーゼ及び切断酵素と一緒にして、水性混合物を形成すること;
複数の微小液滴が形成されるように前記水性混合物を油相と合わせること、ここで、前記複数の微粒子における各微粒子は、前記トランスポザーゼ及び前記切断酵素と共に、対応する単一の微小液滴内に単離される;
対応する単一微小液滴ごとに、前記対応する単一微小液滴内の前記微粒子から前記複数のトランスポゾンDNAを切断し、前記微小液滴内に複数のトランスポソームを形成すること、ここで、前記微小液滴内の各トランスポソームは、共通の固有のバーコード配列を有する2つのトランスポゾンDNAを有する;
前記複数の微小液滴の各微小液滴を溶解すること;並びに
前記トランスポソームを収集して、トランスポソームライブラリーを生成すること、
を含む、トランスポソームライブラリーの作製方法。 - 前記トランスポソームライブラリーが、1,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、10,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、100,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、1,000,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、2,000,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、3,000,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、4,000,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、5,000,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーが、10,000,000を超えるトランスポソームを含む、請求項1に記載の方法。
- 前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリーの各トランスポソームは、固有の紐付けされたバーコード配列を有する、請求項1に記載の方法。
- 前記トランスポソームライブラリーの一部を採取して試薬トランスポソームライブラリーを形成することをさらに含み、前記試薬トランスポソームライブラリー内の実質的に全てのトランスポソームは、固有の紐付けされたバーコード配列を有する、請求項1に記載の方法。
- 各トランスポゾンDNAが特異的プライマー結合部位及び二本鎖トランスポザーゼ結合部位を含む、請求項1に記載の方法。
- 前記トランスポゾンDNAが二本鎖トランスポザーゼ結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む、請求項1に記載の方法。
- 各トランスポゾンDNAが、リンカー及び切断部位によって、対応する微粒子に結合している、請求項1に記載の方法。
- 各トランスポゾンDNAが5’オーバーハングを含み、その対応する5’末端で、リンカー及び切断部位によって、対応する微粒子に結合している、請求項1に記載の方法。
- 前記トランスポザーゼが、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである、請求項1に記載の方法。
- 前記油相が界面活性剤を含む、請求項1に記載の方法。
- 前記油相内の前記複数の微小液滴が、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成される、請求項1に記載の方法。
- 前記油相内の前記複数の微小液滴が、存在する微粒子よりも多くの微小液滴を生成するように前記水性混合物を前記油相と合わせることによって生成され、前記複数の微小液滴が、自発的に生成される、請求項1に記載の方法。
- 前記油相内の前記複数の微小液滴が、マイクロ流体チップ内で前記油相と水性媒体とを合わせることによって生成される、請求項1に記載の方法。
- 前記複数の微小液滴が解乳化剤によって溶解される、請求項1に記載の方法。
- ゲノムDNAをトランスポソームのライブラリーと接触させること、ここで、前記ライブラリーの各トランスポソームはそれ自身の固有の紐付けされたバーコード配列を有し、前記ライブラリーの各トランスポソームは、トランスポザーゼ及びトランスポゾンDNAホモ二量体を含み、前記ホモ二量体の各トランスポゾンDNAは、トランスポザーゼ結合部位、固有のバーコード配列及びプライマー結合部位を含み、前記トランスポソームのライブラリーは、前記ゲノムDNAに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムDNAを、ゲノムDNA断片ライブラリーを表す複数の二本鎖ゲノムDNA断片に切断し、各二本鎖ゲノムDNA断片は、前記ゲノムDNA断片の各末端に固有のバーコード配列対のうちの一方を含む;
前記トランスポゾンDNAと前記ゲノムDNA断片との間のギャップをギャップフィリングし、各末端にプライマー結合部位を有する二本鎖ゲノムDNA断片伸長産物のライブラリーを形成すること;
前記二本鎖ゲノムDNA断片伸長産物を増幅して、アンプリコンを生成すること;
前記アンプリコンを配列決定すること;並びに
前記ゲノムDNAをデノボアセンブリするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結すること、
を含む、デノボゲノムDNAアセンブリの方法。 - 前記ゲノムDNAが、単一細胞から得られた全ゲノムDNAである、請求項23に記載の方法。
- 前記トランスポザーゼが、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである、請求項23に記載の方法。
- 前記トランスポゾンDNAが、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む、請求項23に記載の方法。
- 前記二本鎖ゲノムDNA断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される、請求項23に記載の方法。
- 前記トランスポザーゼが、トランスポゾンDNAとそれぞれ複合体を形成したTn5トランスポザーゼであり、前記トランスポゾンDNAは、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む、請求項23に記載の方法。
- 前記ゲノムDNAが、出生前細胞に由来する、請求項23に記載の方法。
- 前記ゲノムDNAが、癌細胞に由来する、請求項23に記載の方法。
- 前記ゲノムDNAが、循環腫瘍細胞に由来する、請求項23に記載の方法。
- 前記ゲノムDNAが、単一の出生前細胞に由来する、請求項23に記載の方法。
- 前記ゲノムDNAが、単一の癌細胞に由来する、請求項23に記載の方法。
- 前記ゲノムDNAが、単一の循環腫瘍細胞に由来する、請求項23に記載の方法。
- 前記プライマー結合部位が、特異的PCRプライマー結合部位である、請求項23に記載の方法。
- 前記デノボアセンブリが、ハプロタイプ分解デノボアセンブリである、請求項23に記載の方法。
- 非水相中に複数の水性微小液滴を生成すること、ここで、各微小液滴は、前記微小液滴内に形成された複数のトランスポソームを含み、全てのトランスポソームは、2つのトランスポザーゼ及び2つの同一のトランスポゾンDNAを有し、各トランスポゾンDNAは、トランスポザーゼ結合部位、バーコード配列及びプライマー結合部位を有する;
各微小液滴から前記複数のトランスポソームを放出し、放出されたトランスポソームを収集してトランスポソームライブラリーとすること;
反応容積内の試薬トランスポソームライブラリーを形成すること、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する;
ゲノムDNAを前記反応容積内の前記試薬トランスポソームライブラリーと接触させること、ここで、前記トランスポソームは、前記ゲノムDNAに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムDNAを、ゲノムDNA断片ライブラリーを表す複数の二本鎖ゲノムDNA断片に切断し、各二本鎖ゲノムDNA断片は、前記ゲノムDNA断片の各末端に固有のバーコード配列対のうちの一方を含む;
前記トランスポゾンDNAと前記ゲノムDNA断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムDNA断片伸長産物のライブラリーを形成すること;
前記二本鎖ゲノムDNA断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成すること;
前記反応容積内の前記アンプリコンを配列決定すること;並びに
前記ゲノムDNAをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結すること、
を含む、デノボゲノムDNAアセンブリの方法。 - 前記試薬トランスポソームライブラリーが、1,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、10,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、100,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、1,000,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、2,000,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、3,000,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、4,000,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、5,000,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記試薬トランスポソームライブラリーが、10,000,000を超えるトランスポソームを含む、請求項37に記載の方法。
- 前記ゲノムDNAが、単一細胞から得られた全ゲノムDNAである、請求項37に記載の方法。
- 前記トランスポザーゼが、Tn5トランスポザーゼ、Muトランスポザーゼ、Tn7トランスポザーゼ又はIS5トランスポザーゼである、請求項37に記載の方法。
- 前記トランスポゾンDNAが、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及び前記オーバーハングの5’末端のプライマー結合部位を含む、請求項37に記載の方法。
- 前記二本鎖ゲノムDNA断片のギャップフィリング及び伸長の前に、結合したトランスポザーゼが前記二本鎖断片から除去される、請求項37に記載の方法。
- 前記トランスポザーゼが、トランスポゾンDNAとそれぞれ複合体を形成したTn5トランスポザーゼであり、前記トランスポゾンDNAは、二本鎖19bp Tnp結合部位及びオーバーハングを含み、前記オーバーハングは、バーコード配列及びプライマー結合部位を含む、請求項37に記載の方法。
- 前記ゲノムDNAが、出生前細胞に由来する、請求項37に記載の方法。
- 前記ゲノムDNAが、癌細胞に由来する、請求項37に記載の方法。
- 前記ゲノムDNAが、循環腫瘍細胞に由来する、請求項37に記載の方法。
- 前記ゲノムDNAが、単一の出生前細胞に由来する、請求項37に記載の方法。
- 前記ゲノムDNAが、単一の癌細胞に由来する、請求項37に記載の方法。
- 前記ゲノムDNAが、単一の循環腫瘍細胞に由来する、請求項37に記載の方法。
- 前記プライマー結合部位が、特異的PCRプライマー結合部位である、請求項37に記載の方法。
- 物理的に分離した複数の反応チャンバ内で、トランスポザーゼを複数のトランスポゾンDNAと接触させ、それぞれの物理的に分離した反応チャンバ内でトランスポソームを形成すること、ここで、各トランスポゾンDNAは、共通のトランスポザーゼ結合部位、共通のプライマー結合部位及びバーコード配列を含み、前記バーコード配列は、同じ反応チャンバ内の全てのトランスポゾンDNAに対して同じであるが、他の反応チャンバ内のトランスポゾンDNAとは異なる;
各反応チャンバから前記トランスポソームを集め、全ての前記トランスポソームを混合してトランスポソームライブラリーを形成すること;
反応容積内の試薬トランスポソームライブラリーを形成すること、ここで、前記試薬トランスポソームライブラリー内の実質的に全て又は全てのトランスポソームは、固有の紐付けされたバーコード配列を有する;
ゲノムDNAを前記反応容積内の前記試薬トランスポソームライブラリーと接触させること、ここで、前記トランスポソームは、前記ゲノムDNAに沿って並ぶ標的位置群に結合し、前記トランスポザーゼは、前記ゲノムDNAを、ゲノムDNA断片ライブラリーを表す複数の二本鎖ゲノムDNA断片に切断し、各二本鎖ゲノムDNA断片は、前記ゲノムDNA断片の各末端に固有のバーコード配列対のうちの一方を含む;
前記トランスポゾンDNAと前記ゲノムDNA断片との間のギャップをギャップフィリングし、前記反応容積内で、各末端にプライマー結合部位を有する二本鎖ゲノムDNA断片伸長産物のライブラリーを形成すること;
前記二本鎖ゲノムDNA断片伸長産物を増幅して、前記反応容積内にアンプリコンを生成すること;
前記反応容積内の前記アンプリコンを配列決定すること;並びに
前記ゲノムDNAをデノボアセンブルするために、バーコードをマッチングさせることによって前記アンプリコン同士を計算的に連結すること、
を含む、デノボゲノムDNAアセンブリの方法。 - 前記反応チャンバが、管、マルチウェルプレート、マイクロアレイチップ、マイクロウェル、マイクロリアクター、微小液滴、微粒子ヒドロゲル、又は他の区画化方法である、請求項59に記載の方法。
- 前記ハプロタイプ分解デノボアセンブリが、ヒト単一細胞の、ヒト白血球抗原領域、V(D)J組換え領域、又は他の領域上にある、請求項23に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662373057P | 2016-08-10 | 2016-08-10 | |
US62/373,057 | 2016-08-10 | ||
PCT/US2017/046060 WO2018031631A1 (en) | 2016-08-10 | 2017-08-09 | Methods of de novo assembly of barcoded genomic dna fragments |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019528059A true JP2019528059A (ja) | 2019-10-10 |
Family
ID=61162491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019507862A Pending JP2019528059A (ja) | 2016-08-10 | 2017-08-09 | バーコード化ゲノムdna断片のデノボアセンブリの方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20190203204A1 (ja) |
EP (1) | EP3497219A4 (ja) |
JP (1) | JP2019528059A (ja) |
CN (1) | CN109804068A (ja) |
AU (1) | AU2017311306A1 (ja) |
CA (1) | CA3033506A1 (ja) |
RU (1) | RU2019106038A (ja) |
WO (1) | WO2018031631A1 (ja) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
CN104364392B (zh) | 2012-02-27 | 2018-05-25 | 赛卢拉研究公司 | 用于分子计数的组合物和试剂盒 |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US20140155295A1 (en) | 2012-08-14 | 2014-06-05 | 10X Technologies, Inc. | Capsule array devices and methods of use |
US20150376609A1 (en) | 2014-06-26 | 2015-12-31 | 10X Genomics, Inc. | Methods of Analyzing Nucleic Acids from Individual Cells or Cell Populations |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US10400280B2 (en) | 2012-08-14 | 2019-09-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
EP2931919B1 (en) | 2012-12-14 | 2019-02-20 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
CN108753766A (zh) | 2013-02-08 | 2018-11-06 | 10X基因组学有限公司 | 多核苷酸条形码生成 |
GB2546833B (en) | 2013-08-28 | 2018-04-18 | Cellular Res Inc | Microwell for single cell analysis comprising single cell and single bead oligonucleotide capture labels |
CA2943624A1 (en) | 2014-04-10 | 2015-10-15 | 10X Genomics, Inc. | Fluidic devices, systems, and methods for encapsulating and partitioning reagents, and applications of same |
SG11201705615UA (en) | 2015-01-12 | 2017-08-30 | 10X Genomics Inc | Processes and systems for preparing nucleic acid sequencing libraries and libraries prepared using same |
US10697000B2 (en) | 2015-02-24 | 2020-06-30 | 10X Genomics, Inc. | Partition processing methods and systems |
EP3262192B1 (en) | 2015-02-27 | 2020-09-16 | Becton, Dickinson and Company | Spatially addressable molecular barcoding |
JP7508191B2 (ja) | 2015-03-30 | 2024-07-01 | ベクトン・ディキンソン・アンド・カンパニー | コンビナトリアルバーコーディングのための方法および組成物 |
US11390914B2 (en) | 2015-04-23 | 2022-07-19 | Becton, Dickinson And Company | Methods and compositions for whole transcriptome amplification |
ES2745694T3 (es) | 2015-09-11 | 2020-03-03 | Cellular Res Inc | Métodos y composiciones para normalización de biblioteca de ácido nucleico |
US10301677B2 (en) | 2016-05-25 | 2019-05-28 | Cellular Research, Inc. | Normalization of nucleic acid libraries |
US10640763B2 (en) | 2016-05-31 | 2020-05-05 | Cellular Research, Inc. | Molecular indexing of internal sequences |
US10202641B2 (en) | 2016-05-31 | 2019-02-12 | Cellular Research, Inc. | Error correction in amplification of samples |
KR102363716B1 (ko) | 2016-09-26 | 2022-02-18 | 셀룰러 리서치, 인크. | 바코딩된 올리고뉴클레오티드 서열을 갖는 시약을 이용한 단백질 발현의 측정 |
WO2018140966A1 (en) | 2017-01-30 | 2018-08-02 | 10X Genomics, Inc. | Methods and systems for droplet-based single cell barcoding |
WO2018144240A1 (en) | 2017-02-01 | 2018-08-09 | Cellular Research, Inc. | Selective amplification using blocking oligonucleotides |
RU2019142713A (ru) | 2017-05-23 | 2021-06-24 | Президент Энд Фэллоуз Оф Харвард Коллидж | Мультиплексная амплификация нуклеиновых кислот с введением концевых меток |
US10844372B2 (en) | 2017-05-26 | 2020-11-24 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
EP4230746A3 (en) | 2017-05-26 | 2023-11-01 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
EP3635135A1 (en) | 2017-06-05 | 2020-04-15 | Becton, Dickinson and Company | Sample indexing for single cells |
WO2019084043A1 (en) | 2017-10-26 | 2019-05-02 | 10X Genomics, Inc. | METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS |
CN111051523B (zh) | 2017-11-15 | 2024-03-19 | 10X基因组学有限公司 | 功能化凝胶珠 |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
EP3752832A1 (en) | 2018-02-12 | 2020-12-23 | 10X Genomics, Inc. | Methods characterizing multiple analytes from individual cells or cell populations |
SG11202009889VA (en) | 2018-04-06 | 2020-11-27 | 10X Genomics Inc | Systems and methods for quality control in single cell processing |
CA3097976A1 (en) * | 2018-05-03 | 2019-11-07 | Becton, Dickinson And Company | High throughput multiomics sample analysis |
US11365409B2 (en) | 2018-05-03 | 2022-06-21 | Becton, Dickinson And Company | Molecular barcoding on opposite transcript ends |
US11932899B2 (en) | 2018-06-07 | 2024-03-19 | 10X Genomics, Inc. | Methods and systems for characterizing nucleic acid molecules |
US12065688B2 (en) | 2018-08-20 | 2024-08-20 | 10X Genomics, Inc. | Compositions and methods for cellular processing |
JP2022511398A (ja) | 2018-10-01 | 2022-01-31 | ベクトン・ディキンソン・アンド・カンパニー | 5’転写物配列の決定 |
JP2022506546A (ja) | 2018-11-08 | 2022-01-17 | ベクトン・ディキンソン・アンド・カンパニー | ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析 |
CN113195717A (zh) | 2018-12-13 | 2021-07-30 | 贝克顿迪金森公司 | 单细胞全转录组分析中的选择性延伸 |
SG11202105441WA (en) | 2018-12-13 | 2021-06-29 | Dna Script | Direct oligonucleotide synthesis on cells and biomolecules |
US11845983B1 (en) | 2019-01-09 | 2023-12-19 | 10X Genomics, Inc. | Methods and systems for multiplexing of droplet based assays |
CN113574178A (zh) | 2019-01-23 | 2021-10-29 | 贝克顿迪金森公司 | 与抗体关联的寡核苷酸 |
WO2020168013A1 (en) | 2019-02-12 | 2020-08-20 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
US11467153B2 (en) | 2019-02-12 | 2022-10-11 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
EP3924506A1 (en) | 2019-02-14 | 2021-12-22 | Becton Dickinson and Company | Hybrid targeted and whole transcriptome amplification |
US11939622B2 (en) | 2019-07-22 | 2024-03-26 | Becton, Dickinson And Company | Single cell chromatin immunoprecipitation sequencing assay |
WO2021092386A1 (en) | 2019-11-08 | 2021-05-14 | Becton Dickinson And Company | Using random priming to obtain full-length v(d)j information for immune repertoire sequencing |
EP4090763A1 (en) | 2020-01-13 | 2022-11-23 | Becton Dickinson and Company | Methods and compositions for quantitation of proteins and rna |
WO2021231779A1 (en) | 2020-05-14 | 2021-11-18 | Becton, Dickinson And Company | Primers for immune repertoire profiling |
US11932901B2 (en) | 2020-07-13 | 2024-03-19 | Becton, Dickinson And Company | Target enrichment using nucleic acid probes for scRNAseq |
WO2022067565A1 (zh) * | 2020-09-29 | 2022-04-07 | 生物岛实验室 | 空间组学测序、单细胞表观转录组学测序及定位标识方法 |
WO2022109343A1 (en) | 2020-11-20 | 2022-05-27 | Becton, Dickinson And Company | Profiling of highly expressed and lowly expressed proteins |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8829171B2 (en) * | 2011-02-10 | 2014-09-09 | Illumina, Inc. | Linking sequence reads using paired code tags |
WO2013036929A1 (en) * | 2011-09-09 | 2013-03-14 | The Board Of Trustees Of The Leland Stanford Junior | Methods for obtaining a sequence |
US9683230B2 (en) * | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
CN108753766A (zh) * | 2013-02-08 | 2018-11-06 | 10X基因组学有限公司 | 多核苷酸条形码生成 |
US9328382B2 (en) * | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
SG11201609053YA (en) * | 2014-04-29 | 2016-11-29 | Illumina Inc | Multiplexed single cell gene expression analysis using template switch and tagmentation |
EP3191605B1 (en) * | 2014-09-09 | 2022-07-27 | The Broad Institute, Inc. | A droplet-based method and apparatus for composite single-cell nucleic acid analysis |
RU2709655C2 (ru) * | 2014-10-17 | 2019-12-19 | Иллумина Кембридж Лимитед | Транспозиция с сохранением сцепления генов |
AU2015343034B2 (en) * | 2014-11-05 | 2021-12-16 | Illumina, Inc. | Transposase compositions for reduction of insertion bias |
-
2017
- 2017-08-09 AU AU2017311306A patent/AU2017311306A1/en not_active Abandoned
- 2017-08-09 CA CA3033506A patent/CA3033506A1/en not_active Abandoned
- 2017-08-09 CN CN201780062510.3A patent/CN109804068A/zh active Pending
- 2017-08-09 WO PCT/US2017/046060 patent/WO2018031631A1/en unknown
- 2017-08-09 RU RU2019106038A patent/RU2019106038A/ru not_active Application Discontinuation
- 2017-08-09 JP JP2019507862A patent/JP2019528059A/ja active Pending
- 2017-08-09 US US16/324,142 patent/US20190203204A1/en not_active Abandoned
- 2017-08-09 EP EP17840192.3A patent/EP3497219A4/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP3497219A4 (en) | 2020-08-19 |
CA3033506A1 (en) | 2018-02-15 |
AU2017311306A1 (en) | 2019-03-14 |
US20190203204A1 (en) | 2019-07-04 |
WO2018031631A1 (en) | 2018-02-15 |
RU2019106038A (ru) | 2020-09-17 |
CN109804068A (zh) | 2019-05-24 |
EP3497219A1 (en) | 2019-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019528059A (ja) | バーコード化ゲノムdna断片のデノボアセンブリの方法 | |
US20230203563A1 (en) | Multiplex End-Tagging Amplification of Nucleic Acids | |
RU2736351C2 (ru) | Способы дискретной амплификации полного генома | |
EP3325665B1 (en) | Methods of amplifying nucleic acid sequences | |
US20230056763A1 (en) | Methods of targeted sequencing | |
CN113025687A (zh) | 用于核酸扩增的样品制备 | |
CN111295443B (zh) | 基于转座酶的基因组分析 | |
JP7489455B2 (ja) | 哺乳類dnaのメチル化の検出及び分析 | |
CN114466935A (zh) | 基因突变分析 | |
CN114729349A (zh) | 条码化核酸用于检测和测序的方法 | |
CN118308491A (zh) | 单细胞dna甲基化检测方法 | |
CN118056018A (zh) | 基于珠粒的ATACseq处理(BAP) |