JP7441003B2 - ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング - Google Patents
ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング Download PDFInfo
- Publication number
- JP7441003B2 JP7441003B2 JP2018543207A JP2018543207A JP7441003B2 JP 7441003 B2 JP7441003 B2 JP 7441003B2 JP 2018543207 A JP2018543207 A JP 2018543207A JP 2018543207 A JP2018543207 A JP 2018543207A JP 7441003 B2 JP7441003 B2 JP 7441003B2
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- segment
- dna
- sequence
- molecule
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 102000054766 genetic haplotypes Human genes 0.000 title description 6
- 108020004414 DNA Proteins 0.000 claims description 322
- 238000000034 method Methods 0.000 claims description 304
- 102000053602 DNA Human genes 0.000 claims description 159
- 238000012163 sequencing technique Methods 0.000 claims description 155
- 230000004568 DNA-binding Effects 0.000 claims description 46
- 238000007671 third-generation sequencing Methods 0.000 claims description 41
- 239000002105 nanoparticle Substances 0.000 claims description 37
- 108091008146 restriction endonucleases Proteins 0.000 claims description 33
- 150000004713 phosphodiesters Chemical group 0.000 claims description 29
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 23
- 238000005520 cutting process Methods 0.000 claims description 23
- 108010020764 Transposases Proteins 0.000 claims description 22
- 102000008579 Transposases Human genes 0.000 claims description 22
- 108700020911 DNA-Binding Proteins Proteins 0.000 claims description 19
- 230000008569 process Effects 0.000 claims description 18
- 102000004190 Enzymes Human genes 0.000 claims description 16
- 108090000790 Enzymes Proteins 0.000 claims description 16
- 239000003431 cross linking reagent Substances 0.000 claims description 11
- 108010042407 Endonucleases Proteins 0.000 claims description 9
- 102000004533 Endonucleases Human genes 0.000 claims description 9
- 238000010008 shearing Methods 0.000 claims description 7
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 claims description 6
- 230000008439 repair process Effects 0.000 claims description 4
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 claims description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 claims description 3
- 229940045145 uridine Drugs 0.000 claims description 3
- 150000007523 nucleic acids Chemical class 0.000 description 823
- 102000039446 nucleic acids Human genes 0.000 description 715
- 108020004707 nucleic acids Proteins 0.000 description 715
- 239000012071 phase Substances 0.000 description 242
- 239000000523 sample Substances 0.000 description 231
- 108091034117 Oligonucleotide Proteins 0.000 description 136
- 108091028043 Nucleic acid sequence Proteins 0.000 description 94
- 108010077544 Chromatin Proteins 0.000 description 86
- 210000003483 chromatin Anatomy 0.000 description 86
- 125000003729 nucleotide group Chemical group 0.000 description 58
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 54
- 239000002773 nucleotide Substances 0.000 description 48
- 230000027455 binding Effects 0.000 description 44
- 239000011324 bead Substances 0.000 description 39
- 238000003776 cleavage reaction Methods 0.000 description 39
- 230000007017 scission Effects 0.000 description 39
- 230000035772 mutation Effects 0.000 description 32
- 238000005516 engineering process Methods 0.000 description 31
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 description 29
- 230000000295 complement effect Effects 0.000 description 29
- 210000000349 chromosome Anatomy 0.000 description 28
- 238000013507 mapping Methods 0.000 description 27
- 230000008707 rearrangement Effects 0.000 description 24
- 239000007787 solid Substances 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 22
- 108010033040 Histones Proteins 0.000 description 21
- 230000003321 amplification Effects 0.000 description 21
- 238000003199 nucleic acid amplification method Methods 0.000 description 21
- 239000000203 mixture Substances 0.000 description 19
- 108700028369 Alleles Proteins 0.000 description 18
- 102000006947 Histones Human genes 0.000 description 18
- 210000004027 cell Anatomy 0.000 description 18
- 238000013459 approach Methods 0.000 description 17
- 238000000338 in vitro Methods 0.000 description 17
- 238000003860 storage Methods 0.000 description 17
- 230000015654 memory Effects 0.000 description 16
- 102000040430 polynucleotide Human genes 0.000 description 16
- 108091033319 polynucleotide Proteins 0.000 description 16
- 239000002157 polynucleotide Substances 0.000 description 16
- 230000008901 benefit Effects 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 14
- 108090000623 proteins and genes Proteins 0.000 description 14
- 238000001712 DNA sequencing Methods 0.000 description 12
- 108010047956 Nucleosomes Proteins 0.000 description 12
- 230000029087 digestion Effects 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 210000001623 nucleosome Anatomy 0.000 description 12
- 230000003426 interchromosomal effect Effects 0.000 description 11
- 238000003780 insertion Methods 0.000 description 10
- 230000037431 insertion Effects 0.000 description 10
- 238000004132 cross linking Methods 0.000 description 9
- 238000012217 deletion Methods 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 238000005562 fading Methods 0.000 description 9
- 230000003252 repetitive effect Effects 0.000 description 9
- 238000000429 assembly Methods 0.000 description 8
- 230000000712 assembly Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 238000009826 distribution Methods 0.000 description 8
- 102000054765 polymorphisms of proteins Human genes 0.000 description 8
- 102000004169 proteins and genes Human genes 0.000 description 8
- 210000001519 tissue Anatomy 0.000 description 8
- 229910019142 PO4 Inorganic materials 0.000 description 7
- 240000008042 Zea mays Species 0.000 description 7
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 7
- 238000000137 annealing Methods 0.000 description 7
- 108091006090 chromatin-associated proteins Proteins 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 235000016709 nutrition Nutrition 0.000 description 7
- 235000021317 phosphate Nutrition 0.000 description 7
- 235000018102 proteins Nutrition 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 108091028732 Concatemer Proteins 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 6
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 239000002245 particle Substances 0.000 description 6
- 230000001225 therapeutic effect Effects 0.000 description 6
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 5
- 239000002253 acid Substances 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 238000004113 cell culture Methods 0.000 description 5
- 235000005822 corn Nutrition 0.000 description 5
- -1 guanosine nucleotide triphosphate Chemical class 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 239000003550 marker Substances 0.000 description 5
- 102000044158 nucleic acid binding protein Human genes 0.000 description 5
- 108700020942 nucleic acid binding protein Proteins 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 101710096438 DNA-binding protein Proteins 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 101500006448 Mycobacterium bovis (strain ATCC BAA-935 / AF2122/97) Endonuclease PI-MboI Proteins 0.000 description 4
- 102000007999 Nuclear Proteins Human genes 0.000 description 4
- 108010089610 Nuclear Proteins Proteins 0.000 description 4
- 108010090804 Streptavidin Proteins 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 238000002955 isolation Methods 0.000 description 4
- 238000005304 joining Methods 0.000 description 4
- 230000005291 magnetic effect Effects 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 230000005945 translocation Effects 0.000 description 4
- 102000012410 DNA Ligases Human genes 0.000 description 3
- 108010061982 DNA Ligases Proteins 0.000 description 3
- 108010067770 Endopeptidase K Proteins 0.000 description 3
- 206010028980 Neoplasm Diseases 0.000 description 3
- 102000007553 Nucleosome Assembly Protein 1 Human genes 0.000 description 3
- 108010046445 Nucleosome Assembly Protein 1 Proteins 0.000 description 3
- 101710183280 Topoisomerase Proteins 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000001124 body fluid Anatomy 0.000 description 3
- 239000010839 body fluid Substances 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 235000021466 carotenoid Nutrition 0.000 description 3
- 150000001747 carotenoids Chemical class 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000007865 diluting Methods 0.000 description 3
- 238000010348 incorporation Methods 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000000819 phase cycle Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 206010064571 Gene mutation Diseases 0.000 description 2
- 102000018754 Histone Chaperones Human genes 0.000 description 2
- 108010052497 Histone Chaperones Proteins 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- 102000005431 Molecular Chaperones Human genes 0.000 description 2
- 108010006519 Molecular Chaperones Proteins 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 239000000839 emulsion Substances 0.000 description 2
- 238000006911 enzymatic reaction Methods 0.000 description 2
- 230000004049 epigenetic modification Effects 0.000 description 2
- 239000000834 fixative Substances 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 238000001502 gel electrophoresis Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000009878 intermolecular interaction Effects 0.000 description 2
- PHTQWCKDNZKARW-UHFFFAOYSA-N isoamylol Chemical compound CC(C)CCO PHTQWCKDNZKARW-UHFFFAOYSA-N 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 239000006249 magnetic particle Substances 0.000 description 2
- 235000009973 maize Nutrition 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000005298 paramagnetic effect Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 description 1
- PFUVOLUPRFCPMN-UHFFFAOYSA-N 7h-purine-6,8-diamine Chemical compound C1=NC(N)=C2NC(N)=NC2=N1 PFUVOLUPRFCPMN-UHFFFAOYSA-N 0.000 description 1
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000274965 Cyrestis thyodamas Species 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 101000585180 Homo sapiens Stereocilin Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 206010067482 No adverse event Diseases 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102100029924 Stereocilin Human genes 0.000 description 1
- 102000004357 Transferases Human genes 0.000 description 1
- 108090000992 Transferases Proteins 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 238000003916 acid precipitation Methods 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 241000902900 cellular organisms Species 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000003381 deacetylation reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006862 enzymatic digestion Effects 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 102000033785 histone binding proteins Human genes 0.000 description 1
- 108091009732 histone binding proteins Proteins 0.000 description 1
- 230000006197 histone deacetylation Effects 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000000543 intermediate Substances 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000036456 mitotic arrest Effects 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000012188 paraffin wax Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- KHIWWQKSHDUIBK-UHFFFAOYSA-N periodic acid Chemical compound OI(=O)(=O)=O KHIWWQKSHDUIBK-UHFFFAOYSA-N 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 238000005185 salting out Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012384 transportation and delivery Methods 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
- C40B40/08—Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/5308—Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2522/00—Reaction characterised by the use of non-enzymatic proteins
- C12Q2522/10—Nucleic acid binding proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2533/00—Reactions characterised by the enzymatic reaction principle used
- C12Q2533/10—Reactions characterised by the enzymatic reaction principle used the purpose being to increase the length of an oligonucleotide strand
- C12Q2533/107—Probe or oligonucleotide ligation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Immunology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Chemical & Material Sciences (AREA)
- Hematology (AREA)
- Urology & Nephrology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Cell Biology (AREA)
- Food Science & Technology (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Display Devices Of Pinball Game Machines (AREA)
Description
本明細書中の開示と共に使用するのに適している核酸の抽出および精製の方法は、当該技術分野で周知である。例えば、核酸は、フェノール、フェノール/クロロホルム/イソアミルアルコール、あるいはTRIzolおよびTriReagentを含む同様の製剤での有機抽出により精製される。抽出技術の他の限定されない例は、以下を含む:(1)自動核酸抽出器、例えばApplied Biosystems(Foster City, Calif.)から入手可能なModel 341 DNA Extractorの使用を伴うまたは伴わない、例えばフェノール/クロロホルムの有機試薬(Ausubel et al., 1993)を使用する、エタノール沈殿が後続する有機抽出;(2)固定相吸着法(米国特許第5,234,809号;Walsh et al., 1991);および(3)典型的に「塩析」方法と称される沈澱法などの、塩で誘導された核酸沈澱法(Miller et al., (1988))。核酸の単離および/または精製の別の例は磁性粒子の使用を含み、核酸は特異的または非特異的に磁性粒子に結合し、その後磁石を使用してビーズを単離し、洗浄し、そしてビーズから核酸を溶出することができる(例えば米国特許第5,705,628号を参照)。幾つかの実施形態において、上記の単離方法は、サンプルから不要なタンパク質を取り除くのに役立つ酵素消化工程、例えばプロテイナーゼKまたは他のプロテアーゼによる消化より始められてもよい。例えば米国特許第7,001,724号を参照。望ましい場合、RNase阻害剤を、溶解緩衝液に添加することができる。特定の細胞またはサンプル型について、前記プロトコルにタンパク質変性/消化の工程を加えることが望ましい場合もある。精製方法は、DNA、RNA、またはその両方を単離することを目的とし得る。抽出手順の間またはその後にDNAとRNAの両方が一緒に単離されると、更なる工程を利用して、一方または両方を他とは別々に精製することができる。抽出した核酸の細分画を生成することもでき、例えば、サイズ、配列、または他の物理的若しくは化学的特性による精製が行われる。最初の核酸単離工程に加えて、過剰または不要な試薬、反応物、または産物を除去するなどのために、本開示の方法における工程の後に核酸の精製を実施することができる。
核酸は、核酸分子の切断後にフェーズ情報を維持するために核酸結合部分に結合され得る。多くの核酸結合部分は、本明細書中の開示と一致する足場を形成する。本明細書中の開示に適切なものの一部は、フェーズ情報が核酸分子の切断および再ライゲーション後に失われないように複数の点で核酸に結合する。
核酸分子の切断および再配列中のフェーズ情報の維持のための核酸結合部分上への核酸の組み込みは、場合によっては核酸サンプル上への再構成クロマチンの組み込みを介して遂行される。本明細書で使用されるような再構成クロマチンは、核酸上への天然のクロマチン構成要素のアセンブリから、非生物粒子への核酸の結合まで、広く使用される。
結合された核酸は、内部の二本鎖末端を晒すために処理され得る。切断は、制限エンドヌクレアーゼなどの制限酵素で処理され得る。代替的な切断方法は、本明細書における開示とも一致している。例えば、トランスポサーゼは、トランスポサーゼが送達されたオリゴ核酸分子の結合によって印付けられる核酸中の配列から独立した破壊を作り出すように、結合されていない左および右の境界オリゴ核酸分子と組み合わせて随意に使用される。オリゴ核酸分子は、場合によっては、終点に適合可能な(punctuation-compatible)オーバーハングを含むように、あるいは互いに適合可能となるように合成され、それにより、オリゴ核酸分子は、互いにライゲートされ、且つ終点分子として機能する。この種の代替的な方法の利益は、切断が配列に依存せず、従って、2つの核酸分子の配列が局所的に同一であっても、核酸の1つのコピーと別のコピーまでおそらく変動するということである。
場合によっては、終点オリゴヌクレオチドが、晒された切断末端を接続する際に使用され得る。終点オリゴヌクレオチドは、フェーズを維持する再配列を受けるサンプル分子の2つの切断された内部末端を架橋するように、標的ポリヌクレオチドに結合され得るオリゴヌクレオチドを含んでいる。終点オリゴヌクレオチドは、DNA、RNA、ヌクレオチドアナログ、非標準のヌクレオチド、標識化ヌクレオチド、修飾されたヌクレオチド、またはそれらの組み合わせを含み得る。多くの例において、二本鎖終点オリゴヌクレオチドは、互いにハイブリダイズされる2つの別個のオリゴヌクレオチド(「オリゴヌクレオチドデュプレックス」とも称される)を含み、ハイブリダイゼーションは、1つ以上の平滑末端、1つ以上の3’オーバーハング、1つ以上の5’オーバーハング、不適正および/または非対合のヌクレオチドから結果として生じる1つ以上のバルジ、またはこれらの任意の組み合わせを残し得る。幾つかの例において、異なる終点オリゴヌクレオチドが、連続的な反応においてまたは同時に、ポリヌクレオチドを標的とするために結合される。例えば、第1および第2の終点オリゴヌクレオチドが同じ反応に加えられ得る。代替的に、終点オリゴの集団は場合によっては均一である。
アダプターは、標的ポリヌクレオチドに結合され得る配列を持つ任意のオリゴヌクレオチドを含んでいる。終点粘着体オリゴヌクレオチドは、DNA、RNA、ヌクレオチドアナログ、非標準のヌクレオチド、標識化ヌクレオチド、修飾されたヌクレオチド、またはそれらの組み合わせを含み得る。幾つかの例において、アダプターオリゴヌクレオチドは、一本鎖、二本鎖、または部分的に二重である。一般に、部分的に二重のアダプターオリゴヌクレオチドは、1つ以上の一本鎖領域および1つ以上の二本鎖領域を含む。二本鎖アダプターオリゴヌクレオチドは、互いにハイブリダイズされる2つの別個のオリゴヌクレオチド(「オリゴヌクレオチドデュプレックス」とも称される)を含み、ハイブリダイゼーションは、1つ以上の平滑末端、1つ以上の3’オーバーハング、1つ以上の5’オーバーハング、不適正および/または非対合のヌクレオチドから結果として生じる1つ以上のバルジ、またはこれらの任意の組み合わせを残し得る。幾つかの実施形態において、一本鎖アダプターオリゴヌクレオチドは、互いとハイブリダイズすることができる2つ以上の配列を含む。2つのそのようなハイブリダイズ可能な配列が一本鎖アダプターに含まれていると、ハイブリダイゼーションはヘアピン構造(ヘアピンアダプター)を産出する。アダプターオリゴヌクレオチドの2つのハイブリダイズされた領域がハイブリダイズされていない領域によって互いに分離されと、「バブル」構造が結果として生じる。バブル構造を含むアダプターオリゴヌクレオチドは、内部のハイブリダイゼーションを含む単一のアダプターオリゴヌクレオチドから成るか、あるいは互いにハイブリダイズされた2つ以上のアダプターオリゴヌクレオチドを含む。アダプターオリゴヌクレオチドにおける2つのハイブリダイズ可能な配列間などでの内部配列ハイブリダイゼーションは、幾つかの例において、一本鎖アダプターオリゴヌクレオチド中に二本鎖構造を生成する。幾つかの例において、ヘアピンアダプターおよび二本鎖アダプター、または異なる配列のなどの、異なる種類のアダプターオリゴヌクレオチドは、組み合わせで使用される。特定の場合、ヘアピンアダプター中のハイブリダイズ可能な配列は、オリゴヌクレオチドの末端の一方または両方を含んでいる。どの末端もハイブリダイズ可能な配列に含まれない時、両末端は「自由(free)」または「オーバーハング」である。一端のみがアダプター中で別の配列にハイブリダイズされる時、他端は3’オーバーハングまたは5’オーバーハングなどのオーバーハングを形成する。5’-末端ヌクレオチドおよび3’-末端ヌクレオチドの両方が互いにハイブリダイズ可能な配列に含まれ、それにより5’-末端ヌクレオチドおよび3’-末端ヌクレオチドが相補的になり且つ互いとハイブリダイズする時、末端は「平滑」と称される。場合によっては、異なるアダプターオリゴヌクレオチドは、連続的な反応においてまたは同時に、ポリヌクレオチドを標的とするために結合される。例えば、第1および第2のアダプターオリゴヌクレオチドが同じ反応に加えられる。幾つかの例において、アダプターオリゴヌクレオチドは標的ポリヌクレオチドと組み合わせる前に取り扱われる。例えば、末端リン酸塩が追加または除去され得る。
核酸サンプルのフェーズ情報を測定ために、核酸は、例えば本明細書で議論される抽出法によって最初に獲得される。多くの場合、核酸はその後、核酸分子の切断の後にフェーズ情報を維持するように固体表面に結合される。好ましくは、核酸分子は、再構成クロマチンを生成するために核酸結合タンパク質と共にインビトロでアセンブリされるが、他の適切な固体表面は、核酸結合タンパク質凝集体、ナノ粒子、核酸結合ビーズ、または、核酸結合物質、ポリマー、合成核酸結合分子、あるいは他の固体またはほぼ固体の親和性分子で覆われたビーズを含む。核酸サンプルはまた、天然のクロマチンの場合のように固体表面に既に結合された状態で得ることができる。天然のクロマチンは、ホルマリン固定/パラフィン包埋(FFPE)されたまたは同様に維持されたサンプルの形態などで既に固定されている状態で得ることができる。
幾つかの例において、本明細書に記載される、放たれて再配列された核酸分子は、配列決定前に更に処理される。例えば、再配列された核酸分子内に含まれる核酸セグメントは、バーコード化され得る。バーコーディングは、配列のリードのより容易なグルーピングを可能にし得る。例えば、バーコードは、同じ再配列された核酸分子から生じる配列を識別するために使用され得る。バーコードはまた、個々の結合を一意に識別するために使用され得る。例えば、各結合は、結合を一意に識別することができる固有の(例えば、無作為に生成された)バーコードで印をつけられ得る。同じ再配列された核酸分子から生じる配列を識別するための第1のバーコード、および個々の結合を一意に識別するための第2のバーコードなど、複数のバーコードを共に使用することができる。
本明細書には更に、ペアエンドからフェーズ情報を判定するための方法および組成物が提供される。ペアエンドは、開示された方法の何れかまたは提供された実施例に更に例示されるものによって生成され得る。例えば、後に切断される固体表面に結合される核酸分子の場合、自由末端の再ライゲーションの後、再びライゲートされた核酸セグメントは、例えば制限消化によって固相が結合した核酸分子から放たれる。この放出の結果、複数のペアエンドがもたらされる。場合によっては、ペアエンドは、増幅アダプターにライゲートされ、増幅され、且つ短距離技術で配列決定される。これらの場合、多数の異なる核酸結合部分に結合した核酸分子からのペアエンドは、配列決定されたサンプル内にある。しかし、ペアエンドの結合の何れかの側について、結合隣接配列は共通の分子の共通のフェーズから由来することが、確信的に結論付けられる。ペアエンドが終点オリゴヌクレオチドに結合される時、配列決定のリードにおけるペアエンドの結合は、終点オリゴヌクレオチド配列によって識別される。他の場合、ペアエンドは修飾されたヌクレオチドによって結合され、これは、使用される修飾されたヌクレオチドの配列に基づいて識別され得る。
本明細書に開示される方法および組成物は、インプットDNAサンプルと比べて再配列されたセグメントを含む長いDNA分子を生成するために使用され得る。これら分子は、あらゆる配列決定技術を使用して配列決定される。好ましくは、長い分子は、標準のロングリード配列決定技術を使用して配列決定される。付加的または代替的に、、精製された長い分子は、ショートリード配列決定技術と互換性を持たせるために、本明細書に開示されるように修飾され得る。
本明細書に記載される方法および組成物を使用して生成された配列決定データは、好ましい実施形態において、フェージングされたデノボ配列アセンブリを生成するために使用される。
本明細書にはまた、核酸配列ライブラリーの生成のための方法および組成物が開示される。再配列された分子が配列決定され、配列リードが分析される。与えられたリードに関して、配列セグメントが観察され、複数の再配列されたセグメントへとパースされ得る。句切りオリゴが利用される場合、句切り要素によって局所的に中断されてない配列セグメントが観察され得る。配列セグメントにおける配列情報は、インフェーズであると推定され、局所的に正確に順序付けられ、方向付けられる。接合部のどちらの側のセグメントも、一般的なサンプル核酸分子上で互いにインフェーズであると推論されるが、必ずしも、再配列された核酸分子上で互いに対して正確に順序付けられ、方向付けられないと推論される。再配列の恩恵は、互いから遠く離れて位置付けられたセグメントが、時に近位に移され、その結果、サンプル分子において、同一の、フェージングするのが困難な配列の大きな距離だけ離されていたとしても、共通のリードにおいて読み取られ、共通のフェーズに確信的に割り当てられるということである。別の恩恵は、セグメント配列自体が、元のサンプル配列のほとんど、略すべて、またはすべてを含み、その結果、フェーズ情報に加えて、幾つかの場合において、コンティグ情報が、幾つかの場合におけるデノボ配列アセンブリを実行するのに十分であると決定されるということである。このデノボ配列は、新規の足場またはコンティグのセットを生成するか、あるいは前にまたは独立して生成されたコンティグまたは足場配列のセットを増大させるために随意に使用される。
再配列された分子は、長さが少なくとも約100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1kb、1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、2.0kb、2.5kb、3.0kb、3.5kb、4.0kb、4.5kb、5.0kb、5.5kb、6.0kb、6.5kb、7.0kb、7.5kb、8.0kb、8.5kb、9.0kb、9.5kb、10.0kb、またはそれ以上である、少なくとも2、3、4、5、6、7、8、9、10、またはそれ以上のセグメントを有することができる。幾つかの場合では、再配列された分子は、長さが少なくとも500bpである少なくとも3つのセグメントを有する。幾つかの場合では、再配列された分子は、長さが少なくとも500bpである少なくとも4つのセグメントを有する。幾つかの場合では、再配列された分子は、長さが少なくとも500bpである少なくとも5つのセグメントを有する。幾つかの場合では、再配列された分子は、長さが少なくとも500bpである少なくとも6つのセグメントを有する。
さらに、本明細書には、好ましい実施形態において、ほぼ全体のインプット核酸分子を含む核酸配列をフェージングするおよびデノボアセンブルするための方法および組成物が開示される。
本開示の技術は、限定されないが、デノボ配列アセンブリ(フェージングされた配列アセンブリを含む)の生成、リードの足場へのマッピング(フェージング情報を含む)、フェージング情報の決定、および構造変異体の同定を含む、様々な遺伝学およびゲノミクスの用途に使用することができる。
これらの場合では、第1の共通の足場以外の場所にマッピングする一意にマッピングする配列のパーセンテージを含む分子の配列は、分析から除外される。
本明細書に記載されるような方法は、幾つかの場合において、例えば、メモリ(1010)、または電子記憶装置(1015)などの、サーバー(1001)の電子記憶位置に保存された、マシン(またはコンピュータープロセッサ)実行可能コード(またはソフトウェア)によって実施される。使用中に、コードはプロセッサ(1005)によって実行され得る。幾つかの場合では、コードは、電子記憶装置(1015)から取得され、プロセッサ(1005)による容易なアクセスのためのメモリ(1010)上に保存することができる。幾つかの状況において、電子記憶装置(115)は除外することができ、マシン実行可能命令がメモリ(1010)に保存される。代替的に、コードは、第2のコンピューターシステム(1040)上で実行することができる。
1.第1のDNA分子から長距離フェーズ情報を生成する方法であって、上記方法は、a)第1のセグメントと第2のセグメントとを有する第1のDNA分子を提供する工程であって、第1のセグメントと第2のセグメントが第1のDNA分子上で隣接しない、工程と、b)第1のセグメントと第2のセグメントが、第1のDNA分子の共通のホスホジエステル骨格とは無関係にDNA結合部分に結合するように、DNA結合部分に第1のDNA分子を接触させる工程と、c)第1のセグメントと第2のセグメントが共通のホスホジエステル骨格によって結合されないように、第1のDNA分子を切断する工程と、d)再アセンブルされた第1のDNA分子を形成するためにホスホジエステル結合によって第2のセグメントに第1のセグメントを取り付ける工程と、e)単一の配列決定リードの第1のセグメントと第2のセグメントとの間の接合部を含む再アセンブルされた第1のDNA分子の少なくとも4kbの連続する配列を配列決定する工程を含み、第1のセグメント配列と第2のセグメント配列が第1のDNA分子からの長距離フェーズ情報を表す、方法。
2.DNA結合部分は複数のDNA結合分子を含む、付番された実施形態1の方法。
3.複数のDNA結合部分へ第1のDNA分子を接触させる工程は、DNA結合タンパク質の集団に接触させることを含む、付番された実施形態1または2の方法。
4.DNA結合タンパク質の集団は核タンパク質を含む、付番された実施形態1-3のいずれか1つの方法。
5.DNA結合タンパク質の集団はヌクレオソームを含む、付番された実施形態1-4のいずれか1つの方法。
6.DNA結合タンパク質の集団はヒストンを含む、付番された実施形態1-5のいずれか1つの方法。
7.複数のDNA結合部分へ第1のDNA分子を接触させる工程は、DNA結合ナノ粒子の集団に接触させることを含む、付番された実施形態1-6のいずれか1つの方法。
8.第1のDNA分子は、第1のDNA分子上で第1のセグメントあるいは第2のセグメントに隣接していない第3のセグメントを有し、(b)の接触させる工程は、第3のセグメントが第1のDNA分子の共通のホスホジエステル骨格とは無関係に、DNA結合部分に結合されるように行われ、(c)の切断する工程は、第3のセグメントが共通のホスホジエステル骨格によって第1のセグメントと第2のセグメントに結合されないように行われ、取り付ける工程は、再アセンブルされた第1のDNA分子を形成するためにホスホジエステル結合によって第2のセグメントに第3のセグメントを取り付けることを含み、(e)の配列決定された連続する配列は、単一の配列決定リードの第2のセグメントと第3のセグメントとの間に接合部を含む、付番された実施形態1-7のいずれか1つの方法。
9.第1のDNA分子を架橋剤へ接触させる工程を含む、付番された実施形態1-9のいずれか1つの方法。
10.第1のDNA分子を架橋剤へ接触させる工程を含む、付番された実施形態1-9のいずれか1つの方法。
11.架橋剤はホルムアルデヒドである、付番された実施形態1-10のいずれか1つの方法。
12.架橋剤はホルムアルデヒドである、付番された実施形態1-11のいずれか1つの方法。
13.DNA結合部分は、複数のDNA結合部分を含む表面に結合される、付番された実施形態1-12のいずれか1つの方法。
14.DNA結合部分は、ビーズを含む固体のフレームワークに結合される、付番された実施形態1-13のいずれか1つの方法。
15.第1のDNA分子を切断する工程は、制限エンドヌクレアーゼに接触させることを含む、付番された実施形態1-14のいずれか1つの方法。
16.第1のDNA分子を切断する工程は、非特異的なエンドヌクレアーゼに接触させることを含む、付番された実施形態1-15のいずれか1つの方法。
17.第1のDNA分子を切断する工程は、タグメンテーション酵素に接触させることを含む、付番された実施形態1-16のいずれか1つの方法。
18.第1のDNA分子を切断する工程は、トランスポサーゼに接触させることを含む、付番された実施形態1-17のいずれか1つの方法。
19.第1のDNA分子を切断する工程は、第1の分子を剪断することを含む、付番された実施形態1-18のいずれか1つの方法。
20.少なくとも1つの露出した末端にタグを加える工程を含む、付番された実施形態1-19のいずれか1つの方法。
21.タグは標識された塩基を含む、付番された実施形態1-20のいずれか1つの方法。
22.タグはメチル化された塩基を含む、付番された実施形態1-21のいずれか1つの方法。
23.タグはビオチン化された塩基を含む、付番された実施形態1-22のいずれか1つの方法。
24.タグはウリジンを含む、付番された実施形態1-23のいずれか1つの方法。
25.タグは非標準の塩基を含む、付番された実施形態1-24のいずれか1つの方法。
26.タグは平滑末端を有する露出した末端を生成する、付番された実施形態1-25のいずれか1つの方法。
27.第1のセグメントの粘着末端のくぼんだ鎖に少なくとも1つの塩基を加える工程を含む、付番された実施形態1-26のいずれか1つの方法。
28.第1のセグメントの粘着末端にアニール化されるオーバーハングを含むリンカーオリゴを加える工程を含む、付番された実施形態1-27のいずれか1つの方法。
29.リンカーオリゴは、第1のセグメントの粘着末端にアニール化されるオーバーハングと、第2のセグメントの粘着末端にアニール化されるオーバーハングとを含む、付番された実施形態1-28のいずれか1つの方法。
30.リンカーオリゴは2つの5’リン酸塩部分を含まない、付番された実施形態1-29のいずれか1つの方法。
31.取り付ける工程はライゲートする工程を含む、付番された実施形態1-30のいずれか1つの方法。
32.取り付ける工程はDNA一本鎖ニック修復を含む、付番された実施形態1-31のいずれか1つの方法。
33.第1のセグメントと第2のセグメントは、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも10kb離される、付番された実施形態1-32のいずれか1つの方法。
34.第1のセグメントと第2のセグメントは、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも15kb離される、付番された実施形態1-33のいずれか1つの方法。
35.第1のセグメントと第2のセグメントは、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも30kb離される、付番された実施形態1-34のいずれか1つの方法。
36.第1のセグメントと第2のセグメントは、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも50kb離される、付番された実施形態1-35のいずれか1つの方法。
37.第1のセグメントと第2のセグメントは、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも100kb離される、付番された実施形態1-36のいずれか1つの方法。
38.配列決定する工程は、単一分子のロングリード配列決定を含む、付番された実施形態1-37のいずれか1つの方法。
39.ロングリード配列決定は、少なくとも5kbのリードを含む、付番された実施形態1-38のいずれか1つの方法。
40.ロングリード配列決定は、少なくとも10kbのリードを含む、付番された実施形態1-39のいずれか1つの方法。
41.第1の再アセンブルされたDNA分子は、第1のDNA分子の一方の末端で、5’末端~3’末端を結合するヘアピン部分を含む、付番された実施形態1-40のいずれか1つの方法。
42.第1のDNA分子の第2の再アセンブルされたバージョンを配列決定する工程を含む、付番された実施形態1-42のいずれか1つの方法。
43.第1のセグメントと第2のセグメントは各々少なくとも500bpである、付番された実施形態1-42のいずれか1つの方法。
44.第1のセグメント、第2のセグメント、および第3のセグメントは、各々少なくとも500bpである、付番された実施形態1-43のいずれか1つの方法。
45.ゲノムアセンブリの方法であって、該方法は、a)ある構造に複合体化された第1のDNA分子を得る工程と、b)第1の露出した末端と第2の露出した末端を形成するために第1のDNA分子を切断する工程であって、第1の露出した末端と第2の露出した末端が上記切断前に分子上で隣接していなかった、工程と、c)第3の露出した末端と第4の露出した末端を形成するために第1のDNA分子を切断する工程であって、第3の露出した末端と第4の露出した末端が上記切断前に分子上で隣接していなかった、工程と、d)第1の接合部を形成するために、上記第1の露出した末端と上記第2の露出した末端を取り付ける工程と、e)第2の接合部を形成するために、上記第3の露出した末端と上記第4の露出した末端を取り付ける工程と、f)単一の配列決定リード中で上記第1の接合部と上記第2の接合部にわたって配列決定する工程と、g)複数のコンティグの第1のコンティグに、上記第1の接合部の第1の側の配列をマッピングする工程と、h)複数のコンティグの第2のコンティグに、上記第1の接合部の第2の側の配列をマッピングする工程と、i)複数のコンティグの第2のコンティグに、上記第2の接合部の第1の側の配列をマッピングする工程と、j)複数のコンティグの第3のコンティグに、上記第2の接合部の第2の側の配列をマッピングする工程と、k)ゲノムアセンブリの共通のフェーズに、上記第1のコンティグ、上記第2のコンティグ、および上記第3のコンティグを割り当てる工程とを含む、方法。
46.上記複数のコンティグはショットガン配列データから生成される、付番された実施形態45の方法。
47.上記複数のコンティグは単一分子のロングリードデータから生成される、付番された実施形態45または46の方法。
48.上記単一分子のロングリードデータは上記複数のコンティグを含む、付番された実施形態45-47のいずれか1つの方法。
49.上記複数のコンティグは、上記第1の接合部と上記第2の接合部での配列決定によって同時に得られる、付番された実施形態45-48のいずれか1つの方法。
50.上記マーカーオリゴでの配列決定は少なくとも10kbの配列決定を含む、付番された実施形態45-49のいずれか1つの方法。
51.上記構造は、再構成されたクロマチンを形成するために、第1のDNA分子に結合されたDNA結合部分の集団を含む、付番された実施形態45-50のいずれか1つの方法。
52.上記の再構成されたクロマチンは橋架剤に接触させる、付番された実施形態45-5のいずれか1つの方法。
53.上記橋架剤はホルムアルデヒドを含む、付番された実施形態45-52のいずれか1つの方法。
54.DNA結合部分の上記集団はヒストンを含む、付番された実施形態45-53のいずれか1つの方法。
55.DNA結合部分の上記集団はナノ粒子を含む、付番された実施形態45-54のいずれか1つの方法。
56.上記構造は天然のクロマチンを含む、付番された実施形態45-55のいずれか1つの方法。
57.第1の露出した末端と第2の露出した末端は、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも10kb離される、付番された実施形態45-56のいずれか1つの方法。
58.第1の露出した末端と第2の露出した末端は、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも15kb離される、付番された実施形態45-57のいずれか1つの方法。
59.第1の露出した末端と第2の露出した末端は、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも30kb離される、付番された実施形態45-58のいずれか1つの方法。
60.第1の露出した末端と第2の露出した末端は、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも50kb離される、付番された実施形態45-59のいずれか1つの方法。
61.第1の露出した末端と第2の露出した末端は、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも100kb離される、付番された実施形態45-60のいずれか1つの方法。
62.第1のDNA分子の第2のコピーを配列決定する工程を含む、付番された実施形態45-61のいずれか1つの方法。
63.a)第1のセグメント、b)第2のセグメント、および、c)第3のセグメントを含む少なくとも5kbの再配列された核酸分子であって、d)上記第1のセグメントと上記第2のセグメントは第1の接合部で結合され、および、e)上記第2のセグメントと上記第3のセグメントは第2の接合部で結合され、上記第1のセグメント、上記第2のセグメント、および上記第3のセグメントは、再配列されていない核酸分子において少なくとも10kb離れたフェーズに存在し、および、上記再配列された核酸分子の少なくとも70%は、上記共通の再配列されていない核酸分子にマッピングされる、再配列された核酸分子。
64.第1のセグメント、第2のセグメント、および第3のセグメントは、ゲノムの共通の核酸分子からの別々のゲノム核酸配列を含む、付番された実施形態63の再配列された核酸。
65.第1のセグメント、第2のセグメント、および第3のセグメントは、再配列された核酸において再配置される順序でゲノム中の共通の分子に存在する、付番された実施形態63または64の1つの再配列された核酸。
66.上記核酸分子は少なくとも30kbの長さである、付番された実施形態63-65のいずれか1つの再配列された核酸。
67.上記核酸は、二本鎖の終端でヘアーピンループを含み、その結果、分子は、30kbの逆方向反復を含む一本鎖を含んでいる、付番された実施形態63-66のいずれか1つの再配列された核酸。
68.上記核酸は、二本鎖の環状分子である、付番された実施形態63-67のいずれか1つの再配列された核酸。
69.上記再配列された核酸分子の少なくとも80%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-68のいずれか1つの再配列された核酸。
70.上記再配列された核酸分子の少なくとも85%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-69のいずれか1つの再配列された核酸。
71.上記再配列された核酸分子の少なくとも90%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-70のいずれか1つの再配列された核酸。
72.上記再配列された核酸分子の少なくとも95%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-71のいずれか1つの再配列された核酸。
73.上記再配列された核酸分子の少なくとも99%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-72のいずれか1つの再配列された核酸。
74.上記再配列された核酸分子のセグメントの少なくとも80%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-73のいずれか1つの再配列された核酸。
75.上記再配列された核酸分子のセグメントの少なくとも85%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-74のいずれか1つの再配列された核酸。
76.上記再配列された核酸分子のセグメントの少なくとも90%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-75のいずれか1つの再配列された核酸。
77.上記再配列された核酸分子のセグメントの少なくとも95%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-76のいずれか1つの再配列された核酸。
78.上記再配列された核酸分子のセグメントの少なくとも99%は、上記共通の再配列されていない核酸分子にマッピングされる、付番された実施形態63-77のいずれか1つの再配列された核酸。
79.再配列された核酸は付番された実施形態1-62のいずれか1つ以上の方法の工程によって生成される、付番された実施形態63-78のいずれか1つの再配列された核酸。
80.サンプル核酸分子のフェージングされた配列を生成する方法であって、該方法は、a)サンプル核酸分子から付番された実施形態63-78のいずれか1つの第1の再配列された核酸分子を生成する工程と、b)サンプル核酸分子から付番された実施形態63-78のいずれか1つの第2の再配列された核酸分子を生成する工程と、および、c)第1の再配列された核酸分子と第2の再配列された核酸分子を配列決定する工程を含み、第1の再配列された核酸分子と第2の再配列された核酸分子は独立して生成される、方法。
81.サンプル核酸分子のフェージングされた配列を生成する方法であって、該方法は、a)サンプル核酸分子から付番された実施形態63-78のいずれか1つの第1の再配列された核酸分子を配列決定する工程と、b)サンプル核酸分子から付番された実施形態63-78のいずれか1つの第2の再配列された核酸分子を配列決定する工程であって、第1の再配列された核酸分子と第2の再配列された核酸分子が独立して生成される、工程と、c)付番された実施形態63-78のいずれか1つの第1の再配列された核酸分子と、付番された実施形態63-78のいずれか1つの第2の再配列された核酸分子の配列を組み立てる工程であって、組み立てられた配列がサンプル核酸分子の再配列されていないフェージングされた配列である、工程とを含む、方法。
82.第1の再配列された核酸分子を配列決定する工程は、少なくとも1kbの配列リードを生成することを含む、付番された実施形態80または81の方法。
83.第1の再配列された核酸分子を配列決定する工程は、少なくとも2kbの配列リードを生成することを含む、付番された実施形態80-82のいずれか1つの方法。
84.第1の再配列された核酸分子を配列決定する工程は、少なくとも5kbの配列リードを生成することを含む、付番された実施形態80-83のいずれか1つの方法。
85.単一のゲノム分子の共通のフェーズに、上記第1の再配列された分子の少なくとも70%を割り当てる工程を含む、付番された実施形態80-84のいずれか1つの方法。
86.単一のゲノム分子の共通のフェーズに、上記第2の再配列された分子の少なくとも70%を割り当てる工程を含む、付番された実施形態80-85のいずれか1つの方法。
87.単一のゲノム分子の共通のフェーズに、上記第1の再配列された分子の少なくとも80%を割り当てる工程を含む、付番された実施形態80-86のいずれか1つの方法。
88.単一のゲノム分子の共通のフェーズに、上記第2の再配列された分子の少なくとも80%を割り当てる工程を含む、付番された実施形態80-87のいずれか1つの方法。
89.単一のゲノム分子の共通のフェーズに、上記第1の再配列された分子の少なくとも90%を割り当てる工程を含む、付番された実施形態80-88のいずれか1つの方法。
90.単一のゲノム分子の共通のフェーズに、上記第2の再配列された分子の少なくとも90%を割り当てる工程を含む、付番された実施形態80-89のいずれか1つの方法。
91.単一のゲノム分子の共通のフェーズに、上記第1の再配列された分子の少なくとも95%を割り当てる工程を含む、付番された実施形態80-90のいずれか1つの方法。
92.単一のゲノム分子の共通のフェーズに、上記第2の再配列された分子の少なくとも95%を割り当てる工程を含む、付番された実施形態80-91のいずれか1つの方法。
93.ロングリード配列データをフェージングする方法であって、該方法は、a)付番された実施形態63-78のいずれか1つの酸サンプルから配列データを得る工程と、b)付番された実施形態63-78のいずれか1つの再配列された核酸からロングリード配列データを得る工程と、c)付番された実施形態63-78のいずれか1つの再配列された核酸からのロングリード配列データを、核酸サンプルからの配列データにマッピングする工程と、d)付番された実施形態63-78のいずれか1つの再配列された核酸からのロングリード配列データによってマッピングされた核酸サンプルからの配列データを、共通のフェーズに割り当てる工程とを含む、方法。
94.DNA配列決定技術によって核酸サンプルから生成された核酸データセットにフェーズ情報を提供する方法であって、該方法は、a)DNA配列決定技術のリード長よりも大きな距離だけ離れた第1のセグメントと第2のセグメントを有する上記核酸サンプルの核酸を得る工程と、b)第1のセグメントと第2のセグメントがDNA配列決定技術のリード長未満の距離離れるように、核酸を組み換える工程と、;c)第1のセグメントと第2のセグメントがDNA配列決定技術の単一のリードに現われるように、DNA配列決定技術を使用して、組み換えられた核酸を配列決定する工程と、d)第1のセグメント配列を含むデータセットの配列リードと、第2のセグメント配列を含むデータセットの配列リードを、共通のフェーズに割り当てる工程とを含む、方法。
95.DNA配列決定技術は、少なくとも10kbのリード長を有するリードを生成する、付番された実施形態94の方法。
96.組み換える工程は、本明細書に開示された任意の方法の工程を行うことを含む、付番された実施形態94-94のいずれか1つの方法。
97.第1のセグメントと第2のセグメントは、セグメント末端を示すリンカーオリゴによって分離される、付番された実施形態94-94のいずれか1つの方法。
98.付番された実施形態63-78のいずれか1つの複数の分子から得られた配列情報を含む核酸配列データベースであって、ここで、共通の足場へマッピングされるそのセグメントの70%未満を有する分子に対応する配列情報は、少なくとも1つの分析から除外される、核酸配列データベース。
99.付番された実施形態63-78のいずれか1つの複数の分子から得られた配列情報を含む核酸配列データベースであって、ここで、共通の足場へマッピングされるその配列情報の70%未満を有する分子に対応する配列情報は、少なくとも1つの分析から除外される,核酸配列データベース。
100.ロングリード配列データをフェージングする方法であって、該方法は、a)付番された実施形態63-78のいずれか1つの核酸サンプルから配列データを得る工程と、b)付番された実施形態63-78のいずれか1つの再配列された核酸の再配列された核酸からロングリード配列データを得る工程と、c)付番された実施形態63-78のいずれか1つの再配列された核酸の第1のセグメント、第2のセグメント、および第3のセグメントを、核酸サンプルからの配列データ~核酸サンプル配列データにマッピングする工程と、d)少なくとも2つのセグメントが共通の足場へマッピングされるとき、共通のフェーズに上記セグメントの配列変異を割り当てる工程を含む、方法。
101.第1のセグメントは、核酸サンプルからの配列データに関連して一塩基多型を含む、付番された実施形態100の方法。
102.第1のセグメントは、核酸サンプルからの配列データに関連して挿入を含む、付番された実施形態100または101の方法。
103.第1のセグメントは、核酸サンプルからの配列データに関連して欠失を含む、付番された実施形態100-102のいずれか1つの方法。
104.第1の共通の足場にマッピングされるセグメントの第1のセットを、第1の共通の足場の共通のフェーズに割り当てる工程と、第2の共通の足場にマッピングされるセグメントの第2のセットを、第2の共通の足場の共通のフェーズに割り当てる工程を含む、付番された実施形態100-103のいずれか1つの方法。
105.核酸サンプルの核酸配列ライブラリーであって、上記核酸配列ライブラリーは、平均リード長を有する核酸配列リードの集団を含み、上記リードの少なくとも1つは、第1の核酸セグメントの少なくとも500ベースと、第2の核酸セグメントの少なくとも500ベースを含み、上記第1の核酸セグメントと上記第2の核酸セグメントは、上記核酸サンプルの共通の分子上の上記平均リード長よりも大きな距離だけ離れたフェーズ内で見られる、核酸配列ライブラリー。
106.上記第1の核酸セグメントと上記第2の核酸セグメントは、10kbよりも大きな距離だけ離れたフェーズ内で見られる、付番された実施形態105の核酸配列ライブラリー。
107.上記第1の核酸セグメントと上記第2の核酸セグメントは、20kbよりも大きな距離だけ離れたフェーズ内で見られる、付番された実施形態105または106の核酸配列ライブラリー。
108.上記第1の核酸セグメントと上記第2の核酸セグメントは、50kbよりも大きな距離だけ離れたフェーズ内で見られる、付番された実施形態105-107のいずれか1つの核酸配列ライブラリー。
109.上記第1の核酸セグメントと上記第2の核酸セグメントは、100kbよりも大きな距離だけ離れたフェーズ内で見られる、付番された実施形態105-108のいずれか1つの核酸配列ライブラリー。
110.上記リードの少なくとも1つは第1の核酸セグメントの少なくとも1kbを含むことを特徴とする、付番された実施形態105-109のいずれか1つの核酸配列ライブラリー。
111.上記リードの少なくとも1つは第1の核酸セグメントの少なくとも5kbを含むことを特徴とする、付番された実施形態105-110のいずれか1つの核酸配列ライブラリー。
112.上記リードの少なくとも1つは第1の核酸セグメントの少なくとも10kbを含むことを特徴とする、付番された実施形態105-111のいずれか1つの核酸配列ライブラリー。
113.上記リードの少なくとも1つは第1の核酸セグメントの少なくとも20kbを含むことを特徴とする、付番された実施形態105-112のいずれか1つの核酸配列ライブラリー。
114.上記リードの少なくとも1つは第1の核酸セグメントの少なくとも50kbを含むことを特徴とする、付番された実施形態105-113のいずれか1つの核酸配列ライブラリー。
115.核酸配列ライブラリーは、上記核酸サンプルの少なくとも80%を含むことを特徴とする、付番された実施形態105-114のいずれか1つの核酸配列ライブラリー。
116.核酸配列ライブラリーは、上記核酸サンプルの少なくとも85%を含むことを特徴とする、付番された実施形態105-115のいずれか1つの核酸配列ライブラリー。
117.核酸配列ライブラリーは、上記核酸サンプルの少なくとも90%を含むことを特徴とする、付番された実施形態105-116のいずれか1つの核酸配列ライブラリー。
118.核酸配列ライブラリーは、上記核酸サンプルの少なくとも95%を含むことを特徴とする、付番された実施形態105-117のいずれか1つの核酸配列ライブラリー。
119.核酸配列ライブラリーは、上記核酸サンプルの少なくとも99%を含むことを特徴とする、付番された実施形態105-118のいずれか1つの核酸配列ライブラリー。
120.核酸配列ライブラリーは、上記核酸サンプルの少なくとも99.9%を含むことを特徴とする、付番された実施形態105-119のいずれか1つの核酸配列ライブラリー。
121.上記核酸配列ライブラリーは、少なくとも1kbの平均長さを有する核酸配列リードの集団を含み、上記リードは独立して、核酸サンプルの2つの別々のフェーズ内領域からの配列の少なくとも300塩基を含み、上記2つの別々のフェーズ内領域は、核酸サンプル中で10kbよりも大きな距離離れている、核酸配列ライブラリー。
122.上記リードは独立して、核酸サンプルの2つの別々のフェーズ内領域からの配列の少なくとも500塩基を含むことを特徴とする、付番された実施形態121の核酸配列ライブラリー。
123.上記リードは独立して、核酸サンプルの2つの別々のフェーズ内領域からの少なくとも1kbの配列を含むことを特徴とする、付番された実施形態121または122のいずれか1つの核酸配列ライブラリー。
124.上記リードは独立して、核酸サンプルの2つの別々のフェーズ内領域からの少なくとも2kbの配列を含むことを特徴とする、付番された実施形態121から123のいずれか1つの核酸配列ライブラリー。
125.上記リードは独立して、核酸サンプルの2つの別々のフェーズ内領域からの少なくとも5kbの配列を含むことを特徴とする、付番された実施形態121から124のいずれか1つの核酸配列ライブラリー。
126.上記リードは独立して、核酸サンプルの2つの別々のフェーズ内領域からの少なくとも10kbの配列を含むことを特徴とする、付番された実施形態121から125のいずれか1つの核酸配列ライブラリー。
127.上記2つの別々のフェーズ内領域は、核酸サンプル中で20kbよりも大きな距離だけ離れていることを特徴とする、付番された実施形態121から126のいずれか1つの核酸配列ライブラリー。
128.上記2つの別々のフェーズ内領域は、核酸サンプル中で30kbよりも大きな距離だけ離れていることを特徴とする、付番された実施形態121から127のいずれか1つの核酸配列ライブラリー。
129.上記2つの別々のフェーズ内領域は、リードの少なくとも1%において核酸サンプル中で50kbよりも大きな距離だけ離れていることを特徴とする、付番された実施形態121から128のいずれか1つの核酸配列ライブラリー。
130.上記2つの別々のフェーズ内領域は、リードの少なくとも1%において核酸サンプル中で100kbよりも大きな距離だけ離れていることを特徴とする、付番された実施形態121から129のいずれか1つの核酸配列ライブラリー。
131.核酸配列ライブラリーは、上記核酸サンプルの少なくとも80%を含むことを特徴とする、付番された実施形態121-130のいずれか1つの核酸配列ライブラリー。
132.核酸配列ライブラリーは、上記核酸サンプルの少なくとも85%を含むことを特徴とする、付番された実施形態121-131のいずれか1つの核酸配列ライブラリー。
133.核酸配列ライブラリーは、上記核酸サンプルの少なくとも90%を含むことを特徴とする、付番された実施形態121-132のいずれか1つの核酸配列ライブラリー。
134.核酸配列ライブラリーは、上記核酸サンプルの少なくとも95%を含むことを特徴とする、付番された実施形態121-133のいずれか1つの核酸配列ライブラリー。
135.核酸配列ライブラリーは、上記核酸サンプルの少なくとも99%を含むことを特徴とする、付番された実施形態121-134のいずれか1つの核酸配列ライブラリー。
136.核酸配列ライブラリーは、上記核酸サンプルの少なくとも99.9%を含むことを特徴とする、付番された実施形態121-135のいずれか1つの核酸配列ライブラリー。
137.核酸サンプルから生成される核酸ライブラリーであって、核酸サンプルの核酸配列の少なくとも80%は、核酸ライブラリーで表され、核酸サンプルのフェーズ内配列セグメントは、核酸サンプルのフェーズ内セグメントの離れた位置にある少なくとも1つのペアが単一の配列リードで読まれるように、再配列され、上記ライブラリーの配列決定が、核酸サンプルの少なくとも80%にまたがるコンティグ情報と、上記核酸サンプルのフェージングされた配列を生成するために、上記コンティグ情報を順序付けて配向するのに十分なフェーズ情報を同時に生成する、ことを特徴とする核酸ライブラリー。
138.核酸サンプルの核酸配列の少なくとも90%は、核酸ライブラリーで表わされることを特徴とする、付番された実施形態137の核酸ライブラリー。
139.核酸サンプルの核酸配列の少なくとも95%は、核酸ライブラリーで表わされることを特徴とする、付番された実施形態137から138のいずれか1つの核酸ライブラリー。
140.核酸サンプルの核酸配列の少なくとも99%は、核酸ライブラリーで表わされることを特徴とする、付番された実施形態137から139のいずれか1つの核酸ライブラリー。
141.核酸サンプルの核酸配列の上記80%は、せいぜい100,000のライブラリー成分から得られることを特徴とする、付番された実施形態137から140のいずれか1つの核酸ライブラリー。
142.核酸サンプルの核酸配列の上記80%は、せいぜい10,000のライブラリー成分から得られることを特徴とする、付番された実施形態137から141のいずれか1つの核酸ライブラリー。
143.核酸サンプルの核酸配列の上記80%は、せいぜい1,000のライブラリー成分から得られることを特徴とする、付番された実施形態137から142のいずれか1つの核酸ライブラリー。
144.上核酸サンプルの核酸配列の上記80%は、せいぜい500のライブラリー成分から得られることを特徴とする、付番された実施形態137から143のいずれか1つの核酸ライブラリー。
145.サンプルはゲノムサンプルであることを特徴とする、付番された実施形態137から144のいずれか1つの核酸ライブラリー。
146.サンプルは真核生物のゲノムサンプルであることを特徴とする、付番された実施形態137から145のいずれか1つの核酸ライブラリー。
147.サンプルは植物のゲノムサンプルであることを特徴とする、付番された実施形態137から146のいずれか1つの核酸ライブラリー。
148.サンプルは動物のゲノムサンプルであることを特徴とする、付番された実施形態137から147のいずれか1つの核酸ライブラリー。
149.サンプルは哺乳動物のゲノムサンプルであることを特徴とする、付番された実施形態137から148のいずれか1つの核酸ライブラリー。
150.サンプルは真核単核生物のゲノムサンプルであることを特徴とする、付番された実施形態137から149のいずれか1つの核酸ライブラリー。
151.サンプルはヒトゲノムサンプルであることを特徴とする、付番された実施形態137から150のいずれか1つの核酸ライブラリー。
152.核酸ライブラリーはフェーズ情報を保護するためにバーコード化されないことを特徴とする、付番された実施形態137から151のいずれか1つの核酸ライブラリー。
153.上記ライブラリーのリードは、第1の領域からの少なくとも1kbの配列と、第1の領域とフェーズ内にありかつサンプル中の第1の領域から50kbを超えて離れている第2の領域からの少なくとも100塩基の配列を含む、ことを特徴とする、付番された実施形態137から152のいずれか1つの核酸ライブラリー。
154.配列決定デバイス上で配列決定するために核酸分子を構成する方法であって、核酸分子は少なくとも100kbの配列を含み、上記少なくとも100kbの配列は、配列決定デバイスのリード長より大きな長さによって離れた第1のセグメントと第2のセグメントを含み、該方法は、第1のセグメントと第2のセグメントが配列決定デバイスのリード長未満だけ離れるように、核酸分子の第2のセグメントに対する第1のセグメントの相対位置を変更する工程を含み、第1のセグメントと第2のセグメントのためのフェーズ情報は維持され、核酸分子のせいぜい10%が欠失する、方法。
155.第1のセグメントと第2のセグメントの少なくとも一部にまたがるリードを生成する工程を含む、付番された実施形態154の方法。
156.核酸分子の配列の共通のフェーズに、第1のセグメントと第2のセグメントを割り当てる工程を含む、付番された実施形態154-155のいずれか1つの方法。
157.核酸分子のせいぜい5%が欠失することを特徴とする、付番された実施形態154から156のいずれか1つの方法。
158.核酸分子のせいぜい1%以下が欠失することを特徴とする、付番された実施形態154から157のいずれか1つの方法。
159.第1のセグメントと第2のセグメントとは、構成前に核酸分子中で少なくとも10kb離れていることを特徴とする、付番された実施形態154から158のいずれか1つの方法。
160.第1のセグメントと第2のセグメントは、構成前に核酸分子中で少なくとも50kb離れていることを特徴とする、付番された実施形態154から159のいずれか1つの方法。
161.第1のセグメントと第2のセグメントは、上記構成後に、接合部マーカーによって分離されることを特徴とする、付番された実施形態154から160のいずれか1つの方法。
162.核酸の末端にステムループを取り付ける工程を含み、それによって、分子を一本鎖に変換する工程を含む、付番された実施形態154から161のいずれか1つの方法。
163.核酸分子を環状化する工程を含む、付番された実施形態154から162のいずれか1つの方法。
164.DNAポリメラーゼに核酸分子を取り付ける工程を含む、付番された実施形態154から163のいずれか1つの方法。
165.第1のセグメントと第2のセグメントがホスホジエステル骨格とは無関係に一緒に保持されるように、核酸分子を結合する工程と、少なくとも2つの位置で第1のセグメントと第2のセグメントとの間のホスホジエステル骨格を切断する工程と、第1のセグメントと第2のセグメントが配列決定デバイスのリード長未満だけ離れるように、第1のセグメントを第2のセグメントへ再度取り付ける工程とを含む、付番された実施形態154から164のいずれか1つの方法。
166.上記の切断する工程と上記の再度取り付ける工程は、上記核酸分子からの配列情報の喪失を引き起こさない、付番された実施形態154から165のいずれか1つの方法。
167.第1の核酸分子からの長距離フェーズ情報を生成する方法であって、該方法は:a)第1のセグメント、第2のセグメント、および第3のセグメントを有する第1の核酸分子を含むサンプルを提供する工程であって、第1のセグメント、第2のセグメント、および第3のセグメントのいずれも第1の核酸分子上では隣接しておらず、第1のセグメント、第2のセグメント、および第3のセグメントが第1の核酸分子の共通のホスホジエステル骨格とは無関係にフレームワークに結合するように、第1の核酸分子はフレームワークに接触する、工程と、b)第1のセグメント、第2のセグメント、および第3のセグメントが共通のホスホジエステル骨格によって結合されないように、第1の核酸分子を切断する工程と、c)第1のセグメントを第2のセグメントに接続し、第2のセグメントを第3のセグメントに接続する工程と、d)第1のセグメント、第2のセグメント、および第3のセグメントを含む第1の核酸分子の第1の部分を配列決定する工程であって、それによって、第1のセグメント配列情報、第2のセグメント配列情報、および第3のセグメント配列情報を生成し、ここで、第1のセグメント配列情報、第2のセグメント配列情報、および第3のセグメント配列情報が、第1の核酸分子に関する長距離フェーズ情報を提供する、工程と、を含む方法。
168.フレームワークは再構成されたクロマチンを含むことを特徴とする、付番された実施形態167の方法。
169.フレームワークは天然のクロマチンを含むことを特徴とする、付番された実施形態167から168のいずれか1つの方法。
170.切断する工程は制限酵素を用いて行われることを特徴とする、付番された実施形態167から169のいずれか1つの方法。
171.切断する工程はフラグメンターゼ(fragmentase)を用いて行われることを特徴とする、付番された実施形態167から170のいずれか1つの方法。
172.配列決定の前に、多くとも2つのセグメントを含む第1の核酸分子の第2の部分をサンプルから取り除く工程をさらに含む、付番された実施形態167から171のいずれか1つの方法。
173.第1のセグメント配列情報、第2のセグメント配列情報および第3のセグメント配列情報を用いて第1の核酸分子の配列をアセンブルする工程をさらに含む、付番された実施形態167から172のいずれか1つの方法。
174.核酸分子を配列決定する方法であって、該方法は:共通のホスホジエステル骨格を共有する、第1のセグメント、第2のセグメントおよび第3のセグメントを含む第1の核酸分子を得る工程であって、第1のセグメント、第2のセグメントおよび第3のセグメントのいずれも、上記第1の核酸分子上では隣接していない、工程と;第1のセグメント、第2のセグメント、および第3のセグメントがその共通のホスホジエステル骨格とは無関係に関連付けられるように、上記核酸分子を分割する工程と;第1のセグメント、第2のセグメント、および第3のセグメントを結合する連続的なホスホジエステル骨格がないように、フラグメントを生成するために核酸分子を切断する工程と;記第1のセグメント、第2のセグメント、および第3のセグメントが共通のホスホジエステル骨格を共有する再配列された核酸分子上で連続的になるように、上記フラグメントをライゲートする工程と;上記再配列された核酸分子の少なくとも5,000のベースが単一リード中で配列決定されるように、上記再配列された核酸分子の少なくとも一部を配列決定する工程と、を含む方法。
175.分割は、上記第1のセグメント、第2のセグメントおよび第3のセグメントが、その共通のホスホジエステル骨格から独立した共通の複合体中で結合するように、上記核酸分子を結合部分に接触させる工程を含むことを特徴とする、付番された実施形態174の方法。
176.核酸分子を複数のDNA結合分子に接触させる工程は、DNA結合タンパク質の集団に接触させる工程を含む、付番された実施形態174から175のいずれか1つの方法。
177.DNA結合タンパク質の集団は、核タンパク質を含むことを特徴とする、付番された実施形態174から176のいずれか1つの方法。
178.DNA結合タンパク質の集団は、ヌクレオソームを含むことを特徴とする、付番された実施形態174から177のいずれか1つの方法。
179.DNA結合タンパク質の集団は、ヒストンを含むことを特徴とする、付番された実施形態174から178のいずれか1つの方法。
180.複数のDNA結合部分へ核酸分子を接触させる工程は、DNA結合ナノ粒子の集団に接触させることを含むことを特徴とする、付番された実施形態174から179のいずれか1つの方法。
181.核酸分子を切断する工程は、制限エンドヌクレアーゼに接触させることを含むことを特徴とする、付番された実施形態174から180のいずれか1つの方法。
182.核酸分子を切断する工程は、非特異的なエンドヌクレアーゼに接触させることを含むことを特徴とする、付番された実施形態174から181のいずれか1つの方法。
183.核酸分子を切断する工程は、タグメンテーション酵素に接触させることを含むことを特徴とする、付番された実施形態174から182のいずれか1つの方法。
184.核酸分子を切断する工程は、トランスポサーゼに接触させることを含むことを特徴とする、付番された実施形態174から183のいずれか1つの方法。
185.核酸分子を切断する工程は、第1の分子を剪断することを含むことを特徴とする、付番された実施形態174から184のいずれか1つの方法。
186.分割する工程は、サンプルの他の核酸分子から上記核酸分子を分離することを含むことを特徴とする、付番された実施形態174から185のいずれか1つの方法。
187.分割する工程は、上記核酸サンプルを希釈することを特徴とする、付番された実施形態174から186のいずれか1つの方法。
188.割する工程は、上記核酸分子をエマルジョンの微小液滴へ分布させることを含むことを特徴とする、付番された実施形態174から187のいずれか1つの方法。
189.生物のゲノムのゲノムフェーズ情報を表す核酸分子であって、上記核酸分子は単一のゲノム分子にマッピングされる少なくとも20kbの核酸配列情報を含み、上記配列情報はゲノム分子中のその位置に対して再配列されたセグメントを含み、上記生物のゲノムに独自にマッピングされる配列情報の少なくとも70%は、単一のゲノム分子にマッピングされることを特徴とする、核酸分子。
190.核酸分子は、少なくとも20のセグメントを含むことを特徴とする、付番された実施形態189の核酸分子。
191.上記セグメントは上記生物のゲノムにおいて隣接しないことを特徴とする、付番された実施形態189から190のいずれか1つの核酸分子。
192.少なくとも20kbの少なくとも100の核酸分子成分を含む核酸ライブラリーであって、成分は、生物のゲノムの再配列されたセグメントを含み;ライブラリー成分の一意にマッピングされるセグメントの少なくとも70%は、共通のゲノム分子にマッピングされ;成分は核酸結合部分に結合されないことを特徴とする、核酸ライブラリー。
193.少なくとも20kbの少なくとも100の核酸分子成分に対応する配列を含む核酸データセットであって、成分は、生物のゲノムの少なくとも5つの再配列されたセグメントを含み、上記再配列されたセグメントの70%未満が共通の足場へマッピングされる成分は、下流の分析から除外されることを特徴とする、核酸データセット。
194.少なくとも20kbの少なくとも100の核酸分子成分に対応する配列を含む核酸データセットであって、成分は、生物のゲノムの少なくとも5つの再配列されたセグメントを含み、上記配列の70%未満が共通の足場へマッピングされる成分は、下流の分析から除外されることを特徴とする、核酸データセット。
実施例1.いくつかのロングリードの配列決定アプローチは、二倍体DNAサンプルにおいていくつかの突然変異をフェーズできない
特定のヒト疾患の処置は、機能的な遺伝子産物の存在に依存する。この遺伝子産物がある状態では、治療的分子が代謝されて有効な代謝産物を産出する。遺伝子産物がない状態で、治療的分子は蓄積し、患者に有害となる。
実施例1の患者由来のDNAを、本明細書に開示されるアプローチを使用してフェーズ解析に供する。
トウモロコシゲノムのおよそ90%がトランスポゾンなどの転移因子であると推測される。いくつかのトランスポゾンの反復の性質のために、対立遺伝子のフェージングは困難である。改良された収量および改良された栄養成分を有するトウモロコシ株を生産するために、トウモロコシ二重変異系統が望まれている。両方の突然変異が優勢であり、染色体の対向する末端に見出される。高収量のトウモロコシ株を高カロテノイドレベルのトウモロコシ株に交配させてヘテロ接合性の系統を産生させ、次いで自家交配させて分離子孫を生成する。
実施例3の実生のトウモロコシ由来のDNAサンプルが抽出され、セグメントがシャッフルされたフェーズを保存する配列決定ライブラリーを生成するために修飾される。結果として生じる再配列されたDNA分子は、ロングリードの配列決定マシン上で配列決定される。1つ以上の句切りオリゴヌクレオチドによって離された、収量の突然変異の遺伝子座および栄養の突然変異の遺伝子座に及ぶ単一の配列リードが得られる。2つの良性変異が単一の分子上のフェーズ内にあることを示すリードが、実生のサンプルのうちのいくつかについて観察される。開発途上国で必要とされる増大した栄養をもたらす強力なトウモロコシ株を生産するために、確認されたフェーズ内の高収量および改善された栄養成分含有株の1つが選択され、胴枯れ病耐性株と交配される。
二倍体生物は、遺伝物質の各染色体の2つのコピーを含む。少なくとも30kbの同一の配列の分だけ離れている2つの突然変異が、二倍体ゲノムの単一の染色体上に存在する。DNAサンプルを、平均リード長が15kbであるロングリードの配列決定マシンで配列決定する。2つの突然変異が同一または異なる核酸分子に含まれているかどうかを判定することは不可能である。
DNAを実施例5の生物から抽出する。DNAを、再構成されたクロマチンを生成するためにDNA結合タンパク質でインビトロでアセンブルする。再構成されたクロマチンは粘着末端を生産するために切断され、これは再ライゲーションを防止するために部分的に埋められる。部分的に埋められた粘着末端に適合する末端を有する句切りオリゴヌクレオチドを、DNAリガーゼと共にクロマチンサンプルに加える。いくつかの例では、オリゴヌクレオチドのコンカテマー化を回避するために、句切りオリゴヌクレオチドは、脱リン酸化されている。再ライゲートされたクロマチンサンプルのDNAセグメントは、開始DNAサンプルと比較して再配列されるが、分子が句切りプロセスを通じてクロマチンタンパク質に結合されるのでフェーズ情報は維持される。いくつかの例では、ゲノム内の2つの突然変異は15kb未満だけ離れるように再配列される。この場合、離れている距離は、ロングリード配列決定機器の平均のリード長未満である。再配列されたDNAサンプルがクロマチンタンパク質から放たれ、配列決定される時、フェーズ情報が判定され、および、デノボ配列足場を生成するのに十分な配列情報が生成される。
DNAを実施例5の生物から抽出し、インビトロでDNA結合タンパク質を用いて再アセンブルして、再構成されたクロマチンを生成する。DNAを平滑末端を生産するために切断する。平滑末端を有する句切りオリゴヌクレオチドは、切断されたDNAサンプルの平滑末端にライゲートされる。オリゴヌクレオチドのコンカテマー化を回避するために、句切りオリゴヌクレオチドは、脱リン酸化されている。実施例6でのように、再配列されたDNAサンプルをクロマチンタンパク質から放ち、配列決定する。再配列されたDNAサンプルがクロマチンタンパク質から放たれ、配列決定される時、フェーズ情報が判定され、および、デノボ配列足場を生成するのに十分な配列情報が生成される。
実施例6-7のいずれかで記述されるように、句切りオリゴヌクレオチドを含むDNAサンプルが生成される。DNA結合タンパク質からの放出後、句切られたDNA分子と呼ばれる自由DNAサンプルを少なくとも2つのセグメントを含むオリゴヌクレオチドに接触させる。1つのセグメントはバーコードを含み、第2のセグメントは句切り配列に補足的な配列を含む。句切り配列にアニーリングした後、バーコード化されたオリゴヌクレオチドをポリメラーゼで拡張して、同じDNA分子からのバーコード化された分子を産出する。これらのバーコード化された分子は、バーコード配列、句切り相補配列およびゲノムの配列を含む。拡張産物をショートリードの配列決定マシンで配列決定し、および、同じバーコードを有する配列リードを共通のフェーズへとグループ化することにより、フェーズ情報を判定する。
実施例8でのように、DNAサンプルを抽出し、句切り、バーコード化する。拡張後、バーコード化された産物を一緒にバルクライゲートして、ロングリード配列決定技術を用いて読み取られる長い分子を生成する。埋められたリードペアは、増幅アダプタおよび句切り配列を介して識別可能である。さらに詳しいフェーズ情報はリードペアのバーコード配列から得られる。
実施例5のDNAサンプルを抽出し、インビトロでDNA結合タンパク質を用いて再アセンブルして、再構成されたクロマチンを生成する。2つの結合していない句切りオリゴヌクレオチドに結合したトランスポサーゼをDNAサンプルに加える。トランスポサーゼは露出したDNAセグメントを切断し、DNAに2つの句切りオリゴヌクレオチドを挿入する。所与のトランスポサーゼの句切りオリゴヌクレオチドは結合されないため、この挿入は2つの自由DNA末端を結果としてもたらし、各々が2つの句切りオリゴヌクレオチドのうちの1つによって終結し、かつ、各々が再構成されたクロマチンに繋ぎ止められてフェーズ情報を保存する。DNAリガーゼをサンプルに添加して、平滑DNA末端を一緒に連結し、DNAセグメントの再配列をもたらすが、DNA分子がこのプロセス全体を通じてクロマチンタンパク質に結合されるのでフェーズ情報は維持される。実施例6でのように、再配列されたDNAサンプルをクロマチンタンパク質から放出し、配列決定して、フェーズ情報を判定する。
実施例10に記載の通り、DNAサンプルを抽出し、再構成されたクロマチンへとインビトロで再アセンブルし、トランスポサーゼで句切った。平滑末端の再ライゲーションに続いて、再ライゲートされたDNAセグメントを、制限消化によってタンパク質DNA複合体から放出し、複数のペアエンドを結果としてもたらし、これらを続いて増幅アダプタにライゲートする。増幅に続いて、ペアエンドを短い範囲技術(short reach technology)で配列決定する。句切り接合部のいずれの側についても、句切りに隣接する配列は、共通の分子の共通のフェーズに由来すると確信的に結論付けられる。
実施例10に記載の通り、DNAサンプルを抽出し、再構成されたクロマチンへとインビトロで再アセンブルし、トランスポサーゼで句切った。平滑末端の再ライゲーションに続いて、再ライゲートされたDNAセグメントを、制限消化によってタンパク質DNA複合体から放出し、複数のペアエンドを結果としてもたらし、これらを続いて増幅アダプタにライゲートする。増幅後、複数のペアエンドを一緒にバルクライゲートして、ロングリードの配列決定技術を用いて読み取られる長い分子を生成する。埋められたリードペアは、トランスポサーゼ句切り配列に隣接する天然のDNA配列を介して識別可能である。連鎖状の句切られた接合部は、長い配列デバイス上で読み取られ、かつ、複数の接合部についての配列情報が得られる。接合部は複数の異なる染色体にマッピングされることが分かる。しかしながら、句切り接合部のいずれの側についても、句切りに隣接する配列は、共通の分子の共通のフェーズに由来すると確信的に結論付けられる。
DNAサンプルを抽出し、インビトロでDNA結合タンパク質を用いて再アセンブルして、再構成されたクロマチンを生成する。DNAを粘着末端を生産するために切断する。粘着末端は、ビオチン化ヌクレオチドで埋められ、続いて、Chicagoペアと呼ばれるDNAセグメントペアを生成するために、埋められた末端の平滑ライゲーションが行われる。これらの再シャッフルされた核酸は、クロマチンタンパク質から放出され、切断されストレプトアビジン結合ライゲーション接合部が単離される。増幅アダプタはChicagoペアの自由端に加えられる。増幅に続いて、Chicagoペアは、ロングリードの配列技術を使用して読まれる長い分子を生成するために、一緒にバルクライゲートされる。埋められたリードペアは、増幅アダプタを介して識別可能である。ビオチン化塩基を導入するために使用される「埋め込みプロセス(fill-in process)」中で生成された配列反復も、フェーズ内配列内で接続する接合部を識別するために使用される。
実施例6、7、9、10、または12のいずれかで生成されたような、長い句切られたDNA分子が、一方の末端でヘアピンアダプターにライゲートされ、逆方向反復を有する自己アニーリング一本鎖分子を生じる。分子は配列決定酵素を介して供給され、逆方向反復の各側の全長配列が得られる。結果として生じた配列のリードは、それぞれがフェーズ情報を伝達する、複数の再配列されたセグメントを有する句切られたDNA分子の2xカバレッジに対応する。核酸サンプルのデノボ足場を独立して生成するために十分な配列が生成される。
実施例6、7、9、10、または12のいずれかにおいて生成されたような長い、句切られたDNA分子が、所望の長さの二本鎖分子の集団を形成するために切断される。これらの分子は各末端で一本鎖アダプタにライゲートされる。成果は、両端のヘアピンループによってキャップされた二本鎖DNA鋳型である。環状の分子は連続的な配列決定技術によって配列決定される。長い二重鎖セグメントを含む分子の連続的なロングリードの配列決定は、各分子の単一の近接しているリードをもたらす。短い二重鎖セグメントを含む分子の連続的な配列決定は、分子の複数のリードをもたらし、これは分子のコンセンサス配列を確認するために、単独で、または連続的なロングリード配列情報と共に、使用される。句切りオリゴでマークされたゲノムセグメント境界が識別され、句切り境界に隣接する配列がフェーズ内にあると結論付けられる。核酸サンプルのデノボ足場を独立して生成するために十分な配列が生成される。
複数の句切られたDNA分子が、実施例6、7、9、10、または12のいずれかにおいて記載されたように生成され、続いて、ロングリードの配列決定技術を使用して配列決定される。複数の句切られたDNA分子からの配列を比較する。上記複数のDNA分子の2つの分子は共通する配列を共有しているが、独立して由来し、異なる句切りオリゴを有していることが観察される。第1の分子の所与の句切りオリゴについては、配列は句切りオリゴの各々の一方上で判定され、句切りオリゴのいずれかの側の配列セグメントは、共通の分子上でフェーズ内にあることが結論付けられる。しかしながら、フェーズ内セグメントの相対的な位置は明らかではない。
句切られたDNA分子が実施例6、7、9、10、または12のいずれかにおいて記述されたように生成され、続いて、ロングリードの配列決定技術を使用して配列決定される。平行して、インプットDNAは標準的なショートリードのショットガン配列決定技術を使用して配列決定される。サンプルからのショットガン配列は、再配列されたDNA分子から生成されたロングリードのデータにマッピングされる。句切られた分子のフェージングされたゲノムの配列は、同時に生成されたショートリード配列決定から得られた配列決定データにマッピングされる。ショートリードのうちのいくつかはロングリードの生成された配列にマッピングされる。このオーバーラップは、短い配列のリードを、句切られたDNA分子の長い配列決定リードから生成されたゲノム配列と同じフェーズに割り当てることを可能にする。
複数の句切られたDNA分子が実施例6、7、9、10、または12のいずれかにおいて記述されたように生成し、続いて、ロングリードの配列決定技術を使用して配列決定した。句切られた分子をそれぞれ配列決定し、配列リードが分析する。配列リードは配列反応につき平均10kbである。少なくとも第1のセグメントの500塩基および第2のセグメントの500塩基を含む配列リードが識別され、句切りオリゴ配列によって接合される。第1および第2のセグメント配列は足場ゲノムにマッピングされ、少なくとも100kb離れているコンティグにマッピングされるとわかる。
実施例8または11のいずれかに記載のように、複数のペアエンド分子が生成され、続いてロングリード配列決定技術を用いて配列決定される。ライブラリーについての平均のリード長は1kbであると判定された。ペアエンド分子は、インプットDNA試料内でフェーズ内にあり、かつ10kbを超える距離ほど離している第1のDNAセグメントおよび第2のDNAセグメントを含む。配列リードはペアエンド分子から生成され、これらのうちのいくつかは、第1の核酸セグメントからの配列の少なくとも300塩基、および第2の核酸セグメントからの配列の少なくとも300塩基を含む。第1および第2の核酸セグメントからの配列が単一の配列リードにおいて検出されるので、第1および第2の核酸セグメントが、インプットDNAサンプル中の同じDNA分子の上のフェーズ内にあることが判定される。
複数の配列リードが句切られたDNAライブラリーから生成される。ライブラリーは、句切り事象のいずれかの側のセグメントが単一の分子上でフェーズ内にあると判定されるように、実施例18または19に記載されているとおりフェーズ情報を伝える。加えて、生成された配列リードは、インプットDNAサンプルの核酸配列の少なくとも80%を表す。配列リードはインプットDNAサンプルの少なくとも80%に及ぶデノボコンティグ情報を生成するために使用される。さらに、配列リードはフェーズ情報を判定するために使用され、これは、続いて、インプットDNAサンプルのフェージングされた配列アセンブリを生成するために互いに関するコンティグを順序付けおよび方向付けるために使用される。
少なくとも100kbの長さのすくなくともいくつかのDNA分子を含む高分子量(HMW)のDNAサンプルを抽出する。100kbのDNA分子のうちの1つは、標準的な配列決定技術の平均のリード長より長い距離だけ離れている第1のDNAセグメントおよび第2のDNAセグメントを含む。核酸サンプルは二倍体であるが、配列が同一の大きな領域を含み、フェーズ判定を複雑にしている。
哺乳類細胞の培養のサンプルは本明細書に記述された技術を使用して分析される。簡潔に言うと、哺乳動物細胞の細胞培養物を成長させる。細胞を架橋させ、架橋を停止させ、細胞ペレットを-20℃で保存する。細胞をホモジナイズし、核を溶解緩衝液中に回収する。ホモジネート中の核をSPRIビーズに結合し、DpnII制限酵素を使用して消化する。末端をビオチン-11-dCTPなしで充填し、平滑末端をライゲートする。架橋結合を逆にし、DNAを配列決定のために回収し、浄化(clean up)し、調製する。配列決定は、Pacific Biosciences SMRTのロングリードの配列決定を用いて実施する。場合によっては、DNAは、配列決定の前に、少なくとも約6kbの長さの分子についてサイズの選択をすることができる。
Claims (18)
- 第1のDNA分子から長距離フェーズ情報を生成する方法であって、
前記方法は、
(a)第1のセグメント、第2のセグメント、および第3のセグメントを有する第1のDNA分子を提供する工程であって、第1のセグメント、第2のセグメント、および第3のセグメントのいずれも第1のDNA分子上で隣接せず、および、第1のセグメント、第2のセグメント、および第3のセグメントが、第1のDNA分子の共通のホスホジエステル骨格とは無関係にDNA結合部分に結合する、工程と、
(b)第1のセグメント、第2のセグメント、および第3のセグメントが共通のホスホジエステル骨格によって結合されないように、第1のDNA分子を切断する工程と、
(c)再アセンブルされた第1のDNA分子を形成するために、ホスホジエステル結合によって第2のセグメントに第1のセグメントを取り付け、第2のセグメントと第3のセグメントを取り付ける工程と、
(d)単一の配列決定リードの第1のセグメントと第2のセグメントとの間の接合部および第2のセグメントと第3のセグメントとの間の接合部を含む再アセンブルされた第1のDNA分子の少なくとも4kbの連続する配列を配列決定する工程と、を含み、
第1のセグメント配列、第2のセグメント配列、および第3のセグメント配列が第1のDNA分子からの長距離フェーズ情報を表す、方法。 - DNA結合部分は複数のDNA結合分子を含む、請求項1に記載の方法。
- 前記複数のDNA結合分子が、DNA結合タンパク質の集団を含む、請求項2に記載の方法。
- 前記複数のDNA結合分子が、DNA結合ナノ粒子の集団を含む、請求項2に記載の方法。
- 第1のDNA分子を架橋剤へ接触させる工程を含む、請求項1に記載の方法。
- 第1のDNA分子を切断する工程は、制限エンドヌクレアーゼに接触させることを含む、請求項1に記載の方法。
- 第1のDNA分子を切断する工程は、非特異的なエンドヌクレアーゼに接触させることを含む、請求項1に記載の方法。
- 第1のDNA分子を切断する工程は、タグメンテーション酵素に接触させることを含む、請求項1に記載の方法。
- 第1のDNA分子を切断する工程は、トランスポサーゼに接触させることを含む、請求項1に記載の方法。
- 第1のDNA分子を切断する工程は、第1のDNA分子を剪断することを含む、請求項1に記載の方法。
- (c)の前に、前記第1のセグメント、前記第2のセグメント、又は前記第3のセグメントの少なくとも1つの露出した末端にタグを加える工程を含む、請求項1に記載の方法。
- タグは標識された塩基、メチル化された塩基、ビオチン化された塩基、ウリジン、および非標準の塩基からなる群から選択される少なくとも1つのタグを含む、請求項11に記載の方法。
- 第1のセグメントの粘着末端にアニールするオーバーハングを含むリンカーオリゴを加える工程を含む、請求項1-12のいずれか1つに記載の方法。
- 取り付ける工程はライゲートすることおよびDNA一本鎖ニック修復からなる群から選択される方法を含む、請求項1に記載の方法。
- 第1のセグメントと第2のセグメントは、第1のDNA分子を切断する前に、第1のDNA分子上で少なくとも10kb離される、請求項1に記載の方法。
- 配列決定する工程は、単一分子のロングリード配列決定を含む、請求項1に記載の方法。
- ロングリード配列決定は、少なくとも5kbのリードを含む、請求項16に記載の方法。
- 再アセンブルされた第1のDNA分子は、第1のDNA分子の一方の末端で、5’末端を3’末端に結合するヘアピン部分を含む、請求項1に記載の方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022010323A JP2022068171A (ja) | 2016-02-23 | 2022-01-26 | ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662298906P | 2016-02-23 | 2016-02-23 | |
US201662298966P | 2016-02-23 | 2016-02-23 | |
US62/298,966 | 2016-02-23 | ||
US62/298,906 | 2016-02-23 | ||
US201662305957P | 2016-03-09 | 2016-03-09 | |
US62/305,957 | 2016-03-09 | ||
PCT/US2017/019099 WO2017147279A1 (en) | 2016-02-23 | 2017-02-23 | Generation of phased read-sets for genome assembly and haplotype phasing |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022010323A Division JP2022068171A (ja) | 2016-02-23 | 2022-01-26 | ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019506871A JP2019506871A (ja) | 2019-03-14 |
JP2019506871A5 JP2019506871A5 (ja) | 2020-04-02 |
JP7441003B2 true JP7441003B2 (ja) | 2024-02-29 |
Family
ID=59685567
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018543207A Active JP7441003B2 (ja) | 2016-02-23 | 2017-02-23 | ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング |
JP2022010323A Pending JP2022068171A (ja) | 2016-02-23 | 2022-01-26 | ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022010323A Pending JP2022068171A (ja) | 2016-02-23 | 2022-01-26 | ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング |
Country Status (10)
Country | Link |
---|---|
US (2) | US10975417B2 (ja) |
EP (1) | EP3420108A4 (ja) |
JP (2) | JP7441003B2 (ja) |
KR (1) | KR20180116377A (ja) |
CN (1) | CN109072298B (ja) |
AU (1) | AU2017223600B2 (ja) |
CA (1) | CA3014911A1 (ja) |
IL (1) | IL261180B (ja) |
SG (1) | SG11201807117WA (ja) |
WO (1) | WO2017147279A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2017223600B2 (en) * | 2016-02-23 | 2023-08-03 | Dovetail Genomics Llc | Generation of phased read-sets for genome assembly and haplotype phasing |
AU2017263810B2 (en) | 2016-05-13 | 2023-08-17 | Dovetail Genomics Llc | Recovering long-range linkage information from preserved samples |
CA3060539A1 (en) * | 2017-04-18 | 2018-10-25 | Dovetail Genomics, Llc | Nucleic acid characteristics as guides for sequence assembly |
US20210317506A1 (en) * | 2018-05-08 | 2021-10-14 | The University Of Chicago | Chemical platform assisted proximity capture (cap-c) |
CN113508180A (zh) * | 2018-12-21 | 2021-10-15 | 爱披萨佛公司 | 用于染色质作图测定的dna条形码化核小体 |
EP3990920A4 (en) | 2019-06-27 | 2023-06-07 | Dovetail Genomics, LLC | PROXIMITY LIGATION METHODS AND COMPOSITIONS |
IL294909A (en) | 2020-02-13 | 2022-09-01 | Zymergen Inc | A metagenomic library and natural product discovery platform |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014121091A1 (en) | 2013-02-01 | 2014-08-07 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
WO2016019360A1 (en) | 2014-08-01 | 2016-02-04 | Dovetail Genomics Llc | Tagging nucleic acids for sequence assembly |
Family Cites Families (166)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1007228A (en) | 1911-03-03 | 1911-10-31 | William R Munden | Door-hanger. |
NL154598B (nl) | 1970-11-10 | 1977-09-15 | Organon Nv | Werkwijze voor het aantonen en bepalen van laagmoleculire verbindingen en van eiwitten die deze verbindingen specifiek kunnen binden, alsmede testverpakking. |
US3817837A (en) | 1971-05-14 | 1974-06-18 | Syva Corp | Enzyme amplification assay |
US3939350A (en) | 1974-04-29 | 1976-02-17 | Board Of Trustees Of The Leland Stanford Junior University | Fluorescent immunoassay employing total reflection for activation |
US3996345A (en) | 1974-08-12 | 1976-12-07 | Syva Company | Fluorescence quenching with immunological pairs in immunoassays |
US4275149A (en) | 1978-11-24 | 1981-06-23 | Syva Company | Macromolecular environment control in specific receptor assays |
US4277437A (en) | 1978-04-05 | 1981-07-07 | Syva Company | Kit for carrying out chemically induced fluorescence immunoassay |
US4366241A (en) | 1980-08-07 | 1982-12-28 | Syva Company | Concentrating zone method in heterogeneous immunoassays |
US5242794A (en) | 1984-12-13 | 1993-09-07 | Applied Biosystems, Inc. | Detection of specific sequences in nucleic acids |
US4988617A (en) | 1988-03-25 | 1991-01-29 | California Institute Of Technology | Method of detecting a nucleotide change in nucleic acids |
US5681726A (en) * | 1988-09-19 | 1997-10-28 | Stratagene | Method of double stranded DNA synthesis |
US5234809A (en) | 1989-03-23 | 1993-08-10 | Akzo N.V. | Process for isolating nucleic acid |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5494810A (en) | 1990-05-03 | 1996-02-27 | Cornell Research Foundation, Inc. | Thermostable ligase-mediated DNA amplifications system for the detection of genetic disease |
ATE244065T1 (de) | 1990-12-06 | 2003-07-15 | Affymetrix Inc | Verfahren und reagenzien für immobilisierten polymersynthese in sehr grossem masstab |
US5994056A (en) | 1991-05-02 | 1999-11-30 | Roche Molecular Systems, Inc. | Homogeneous methods for nucleic acid amplification and detection |
EP0972564B1 (en) | 1991-11-22 | 2003-05-28 | Affymetrix, Inc. (a Delaware Corporation) | Method of forming arrays of polymers |
US6033854A (en) | 1991-12-16 | 2000-03-07 | Biotronics Corporation | Quantitative PCR using blocking oligonucleotides |
US5348853A (en) | 1991-12-16 | 1994-09-20 | Biotronics Corporation | Method for reducing non-specific priming in DNA amplification |
US5567583A (en) | 1991-12-16 | 1996-10-22 | Biotronics Corporation | Methods for reducing non-specific priming in DNA detection |
WO1994024143A1 (en) | 1993-04-12 | 1994-10-27 | Northwestern University | Method of forming oligonucleotides |
US5837832A (en) | 1993-06-25 | 1998-11-17 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
EP0730663B1 (en) | 1993-10-26 | 2003-09-24 | Affymetrix, Inc. | Arrays of nucleic acid probes on biological chips |
US6110709A (en) | 1994-03-18 | 2000-08-29 | The General Hospital Corporation | Cleaved amplified modified polymorphic sequence detection methods |
US5571639A (en) | 1994-05-24 | 1996-11-05 | Affymax Technologies N.V. | Computer-aided engineering system for design of sequence arrays and lithographic masks |
US5705628A (en) | 1994-09-20 | 1998-01-06 | Whitehead Institute For Biomedical Research | DNA purification and isolation using magnetic particles |
US5795716A (en) | 1994-10-21 | 1998-08-18 | Chee; Mark S. | Computer-aided visualization and analysis system for sequence evaluation |
US5599695A (en) | 1995-02-27 | 1997-02-04 | Affymetrix, Inc. | Printing molecular library arrays using deprotection agents solely in the vapor phase |
US5780613A (en) | 1995-08-01 | 1998-07-14 | Northwestern University | Covalent lock for self-assembled oligonucleotide constructs |
JP2000504575A (ja) | 1996-02-08 | 2000-04-18 | アフィメトリックス,インコーポレイテッド | 微生物のチップベースの種分化および表現型特徴付け |
US5786146A (en) | 1996-06-03 | 1998-07-28 | The Johns Hopkins University School Of Medicine | Method of detection of methylated nucleic acid using agents which modify unmethylated cytosine and distinguishing modified methylated and non-methylated nucleic acids |
PT1179600E (pt) | 1996-06-04 | 2005-08-31 | Univ Utah Res Found | Monitorizacao da hibridacao durante a rcp |
US6117635A (en) | 1996-07-16 | 2000-09-12 | Intergen Company | Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon |
US6582921B2 (en) * | 1996-07-29 | 2003-06-24 | Nanosphere, Inc. | Nanoparticles having oligonucleotides attached thereto and uses thereof |
US6449562B1 (en) | 1996-10-10 | 2002-09-10 | Luminex Corporation | Multiplexed analysis of clinical specimens apparatus and method |
WO1998041651A1 (en) | 1997-03-18 | 1998-09-24 | Hsc Research & Development Limited Partnership | Method for preparing chromatin |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
WO1999022029A1 (en) | 1997-10-28 | 1999-05-06 | The Regents Of The University Of California | Dna base mismatch detection using flow cytometry |
US5989823A (en) | 1998-09-18 | 1999-11-23 | Nexstar Pharmaceuticals, Inc. | Homogeneous detection of a target through nucleic acid ligand-ligand beacon interaction |
GB9812768D0 (en) | 1998-06-13 | 1998-08-12 | Zeneca Ltd | Methods |
US20040106110A1 (en) | 1998-07-30 | 2004-06-03 | Solexa, Ltd. | Preparation of polynucleotide arrays |
US20030022207A1 (en) | 1998-10-16 | 2003-01-30 | Solexa, Ltd. | Arrayed polynucleotides and their use in genome analysis |
US6787308B2 (en) | 1998-07-30 | 2004-09-07 | Solexa Ltd. | Arrayed biomolecules and their use in sequencing |
US6696246B1 (en) | 1998-08-21 | 2004-02-24 | Naxcor, Inc. | Assays using crosslinkable immobilized nucleic acids |
DK1137812T3 (da) | 1998-12-02 | 2007-05-21 | Adnexus Therapeutics Inc | DNA-proteinfusioner og anvendelser deraf |
US8367322B2 (en) | 1999-01-06 | 2013-02-05 | Cornell Research Foundation, Inc. | Accelerating identification of single nucleotide polymorphisms and alignment of clones in genomic sequencing |
US6994969B1 (en) | 1999-04-30 | 2006-02-07 | Methexis Genomics, N.V. | Diagnostic sequencing by a combination of specific cleavage and mass spectrometry |
US7056661B2 (en) | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6225109B1 (en) | 1999-05-27 | 2001-05-01 | Orchid Biosciences, Inc. | Genetic analysis device |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US7211390B2 (en) | 1999-09-16 | 2007-05-01 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
EP1218543A2 (en) | 1999-09-29 | 2002-07-03 | Solexa Ltd. | Polynucleotide sequencing |
US6582938B1 (en) | 2001-05-11 | 2003-06-24 | Affymetrix, Inc. | Amplification of nucleic acids |
GB0002389D0 (en) | 2000-02-02 | 2000-03-22 | Solexa Ltd | Molecular arrays |
US6291187B1 (en) * | 2000-05-12 | 2001-09-18 | Molecular Staging, Inc. | Poly-primed amplification of nucleic acid sequences |
US6448717B1 (en) | 2000-07-17 | 2002-09-10 | Micron Technology, Inc. | Method and apparatuses for providing uniform electron beams from field emission displays |
AU2001293163A1 (en) | 2000-09-27 | 2002-04-08 | Lynx Therapeutics, Inc. | Method for determining relative abundance of nucleic acid sequences |
US7001724B1 (en) | 2000-11-28 | 2006-02-21 | Applera Corporation | Compositions, methods, and kits for isolating nucleic acids using surfactants and proteases |
DE10120797B4 (de) | 2001-04-27 | 2005-12-22 | Genovoxx Gmbh | Verfahren zur Analyse von Nukleinsäureketten |
EP1407053A4 (en) | 2001-05-11 | 2004-09-29 | Stamatoyannopoulos John A | ACTIVE CHROMATIN ELEMENTS DNA MICROARRAYS AND COMPREHENSIVE PROFILING THEREFOR |
GB0114853D0 (en) | 2001-06-18 | 2001-08-08 | Medical Res Council | Happier Mapping |
WO2003020968A2 (de) | 2001-08-29 | 2003-03-13 | Genovoxx Gmbh | Verfahren zur analyse von nukleinsäurekettensequenzen und der genexpression |
AU2002350485A1 (en) | 2001-10-04 | 2003-04-22 | Genovoxx Gmbh | Device for sequencing nucleic acid molecules |
DE10149786B4 (de) | 2001-10-09 | 2013-04-25 | Dmitry Cherkasov | Oberfläche für Untersuchungen aus Populationen von Einzelmolekülen |
US20050124022A1 (en) | 2001-10-30 | 2005-06-09 | Maithreyan Srinivasan | Novel sulfurylase-luciferase fusion proteins and thermostable sulfurylase |
US6902921B2 (en) | 2001-10-30 | 2005-06-07 | 454 Corporation | Sulfurylase-luciferase fusion proteins and thermostable sulfurylase |
EP1497455A4 (en) | 2001-11-09 | 2005-12-28 | Aclara Biosciences Inc | DETECTION OF NUCLEIC ACID SEQUENCES BY CLEAVAGE AND SEPARATION OF MARKED STRUCTURES |
US20050130161A1 (en) | 2002-03-08 | 2005-06-16 | Peter Fraser | Tagging and recovery of elements associated with target molecules |
US20030228627A1 (en) | 2002-03-22 | 2003-12-11 | Emerson Beverly M. | Assay for p53 function in cells |
DE10214395A1 (de) | 2002-03-30 | 2003-10-23 | Dmitri Tcherkassov | Verfahren zur Analyse von Einzelnukleotidpolymorphismen |
CA2490864C (en) | 2002-06-28 | 2012-09-11 | Sention, Inc. | Methods of detecting sequence differences |
US7563600B2 (en) | 2002-09-12 | 2009-07-21 | Combimatrix Corporation | Microarray synthesis and assembly of gene-length polynucleotides |
US7414117B2 (en) | 2002-12-26 | 2008-08-19 | Ngk Insulators, Ltd. | Nucleotide derivative and DNA microarray |
JP2007525151A (ja) | 2003-01-29 | 2007-09-06 | 454 コーポレーション | 一本鎖dnaライブラリーの調製方法 |
US20040197779A1 (en) | 2003-04-03 | 2004-10-07 | Apffel James Alexander | Methods for analyzing mixtures of proteins |
US8741577B2 (en) | 2003-04-07 | 2014-06-03 | Bio-Rad Laboratories Inc. | Surface immobilised multilayer structure of vesicles |
FI20030778A0 (fi) | 2003-05-22 | 2003-05-22 | Licentia Oy | Taudin määrittäminen tai ennustaminen |
WO2005001113A2 (en) | 2003-06-27 | 2005-01-06 | Thomas Jefferson University | Methods for detecting nucleic acid variations |
WO2005005655A1 (en) | 2003-07-02 | 2005-01-20 | Dsm Ip Assets B.V. | Improved test system for the determination of the presence of an antibiotic in a fluid |
GB0316075D0 (en) | 2003-07-09 | 2003-08-13 | Molecular Sensing Plc | Protease detection assay |
DE10356837A1 (de) | 2003-12-05 | 2005-06-30 | Dmitry Cherkasov | Modifizierte Nukleotide und Nukleoside |
EP1725572B1 (de) | 2003-11-05 | 2017-05-31 | AGCT GmbH | Makromolekulare nukleotidverbindungen und methoden zu deren anwendung |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
DE102004009704A1 (de) | 2004-02-27 | 2005-09-15 | Dmitry Cherkasov | Makromolekulare Nukleotidverbindungen und Methoden zu deren Anwendung |
CN1965090A (zh) | 2004-02-28 | 2007-05-16 | 王长宁 | 核酸复合体 |
DE102004025694A1 (de) | 2004-05-26 | 2006-02-23 | Dmitry Cherkasov | Verfahren und Oberfläche zu hochparallelen Analysen von Nukleinsäureketten |
DE102004025744A1 (de) | 2004-05-26 | 2005-12-29 | Dmitry Cherkasov | Oberfläche für die Analysen an einzelnen Nukleinsäuremolekülen |
DE102004025695A1 (de) | 2004-05-26 | 2006-02-23 | Dmitry Cherkasov | Verfahren und Oberfläche zur parallelen Sequenzierung von Nukleinsäureketten |
DE102004025746A1 (de) | 2004-05-26 | 2005-12-15 | Dmitry Cherkasov | Verfahren, Oberfläche und Substrate zur hochparallelen Sequenzierung von Nukleinsäureketten |
DE102004025696A1 (de) | 2004-05-26 | 2006-02-23 | Dmitry Cherkasov | Verfahren, Oberfläche und Substrate zu hochparallelen Analysen von Nukleinsäureketten |
DE102004025745A1 (de) | 2004-05-26 | 2005-12-15 | Cherkasov, Dmitry | Oberfläche für die Analysen an einzelnen Molekülen |
GB0413688D0 (en) * | 2004-06-18 | 2004-07-21 | Novartis Forschungsstiftung | Analysis of methylated nucleic acid |
US7361468B2 (en) | 2004-07-02 | 2008-04-22 | Affymetrix, Inc. | Methods for genotyping polymorphisms in humans |
US20060024711A1 (en) | 2004-07-02 | 2006-02-02 | Helicos Biosciences Corporation | Methods for nucleic acid amplification and sequence determination |
US7276720B2 (en) | 2004-07-19 | 2007-10-02 | Helicos Biosciences Corporation | Apparatus and methods for analyzing samples |
US20060012793A1 (en) | 2004-07-19 | 2006-01-19 | Helicos Biosciences Corporation | Apparatus and methods for analyzing samples |
US20060024678A1 (en) | 2004-07-28 | 2006-02-02 | Helicos Biosciences Corporation | Use of single-stranded nucleic acid binding proteins in sequencing |
GB0422730D0 (en) | 2004-10-13 | 2004-11-17 | Lingvitae As | Method |
US9035035B2 (en) | 2004-11-05 | 2015-05-19 | Genovoxx Gmbh | Macromolecular nucleotide compounds and methods for using the same |
US7425415B2 (en) | 2005-04-06 | 2008-09-16 | City Of Hope | Method for detecting methylated CpG islands |
JP2006301289A (ja) | 2005-04-20 | 2006-11-02 | Tokyo Ohka Kogyo Co Ltd | ネガ型レジスト組成物およびレジストパターン形成方法 |
US20090233291A1 (en) | 2005-06-06 | 2009-09-17 | 454 Life Sciences Corporation | Paired end sequencing |
CA2611743C (en) | 2005-06-15 | 2019-12-31 | Callida Genomics, Inc. | Nucleic acid analysis by forming and tracking aliquoted fragments of a target polynucleotide |
BRPI0611702B1 (pt) | 2005-07-04 | 2015-05-19 | Univ Erasmus Medical Ct | Captura e caracterização de cromatina co-localizada (4c) |
US20110027890A1 (en) | 2005-12-26 | 2011-02-03 | Kuraray Co., Ltd. | Material for cell culture |
US20070172839A1 (en) | 2006-01-24 | 2007-07-26 | Smith Douglas R | Asymmetrical adapters and methods of use thereof |
GB0603251D0 (en) | 2006-02-17 | 2006-03-29 | Isis Innovation | DNA conformation |
US8071296B2 (en) | 2006-03-13 | 2011-12-06 | Agency For Science, Technology And Research | Nucleic acid interaction analysis |
WO2007136874A2 (en) | 2006-05-18 | 2007-11-29 | President And Fellows Of Harvard College | Genomic library construction |
CA2661640A1 (en) | 2006-08-24 | 2008-02-28 | University Of Massachusetts Medical School | Mapping of genomic interactions |
KR20090101158A (ko) | 2006-10-04 | 2009-09-24 | 브룩하벤 싸이언스 어쏘씨에이츠 | Dna-가이드 나노입자 결합체 |
US8278112B2 (en) | 2006-12-21 | 2012-10-02 | The Regents Of The University Of California | Site-specific installation of methyl-lysine analogues into recombinant histones |
PT2121977T (pt) | 2007-01-11 | 2017-08-18 | Erasmus Univ Medical Center | Captura da conformação cromossómica circular (4c) |
WO2008097887A2 (en) | 2007-02-02 | 2008-08-14 | Emory University | Methods of direct genomic selection using high density oligonucleotide microarrays |
US7906287B2 (en) | 2007-05-14 | 2011-03-15 | Insight Genetics, Inc. | Methods of screening nucleic acids for single nucleotide variations |
WO2009052214A2 (en) | 2007-10-15 | 2009-04-23 | Complete Genomics, Inc. | Sequence analysis using decorated nucleic acids |
EP2053132A1 (en) | 2007-10-23 | 2009-04-29 | Roche Diagnostics GmbH | Enrichment and sequence analysis of geomic regions |
US8592150B2 (en) | 2007-12-05 | 2013-11-26 | Complete Genomics, Inc. | Methods and compositions for long fragment read sequencing |
US8263367B2 (en) | 2008-01-25 | 2012-09-11 | Agency For Science, Technology And Research | Nucleic acid interaction analysis |
WO2009132315A1 (en) | 2008-04-24 | 2009-10-29 | Life Technologies Corporation | Method of sequencing and mapping target nucleic acids |
US20090298064A1 (en) | 2008-05-29 | 2009-12-03 | Serafim Batzoglou | Genomic Sequencing |
GB0810051D0 (en) | 2008-06-02 | 2008-07-09 | Oxford Biodynamics Ltd | Method of diagnosis |
US8076070B2 (en) | 2008-08-06 | 2011-12-13 | University Of Southern California | Genome-wide chromosome conformation capture |
US9434985B2 (en) | 2008-09-25 | 2016-09-06 | University Of Massachusetts | Methods of identifying interactions between genomic loci |
EP2370594B1 (en) | 2008-11-18 | 2014-01-08 | BioNano Genomics, Inc. | Polynucleotide mapping and sequencing |
US8703462B2 (en) | 2009-02-03 | 2014-04-22 | New England Biolabs, Inc. | Generation of random double-strand breaks in DNA using enzymes |
US9524369B2 (en) | 2009-06-15 | 2016-12-20 | Complete Genomics, Inc. | Processing and analysis of complex nucleic acid sequence data |
WO2011032040A1 (en) | 2009-09-10 | 2011-03-17 | Centrillion Technology Holding Corporation | Methods of targeted sequencing |
US10207240B2 (en) | 2009-11-03 | 2019-02-19 | Gen9, Inc. | Methods and microfluidic devices for the manipulation of droplets in high fidelity polynucleotide assembly |
US8841075B1 (en) | 2010-04-13 | 2014-09-23 | Cleveland State University | Homologous pairing capture assay and related methods and applications |
US20110287947A1 (en) | 2010-05-18 | 2011-11-24 | University Of Southern California | Tethered Conformation Capture |
ES2667346T3 (es) | 2010-07-09 | 2018-05-10 | Cergentis B.V. | Estrategias de secuenciación de región genómica 3-D de interés |
WO2012047726A1 (en) | 2010-09-29 | 2012-04-12 | The Broad Institute, Inc. | Methods for chromatin immuno-precipitations |
WO2012045012A2 (en) | 2010-09-30 | 2012-04-05 | Raindance Technologies, Inc. | Sandwich assays in droplets |
US20120197533A1 (en) | 2010-10-11 | 2012-08-02 | Complete Genomics, Inc. | Identifying rearrangements in a sequenced genome |
EP2630263B2 (en) | 2010-10-22 | 2021-11-10 | Cold Spring Harbor Laboratory | Varietal counting of nucleic acids for obtaining genomic copy number information |
KR101173257B1 (ko) | 2010-10-27 | 2012-08-10 | 삼성에스디에스 주식회사 | 하플로타입 페이징 방법 및 장치 |
US20140057799A1 (en) | 2010-12-16 | 2014-02-27 | Gigagen | System and Methods for Massively Parallel Analysis of Nucleic Acids in Single Cells |
US9738930B2 (en) | 2011-01-28 | 2017-08-22 | The Broad Institute, Inc. | Paired end bead amplification and high throughput sequencing |
JP6017458B2 (ja) * | 2011-02-02 | 2016-11-02 | ユニヴァーシティ・オブ・ワシントン・スルー・イッツ・センター・フォー・コマーシャリゼーション | 大量並列連続性マッピング |
WO2012150317A1 (en) | 2011-05-05 | 2012-11-08 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Linear dna amplification |
WO2012142531A2 (en) | 2011-04-14 | 2012-10-18 | Complete Genomics, Inc. | Processing and analysis of complex nucleic acid sequence data |
US8663919B2 (en) | 2011-05-18 | 2014-03-04 | Life Technologies Corporation | Chromosome conformation analysis |
CN103890245B (zh) | 2011-05-20 | 2020-11-17 | 富鲁达公司 | 核酸编码反应 |
WO2012177774A2 (en) | 2011-06-21 | 2012-12-27 | Life Technologies Corporation | Systems and methods for hybrid assembly of nucleic acid sequences |
WO2013078470A2 (en) | 2011-11-22 | 2013-05-30 | MOTIF, Active | Multiplex isolation of protein-associated nucleic acids |
EP2841601B1 (en) | 2012-04-24 | 2019-03-06 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
KR101974577B1 (ko) | 2012-05-21 | 2019-05-02 | 삼성전자주식회사 | 나노입자 제작용 주형 및 이를 이용한 나노입자의 제조 방법 |
EP3392338B1 (en) | 2012-07-13 | 2020-12-09 | X-Chem, Inc. | Dna-encoded libraries having encoding oligonucleotide linkages not readable by polymerases |
WO2014047561A1 (en) | 2012-09-21 | 2014-03-27 | The Broad Institute Inc. | Compositions and methods for labeling of agents |
US9411930B2 (en) | 2013-02-01 | 2016-08-09 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
EP2971278B1 (en) | 2013-03-15 | 2022-08-10 | The Broad Institute, Inc. | Methods for determining multiple interactions between nucleic acids in a cell |
EP3022320B2 (en) | 2013-07-19 | 2024-09-25 | Ludwig Institute for Cancer Research Ltd | Whole-genome and targeted haplotype reconstruction |
WO2015089243A1 (en) * | 2013-12-11 | 2015-06-18 | The Regents For Of The University Of California | Methods for labeling dna fragments to recontruct physical linkage and phase |
EP2986761B1 (en) | 2014-02-13 | 2018-08-15 | Bio-rad Laboratories, Inc. | Chromosome conformation capture in droplet partitions |
US20170283860A1 (en) | 2014-09-16 | 2017-10-05 | The Board Of Trustees Of The Leland Stanford Junio University | Methods and compositions for the removal of aldehyde adducts and crosslinks from biomolecules |
SG11201703139VA (en) | 2014-10-17 | 2017-07-28 | Illumina Cambridge Ltd | Contiguity preserving transposition |
KR102721363B1 (ko) | 2015-02-17 | 2024-10-23 | 더브테일 제노믹스 엘엘씨 | 핵산 서열 어셈블리 |
US11807896B2 (en) * | 2015-03-26 | 2023-11-07 | Dovetail Genomics, Llc | Physical linkage preservation in DNA storage |
US11326159B2 (en) | 2015-04-06 | 2022-05-10 | The Regents Of The University Of California | Methods and compositions for long-range haplotype phasing |
MY194686A (en) | 2015-06-24 | 2022-12-15 | Oxford BioDynamics PLC | Detection of chromosome interactions |
WO2017007847A1 (en) * | 2015-07-07 | 2017-01-12 | The Regents Of The University Of California | Method for detecting protein-specific glycosylation |
WO2017031370A1 (en) | 2015-08-18 | 2017-02-23 | The Broad Institute, Inc. | Methods and compositions for altering function and structure of chromatin loops and/or domains |
EP3365445B1 (en) * | 2015-10-19 | 2023-05-31 | Dovetail Genomics, LLC | Methods for genome assembly, haplotype phasing, and target independent nucleic acid detection |
AU2017223600B2 (en) * | 2016-02-23 | 2023-08-03 | Dovetail Genomics Llc | Generation of phased read-sets for genome assembly and haplotype phasing |
AU2017263810B2 (en) * | 2016-05-13 | 2023-08-17 | Dovetail Genomics Llc | Recovering long-range linkage information from preserved samples |
-
2017
- 2017-02-23 AU AU2017223600A patent/AU2017223600B2/en active Active
- 2017-02-23 SG SG11201807117WA patent/SG11201807117WA/en unknown
- 2017-02-23 US US16/078,741 patent/US10975417B2/en active Active
- 2017-02-23 WO PCT/US2017/019099 patent/WO2017147279A1/en active Application Filing
- 2017-02-23 JP JP2018543207A patent/JP7441003B2/ja active Active
- 2017-02-23 KR KR1020187027586A patent/KR20180116377A/ko active IP Right Grant
- 2017-02-23 EP EP17757199.9A patent/EP3420108A4/en active Pending
- 2017-02-23 CN CN201780025354.3A patent/CN109072298B/zh active Active
- 2017-02-23 CA CA3014911A patent/CA3014911A1/en active Pending
-
2018
- 2018-08-15 IL IL261180A patent/IL261180B/en unknown
-
2021
- 2021-03-10 US US17/197,551 patent/US20220064701A1/en active Pending
-
2022
- 2022-01-26 JP JP2022010323A patent/JP2022068171A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014121091A1 (en) | 2013-02-01 | 2014-08-07 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
WO2016019360A1 (en) | 2014-08-01 | 2016-02-04 | Dovetail Genomics Llc | Tagging nucleic acids for sequence assembly |
Non-Patent Citations (1)
Title |
---|
Genome Res.,2016.02.04,Vol.26,p.342-350 |
Also Published As
Publication number | Publication date |
---|---|
AU2017223600B2 (en) | 2023-08-03 |
CN109072298B (zh) | 2022-04-08 |
EP3420108A4 (en) | 2019-11-06 |
CA3014911A1 (en) | 2017-08-31 |
EP3420108A1 (en) | 2019-01-02 |
KR20180116377A (ko) | 2018-10-24 |
AU2017223600A1 (en) | 2018-09-27 |
JP2022068171A (ja) | 2022-05-09 |
JP2019506871A (ja) | 2019-03-14 |
IL261180A (en) | 2018-10-31 |
IL261180B (en) | 2021-09-30 |
SG11201807117WA (en) | 2018-09-27 |
US20190241933A1 (en) | 2019-08-08 |
US10975417B2 (en) | 2021-04-13 |
CN109072298A (zh) | 2018-12-21 |
WO2017147279A1 (en) | 2017-08-31 |
US20220064701A1 (en) | 2022-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7441003B2 (ja) | ゲノムアセンブリのためのフェージングされたリードセットの生成とハプロタイプフェージング | |
JP7532455B2 (ja) | 連続性を維持した転位 | |
US20220213533A1 (en) | Method for generating double stranded dna libraries and sequencing methods for the identification of methylated | |
JP7497976B2 (ja) | 保存されたサンプルからの長距離連鎖情報の回復 | |
JP2020501554A (ja) | 短いdna断片を連結することによる一分子シーケンスのスループットを増加する方法 | |
US11807896B2 (en) | Physical linkage preservation in DNA storage | |
US20220073977A1 (en) | Methods and materials for assessing nucleic acids | |
JP2018509928A (ja) | 環状化メイトペアライブラリーおよびショットガン配列決定を用いて、ゲノム変異を検出するための方法 | |
JP2024502028A (ja) | 配列決定ライブラリー調製のための方法および組成物 | |
JP7558249B2 (ja) | 核酸シーケンシングの核酸フラグメント起源を追跡するための方法および組成物 | |
JP2024160269A (ja) | 連続性を維持した転位 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190408 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200219 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200220 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201009 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201104 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210128 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210429 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220126 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220126 |
|
C11 | Written invitation by the commissioner to file amendments |
Free format text: JAPANESE INTERMEDIATE CODE: C11 Effective date: 20220207 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220308 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220309 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220513 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220518 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230320 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20230405 |
|
RD12 | Notification of acceptance of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7432 Effective date: 20230405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20230405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230810 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7441003 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |