JP2004529650A - Analysis method of nucleic acid strand - Google Patents
Analysis method of nucleic acid strand Download PDFInfo
- Publication number
- JP2004529650A JP2004529650A JP2002585662A JP2002585662A JP2004529650A JP 2004529650 A JP2004529650 A JP 2004529650A JP 2002585662 A JP2002585662 A JP 2002585662A JP 2002585662 A JP2002585662 A JP 2002585662A JP 2004529650 A JP2004529650 A JP 2004529650A
- Authority
- JP
- Japan
- Prior art keywords
- nts
- sequence
- nacf
- nacfs
- primer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 69
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 51
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 51
- 238000004458 analytical method Methods 0.000 title claims description 60
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 191
- 239000002773 nucleotide Substances 0.000 claims abstract description 178
- 238000006243 chemical reaction Methods 0.000 claims abstract description 165
- 238000000034 method Methods 0.000 claims abstract description 163
- 238000001514 detection method Methods 0.000 claims abstract description 53
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 37
- 239000013615 primer Substances 0.000 claims description 265
- 230000027455 binding Effects 0.000 claims description 70
- 239000007850 fluorescent dye Substances 0.000 claims description 59
- 239000012634 fragment Substances 0.000 claims description 52
- 239000000499 gel Substances 0.000 claims description 43
- 238000009396 hybridization Methods 0.000 claims description 42
- 230000000295 complement effect Effects 0.000 claims description 41
- 239000000975 dye Substances 0.000 claims description 39
- 238000010348 incorporation Methods 0.000 claims description 26
- 238000005406 washing Methods 0.000 claims description 25
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 19
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 19
- 238000000137 annealing Methods 0.000 claims description 14
- 150000001875 compounds Chemical class 0.000 claims description 14
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 13
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 13
- 238000012986 modification Methods 0.000 claims description 12
- 230000004048 modification Effects 0.000 claims description 12
- 239000003446 ligand Substances 0.000 claims description 11
- 239000011521 glass Substances 0.000 claims description 10
- 230000005526 G1 to G0 transition Effects 0.000 claims description 9
- 230000000737 periodic effect Effects 0.000 claims description 9
- 241000588724 Escherichia coli Species 0.000 claims description 8
- 125000003277 amino group Chemical group 0.000 claims description 8
- 230000010354 integration Effects 0.000 claims description 8
- 229920002401 polyacrylamide Polymers 0.000 claims description 8
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 claims description 7
- 108010006785 Taq Polymerase Proteins 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 239000004033 plastic Substances 0.000 claims description 6
- 229920003023 plastic Polymers 0.000 claims description 6
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 claims description 5
- 229920000936 Agarose Polymers 0.000 claims description 5
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 239000010703 silicon Substances 0.000 claims description 5
- 229910052710 silicon Inorganic materials 0.000 claims description 5
- 239000004793 Polystyrene Substances 0.000 claims description 4
- 239000000919 ceramic Substances 0.000 claims description 4
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 239000004417 polycarbonate Substances 0.000 claims description 4
- 229920000515 polycarbonate Polymers 0.000 claims description 4
- 229920002223 polystyrene Polymers 0.000 claims description 4
- 108010042407 Endonucleases Proteins 0.000 claims description 3
- 239000011543 agarose gel Substances 0.000 claims description 3
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 claims description 3
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 claims description 3
- 239000003155 DNA primer Substances 0.000 claims description 2
- 230000001747 exhibiting effect Effects 0.000 claims 3
- 241000894006 Bacteria Species 0.000 claims 2
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims 2
- 102000004533 Endonucleases Human genes 0.000 claims 2
- 241000700605 Viruses Species 0.000 claims 2
- 230000001580 bacterial effect Effects 0.000 claims 2
- 230000000593 degrading effect Effects 0.000 claims 2
- 229940075420 xanthine Drugs 0.000 claims 2
- 238000012163 sequencing technique Methods 0.000 description 86
- 125000005647 linker group Chemical group 0.000 description 79
- 108020004414 DNA Proteins 0.000 description 53
- 239000000243 solution Substances 0.000 description 49
- 230000015572 biosynthetic process Effects 0.000 description 25
- 239000002585 base Substances 0.000 description 24
- 238000003776 cleavage reaction Methods 0.000 description 24
- 239000000203 mixture Substances 0.000 description 22
- 239000000872 buffer Substances 0.000 description 20
- 230000007017 scission Effects 0.000 description 20
- 108090000623 proteins and genes Proteins 0.000 description 17
- 239000001226 triphosphate Substances 0.000 description 17
- 235000011178 triphosphate Nutrition 0.000 description 17
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 16
- 150000002148 esters Chemical class 0.000 description 16
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 15
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 15
- 239000002299 complementary DNA Substances 0.000 description 13
- 108020004999 messenger RNA Proteins 0.000 description 13
- 238000012300 Sequence Analysis Methods 0.000 description 11
- 210000004027 cell Anatomy 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 239000000463 material Substances 0.000 description 11
- 239000002777 nucleoside Substances 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 10
- 125000003342 alkenyl group Chemical group 0.000 description 10
- 125000000217 alkyl group Chemical group 0.000 description 10
- 150000001408 amides Chemical class 0.000 description 10
- 125000003835 nucleoside group Chemical group 0.000 description 10
- 238000002360 preparation method Methods 0.000 description 10
- GMXJWMUWQYWCKI-UHFFFAOYSA-N sulfoperoxy hydrogen sulfate Chemical compound OS(=O)(=O)OOOS(O)(=O)=O GMXJWMUWQYWCKI-UHFFFAOYSA-N 0.000 description 10
- 238000012360 testing method Methods 0.000 description 10
- 150000003568 thioethers Chemical class 0.000 description 10
- 102000053602 DNA Human genes 0.000 description 9
- 239000013612 plasmid Substances 0.000 description 9
- 125000000714 pyrimidinyl group Chemical group 0.000 description 9
- 239000000523 sample Substances 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 238000001712 DNA sequencing Methods 0.000 description 8
- 229960002685 biotin Drugs 0.000 description 8
- 235000020958 biotin Nutrition 0.000 description 8
- 239000011616 biotin Substances 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 239000000047 product Substances 0.000 description 8
- 239000007787 solid Substances 0.000 description 8
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 125000000524 functional group Chemical group 0.000 description 7
- 239000003068 molecular probe Substances 0.000 description 7
- -1 nucleoside monophosphate Chemical class 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 230000002441 reversible effect Effects 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- ROOXNKNUYICQNP-UHFFFAOYSA-N ammonium persulfate Chemical compound [NH4+].[NH4+].[O-]S(=O)(=O)OOS([O-])(=O)=O ROOXNKNUYICQNP-UHFFFAOYSA-N 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 5
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 5
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 5
- 238000000429 assembly Methods 0.000 description 5
- 230000000712 assembly Effects 0.000 description 5
- UFULAYFCSOUIOV-UHFFFAOYSA-N cysteamine Chemical compound NCCS UFULAYFCSOUIOV-UHFFFAOYSA-N 0.000 description 5
- 150000002019 disulfides Chemical class 0.000 description 5
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 5
- 238000006911 enzymatic reaction Methods 0.000 description 5
- 230000005284 excitation Effects 0.000 description 5
- 238000000799 fluorescence microscopy Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 229960003151 mercaptamine Drugs 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical group N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 238000000018 DNA microarray Methods 0.000 description 4
- 102100031780 Endonuclease Human genes 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000001218 confocal laser scanning microscopy Methods 0.000 description 4
- 238000004624 confocal microscopy Methods 0.000 description 4
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- DNJIEGIFACGWOD-UHFFFAOYSA-N ethyl mercaptane Natural products CCS DNJIEGIFACGWOD-UHFFFAOYSA-N 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 238000002844 melting Methods 0.000 description 4
- 230000008018 melting Effects 0.000 description 4
- 238000001634 microspectroscopy Methods 0.000 description 4
- 230000009871 nonspecific binding Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000000399 optical microscopy Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000036961 partial effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 238000004007 reversed phase HPLC Methods 0.000 description 4
- 239000007858 starting material Substances 0.000 description 4
- 125000001424 substituent group Chemical group 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 150000007970 thio esters Chemical class 0.000 description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 4
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 3
- 108090001008 Avidin Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 229910001870 ammonium persulfate Inorganic materials 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 125000004432 carbon atom Chemical group C* 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000001035 drying Methods 0.000 description 3
- GBMDVOWEEQVZKZ-UHFFFAOYSA-N methanol;hydrate Chemical compound O.OC GBMDVOWEEQVZKZ-UHFFFAOYSA-N 0.000 description 3
- ZIUHHBKFKCYYJD-UHFFFAOYSA-N n,n'-methylenebisacrylamide Chemical compound C=CC(=O)NCNC(=O)C=C ZIUHHBKFKCYYJD-UHFFFAOYSA-N 0.000 description 3
- 102000054765 polymorphisms of proteins Human genes 0.000 description 3
- 239000002987 primer (paints) Substances 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 230000035484 reaction time Effects 0.000 description 3
- 230000003252 repetitive effect Effects 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- GHKCSRZBNZQHKW-UHFFFAOYSA-N 1-sulfanylethanol Chemical group CC(O)S GHKCSRZBNZQHKW-UHFFFAOYSA-N 0.000 description 2
- XDLMVUHYZWKMMD-UHFFFAOYSA-N 3-trimethoxysilylpropyl 2-methylprop-2-enoate Chemical compound CO[Si](OC)(OC)CCCOC(=O)C(C)=C XDLMVUHYZWKMMD-UHFFFAOYSA-N 0.000 description 2
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 2
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 2
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-WFVLMXAXSA-N DEAE-cellulose Chemical compound OC1C(O)C(O)C(CO)O[C@H]1O[C@@H]1C(CO)OC(O)C(O)C1O GUBGYTABKSRVRQ-WFVLMXAXSA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- VHJLVAABSRFDPM-IMJSIDKUSA-N L-1,4-dithiothreitol Chemical compound SC[C@H](O)[C@@H](O)CS VHJLVAABSRFDPM-IMJSIDKUSA-N 0.000 description 2
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- PXIPVTKHYLBLMZ-UHFFFAOYSA-N Sodium azide Chemical compound [Na+].[N-]=[N+]=[N-] PXIPVTKHYLBLMZ-UHFFFAOYSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229910052782 aluminium Inorganic materials 0.000 description 2
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 2
- 239000001099 ammonium carbonate Substances 0.000 description 2
- 235000012501 ammonium carbonate Nutrition 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 238000005842 biochemical reaction Methods 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 125000001369 canonical nucleoside group Chemical group 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 230000000052 comparative effect Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 238000004163 cytometry Methods 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 2
- 229910052737 gold Inorganic materials 0.000 description 2
- 239000010931 gold Substances 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000007654 immersion Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 239000011630 iodine Substances 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000012047 saturated solution Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000004904 shortening Methods 0.000 description 2
- 229910052709 silver Inorganic materials 0.000 description 2
- 239000004332 silver Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- 229910052727 yttrium Inorganic materials 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- WNDKIGQUFDOYIB-UHFFFAOYSA-N 1-hydroxypyrrolidine-2,5-dione;propanoic acid Chemical compound CCC(O)=O.ON1C(=O)CCC1=O WNDKIGQUFDOYIB-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- MBXADFLSFSJJOZ-SNAWJCMRSA-N 2-[1-[(4-ethoxyphenyl)methyl]-4-[(e)-3-(4-methoxyphenyl)prop-2-enyl]piperazin-2-yl]ethanol Chemical compound C1=CC(OCC)=CC=C1CN1C(CCO)CN(C\C=C\C=2C=CC(OC)=CC=2)CC1 MBXADFLSFSJJOZ-SNAWJCMRSA-N 0.000 description 1
- OBYNJKLOYWCXEP-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-4-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC(N=C=S)=CC=C1C([O-])=O OBYNJKLOYWCXEP-UHFFFAOYSA-N 0.000 description 1
- IJSMFQNTEUNRPY-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-5-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC=C(N=C=S)C=C1C([O-])=O IJSMFQNTEUNRPY-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 101000798869 Escherichia phage Mu DDE-recombinase A Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 229910052770 Uranium Inorganic materials 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 239000011230 binding agent Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000008367 deionised water Substances 0.000 description 1
- 229910021641 deionized water Inorganic materials 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- LSXWFXONGKSEMY-UHFFFAOYSA-N di-tert-butyl peroxide Chemical compound CC(C)(C)OOC(C)(C)C LSXWFXONGKSEMY-UHFFFAOYSA-N 0.000 description 1
- 239000012969 di-tertiary-butyl peroxide Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- LIKFHECYJZWXFJ-UHFFFAOYSA-N dimethyldichlorosilane Chemical compound C[Si](C)(Cl)Cl LIKFHECYJZWXFJ-UHFFFAOYSA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 238000003505 heat denaturation Methods 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001678 irradiating effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 229940083747 low-ceiling diuretics xanthine derivative Drugs 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 238000000386 microscopy Methods 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000011535 reaction buffer Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000002940 repellent Effects 0.000 description 1
- 239000005871 repellent Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 229910000077 silane Inorganic materials 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Saccharide Compounds (AREA)
Abstract
本発明は、核酸鎖を解析する方法に関する。本方法の基礎は、ポリメラーゼにより伸長中の核酸鎖に組み込まれた、色素で標識された個々のヌクレオチド分子の蛍光シグナルの検出である。反応は平面的表面上で行われる。個々の核酸分子が非常に多く該表面に固定化されている。これらの核酸分子はすべて同じ条件下にあり、それ故合成反応をすべての核酸分子において同時に行うことができる。The present invention relates to a method for analyzing a nucleic acid chain. The basis of the method is the detection of the fluorescent signal of individual dye-labeled nucleotide molecules incorporated into the elongating nucleic acid strand by the polymerase. The reaction takes place on a planar surface. Very many individual nucleic acid molecules are immobilized on the surface. These nucleic acid molecules are all under the same conditions, so that a synthesis reaction can be performed on all nucleic acid molecules simultaneously.
Description
【0001】
本発明は、核酸鎖の解析方法に関する。本方法の基礎は、ポリメラーゼによって伸長中の核酸鎖に取り込まれた色素で標識された、個々のヌクレオチド分子の蛍光シグナルの検出である。この反応は平面的表面上で起こる。非常に多くの個々の核酸分子が該表面に結合している。これら核酸分子はすべて同じ条件下にあり、故にすべての核酸分子において合成反応が同時に起こり得る。
【0002】
本方法は基本的に以下のステップを含む:
1)平面的表面への核酸鎖(NACFs)の結合およびそれに続くプライマーのハイブリダイゼーション、あるいはプライマーの結合およびそれに続くNACFのハイブリダイゼーション(これによりNACFsプライマー複合体が形成される)。
2)各サイクルが以下のステップよりなる周期的合成反応の実行:
a)結合NACFプライマー複合体への標識ヌクレオチド(NTs*)およびポリメラーゼを含む溶液の添加、
b)NTによる相補鎖の伸長に適した条件下の、結合NACFプライマー複合体と本溶液とのインキュベーション、
c)洗浄、
d)個々の分子のシグナルの検出、
e)取り込まれたヌクレオチドからの標識の除去、
f)洗浄。
3)検出された個々の分子のシグナルの解析。
4)個々のデータから得られた配列の再構築。
【0003】
1. 略語および用語の説明
DNA 相異なる起源および相異なる長さのデオキシ核酸 (ゲノムDNA、cDNA、ssDNA、dsDNA)
RNA リボ核酸 (通常mRNA)
ポリメラーゼ 伸長中のDNAまたはRNA鎖に相補的ヌクレオチドを組み込むことができる酵素 (例えば DNAポリメラーゼ、逆転写酵素、RNAポリメラーゼ)
dNTP - 2'-デオキシヌクレオシド三リン酸、DNAポリメラーゼおよび逆転写酵素の基質
NTP リボヌクレオシド三リン酸、RNAポリメラーゼの基質
NT 天然ヌクレオチド、別段の明示がない限り通常dNTP。
略語「NT」は、核酸配列の長さを示すときにもまた、例えば1,000NTのように使用される。この場合、「NT」はヌクレオシド一リン酸を表す。
文中、略語の場合、大部分は接尾辞「s」を用いて形成される。「NT」は例えば「ヌクレオチド(単数)」を、「NTs」はいくつかのヌクレオチドを意味する。
NT* - 修飾ヌクレオチド、別段の明示がない限り通常dNTP。 NTs*は修飾ヌクレオチド(複数)を示す。
NAC 核酸鎖。それら本来の長さのDNAまたはRNA。
NACF 全体配列の一部に相当する核酸鎖断片 (DNAまたはRNA)、NACFs 核酸鎖断片(複数)。NACFsを全て合わせたものが全体配列と等しくなる。このNACFsは、例えば断片化ステップの後に形成されたDNAまたはRNA全体配列の断片であり得る。
全体配列 配列決定反応で使用した一の配列または複数の配列(通常NACFsに変換される)。それらは本来一つまたはそれ以上のNACより成り得る。これに関し、全体配列は、別の配列または配列集合体(例えばmRNA、cDNA、挿入配列を有するプラスミドDNA、BAC、YAC)で、かつ一種類または異なる種のものの一部またはそれ同等のものを意味し得る。
プライマー結合部位 (PBS) プライマーが結合するNACまたはNACF中の配列の部分。
参照配列 調べようとする配列または調べようとする複数の配列(全体配列)における偏向が決定されている既知の配列。データベースにおいて、例えばNCBIデータベースから、利用可能な配列が参照配列として使用できる。
Tm 融解温度
【0004】
平面的表面:好ましくは以下の性質を示す表面: 1)それが、各レンズ-表面距離のレンズ位置において、同時に個々の分子いくつか、好ましくは100以上、より良くは1000以上を検出可能とする。2) 固定化された個々の分子が等焦点面に位置し、それが再現性よく調節可能である。
広視野光学的検出系 ある領域上(その領域はおよそ100μm2かそれ以上)に分布する個々の分子からの蛍光シグナルを同時に検出できる検出系。広視野検出光学の例は、Plan-neofluar油浸レンズ 100x NA 1.4 (Zeiss)、またはplanapochromat油浸レンズ 100x NA 1.4 (Zeiss)を有する蛍光顕微鏡Axiovert 200またはAxioplan 2e (Zeiss);これに関して、蛍光の励起は、ランプ、例えば水銀蒸気ランプ、またはレーザーもしくはダイオードで起こすことができる。エピフルオレッセンスモード、および全反射蛍光顕微鏡(TIRF顕微鏡)またはレーザー走査顕微鏡モードの両方が使用できる。これらの広視野検出光学を本出願に使用する。
立体障害:ポリメラーゼによる伸長反応において連続して組み込まれ得ないように,
その基に結合したNTs*の性質をその化学構造によって改変する、立体要求基。
停止の定義:本出願では、修飾非切断NTs*の組み込みの可逆的停止を停止として定める。この用語は、常套的配列決定におけるジデオキシNTPによる「停止」の語の通常の使用とは区別されるべきである。
停止は修飾NT*の組み込みの後に起こる。組み込まれた修飾NTs*は、この塩基に可逆的に結合する立体基を有し、それは、ポリメラーゼにより伸長中の鎖における以降の相補的NT*の組み込みの阻害につながる。
遺伝子産物 遺伝子産物とは、その遺伝子の一次遺伝子産物である。基本的にこれらは、標的配列(または標的核酸配列)としてもまた定められる該遺伝子のRNA転写産物である。これら標的配列はまた、mRNAに加えてそれら由来の一本鎖および二本鎖cDNA、cDNA由来のRNAまたはcDNAより増幅したDNAを含む。
一塩基変異多型(SNPs) 置換(転移もしくは転換)として、または単一NTの欠失もしくは挿入として起こり得る、配列中の変化。
【0005】
2. 当業界の現状
核酸鎖配列解析は、多くの科学領域において重要な手段となっている。解析にはいくつかの方法が開発されている。
最もよく知られた方法は、サンガーによる連鎖停止物質の組み込みに基づく連鎖停止配列決定(F. Sanger et al. PNAS 1977 v. 74 p. 5463)、および核酸鎖の塩基特異的修飾および切断に基づくマキサム-ギルバート法である(A.M. Maxam and W. Gilbert PNAS 1977, v. 74 p. 560)。両方法とも多数の長さの異なる核酸鎖断片を生じる。これら断片は、ゲル中でそれらの長さに従い分離される。これと関連して、電気泳動の全ての欠点(例えば泳動時間が長いこと、一回で決定できる配列の距離が比較的短いこと、一回に並行してできる数が限られること、および比較的多量のDNAが必要なこと)が許容されなければならない。これらの方法は非常に手間がかかり遅い。
配列決定の更なる方法は、核酸鎖と短いオリゴヌクレオチドとのハイブリダイゼーションに基づく。この方法においては、完全配列を決定するのに特定の長さのオリゴヌクレオチドがいくつ存在すべきかを、数学的方法により計算する(Z.T. Strezoska et al. PNAS 1991 v. 88 p. 10089 RS Drmanac et al. Science 1993 v. 260 p. 1649)。この方法もまたいくつかの問題に悩まされる:一回に一配列しか決定できず、二次構造がハイブリダイゼーションを阻害し、かつ配列の反復が正しい解析を妨げる。
【0006】
配列決定の別の方法が、いくつかのチームにより開発されている(例えば、Dower US Patent 5.547.839、Canard et al. US Patent 5.798.210、Rasolonjatovo Nucleosides & Nucleotides 1999 v. 18 p. 1021 Metzker et al. NAR 1994 v. 22 p. 4259、Welch et al. Nucleosides & Nucleotides 1999 v. 18 p. 197)。この方法は、BASS (Base Addition Sequencing Scheme)またはSBS (Sequencing by Synthesis)と略される。この方法においては、非常に多数の同一一本鎖DNA片が表面上の規定の位置に固定され、これら多数の同一DNA断片すべてからのシグナルが解析される。ポリメラーゼおよびヌクレオチドを含む溶液をこの固定化DNAに添加することで相補鎖が合成できる。ポリメラーゼはこれに関して段階的に働くことになる:すなわち、単一のヌクレオチドのみが各ステップで組み込まれる。続くサイクルでポリメラーゼが次のヌクレオチドを組み込むとすぐに後のものが検出される。この方法においては、デオキシリボースの3'OH基が修飾されたヌクレオチドが使用された。方法中の個々のステップを数少なくすることに成功したにも関わらず、それは機能的方法へと発展しなかった。これはおそらく、例えば、以下の事実による:相補鎖の合成中、合成の脱同調が非常にすばやく起こり、それ故各ステップで不備が蓄積する。このためほんの短い断片しか配列決定できない。記載したBASS法はすべて個々の分子の検出に基づいていないことは強調されるべきである。かわりに、規定の位置に固定された多数の同一分子からシグナルが記録される。これに関しては、「個々の分子」および「分子」なる用語の使用は、互いに分離された個々の分子ではなく多数の同一分子より成る集合体を対象とするものである。まさに同様に、これら分子は同じ配列を有する。
【0007】
更なる問題が3'位で修飾されたヌクレオチドによってもたらされる。一方では、ヌクレオチドのこの位置に大きな置換基が結合すると、多くの場合、ポリメラーゼによる組み込み反応が妨げられる。他方ポリメラーゼは3'位の修飾を多数切断できる。
それゆえ本発明の目的は、上記方法の欠点を示さず、とりわけ、より費用がかからず、より速く、かつより効率的な核酸配列解析を可能とする、核酸鎖の配列解析法を提供することにある。特に、該方法は多数の配列を並行して決定できるはずである。従ってそれは、例えば一回での非常に長い核酸鎖(数Mb)の解析または多数の短い鎖における変異体解析(変異解析、SNP解析)に使用できる。
【0008】
3.簡単な説明
本発明の目的は、核酸配列(核酸鎖、NACs)の並行配列解析のための方法により、本発明に従い達成されるが、その方法においては、
全体配列の重複部分配列に相当する約50−1000ヌクレオチドの長さの一本鎖NACsの断片(NACFs)を生産し、
NACFsが、一つの均一な、またはいくつかの異なったプライマーを用いて、NACFプライマー複合体の形でランダムな配置で反応表面上に結合し、
NACFsの相補鎖の周期的合成反応を、一つまたはそれ以上のポリメラーゼを用いて以下の方法により実行する:
a)表面上に結合したNACFプライマー複合体に、一つまたはそれ以上のポリメラーゼ、および、蛍光色素で標識された一つから四つの修飾ヌクレオチド(NTs*)であって、少なくとも二つのNTs*を併用した場合に相異なる蛍光シグナルを測定することにより使用したNTs*を互いに区別できるようにそのNTs*に存在する蛍光色素が選択さされており、伸長中の相補鎖におけるこのようなNTs*の組み込みに続いてポリメラーゼが同じ鎖にさらにNT*を組み込むことができないようにその塩基において構造的に修飾されており、その蛍光色素が切断可能であり、かつその構造的修飾が切断可能な立体要求リガンドであるNTs*を含む溶液を添加し、
b)ステップa)で得られた固定相を、相補鎖を伸長するのに適した条件下でインキュベートし、その相補鎖をいずれの場合にも1NT*ずつ伸長させ、
c)ステップb)で得られた固定相を、相補鎖に組み込まれなかったNTs*を除去するのに適した条件下で洗浄し、
d)それぞれの蛍光色素に特徴的なシグナルを測定することにより相補鎖に組み込まれた単一NTs*を検出し、同時に測定している個々の蛍光シグナルの反応表面上の相対的位置を決定し、
e)非標識(NTsまたは)NACFsを形成するため、相補鎖に添加したNTs*の蛍光色素および立体要求リガンドを切断除去し、
f)ステップe)で得られた固定相を、蛍光色素およびリガンドを除去するのに適した条件下で洗浄し、
ステップa)からf)を適すれば数回繰り返し、
連続的サイクルのステップd)において各々の位置で検出された蛍光シグナルをNTsに具体的に割り当てることにより、反応表面上の個々のNACFプライマー複合体の相対的位置およびこれらNACFsの配列を決定する。
【0009】
NACsの全体配列は、例えば、決定された部分配列から定められる。これに関し、並行配列解析は、均一なNAC集合体またはいくつかの異なったNAC集合体に由来する多数のNACF(例えば1,000,000から10,000,000)の同時配列解析を意味すると解される。
NACsの全体配列を形成するため、例えば市販のプログラムによる新規配列決定において得られた重複部分配列の集合体を統合することができる(Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257)。
既知の参照配列の変異体解析において、変異または一塩基多型は、得られた重複部分配列を参照配列と比較することにより明らかにできる。
本発明の具体的態様に従い、a)各サイクルで標識NT*を一つだけ使用するか、b)各サイクルで二つの異なる標識NT*を使用するか、またはc)各サイクルで四つの異なる標識NT*を使用して、周期的合成のステップa)からf)を数回繰り返すことにより、該方法を実施できる。
【0010】
NACsが既知の参照配列の変異体であるならば、二つの異なる標識をしたNTs*および二つの非標識NTsをサイクル中で交互に使用して、標識周期的合成反応のステップa)からf)を数回繰り返し、全体配列を参照配列と比較して決定することによってもまた、この方法を実施できる。
本発明の目的はさらに、図7e、7f、および7gに図示されるヌクレオチド、および、例えば末端アミノ基に蛍光色素が結合した対応する標識ヌクレオチド、または図7h、7iまたは7jに図示される標識ヌクレオチドより成る。
本発明の目的はさらに、図7e、7f、および7gに図示されるヌクレオチドおよび蛍光色素で標識された対応するヌクレオチドの、本発明による方法についての使用である。
本発明の目的はさらに、その塩基が修飾されたNTs*(例えば、図7k、7Lおよび7m参照)および蛍光色素で標識された対応するヌクレオチドの、本発明による方法についての使用である。
【0011】
本発明の目的はさらに、この方法を実行するためのキット(反応表面、方法を実行するために必要な反応溶液、一つまたはそれ以上のポリメラーゼ、およびヌクレオチド(NTs)(一つから四つが蛍光色素で標識されており、伸長中の相補鎖におけるこのようなNT*の組み込みに続いてポリメラーゼが同じ鎖にさらにNT*を組み込むことができないようにさらに構造的に修飾されており、その蛍光色素が切断可能で、かつその構造的修飾は切断可能な立体要求リガンドである(NT*またはNTs*))を含む)である。ヌクレオチドは好ましくは本発明に従う前述のヌクレオチドである。
本発明の具体的態様に従い、このキットはさらに、二本鎖から一本鎖を生産するのに必要な試薬、NACFsにPBSとして導入される一本鎖核酸分子、オリゴヌクレオチドプライマー、蛍光色素および立体要求基を切断除去するのに必要な試薬および/または洗浄液を含む。
本発明による方法は、核酸配列を決定するのに役立ち、遺伝学の様々な領域において使用可能である。これらは特に、未知の長い配列の決定、配列多型の解析および点突然変異および非常に多くの遺伝子配列の並行解析を含む。
解析しようとする物質(一本鎖および二本鎖核酸配列)の調製は課題の種類に依存し、かつ、長い核酸鎖から比較的小さい一本鎖核酸鎖断片(NACFs)の集合体を形成し、これら断片を配列決定反応の開始に適したプライマーとともに(NACFプライマー複合体)提供し、それらを平面的表面上に固定することを目的をする。
【0012】
これに関し、個々のNACFsは、これら分子において酵素反応が起こり得るように平面的表面上に固定される。基本的に、様々な種類の固定化が可能であり、それは、目的、NACの性質および反応に用いられるポリメラーゼに依存する。固定化または結合の間、NACFsは表面上にランダムに分布し、すなわち、それ故に個々の鎖を確実に正確に位置させる必要はない。NACFプライマー複合体は、NACFまたはプライマーを介して表面に結合できる。これに関し、NACFプライマー複合体は、個々のNACFに組み込まれたNT*からその後検出されるシグナルを確実にはっきりと割り当てられるような密度で、表面に固定しなければならない。
NACFsの調製に続き、表面上に固定されたすべてのNACFプライマー複合体分子で配列決定反応が開始する。個々の結合NACFのそれぞれに対する相補鎖の合成が、配列決定の基礎となる。これに関し、標識NT*は新規に合成された鎖に組み込まれる。ポリメラーゼは、伸長中の鎖に標識NT*を一つだけ組み込む。これは、停止をもたらす立体要求基をそのNTs*に可逆的に結合することによりなされる。それにより、さらに標識NT*を組み込むことが不可能になる。この立体要求基は、蛍光色素であることが好ましい。
【0013】
配列決定反応はいくつかのサイクルで進行する。1サイクルは以下のステップを含む:
a)結合NACFプライマー複合体への標識ヌクレオチド(NTs*)およびポリメラーゼを含む溶液の添加、
b)NTによる相補鎖の伸長に適した条件下の、結合NACFプライマー複合体と本溶液とのインキュベーション、
c)洗浄、
d)個々の分子のシグナルの検出、
e)取り込まれたヌクレオチドからの標識化の除去、
f)洗浄。
適すれば、サイクル(aからf)を繰り返す。
サイクル中のステップb)の反応条件は、ポリメラーゼが、1サイクルで配列決定反応に関与するNACFs(伸長可能なNACFプライマー複合体)の50%以上、好ましくは90%以上に標識NT*を組み込むことができるように選択する。
これに関し、実行するサイクル数は、それぞれの問題のタイプに依存し、理論的には無限であり、好ましくは20から5000の間である。
固定された各NACFの場合、その特異的配列は、組み込まれたNTs*の配列からその後決定される。重複NACF配列から再構築できる
【0014】
ある具体的態様においては、本来のNAC配列は重複NACF配列から再構築できる(自動化DNA配列決定および解析(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257)。これに関し、NACFs配列中の一致/重複は、NACF配列集合体の全体において検索する。NACFは、これらの一致/重複を介して、例えば以下のように一列に並べることができる:
既知の配列を配列決定するとき、配列既決定断片中の300bp以上の長さを得るのに価値があることが実際証明されている。これにより、ショットガン法において真核生物から得たゲノムの配列を決定することができる。
これに関し、本方法における誤りは、様々な手段により検出し、訂正できる。本方法の全てのステップが幅広く自動化できる。
前述のBASS法を上回るいくつかの利点が、個々の分子に働くことから生じる:
1. 分子が個々に検出されるので、集合体における脱同調の結果としてシグナルに誤りが生じる危険性がない。各固定NACFについてそれ自身の配列が決定される。その結果、近隣分子において合成がさらに進行してるか、または脱落してしまったかは重要でない。
2. シグナルが個々の分子から発され、空間的に規定された集合体から発されるのではないため、分子を表面上に規定の配置で固定する必要がない(BASS法にはこれが必要である)。
【0015】
4.詳しい説明
4.1 反応の一般的原理
反応の一般的原理は、長さ数MbのDNA断片の配列決定を用いた例により、以下に図示される。ショットガン原理が核酸配列の配列決定および再構築の基礎である(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257)。これに関し、DNAの長い断片の配列は、小さなDNA断片の配列決定およびその後の再構築により決定される。好ましくは長さ50から1000bpの断片に分解することにより、解析しようとする材料(1)を配列決定反応のため調製する(2)。その後、各断片をプライマー結合部位およびプライマーと共に準備する(3)。次にこの様々なDNA断片の混合物を平面的表面上に固定する(4)。非結合DNA断片を洗浄ステップにより除去する。その後、全反応表面上で配列決定反応を行う。この反応は周期的に進行する。サイクルのステップ1において、蛍光色素で標識されたNT*が伸長中の鎖に組み込まれる:ポリメラーゼが、各サイクルにおいて標識NT*を一つだけ伸長中の鎖に組み込めるように、反応を調節する。これは、停止をもたらす可逆的結合基を有するNTs*を使用することで達成される。それにより、さらに標識NT*を組み込むことが不可能となる。ポリメラーゼおよび標識NTs*は、この反応中で同時に用いられる(5)。その後、反応混合物を除去し、表面を適切に洗浄する(6)。次に検出ステップが続く(7):表面を単一分子検出に適した装置(光源、顕微鏡、カメラ、走査台、制御および画像認識または画像処理ソフトウェアを伴うコンピューターより成る)でスキャンし、、組み込まれた個々の標識NT*のシグナルを同定する。検出ステップの後、組み込まれた全てのNTs*から、標識および停止をもたらす基を除去する(8)。続く洗浄ステップの後、新しいサイクルが開始可能である。再構築をショットガン原理に従い行うならば、より大きい本来のDNA配列(例えば長さ数MbのDNA断片)を再構築するために、DNA断片は長さ数百NTでなければならない(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257)。1サイクルにつきNT*が一つだけ組み込まれるので、配列決定を目的としては少なくとも300サイクルが必要である。
【0016】
4.2 材料の選択
本発明による方法を用いて、あらかじめ選択されたDNA配列(例えば、YAC、PACまたはBACベクター中のゲノムのクローン化部分 (R. Anand et al. NAR 1989 v. 17 p. 3425, H. Shizuya et al. PNAS 1992 v. 89 p. 8794, ”Construction of bacterial artificial chromosome libraries using the modified PAC system” in ”Current Protocols in Human genetics” 1996 John Wiley & Sons Inc.)および前もって選択されていないDNA(例えばゲノムDNA、cDNA混合物)の両方を解析できる。事前選択を通して、大量の遺伝情報から、例えばゲノムまたは遺伝子産物の集合体から得られる配列部分のような適切な情報を前もってふるい分け、それによって解析する配列数を限定できる。
【0017】
4.3 材料の調製
材料調製の目的は、好ましくは長さ50−1000NTsで、単一のプライマー結合部位およびハイブリダイズしたプライマーを有する結合一本鎖NACFs(結合NACFプライマー複合体)を得ることである。これらNACFプライマー複合体は、例えば、図2に示される構造を有する。特に、高度に変化に富む構造がこの一般構造から誘導できる。より明確にするため、次に、個々にまたは組み合わせて使用可能な前述の方法と共に、いくつかの例が以下に続く。
【0018】
4.3.1 短核酸鎖断片(50−1000NTs)の生産(断片化ステップ)
全体配列の部分配列に相当する断片が得られるように、NACsの断片化を行うことが重要である。これは、切断産物として相異なる長さの断片がランダムな分布で形成される方法により達成できる。本発明に従い、いくつかの方法により、例えば、出発材料を超音波、または、例えば非特異的エンドヌクレアーゼ混合物のようなエンドヌクレアーゼ(”Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press)により断片化することによって、核酸鎖断片(NACFs)を生産することができる。本発明によれば、超音波断片化が好ましい。平均長100bpから1kbの断片が形成されるように条件を調節できる。その後、クレノーフラグメント(大腸菌ポリメラーゼI)またはT4-DNAポリメラーゼ(”Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press)によりこれら断片の末端を埋める。
加えて、相補的短NACFsは、長NACより任意選択プライマーを用いて合成できる。この方法は特に、遺伝子配列の解析において好まれ、この場合、任意選択プライマーおよび逆転写酵素を伴うmRNAにおいて一本鎖DNA断片が形成される(Zhang-J et al. Biochem. J. 1999 v. 337 p. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 p. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 p. 264, Decraene et al. Biotechniques 1999 v. 27 p. 962)。
【0019】
4.3.2 NACFにおけるプライマー結合部位の導入
プライマー結合部位(PBS)は、NACFに対するプライマーの選択的結合を許容することを意味する配列部分である。
ある態様においては、プライマー結合部位が異なる場合があり、故にいくつかの異なるプライマーを使用しなければならない。この場合、全体配列の特定の配列部分が、特定のプライマーに対する天然のPBSsとしての役割を果たし得る。この態様は、既知のSNP部分の検討に特に適している(実施例5「配列特異的プライマーによるSNP解析」参照)。
別の態様においては、解析を単純化するため、均一なプライマー結合部位が全てのNACFsに存在することが好ましい。本発明の好ましい態様に従い、それゆれ、プライマー結合部位をNACFsにさらに導入する。こうして、構造の均一なプライマーが反応に使用できる。
本態様は以下に詳しく記載される。
プライマー結合部位の組成は限定されない。その長さは20から50NTsの間であることが好ましい。プライマー結合部位は、例えばNACFを固定するための機能基を有することができる。この機能基は、例えばビオチン基であってよい。
均一なプライマー結合部位の導入の例として、DNA断片におけるライゲーションおよびヌクレオチドテーリングを以下に記載する。
【0020】
a)ライゲーション
この工程では、プライマー結合部位を有する二本鎖オリゴヌクレオチド複合体を使用する(図3a)。これを市販のリガーゼによりDNA断片に結合する(”Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press)。プライマー結合部位が一つだけDNA断片に結合することが重要である。これは、例えば両鎖においてオリゴヌクレオチド複合体の片側を修飾することにより達成される(図3b)。ライゲーション後またはそれに続く変性後の結果は、図3bおよび図3dに示す。オリゴヌクレオチド複合体上の修飾基は固定化に役立ち得る。このようなオリゴヌクレオチド複合体の合成および修飾は、標準化された教授に従い行うことができる。例えば、DNA合成機380A Applied Biosystemsが合成に使用できる。しかしながら、特定の組成の修飾済または未修飾オリゴヌクレオチドもまた応用合成物として、例えばMWG-Biotech GmbH, Germanyから市販されている。
b)ヌクレオチドテーリング
オリゴヌクレオチドとのライゲーションのかわりに、末端デオキシヌクレオチド転移酵素によりいくつか(例えば10から20の間)のヌクレオチド一リン酸をss-DNA断片の3’末端に結合でき(”Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, ”Method in Enzymology” 1999 v. 303, pp. 37-38)、それは例えばいくつかのグアノシン一リン酸である((G)n-テーリングと呼ばれる)。形成される断片はプライマーと結合するのに使用され、この例においては(C)nプライマーである。
【0021】
4.3.3 一本鎖調製
一本鎖NACFsが配列決定反応に必要である。出発材料が二本鎖形態で存在する場合、二本鎖DNAから一本鎖形態を生産するにはいくつかの方法がある(例えば、熱変性またはアルカリ変性)(”Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press)。
【0022】
4.3.4 配列決定反応のためのプライマー
これは、NACFの単一の位置での開始を可能とする機能を有する。それは、NACF中のプライマー結合部位に結合する。プライマーの組成および長さは限定されない。開始機能とは別に、プライマーはまた、例えば反応表面への結合の構築のような別の機能を担うことができる。プライマーがそれぞれのポリメラーゼによる配列決定反応の開始を可能とするように、プライマー結合部位の長さおよび組成にプライマーを合わせなければならない。
相異なるプライマー結合部位(例えば本来の全体配列中の天然のプライマー結合部位)を使用するとき、それぞれのプライマー結合部位に配列特異的なプライマーを使用する。この場合、プライマー混合物を配列決定に用いる。
均一なプライマー結合部位、例えばライゲーションによりNACFsに結合したプライマー結合部位、の場合、均一なプライマーを使用する。
プライマーの長さは6から100NTsの間であることが好ましく、理想的には、15から30NTsの間である。プライマーは、NACFを固定化するのに役立つ機能基を有することができ、例えばそのような機能基はビオチン基である(固定化についての節参照)。それは配列決定反応を阻害すべきでない。このようなプライマーの合成は、例えばDNA合成機380 A Applied Biosystemsにより行うことができ、あるいは例えばMWG-Biotech GmbH, Germanyのような市販業者によって応用合成として行われ得る。
【0023】
ハイブリダイゼーションに先立って、プライマーは様々な技術により表面上の解析しようとするNACFsに固定でき、または、表面上で直接合成できる(例えば以下に従う:McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, ”Microarray biochip technology” 2000 M. Schena Eaton Publishing, ”DNA Microarrays” 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v. 285 p. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. 15 p. 5353, Gingeras et al. NAR 1987 v. 15 p. 5373, Maskos et al. NAR 1992 v. 20 p. 1679)。
プライマーは、例えば100μm2につき10−100、100μm2につき100-10,000、または100μm2につき10,000-1,000,000の密度で表面上に結合する。
プライマーまたはプライマー混合物を、それがプライマー結合部位に選択的に結合するようなハイブリダイゼーション条件下、NACFsとインキュベートする。このプライマーハイブリダイゼーション(アニーリング)は、NACFsの表面への結合の前(1)、間(2)、または後(3)に行うことができる。ハイブリダイゼーション条件の最適化は、プライマー結合部位およびプライマーの正確な構造に依存し、Rychlik et al. NAR 1990 v. 18 p. 6409に従い計算できる。これらのハイブリダイゼーション条件は、以下では標準化ハイブリダイゼーション条件として示される。
全NACFsに共通する既知構造のプライマー結合部位が、例えばライゲーションにより導入される場合、均一構造のプライマーが使用できる。プライマー結合部位は、その3’末端に、例えば固定化に役立つ機能基を有することができる。この基は、例えばビオチン基である。プライマーはプライマー結合部位に相補的な構造を有する。
プライマー結合部位およびプライマーの例を以下に示す:
【0024】
4.3.5 NACFプライマー複合体の表面への固定(NACFsの結合または固定化)
固定(固定化)の目的は、周期的酵素的配列決定反応が起こり得るように、NACFプライマー複合体を適した平面的表面上に固定することである。これは例えばプライマー(上記参照)またはNACFを表面に結合することにより行える。
NACFプライマー複合体の固定におけるステップの順序は変化してよい:
1)はじめに溶液中でハイブリダイゼーション(アニーリング)によりNACFプライマー複合体を形成し、その後表面へ結合できる。
2)はじめにプライマーを表面に結合し、その後NACFsを結合プライマーにハイブリダイズし、NACFプライマー複合体を形成できる(NACFsは間接的に表面に結合)。
3)はじめにNACFsを表面に結合し(NACFsは直接表面に結合)、次のステップでプライマーをこれら結合NACFsにハイブリダイズし、NACFプライマー複合体を形成できる。
それゆえ、表面に対するNACFsの固定化は直接的または間接的結合により行える。
本目的については、表面および反応表面は、別の意味が特に示されていなければ同一の概念として考えられるべきである。いずれの材料の固層表面でも反応表面の役目を果たす。この材料は、酵素反応に対し不活性で、かつ検出を妨げないことが好ましい。シリコン、ガラス、セラミック、プラスチック(例えばポリカーボネートまたはポリスチレン)、金属(金、銀、またはアルミニウム)またはこれら機能的要求を満たす他の材料が使用できる。表面は変形可能でないことが好ましく、なぜならそうでなければ繰り返し検出するとシグナルの歪みが予想されるからである。
【0025】
ゲル様固層(ゲル表面)を使用する場合、このゲルは例えばアガロースまたはポリアクリルアミドゲルであってよい。ゲルは、分子量5000Da未満の分子を自由に通せることが好ましい(例えば、1から2%のアガロースゲルまたは10から15%のポリアクリルアミドゲルを使用できる)。このようなゲル表面は、表面に対するNT*の非特異的結合が他の固層表面と比較してかなり低くしか起こらないという利点を有する。表面上にNACFプライマー複合体が結合するので、組み込まれたNT*の蛍光シグナルの検出が可能である。遊離NT*はゲル材料に結合しておらず、従って固定化されていないため、それらのシグナルは検出できない。ゲルは固体表面上に連結していることが好ましい(図5)。この固体表面は、シリコン、ガラス、セラミック、プラスチック(例えばポリカーボネートまたはポリスチレン)、金属(金、銀、またはアルミニウム)または他の材料であってよい。ゲルの厚さは0.1mm以下であることが好ましい。ゲル厚さはレンズの単一物体深度より大きいことが好ましく、それにより非特異的に固体表面に結合したNTs*が最終的に焦点面に存在してしまわず、それ故に検出される。物体深度が例えば0.3μmの場合、ゲル厚さは1μmから100μmの間であることが好ましい。表面は、連続表面として、または個々の小さい構成要素(例えばアガロースビーズ)により構成される非連続表面として形成できる(図5b)。反応表面は、必要数のNACFsを対応する密度で固定化できるのに十分な程大きくなければならない。反応表面は、好ましくは20cm2を超えないべきである。
【0026】
様々なサイクルステップで、表面上での様々な反応液の交換が必要となる。反応表面は反応槽の一部を形成することが好ましい。言い換えれば、反応槽は流動装置を有する反応機器の一部を形成することが好ましい。流動装置が反応槽における溶液の交換を可能とする。交換は、コンピューターにより、または手動で制御されるポンプ装置により行うことができる。これに関し、表面が乾燥しきらないことが重要である。反応槽の容量は、50μl未満であることが好ましい。理想的には、その容量は1μl未満である。このような流動系の例は、図6に示される。
【0027】
NACFプライマー複合体の表面上での固定がNACFsを介して起こる場合、これは例えばNACFsが二つの鎖末端の一方で結合して起こり得る。これは、対応する共有結合、アフィン結合、または他の結合により達成できる。核酸固定化の多くの例が知られている(McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, ”Microarray biochip technology” 2000 M. Schena Eaton Publishing, ”DNA Microarrays” 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, p. 138, Allemand et al. Biophysical JouRNAl 1997, v. 73, p. 2064, Trabesinger et al. Analytical Chemistry 1999, v. 71, p. 279, Osborne et al. Analytical Chemistry 2000, v. 72, p. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. 15 p. 5353, Gingeras et al. NAR 1987 v. 15 p. 5373, Maskos et al. NAR 1992 v. 20 p. 1679)。固定はまた、例えばNACFsを含む試料を平面的表面上で乾燥させることによる非特異的結合によっても、達成できる。
NACFsは、例えば100μm2につき10−100NACFs、100μm2につき100-10,000、または100μm2につき10,000-1,000,000の密度で表面上に結合する。
検出に必要な伸長可能なNACFプライマー複合体の密度は、100μm2につき約10−100である。それは、遺伝子産物に対するプライマーのハイブリダイゼーションの前、間、または後に達成できる。
【0028】
例として、NACFプライマー複合体を結合するいくつかの方法を、以下にさらに詳しく記載する:ある態様においては、NACFsの固定化は、ビオチン-アビジンまたはビオチン-ストレプトアビジン結合を介して起こる。これに関し、アビジンまたはストレプトアビジンは表面に共有結合し、プライマーの5’末端がビオチンを含む。(溶液中における)標識プライマーのNACFsとのハイブリダイゼーションに続き、これらはアビジン/ストレプトアビジンで覆われた表面上に固定される。ビオチンで標識されたハイブリダイゼーション産物の濃度および表面と本溶液とのインキュベーションの持続時間は、この場面により配列決定反応に適した密度が達成されるように選択する。
別の好ましい態様においては、配列決定反応に適したプライマーは、配列決定反応の前に、適した方法により表面上に固定される(上記参照)。それについて、各々が1NACFにつきプライマー結合部位を一つ有する一本鎖NACFsを、ハイブリダイゼーション条件(アニーリング)のもとインキュベートする。これに関し、それらは固定プライマーに結合し、それにより結合し(間接的結合)、プライマーNACF複合体を形成する。一本鎖NACFsの濃度およびハイブリダイゼーション条件は、100μm2につき10-100の伸長可能NACFプライマー複合体の配列決定に適した固定化密度が達成されるように選択する。ハイブリダイゼーション後、非結合NACFsを洗浄ステップで除去する。この態様においては、所望のNACFプライマー複合体密度がより速く形成されるのでプライマー密度の高い表面が好ましく、それは例えば100μm2につき約1,000,000プライマーかさらにそれより高い密度で、この場合、一部のプライマーにしかNACFsは結合しない。
【0029】
別の態様においては、NACFsを表面に直接結合し(上記参照)、その後ハイブリダイゼーション条件下プライマーとインキュベートする。100μm2につき約10−100NACFの密度で、全ての利用可能なNACFsをプライマーと共に提供し、それらを配列決定反応に利用できるようにすることが試みられるであろう。これは、例えばプライマー濃度を高くすることで達成でき、例えば1から100mmol/lである。表面上の固定NACFsの密度が高い(例えば100μm2につき10,000−1,000,000)場合、光学検出に必要とされるNACFプライマー複合体の密度は、プライマーハイブリダイゼーション中に達成できる。これに関し、プライマーが固定化NACFsの一部にしか結合しないようにハイブリダイゼーション条件(例えば温度、時間、緩衝液、プライマー濃度)を選択する(実施例5、6参照)。
固層(例えばシリコンまたはガラス)の表面を固定化に使用する場合、ブロッキング溶液は、各サイクルにおいてステップ(a)の前に表面に加えられることが好ましく、それにより、表面におけるNTs*の非特異的吸収を防ぐことができる。ブロッキング溶液についてのこれらの条件は、例えばpH8から10の間のアルブミン溶液(BSA)により満たされる。
【0030】
4.4 ポリメラーゼの選択
基本的に、3’−5’エキソヌクレアーゼ活性を持たないDNA依存DNAポリメラーゼの全てが、ポリメラーゼとして適しており(DNA-Replication” 1992 Ed. A. Kornberg, Freeman and company NY)、例えば”Sequenase Version 2” タイプの改変T7ポリメラーゼ(Amersham Pharmacia Biotech)、DNA ポリメラーゼ Iの3'-5' エキソヌクレアーゼフリークレノーフラグメント(Amersham Pharmacia Biotech)、様々な起源のポリメラーゼベータ (Animal Cell DNA Polymerases” 1983, Fry M.、CRC Press Inc.、Chimerxより市販) 例えば Taq ポリメラーゼ(GibcoBRL)のような熱安定性ポリメラーゼ、proHATM ポリメラーゼ (Eurogentech)である。
既存の3’−5’エキソヌクレアーゼを抑制する反応条件を選択するか、または組み込み反応へNaFを添加すれば、3’−5’エキソヌクレアーゼ活性を有するポリメラーゼが使用可能であり(例えば大腸菌ポリメラーゼ I のクレノーフラグメント)、それは例えばクレノーフラグメントにおいては低pH(pH6.5)である(Lehman and Richardson, J. Biol. Chem. 1964 v. 239 p. 233)。別の可能性は、フォスフォロチオエート化合物とともにNTs*を使用することにある(Kunkel et al. PNAS 1981, v. 78 p. 6734)。この場合、組み込まれたNTs*は、ポリメラーゼの3’−5’エキソヌクレアーゼによる攻撃を受けない。これらのポリメラーゼ型は全て、以下「ポリメラーゼ」と示される。
【0031】
4.5 化学
4.5.1 一般原理
個々の核酸分子についての高度並行配列解析(10,000,000までのNACF配列)に関する配列決定反応には、組み込まれた各NT*を同定することが重要である。これには、各サイクルにつき単一のNT*のみが核酸鎖に組み込まれることが必要である。ポリメラーゼが同じサイクルでいくつかのNTs*を連続的に組み込むと、これが配列決定における誤りにつながる。このため、NTs*の組み込みは調節されなければならない。
例えば、BASS法において可逆的3’−OH修飾NTsが示されている(Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p. 1021, Metzker et al. NAR 1994, v. 22, p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197)。これに関し、切断は、穏やかな条件下光化学的に(The cleavage is in this connection to take place photochemically (Dower US Patent 5.547.839, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197)または化学的に(Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p. 1021)行うべきである。
【0032】
光化学的に切断可能な3’−OH修飾NT*の合成は非常に費用がかかる。ポリメラーゼがこれらのヌクレオチド類縁体に対してかなり異なる親和性を示すため、核酸合成が非常に不均一な方法で起こるか、または多くのDNA位置で全く起こらない(Metzker et al. NAR 1994 v. 22 p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197)。これらの理由により、これら類縁体は配列決定反応に適さないか、または非常に限定された方法にしか適さない。切断可能な3’エステル結合(Canard et al. US Patent 5.798.210)もまた、合成の可逆的停止の基礎とは考えられない。次の相補的NT3’−OHエステル化合物が利用可能な場合ほとんどのポリメラーゼが切断するので、3’−OH基に結合した標識が溶液中に放出され、もはや停止剤として機能できない(Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v. 18 p. 1021, Canard et al. PNAS 1995 v. 92 p. 10859)。ポリメラーゼがいくつかの同一NTs*を連続的に組み込める位置において、このことは誤ったシグナルをもたらす。BMBFコンソーシアムプロジェクト「複数色素およびキャピラリー電気泳動を用いた配列解析」G. Sagner, 1999の最終報告において、ヌクレオチドの3’位における修飾は、ポリメラーゼに対するそれらの基質特性を消去することが報告された。
【0033】
本方法に適したNT類縁体の開発における困難性は、以下の基本的条件に基づく:
1)ポリメラーゼが個々にNTs*を組み込むように、反応を調節しなければならない(さらなる組み込みの停止)。
2)NTs*が検出に必要とされる条件を満たす色素を有する。
3)NACFプライマー複合体もこの系の個々の構成要素も障害を受けないように、色素が穏やかな条件下切断できねばならない。
4)切断ができる限り速くかつ適量で起こらなければならない。
5)組み込みの停止が可逆的で、かつ穏やかな条件下で終わらせることができなければならない。
今までのところ、これらの問題についての実際的解決方法は、関連の文献において提唱されていない。
【0034】
従来知られている問題が、本発明により初めて解決された。本発明に従い、その塩基に立体要求基を有するNTs*を配列決定に使用する。
塩基に結合した立体要求基は更なる合成を妨げることができ、この妨害は、技術文献においては核酸の修飾における修飾NTsの望ましくない性質と見なされている。ビオチン、ジゴキシゲニン、およびフルオレセインのような蛍光色素、テトラメチルローダミンおよびCy3色素は、この種の立体要求基の例である(Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22, p. 3418, Gebeyehu et al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, p. 166, Heer et al. BioTechniques 1994 v. 16 p. 54)。
本反応に従う方法における配列決定反応では、標識NTs*をポリメラーゼおよび核酸と共にインキュベートするが、ここでNTs*はその塩基に可逆的に結合した立体要求基を有する。修飾NTs*しか含まない反応混合物を反応に使用すれば、ポリメラーゼは単一のNT*しか組み込むことができない。以降のNT*の組み込みは立体的に妨害される。それゆえこれらNTs*は合成停止剤として働く。立体要求基の除去に続き、次の相補的NT*を組み込むことができる。これらのNTs*はさらなる合成を完全には妨害せず、標識NT*をさらに一つ組み込むのを阻害するだけなので、それらは半停止剤と呼ばれる。
3’−OH停止剤法との違いは、合成に必要な3’−OH基の遮断は必要とされず、かわりに塩基に結合した基を更なる組み込みの立体障害に利用することにある。これに関し、3’−OH基はずっと遊離したままである。
【0035】
4.5.2 NT*の一般構造
その一般的特徴は、図7a、b、dに示される。
この構造は、立体基(D)および蛍光マーカー(F)がその塩基に切断可能なリンカー(A−E)を介して結合していることを特徴とする。
アデノシン(A)、グアノシン(G)、シチジン(C)およびチミジン(T)をヌクレオシド残基として有するデオキシヌクレオシド三リン酸は、NTs*の基礎となる。チミジンのかわりに、ウリジンがヌクレオシド残基として好んで使用される。イノシンをグアノシンのかわりに用いることができる。
【0036】
4.5.3 マーカー、フルオロフォア
各塩基は、それに特徴的なマーカー(F)で標識される(図7)。マーカーは蛍光を発する色素である。いくつかの因子が蛍光色素の選択に影響する。色素が以下の必要条件を満たせば、その選択は限定されない:
a)用いる検出装置が、穏やかな条件(好ましくは反応条件)のもと、このマーカーをDNAに結合した単独の分子として同定できなければならない。色素は、かなりの光安定性を有していることが好ましい。それらの蛍光は、DNAによって消されることがないか、またはあってもほんのわずかあることが好ましい。
b)NTに結合する色素は、酵素反応のいかなる非可逆的妨害も引き起こしてはならない。
c)色素で標識されたNTs*が、ポリメラーゼによって核酸鎖に組み込まれなければならない。
d)様々な色素による標識の場合、これら色素の発光スペクトルが大幅には重複していない。
【0037】
本発明に関し使用できる蛍光色素は、構造式とともに、”Handbook of Fluorescent Probes and Research Chemicals” 6th ed. 1996, R. Haugland, Molecular Probesに挙げられている。本発明に従い、以下の色素類がマーカーとして好んで使用される:シアニン色素およびそれらの誘導体 (例えば、Cy2、Cy3、Cy5、CY7、Amersham Pharmacia Biotech, Waggoner US Patent 5.268.486)、ローダミンおよびそれらの誘導体(例えばTAMRA,TRITC,RG6、R110、ROX、Molecular Probes、ハンドブック参照)、キサンチン誘導体(例えばAlexa568、Alexa594、Molecular Probes, Mao et al. US Patent 6.130.101)。これらの色素は市販されている。
スペクトルの性質および利用可能な装置に依存して、これに関し対応する色素が選択できる。色素は、例えばチオシアネートまたはエステル結合を介して、リンカーに結合する(”Handbook of Fluorescent Probes and Research Chemicals” 6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. 278 p. 363, Waggoner Methods in Enzymology 1995 v. 246 p. 362)実施例1および2参照。
【0038】
4.5.4 立体要求基の性質
基(D)(図7a、b、d)は、ポリメラーゼによるさらなる標識相補的NTの組み込みの妨害を意味する。ビオチン、ジゴキシゲニンおよび蛍光色素が、この種の立体要求基の例にあたる(Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22, p. 3418, Gebeyehu et al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, p. 166, Heer et al. BioTechniques 1994 v. 16, p. 54)。この基の化学構造は、それが結合する標識NT*の組み込みをそれほど妨げず、かつ酵素反応を非可逆的に妨害しないならば、限定されない。
この基はリンカー中で独立の部分として存在してもよく(7a)、または色素(7b)または切断可能基(7d)と同一であってもよい。リンカー切断の結果、ポリメラーゼがさらに標識NT*を組み込めるように、シグナルの検出に続いてこの立体要求基(D)が除去される。7dに示される構造の場合、立体基は切断により除去される。
好ましい態様においては、標識ヌクレオチドが図7b、k、lに記載される構造を示すように、蛍光色素がこの種の立体要求基の機能を果たす。
別の好ましい態様においては、感光切断可能基が、この種の立体要求基の機能を果たす(図7d)。
【0039】
4.5.5 リンカー
マーカー(蛍光色素)は、リンカーと呼ばれる様々な長さのスペーサーブロックを介して塩基に結合することが好ましい。リンカーの例は、図7e、f、h、i、j、k、l、m、に示される。このリンカーは、塩基対合に関与しない塩基上の位置の一つに結合することが好ましい。より好ましくは、リンカーの結合する位置は、ピリミジン環の5位およびプリン環の7位または8位である。塩基に対するリンカー結合の例は以下の出典より得られる(Hobbs et al. US Patent 5.047.519, Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 1996 v. 274, p. 403, Zhu et al. NAR 1994 v. 22 p. 3418, Herman et al. Methods in Enzymology 1990 v. 184 p. 584, J.L. Ruth et al. Molecular Pharmacology 1981 v. 20 p. 415, L. Otvos et al. v. 15 p. 1763, G.E. Wright et al. Pharmac Ther. 1990 v. 47, p. 447 ”Nucleotide Analogs; Synthesis and Biological Function” K.H. Scheit 1980, Wiley-Interscience Publication, ”Nucleic acid chemistry” Ed. L.B. Townsend, v. 1-4, Wiley-Interscience Publication, ”Chemistry of Nucleosides and Nucleotides” Ed. L.B. Townsend, v. 1-3, Plenum Press)。
リンカーの全長は様々であってよい。それは、A、C、Eの部分における炭素原子数に対応し(図7a、b、d、)、好ましくは3から20の間である。最適には4から10の間である。リンカー(図7a、b、dのA、C、E部分)の化学組成は、それが反応条件下で安定であり酵素反応を妨害しないかぎり、限定されない。
【0040】
4.5.6 切断可能化合物、切断
リンカーは、切断可能化合物または切断可能基を有する(図7a、b、dの(B)部分および、図7k、lの(C)部分)。この切断化合物は、各サイクルの終わりにマーカーおよび立体障害を除去することを可能にする。その選択は、それが酵素的配列決定反応の条件下で安定であり、ポリメラーゼを非可逆的に妨害せず、かつ穏やかな条件下で切断除去できる限り、限定されない。「穏やかな条件」とは、NACFプライマー複合体を破壊しないような条件を意味すると解されるべきであり、例えば、好ましくはpH3から11の間、温度0℃から温度値(x)の間である。この温度値(x)は、NACFプライマー複合体のTmに依存し(Tmはその「融点」である)、例えばTm(NACFプライマー複合体)マイナス5℃として計算される(例えばTmが47℃ならば最高温度は42℃である;これらの条件下、エステル、チオエステル、ジスルフィド化合物、および感光化合物が、切断可能化合物として適している)。
【0041】
該化合物は、化学的または酵素的に切断可能な化合物か、または感光化合物に属することが好ましい。化学的切断可能基の例としては、エステル、チオエステル、およびジスルフィド化合物が好ましい(図7k、l)(”Chemistry of protein conjugation and crosslinking” Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v. 184 p. 584, Lomant et al. J. Mol. Biol. 1976 v. 104 243, ”Chemistry of carboxylic acid and esters” S. Patai 1969 Interscience Publ.)。感光化合物(図7m)の例は、文献中以下の所に見ることができる:”Protective groups in organic synthesis” 1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 p. 1, V. Pillai Org. Photochem. 1987 v. 9 p. 225、学術論文”Neue photolabile Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese” H. Giegrich, 1996, Konstanz、学術論文”Neue photolabile Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese” S.M. Buhler, 1999, Konstanz)。
リンカー中の切断可能化合物/基の位置は、塩基から10原子以上離れていないことが好ましいが、塩基から3原子以上でないことがより好ましい。特に好ましいのは、塩基上に直接存在する切断可能化合物または基である。
【0042】
切断および除去ステップは全てのサイクルに存在し、かつ核酸が障害または改変されないように穏やかな条件下(上記参照)で進行しなければならない。
切断は、化学的に(例えばエステル化合物については弱酸または弱アルカリ環境において、またはジスルフィド化合物の切断に関しては、例えばジチオスレイトールまたはメルカプトエタノール(Sigma)のような還元剤を添加して)(実施例1参照)、または物理的に(例えば感光基の切断に特異的な波長の光を表面に照射して;学術論文”Neue photolabile Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese” H. Giegrich, 1996, Konstanz)進行することが好ましい。
切断に続き、リンカーラジカル(A)が塩基上に残る(図7c)。切断後遊離したリンカーラジカル上のメルカプト基がさらなる反応を妨げるならば、既知の方法(例えばジスルフィドまたはヨウ素酢酸化合物)によってそれを化学的に修飾できる。
切断可能リンカーの合成は、実施例により説明する(実施例1および2参照)。
【0043】
4.5.7 ポリメラーゼおよびNT*の組み合わせ
全体的にみると、マーカーの大きさ、電荷、および化学構造、切断可能リンカーおよびリンカー残基、およびポリメラーゼの選択もまた重要な役割を果たす。それらは一緒になて、ポリメラーゼにより標識NT*が伸長中の核酸鎖に組み込まれるか、および、次の標識NT*の組み込みがそれにより障害されるか、を決定する。これに関し二つの条件を特に考慮しなければならない:
一方では、リンカーの切断後、組み込まれた修飾NT*によりポリメラーゼがさらに核酸鎖を伸長できるかが重要である。それゆえ、切断後にリンカー残基「A」(図7c)が更なる合成をそれほど妨害しないことが重要である。他方、組み込まれた非切断NTs*は妨害を示さなければならない。反応に適した多くのNTs*が合成できる。特に、配列決定のための特定のNT*型の適性を試験する一連の予備試験は、ポリメラーゼとNTs*の全ての組み合わせについて行うべきである。
【0044】
緩衝液条件は、ポリメラーゼ製造者から得られる情報に従い選択する。反応温度は、非熱安定性ポリメラーゼについて、製造者から得られる情報に従い選択する(例えばSequenase Version 2については37℃);熱安定性ポリメラーゼ(例えばTaqポリメラーゼ)については、反応温度は高くても温度値(x)である。この温度値(x)はNACFプライマー複合体のTmに依存し、例えばTm(NACFプライマー複合体)マイナス5℃として計算される(例えばTmが47℃ならば最大反応温度は42℃である)。これらの緩衝液条件および反応温度は、以下に「最適緩衝液および温度条件」として示される。
反応時間(サイクル中の組み込みステップの持続時間に相当する)は、1時間未満であることが好ましい;理想的には、反応時間は10秒から10分の間である。
以下の組み合わせが、NT*とポリメラーゼの適した組み合わせの例として挙げられる。
a)短いリンカー残基を有するNT*(合成、実施例2参照、図7e、h、i):nTP-SS-TRITC (L7)、dNTP-SS-Cy3 (L11)(Sequenase Version 2、クレノーフラグメント大腸菌DNAポリメラーゼI、Taqポリメラーゼ(GibcoBRL)との組み合わせ)。
b)長いリンカー残基を有するNT*(合成、実施例1参照、図7f、g、j):dNTP-SS-TRITC (L14)(sequenase version 2 または、クレノーフラグメント大腸菌DNAポリメラーゼI、またはProHATM ポリメラーゼ (Eurogentech)との組み合わせ)。
【0045】
ある試験系によって塩基(A)におけるリンカー残基の反応に対する適性を調べるが、ここでは切断されたNTs*が核酸鎖に連続的に組み込まれる。例えば、切断された所望のリンカー残基を有するdUTP*、マトリックスとしてポリ-dA、オリゴdT20プライマー、所望のポリメラーゼを使用し、それぞれのポリメラーゼに適した最適緩衝液および温度条件のもと、反応を行う。NT*濃度は、5μmol/lおよび200μmol/lの間であることが好ましい。反応後、核酸鎖に組み込まれたNT*の数を、例えばゲル中で長さに基づいて分離することによって解析する。リンカー残基の適性の結論としては、以下の情報が使用できる:ポリメラーゼが20NT*より多く組み込めるならば、このリンカー残基は配列決定反応に適している。切断されたNT*が20より少なくしか組み込まれない場合、このNT*とポリメラーゼの組み合わせは配列決定反応に最適ではない。
【0046】
適したリンカーラジカルを定めたら、未切断標識NTs*が半停止剤として機能するかについて、別の試験系において調べる。これは、反応に適した最適緩衝液および温度条件のもと、標識NTs*をポリメラーゼおよびマトリックスとともにインキュベートして調べる。NT*濃度は、5μmol/lおよび200μmol/lの間であることが好ましい。マトリックスは、連続していくつかのNT*が組み込まれることが期待できるように選択すべきであり、例えば前述の例にあるように、dUTP*の場合ポリ-dAが使用できる。理想的には、ポリメラーゼはNT*を一つしか組み込まない。
【0047】
所定の最適緩衝液および温度条件のもと、ポリメラーゼによっていくつかのNT*が連続的に組み込まれるならば、反応パラメーター(例えばNT*濃度、反応濃度)を変えて、それぞれのNT*とポリメラーゼの組み合わせに合わせることができる。これに関し最も重要なことは、特定時間内に(好ましくは10秒から10分の間)、ポリメラーゼが二番目のNT*を組み込まないことである。
本発明に従い、ある態様におけるこの適合は、他の反応パラメーターを一定に保ったまま反応温度を変更することによって行う。
【0048】
これらの実験におけるNT*濃度は、通常5μmol/lおよび200μmol/lの間であり、好ましくは10μmol/lおよび100μmol/lの間である。ポリメラーゼの濃度および緩衝液条件は製造者の教授に従い選択する。反応所要時間は様々であってよく、好ましくは、10秒から10分の間であり、これは1サイクル中の組み込みステップ(a)の所要時間に相当する。例えばSequenase Version 2(Amersham Pharmacia Biotech)、DNAポリメラーゼIのエキソヌクレアーゼフリークレノーフラグメント(Amersham Pharmacia Biotech)のような非熱安定性ポリメラーゼの場合、常套的な37℃から20−30℃まで反応温度を下げる。例えばTaqポリメラーゼ(GibcoBRL)、ProHATMポリメラーゼ(Eurogentech)のような熱安定性ポリメラーゼの場合、常套的な70−75℃から、好ましくは30℃から温度値(x)の間まで反応温度を下げる。この温度値(x)は、NACFプライマー複合体のTmに依存し、Tm(NACFプライマー複合体)マイナス5℃として計算される(例えばTmが47℃ならば温度値(x)は42℃である。
【0049】
本発明の別の好ましい態様においては、他の反応パラメーター(緩衝液条件、温度条件)を一定に保ったまま、NT*濃度を5μmol/l未満まで下げて、反応条件を適合させる。この適合の場合、NT*濃度は、0.5μmol/lから5μmol/lの間であることが好ましい。反応の所要時間は10秒から10分の間である。NT*濃度の選択において最も重要なことは、ポリメラーゼが特定時間内に(好ましくは10秒から10分の間)二番目のNT*を組み込まないことである。
個々のNT*の組み込みについての反応条件の最適化に続き、反応は、切断されたNTs*と繰り返されなければならない。ポリメラーゼは、それに応じて変更された反応パラメーターのもと、切断されたNTs*を連続的に組み込めなければならない。
最適化反応は、サイクル中の組み込みステップ、ステップ(b)に相当する。最適反応のため決められる条件、温度、NT*濃度、緩衝液条件、反応所要時間は、表面における反応のために選択する。
これらの反応条件下、1サイクルで配列決定反応に関与するNACFプライマー複合体の50%、好ましくは90%よりも多くに標識NT*が組み込まれるように、NACFプライマー複合体におけるNTs*の組み込みを行うことが好ましい。
これは、反応が多くの核酸鎖において非常にゆっくりと進行する事実と関連する。各サイクルにおいて各相補的位置にNTs*を組み込こもうとするが、成功した組み込み反応のみが検出され評価されるので必要ではない;次のサイクルにおける遅れた反応は配列決定の誤りはもたらさない。
同じポリメラーゼが全てのNTs*に使用されることが好ましい。しかしながら、相異なるNTs*に相異なるポリメラーゼもまた使用できる。
【0050】
4.5.8 カラーコーディングの仕組み、色素の数
1サイクルは、
a)相異なるよう標識された4つのNTs*、
b)相異なるよう標識された2つのNTs*、
c)1つの標識NT*、
b)相異なるよう標識された2つのNTs*および二つの非標識NTs、
により行うことができ、即ち、
a)4つのNTsすべてを相異なる色素で標識でき、反応において4つすべてを同時に使用できる。この場合、最低限のサイクル数で核酸鎖の配列決定が達成できる。しかしながら、本発明のこの変法は検出系に多大な要求を与える:4つの相異なる色素が各サイクルにおいて同定されなければならない
b)検出を単純化するため、二つの色素で標識することが選択できる。ここでは、相異なるよう標識された二組のNTs*を形成するが、例えばAおよびGが標識「X」を有し、CおよびUが標識「Y」を有するようにである。サイクル(n)の反応中、相異なるよう標識された2つのNTs*、例えばA*と組み合わせてC*、を同時に使用し、そしてその後U*およびG*を次のサイクル(n+1)に添加する。
c)さらに、4つすべてのNTs*を標識するのに単一の色素のみ使用し、各サイクルにつき1つのNT*だけを使用できる。
d)技術的に単純化された態様においては、各サイクルにつき相異なるよう標識された2つのNTs*と2つの非標識NTs(2NTs*/NTs法と呼ばれる)を使用する。この態様は、既知の配列の変異体(例えば変異または選択的スプライシングを受けた遺伝子)を決定するのに使用できる。
【0051】
4.6 検出装置
表面上の個々の分子は、様々な方法によって調べられる。いくつかの方法が知られている:例えば、AtomForce顕微鏡、電子顕微鏡、近磁界蛍光顕微鏡、広視野蛍光顕微鏡、TIR顕微鏡、などである(Science 1999 v. 283 1667, Unger et al. BioTechniques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. 92 p. 161, Dickson et al. Science 1996 v. 274 p. 966, Xie et al. Science 1994 v. 265 p. 361, Nie et al. Science 1994 v. 266 p. 1018, Betzig et al. Science 1993 v. 262 p. 1422)。
本発明に従い、核酸鎖に組み込まれた個々のNTs*の蛍光シグナルは、広視野蛍光顕微鏡(エピフルオレッセンス)またはレーザー走査顕微鏡(エピフルオレッセンス)またはTIRF顕微鏡(全反射蛍光顕微鏡)によることが、好ましい。
【0052】
このような装置構築の種々の変形が可能である(Weston et al. J. Chem. Phys. 1998 v. 109 p. 7474, Trabesinger et al. Anal. Chem. 1999 v. 71 p. 279, Adachi et al. Journal of Microscopy 1999 v. 195 p. 125, Unger et al. BioTechniques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. 92 p. 161, Dickson et al. Science 1996 v. 274 p. 966, Tokunaga et al. Bichem. Biophys. Res. Com. 1997 v. 235 p. 47, ”Confocal Laser Scanning Microscopy” 1997 Ed. Sheppard, BIOS Scientific Publishers, ”New Techniques of optical microscopy and microspectroscopy” 1991 Ed. R. Cherry CRC Press, Inc., ”Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, ”Handbook of biological confocal microscopy” 1995 J Pawley Plenum Press)。それらの具体的構造における違いは、それらの構成要素が変化に富むことにから生じる。励起光のための機器は、例えばレーザー、ランプ、またはダイオードに基づいて機能しうる。CCDカメラとPMTの両者が検出機器として働き得る。技術的詳説の他の例については、以下参照(”Confocal Laser Scanning Microscopy” 1997 Ed. Sheppard, BIOS Scientific Publishers, ”New Techniques of optical microscopy and microspectroscopy” 1991 Ed. R. Cherry CRC Press, Inc., ”Fluorescence microscopy” 1998 2 ed. Herman BIOS Scientific Publishers, ”Handbook of biological confocal microscopy” 1995 J. Pawley Plenum Press)。全ての可能な検出機器の技術的変形を挙げることが、本発明の目的ではない。適した装置の図式的構造は、図式、図8において説明する。それは以下の要素を含む:
蛍光を励起するための光源(1)、
光誘導部分(2)、
走査台(3)、
スペクトルを選択する装置(4)、
検出機器(5)、
制御および解析機能を有するコンピューター(6)。
これらの装置の要素は市販されている(顕微鏡会社: Zeiss, Leica, Nikon. Olympus)。
【0053】
以下は、個々の分子の検出に適したこれら要素の組み合わせを提案することを意図している:
水銀蒸気ランプを有する広視野蛍光顕微鏡 Axioplan 2 (Zeiss)、
Plan-neofluar 100x レンズ, NA 1.4 (Zeiss)、
Photometrix or AxioCam カメラ (Zeiss)、
制御および解析用ソフトウェアを伴うコンピューター。
【0054】
以下は、検出手順を説明すること意図している。これに関しては、蛍光顕微鏡の一般的規則に従うべきである(”Confocal Laser Scanning Microscopy” 1997 Ed. Sheppard, BIOS Scientific Publishers, ”New Techniques of optical microscopy and microspectroscopy” 1991 Ed. R. Cherry CRC Press, Inc., ”Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, ”Handbook of biological confocal microscopy” 1995 J Pawley Plenum Press)。
検出は以下の相を含む:
1)検出のための調製
2)各サイクルにおける検出ステップの実行(各検出ステップは走査工程として行われ、以下の操作を含む):
a)レンズ位置の調節(X、Y軸)
b)焦点面の調節(Z軸)
c)個々の分子のシグナルの検出、NT*に対するシグナルの割り当て、およびそれぞれのNACFに対するシグナルの割り当て。
d)表面上の次の位置への移動
NACFsに組み込まれたNTs*のシグナルは、表面を走査して記録する。走査工程は様々な方法で行える(”Confocal Laser Scanning Microscopy” 1997 Ed. Sheppard, BIOS Scientific Publishers, ”New Techniques of optical microscopy and microspectroscopy” 1991 Ed. R. Cherry CRC Press, Inc., ”Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, ”Handbook of biological confocal microscopy” 1995 J. Pawley Plenum Press)。例えば、不連続走査工程を選択したら、各表面位置の2次元画像(2D画像)を形成するように、レンズが表面上を段階的に移動する(図8a)、(図8b、c);試験的セットアップについては実施例6参照。
2D画像は様々な方法、例えば顕微鏡視野の位置を走査するレーザー(レーザー走査顕微鏡)、またはある位置におけるカメラショットにより生み出すことができる(顕微鏡ハンドブック参照)。例として、CCDカメラによる個々の分子の検出を記載する。
【0055】
検出は、長さ1MbのDNA断片の配列決定の例に基づいて概説する。
1)検出のための調製:
はじめに、本来の配列を再構築するのにいくつのNACF配列を解析すべきかを定める。ショットガン法による再構築の場合(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al, Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257)、以下の因子が関与する:1)各NACFのうち、約300−500NTsの配列が、配列決定中に決定される。2)解析しようとする配列の全長が重要である。3)配列決定の間、精度を上げ、誤りを正すため、ある種の冗長性測定を行わなければならない。概して、本来の配列のほとんどは、再構築するのにおよそ10から100倍量の原配列が必要であり、すなわち、1Mbについてのこの例では、10から100Mbの原配列データが使用される。従って、各NACFにつき平均配列長400bpの場合、25,000から250,000のDNA断片が必要である。
2)各サイクルにおける検出ステップの実行
配列決定のため、NACFsの位置は、シグナルを割り当てるための基盤が存在するように決定しなければならない。これらの位置について知ることにより、個々の分子のシグナルが、組み込まれたNTs*に由来するか、または表面にランダムに結合したNTs*に由来するかを定めることが可能になる。これらの位置は様々な方法により同定できる。
【0056】
好ましい態様においては、結合NACFプライマー複合体の位置は、配列決定の間に同定される。核酸鎖に組み込まれたNTs*からのシグナルは常に同じ座標を有するという事実をこれに利用する。これは、核酸鎖を固定することにより保証される。非特異的に結合したNTs*は、表面の様々な位置にランダムに結合している。
固定NACFsの位置を同定するため、いくつかの連続するサイクルから得られるそれらの座標の一致について、シグナルを調べる。これは、例えば配列決定の始めに行える。一致する座標を評価し、そのDNA断片の座標として保存する。
走査系は、複数のサイクルにわたり再現可能な方法で表面を走査できなければならない。各表面位置に定まっているX、Y、およびZ軸をコンピューターで調べられる。各走査工程におけるレンズ位置の調節の安定性および再現性は、検出の質、つまり個々の分子のシグナルの同一性を決定する。
【0057】
a)レンズ位置の調節(X、Y軸)
市販の走査台が機械的に不安定なこと、および同じX、Y位置の反復調節の再現性のレベルが低いことが、数サイクルにわたり個々の分子のシグナルを正確に解析することを難しくする。反復調節の場合に座標の整合性を改良する方法、または起こり得る不適合を監視する方法、は多く存在する。ある監視オプションを例として挙げる。レンズ位置を大まかに機械的に調節した後、表面にしっかりと結合したパターンの対照画像を形成する。機械的調節が正確に同じ座標を示さない場合でも(最大10μmまでの逸脱がよく起こり得る)、光学検査により訂正できる。パターンの対照画像は、組み込まれたNTs*からのシグナルによる画像にとって座標系として機能する。このような訂正に必要なのは、これら二つの画像間でそれ以上表面を動かさないことである。そのパターン位置におけるX、Y偏差が、個々の分子のシグナル位置におけるX、Y偏差と同じになるように、個々の分子からのシグナルをそのパターンに対して位置づける。パターンの対照画像は、個々の分子の検出の前、間、または後に形成できる。この種の対象画像は、新しい表面位置におけるいずれの調節に対しても形成しなければならない。
【0058】
b)焦点面の調節(Z軸)
表面は完全には平面でなく、様々な窪みを示す。従って、表面-レンズ距離は、周辺の位置が走査されているときは変化する。これらの距離の違いから、個々の分子が焦点面から離れ、従って解析されにくくなる。
このため、表面を走査するときは、全てのレンズ位置において焦点面の調節が再現可能であることが重要である。
焦点面を再現性よく調節するには、様々な方法がある。例えば、以下の方法が使用できる:個々の分子の励起がそれらの蛍光の励起をもたらすので、焦点面の調節に役立つマーカーをその表面に加える。その後個々の分子のシグナルの検出を続ける。マーカーはいずれの性質のもの(例えば色素またはパターン)であってもよいが、検出および反応を障害してはならない。
【0059】
c)個々の分子の検出、NT*に対するシグナルの割り当て、およびそれぞれのNACFに対するシグナルの割り当て。
検出系により生み出された反応表面の二次元画像は、NACFsに組み込まれたNTs*のシグナル情報を含む。さらに処理する前に、画像情報のデータ全体から適した方法によりこれらを抽出しなければならない。画像情報の計量、変換、およびフィルタリングに必要なアルゴリズムは、デジタル画像処理およびパターン認識の標準的レパートリーの一部である(Haberacker P. ”Praxis der Digitalen Bildverarbeiting und Mustererkennung”. Hanser-Verlag, Munich, Vienna, 1995; Galbiati L.J. ”Machine vision and digital image processing fundamentals”. Prentice Hall, Englewood Cliffs, New Jersey, 1990)。シグナル抽出は、それぞれの蛍光チャンネルに対する反応表面の明度分布を描くグレースケール画像値により行うことが好ましい。相異なる蛍光色素を有する複数のヌクレオチドを配列決定反応に使用する場合、始めに使用した各蛍光標識ヌクレオチド(A、T、C、GまたはU)について別個のグレースケール値画像を形成できる。原則として、これには二つの方法が使用できる:
1、適したフィルター(Zeiss フィルターセット)を用いて、各蛍光チャンネルに対してグレースケール値画像を生成する。
2、画像処理プログラムを用いる適したアルゴリズムにより、記録されたマルチチャンネルカラー画像から適切なカラーチャンネルを抽出し、それぞれの場合においてグレースケール値画像として個々にさらに処理する。これに関し、チャンネル抽出のため、問題のチャンネルに特異的なカラー閾値アルゴリズムを用いる。このように、はじめにマルチチャンネルカラー画像から、1からNの個々のグレースケール値画像が形成される。これらの画像は以下のように規定される:
GBN = (s (x,y)) 単一チャンネルグレースケール値画像
N = {1, ... 蛍光チャンネルの数}。
M = {0, 1, ... , 255} グレースケール値の量
S = (s (x, y)) グレースケール値画像の画像マトリックス
X = 0, 1, ... , L-1 画像ライン
Y = 0, 1, ... , R-1 画像カラム
(x, y) 画像点の空間座標
s (x, y)εM 画像点のグレースケール値。
【0060】
次に、適したプログラムを用いて適切な画像情報をこの多量のデータから抽出する。このようなプログラムは、以下のステップを行うべきである:
GB1からGBNのため以下を行う:
I.画像の前処理、例えば、適すれば、画像情報のデジタル化の結果生じる画像ノイズの減少(例えばグレースケール値補整による)。
II.各画像点(x、y)が、それを取り囲む直接点およびより離れた近接点とともに、蛍光点の性質を満たすかを定めるための、そのグレースケール値画像の各画像点のの試験。これらの性質は、とりわけ使用する検出装置およびグレースケール値画像の解像度に依存する。それらは、例えば画像点を取り囲むマトリックス上の明度値の典型的分布パターンを示すであろう。これに使用可能な画像分割法は、単純閾値法から普通のネットワークの使用までにわたる。
画像点(x、y)が、これらの要求を満たす場合、事前に行った配列決定サイクルにおいて同定したNACFsの座標軸との比較を次に行う。適合する場合、それぞれの蛍光チャンネルから生じるヌクレオチドについてのシグナルをこのNACFに割り当てる。不適合座標を有するシグナルを評価し、バックグラウンドシグナルとして却下する。シグナルの解析は走査工程と並行して行える。
【0061】
典型的な態様においては、1317x1035ピクセルの解像度の8-ビットグレースケール値画像を用いた。デジタル化により生じる画像における変化を減らすため、画像全体の前処理をはじめに行った:各画像点にその近隣の8つの明度の平均を割り当てた。それにより選択した解像度で、最も強い明度値を有し、かつ明度を有する近隣の画像点がすべての側に向かって減少している中心画像点のパターンを形成するが、そのパターンは蛍光点の特色を示すものである。画像点がこれらの指標を満たし、かつ明度における遠心性落下が特定の閾値を上回った場合(弱い蛍光点を排除するため)、この中心画像点を蛍光点の座標として評価した。
d)表面上の次の位置へのレンズの移動。個々の分子のシグナルの検出に続き、表面上の別の位置の上にレンズを位置させる。
全体として、連続した画像は、例えばX、Y位置の監視、焦点面の調節、および新しい各レンズ位置での分子の検出により形成できる。これらのステップはコンピューターにより制御できる。
【0062】
工程ステップの時間的順序
走査工程および生化学的反応は一定の時間がかかる。これらの工程を連続して行えば、装置の最適な動作が達成できる。好ましい態様においては、二つの別個の表面において反応を行う(図9)。例として、反応が2つの部分でお互い独立して進行できるように、結合NACFプライマー複合体を有する表面を空間的に分離された2つの部分に分けることができる。別の例では、最初からNACFsを2つの別個の表面に固定化することもできる。
その後、反応を開始する。その背後にある原理は、反応および洗浄ステップが表面の一部分で進行する間、二番目の部分が走査されるというものである。このように、絶え間ない連続した解析が達成でき、配列決定率が増加する。
反応が進行する表面の数は、2よりも多くてもよい。これは、反応が時間的律速段階として起こる場合、すなわち表面上のシグナルの検出が反応および洗浄ステップより速く進行する場合に、適切と思われる。反応の全所要時間を検出時間に適合するため、反応における個々の各ステップは、次の表面と比較して時間的に遅らして一方の表面上で進行できる。
【0063】
以下、本発明を実施例により説明する:
【実施例】
【0064】
実施例1
長い切断可能なリンカーをもつ修飾dUTP(図7f-1)。出発物質として、5-(3-アミノアリル)-2'-デオキシウリジン-5'-トリホスフェート、AA-dUTP(Sigma)、3,3'-ジチオ-ビス(プロピオン酸N-ヒドロキシスクシンイミドエステル)、DTBP-NHS(Sigma)、2-メルカプロエチルアミン, MEA(Sigma)を用いる。DMF(25μlの0.4mol/l溶液)中の3当量のDTBP-NHSを100mmol/l ホウ酸塩緩衝液(pH8.5)中の50 mmol/l AA-dUTP溶液100μlに加える。反応混合物を室温にて4時間インキュベートする。次いで、反応溶液中のCH3COONH4の総濃度が100 mmol/lになるまで濃酢酸アンモニウム溶液(pH9)を加え、反応物をさらにインキュベートする。次いで、1mol/l MEA溶液(pH 9)200μlを加え、室温にて1時間インキュベートする。次いで、この混合物に、0.3mol/l KI溶液中のI2の飽和溶液を、ヨウ素色が残るまで滴下する。DEAEセルロースカラムにて、炭酸アンモニウム勾配(pH8.5)により、修飾ヌクレオチドを他の反応生成物から分離する。RP-HPLCにて、切断可能なリンカーをもつヌクレオチドの単離を行う。種々の方法によって、このリンカーに色素を結合させることができる(”Handbook of Fluorescent Probes and Research Chemicals” 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, p. 362, Jamesonら、Method in Enzymology 1997, v. 278, p. 363)。
【0065】
他のヌクレオチド類縁体(たとえば、Hobbsら、US Patent 5,047,519、Khanら、US Patent 5,821,356など)も、図7f-2、3、4および7g-1、2に示す構造をもつヌクレオチド類縁体を製造することができる反応に用いることができる。
TRITC(テトラメチルローダミンイソチオシアネート)の結合を、色素のリンカーへの結合の例として示す(NT*構造、図7j)。
切断可能なリンカーで修飾されたdNTP(300nmol)を30μlの100mmol/l ホウ酸ナトリウム緩衝液(pH9)(10mmol/l NT*)に溶解する。このために、10μlの10mmol/l TRITCをジメチルホルムアミド(DMF)に加え、室温にて4時間インキュベートする。色素で修飾されたNT*の精製は、メタノール−水勾配を用いてRP-HPLCにて行なう。
このように製造されたNT*は、本発明方法が成功するのに必要な、DNA鎖における組み込み、蛍光のプルーフおよび組み込み後の連鎖停止ならびに阻害の終結のための要求を満たしている。
修飾NT*におけるジスルフィド化合物の切断の例。切断は、反応表面に20〜50mmol/l ジチオスレイトール溶液(DTT)またはメルカプトエタノール溶液(Sigma)(pH8)を添加することによって行なわれる。該表面をこの溶液とともに10分間インキュベートする;次いで、溶液を除去し、表面を緩衝液で洗浄してDTTまたはメルカプトエタノール残渣を除去する。
【0066】
実施例2
短い切断可能なリンカーをもつ修飾dUTP(dUTP-SS-CH2CH2NH2)(図7e-1)。出発物質として、Hanna(Enzymology 1989、v. 180、p. 383に記載の方法)にしたがって合成されたビス-dUTP、2-メルカプトエチルアミン(MEA)(Sigma)を用いる。
H2O中の100μlの100mmol/l MEA溶液(pH8.5)を40mmol/l ホウ酸塩緩衝液(pH8.5)中の400μlの100mmol/l ビス-dUTPに加え、室温にて1時間インキュベートする。次いで、この混合物に、0.3mol/l KI溶液中のI2の飽和溶液を、ヨウ素色が残るまで滴下する。たとえば、エタノール沈殿または炭酸アンモニウム勾配(pH8.5)を用いるDEAEセルロースカラムによって、ヌクレオチド(ビス-dUTPおよびdUTP-SS-CH2CH2NH2)を他の反応生成物から分離することができる。ビス-dUTPは、次に起こるリンカーのアミノ基への色素の結合において妨害効果をもたないので、ビス-dUTPからのdUTP-SS-CH2CH2NH2の分離を最終精製ステップで行うことができる。
同様に、dCTP(図7e-2)をビス-dCTPを出発物質として用いて修飾することができる(Hannaら、Nucleic Acid Research 1993、v. 21、p. 2073にしたがって合成)。
種々の方法によって、このリンカーに色素を結合させることができる(”Handbook of Fluorescent Probes and Research Chemicals” 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, p. 362, Jamesonら、Method in Enzymology 1997, v. 278, p. 363)。
【0067】
FluoroLinkTM Cy3 単官能性色素(Amersham Pharmacia biotech)(NT*構造、図7i)の結合を、色素のリンカーへの結合の例として示す。これは、単官能性NHSエステル蛍光色素である。反応は、使用説明書にしたがって行う:
切断可能なリンカーで修飾されたdNTP(300nmol)を300μlの100mmol/l ホウ酸ナトリウム緩衝液(pH8.5)に溶解する。このために、色素(300nmol)を加え、室温にて1時間インキュベートする。色素で修飾されたNT*の精製は、メタノール−水勾配を用いてRP-HPLCにて行なう。
TRITC(テトラメチルローダミン-5-イソチオシアネート、Molecular Probes)の結合を、色素のリンカーへの結合のさらなる例として示す(dUTP-SS-TRITC、図7h)。
【0068】
切断可能なリンカーで修飾されたdNTP(300nmol)を30μlの100mmol/l ホウ酸ナトリウム緩衝液(pH9)(10mmol/l NT*)に溶解する。このために、10μlの10mmol/l TRITCをジメチルホルムアミド(DMF)に加え、室温にて4時間インキュベートする。色素で修飾されたNT*の精製は、メタノール−水勾配を用いてRP-HPLCにて行なう。
このように製造されたNT*は、本発明方法が成功するのに必要な、DNA鎖における組み込み、蛍光のプルーフおよび組み込み後の連鎖停止ならびに阻害の終結のための要求を満たしている。
修飾NT*におけるジスルフィド化合物の切断の例。切断は、反応表面に20〜50mmol/l ジチオスレイトール溶液(DTT)またはメルカプトエタノール溶液(Sigma)(pH8)を添加することによって行なわれる。該表面をこの溶液とともに10分間インキュベートする;次いで、溶液を除去し、表面を緩衝液で洗浄してDTTまたはメルカプトエタノール残渣を除去する。
たとえば、図7k、7l、7mに示すように、さらに、NT*は、実施例1および2に記載したNT類縁体に対する同様な方法で合成することができ、本発明方法に用いることができる。個々の合成ステップについては、たとえば、J.L. Ruthら、Molecular Pharmacology 1981 v. 20 p. 415、L. Otvosら、NAR 1987 v. 15 p. 1763、G.E. Wrightら、Pharmac Ther. 1990 v. 47、p. 447 ”Nucleotide Analogs; Synthesis and Biological Function” K.H. Scheit 1980、Wiley-Interscience Publication、”Nucleic acid chemistry” Ed. L.B. Townsend、v. 1-4、Wiley-Interscience Publication、”Chemistry of Nucleosides and Nucleotides” Ed. L.B. Townsend、v. 1-3、Plenum Pressを参照のこと。
【0069】
実施例3
4つの標識NT*に関する配列解析
本発明の好ましい実施態様においては、反応に用いるすべての4つのNT*を蛍光色素で標識する。
【0070】
3A.ショットガン原理にしたがった本来の配列の再構築(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adamsら、Academic Press、Huangら、Genom Res. 1999 v. 9 p. 868、Huang Genomics 1996 v. 33 p. 21、Bonfieldら、NAR 1995 v. 23 p. 4992、Millerら、J. Comput. Biol. 1994 v. 1 p. 257)。(この原理は、新しい、未知の配列の解析に特に適している。)
【0071】
3A−1.DNAの長い片の配列決定(図1)
長い核酸鎖の配列決定は、1Mbの長片DNAの配列決定を用いて、図式的に記載されるべきである(図1)。配列決定は、ショットガン原理に基づく(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adamsら、Academic Press、Huangら、Genom Res. 1999 v. 9 p. 868、Huang Genomics 1996 v. 33 p. 21、Bonfieldら、NAR 1995 v. 23 p. 4992、Millerら、J. Comput. Biol. 1994 v. 1 p. 257)。好ましくは50〜1000bp長さの断片に分断することによって、配列決定反応のための解析材料を調製する。次いで、各断片にプライマー結合部位およびプライマーを与える。このDNA断片の混合物を平面的表面に固体する。洗浄ステップによって非結合DNA断片を除去する。次いで、完全な反応表面上で配列決定反応を行う。1Mbの長いDNA配列を再構築するために、NACFの配列は、300NTよりも長くあるべきであり、平均約400bpである。1つの標識NT*のみを1つのサイクルに組み込み、配列決定には、少なくとも400サイクルが必要である。
本来の配列の再構築のためには、すべてにおいて、約10から100倍の原(raw)配列の定量、すなわち、10から100Mbが必要である。したがって、NACF当り約400bpの平均配列長の場合、完全配列の99.995%以上をカバーするためには、25,000〜50,000個のDNA断片が必要である。
決定されたNACF配列は、市販のプログラムを用いて、NACの全体配列になるように合わせることができる、オーバーラップしている部分的配列の集合体を表す(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adamsら、Academic Press、Huangら、Genom Res. 1999 v. 9 p. 868、Huang Genomics 1996 v. 33 p. 21、Bonfieldら、NAR 1995 v. 23 p. 4992、Millerら、J. Comput. Biol. 1994 v. 1 p. 257)。
【0072】
3A−2.cDNAの配列決定の例に基づく遺伝子産物の配列決定
好ましい実施態様において、1つの配列の代わりに、一回に、幾つかの配列を解析することができる。たとえば、ショットガン原理によって得られた原データから、本来の配列を再構築することができる。
まず第1に、NACFを製造する。たとえば、mRNAを二本鎖cDNAに変換し、このcDNAを超音波で断片化することができる。次いで、これらのNACFにプライマー結合部位を与え、変性し、固定し、次いで、プライマーをハイブリダイズする。サンプル製造のこの変法では、cDNA分子が、不完全なmRNA配列を表すことに留意すべきである(Method in Enzymology 1999、v. 303、p. 19 およびこの著書における他の論説である”cDNA library protocols” 1997 Humana Press)。
mRNAの一本鎖NACFの生成のための他の選択肢は、ランダム化プライマーによるmRNAの逆転写にある。これに関しては、多くの比較的短いアンチセンスDNA断片が形成される(Zhang-Jら、Biochem. J. 1999 v. 337 p. 231、Ledbetterら、J. Biol. Chem. 1994 v. 269 p. 31544、Kollsら、Anal. Biochem. 1993 v. 208 p. 264、Decraeneら、Biotechniques 1999 v. 27 p. 962)。次いで、これらの断片にプライマー結合部位を与える(上記参照)。続いてのステップは、前述の手順にしたがう。ランダム化プライマーはmRNAの全長にわたって結合するので、この方法によって、完全mRNA配列(5'から3'末端)を解析する。
前述の配列決定の実施態様の1つを用いて、固定化したNACFを解析する。mRNAの配列は、たとえば、ゲノムDNAよりもかなり少ない反復配列しか示さないので、NACFが組み込まれたNT*から検出されるシグナルの数は、300よりも少なく、20〜1000の間であるのが好ましい。解析されなければならないNACFの数は、ショットガンの長い配列の再構築に関するものと同じ原理によって計算される。
オリジナルの遺伝子配列は、ショットガン法の原理にしたがって、NACF配列から再構築される。
この方法は、予備クローニングを必要とすることなく、多くのmRNAの同時配列決定を可能にする。
【0073】
3B.配列変異体の解析
すでにわかっている配列またはこの配列の変異体の検査の確認においては、決定されたNACF配列の長さおよび重複性についての要求は非常に少ない。配列プロセシングもまた、この場合、より単純である。全配列を再構築することを必要としない。むしろ、市販のプログラムを用いて、NACF配列が、全配列に割り当てられる。このようなプログラムは、たとえば、BLASTまたはFASTAアルゴリズムに基づくことができる(”Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall)。
前述の方法の1つによって、解析される配列をNACFに変換する。使用できることを調査される(実施例5を参照)全体配列において起こる、均一プライマーおよび均一プライマー結合部位の両方ならびに異なる配列特異的プライマーおよび天然のプライマー結合部位を用い、本発明方法によって、これらのNACFの配列決定を行う。次いで、決定されたNACFの配列をショットガン法にしたがって合わせるのではなく、参照配列と比較し、このような方法で、全配列中のそれらの位置を割り当てる。ゲノムまたはcDNA配列が含まれる。
ショットガン法による再構築とは異なって、配列変異体の解析は、非常に少ない原配列データしか必要としない。したがって、全配列の新規変異体の復元には、原配列の5〜10倍量で十分である。ショットガン法を用いると、復元には10から100倍量の原配列が必要である(”Automated DNA sequencing and analysis” p. 231 et seq. 1994 M. Adamsら、Academic Press、Huang et al、Genom Res. 1999 v. 9 p. 868、Huang Genomics 1996 v. 33 p. 21、Bonfieldら、NAR 1995 v. 23 p. 4992、Millerら、J. Comput. Biol. 1994 v. 1 p. 257)。
決定されたNACF配列の長さは、参照配列における特定の位置を明確に割り当てるのに十分でなければならない;したがって、たとえば、20NTの長さをもつ配列(たとえば、ヒトゲノムにおける非反復セクションを含む)でさえ、明確に同定することができる。反復セクションの比較解析には、課題に応じて配列の正確な長さをもつ、より長い配列が必要である。非反復セクションの解析のために決定されたNACF配列の長さは、20NT以上が好ましい。反復セクションについては、500NT以上が好ましい。
予め既知の完全配列の新規変異体の配列決定における目的は、まったく異なるものであってよい。既知の完全配列をもつ新たに決定された配列/参照配列の比較が、主として追及される。2つの配列は、この点に関し、進化という条件において大きく異なる種から始まる。これらの2つの配列の構成の種々のパラメーターを比較することができる。以下の記載は、このような解析の例である:突然変異または多型解析および選択的にスプライスされた遺伝子産物の解析。
解析される配列の前もっての再構築を行うことなく参照配列と調査される配列を比較することは、以下においては、図式的に、および典型的な基準に基づいて検討されるべきである。このような比較は、たとえば、突然変異またはSNP解析に用いることができる。
【0074】
3B−1.
たとえば、1Mbなどの解析される長い配列を、前述の方法の1つによってNACFに分割する。本発明方法により、均一プライマーを用いて、これらのNACFの配列決定を行う。決定された各個のNACFの配列を参照配列と直接比較する。参照配列は、ショットガン法による高価な再構築をなしですませるように、この点に関し、決定されたNACF配列の割り当てのための基準となる。非反復セクションの解析において決定されたNACF配列の長さは、20NT以上が好ましい。反復セクションの解析については、500NT以上が好ましい。解析されるNACFの数は、この点に関し、調査される配列の全長、NACF配列の平均長および配列決定の必要な正確さによって決定される。決定されたNACF配列の平均長が100NTであり、調査される配列の全長が1Mbであり、および原配列決定に対応する正確さ(すなわち、各位置が、一度だけ配列決定されることが可能な場所である)である場合、全体配列にわたってNACFの分布がランダムに生じるので、原配列の約5倍量、すなわち5Mbが必要である。全体として、全セクションの99%以上をカバーするために、50,000NACFを解析しなければならない。
次いで、市販のプログラムによって、決定されたNACF配列を全配列に割り当て、不適合を検出する。このようなプログラムは、たとえば、BLASTまたはFASTAアルゴリズム(”Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall)に基づく。
【0075】
実施例4
2つの標識NT*および2つの非標識NTを用いる配列解析(2NT*/2NT法)。
もう1つの実施態様においては、配列の解析のために2つの修飾NT*および非修飾NTを用いる。
この方法は、配列変異体の解析(たとえば、SNPまたは突然変異解析など)に特に適しており、参照配列の認識を必要とする。この方法に関しては、全配列の再構築は行わない;その代わりに、プログラムを用いて、決定された配列を参照配列に割り当て、不適合を記録する。このようなプログラムは、たとえば、BLASTまたはFASTAアルゴリズム(”Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall)に基づく。
この実施態様は、2つのシグナル(標識NT*)の配列が、配列を同定するための十分な情報を含むことができるという原理に基づいている。決定された配列を参照配列と比較し、特定の位置、たとえば:
を割り当てる
【0076】
解析される参照配列の未知の変異体を、前述のように配列決定のために調製する(NACをNACFに変換し、これらをPBSにライゲートし、次いで、プライマーとハイブリダイズさせ、反応表面に固定化する)。このような方法で調製されたNACFを2NT*/2NT法によって配列決定を行う。2NT*の配列を表している各NACF配列を用いて、NACF配列を得る。決定された配列の既知の参照配列への明確な割り当てを促進するために、この配列は、十分な長さをもたなければならない。決定されたNACF配列の長さは、40NT*以上であるのが好ましい。2つの標識NT*は、配列の一部のみを表すので、合成された相補鎖の全長は、検出されたNT*の配列の約2倍である(40 NT*が検出された場合、全長は、たとえば、平均80NTである)。
相補鎖の合成には、4つのヌクレオチドが必要である。蛍光色素で標識されたNT*は、本発明においては、半停止剤として生じる、すなわち、もし修飾NT*が利用できるならば停止が単独で起こるので、非修飾NTが、各サイクルの追加のステップにおいて反応に加えられなければならない。サイクルにおけるこのステップの正確な位置は、変更することができる。この点について、標識NT*および非修飾NTをそれぞれ用いることが重要である。
【0077】
この実施態様におけるサイクルは、たとえば、以下のように現れる:
a)提供されたNACFをもつ表面への修飾NT*およびポリメラーゼを含む溶液の添加
b)NTにより相補鎖を伸長するのに適した条件下での、この溶液と固定化核酸鎖のインキュベーション
c)洗浄
d)NACFに相補的な新たに合成された鎖に組み込まれた個々の修飾NT*分子のシグナルの検出
e)組み込まれたヌクレオチドの場合、標識および停止基の除去
f)洗浄
g)2つの非修飾NTおよびポリメラーゼの添加
h)洗浄。
【0078】
この2NT*/2NT法は、たとえば、遺伝子のゲノムセクションのSNP解析または二本鎖cDNA解析に適している。それは、以下の原理に基づいている。
1)1つの鎖において失われた情報を、他方の鎖からの情報によって完全にすることができるように、2つの各相補的DNA鎖おけるゲノム情報は、同一である。
2)二本鎖DNAからの完全な情報は、標識NT*の特定の対の組み合わせによって、2つのNT*のみから得ることができる。この実施態様におけるNT*の許容しうる組み合わせは、次のとおりである:A*C*; A*G*; C*T*/C*U*; G*T*/G*U*。C*およびU*の組み合わせが好ましい。
3)既知の参照配列が解析の基礎となる。
4)NACFは、解析されるNACの両方の鎖から生じ、決定された該NACF配列は、解析される配列の全長をカバーする。
【0079】
次の実施例によって、2つの標識NT*のみをもつ二本鎖DNA断片からどのように情報が得られるか、および本来のまたは非突然変異配列(参照配列/比較配列)との差異をどのように決定することができるかを説明する。1)および2)における配列は、1つの位置(下線)以外は同一である。A*およびC*を標識する。
1)試験される配列:
NACF配列の集合体(決定されたNACF配列)が生じるように、2NT*/2NT法によって、試験される配列の配列決定を行う。決定されたこれらのNACF配列は、あらゆる鎖からの情報を含む:
2)比較配列:
解析には、比較配列(参照配列)が必要である:
3)決定された適合NACF配列をもつ比較配列:
プログラムを用いて、決定されたNACF配列を比較配列中の特定の位置に割り当て、不適合を検出する:
【0080】
この実施態様において、SNPまたは突然変異について、二本鎖核酸を調査することができる。この点に関し、決定されたNACF配列を参照配列と比較する。2つの標識NTのみを用いる解析の場合、部分配列および完全配列の比較の基本規則は、すべての4つの標識NT*を用いる配列の比較に適用される規則とは原則的には異ならない。さらなる情報については、4つのNT*(実施例3B)による突然変異解析およびSNP解析に対する配列比較を参照のこと。
【0081】
実施例5
配列特異的プライマーをもつ単一ヌクレオチド多型の解析は、本発明方法の特別の実施態様を表す。セクション1の”用語の略語および説明”に加えて、以下の用語をこの実施例のために定義する。
「プライマー」−発明の意図を明確にするために、本実施例では、次の用語を区別する:
a) ”プライマー”は、一般的に理解される本発明の目的にとっては、均一構造をもつプライマー分子の集合体を意味する。
b) ”数個のプライマー”または類語は、理解される主題において、異なる構造をもつプライマー分子の数個の集合体を意味する。
c) ”プライマー分子”は、単独のオリゴヌクレオチド分子を意味する。
d) ”数個のプライマー分子”は、数個の個別のオリゴヌクレオチド分子を意味する;それらは、均一または異なる構造を示す。
「SNP位置」−SNPの存在または不在について調査されるNACにおける位置。
「標的配列」−配列決定反応において配列特異的プライマーの使用によって配列決定/決定される全体配列の一部。全体配列は、数個の標的配列を含むことができる。標的配列は、全体配列内で標的配列の位置決定をほとんど確実にするのに十分長い。標的配列は、たとえば、1つまたはそれ以上のSNP位置を含むことができる。
「認識配列」−全体配列におけるこの標的配列の割り当てのために用いられる標的配列の一部。
【0082】
SNP解析のこの実施態様において、解析されるNACにおいて調査される参照配列における数個の潜在的SNP位置が選ばれる。これに対応して、異なる、配列特異的プライマーが、これらの位置に対して提供される。これらのプライマーは、特定の問題に関してSNP解析のために用意された標準化プライマーを形成し、問題となっている解析のためのキットとして一律に用いられる。
本発明によれば、解析される材料の調製は、1つまたはそれ以上の核酸鎖(全体配列)から、相対的に小さい、30〜2000NTの長さの一本鎖核酸鎖断片(NACF)集合体を形成する目的をもつ。
これらのNACF分子を平面的表面に、10〜1,000,000/100μm2、好ましくは、10〜100 NACF/100μm2、100〜10,000/100μm2または10,000〜1,000,000/100μm2の密度でランダムに固定化する。伸長可能なNACFプライマー複合体の密度が約10〜100F/100μm2となるように、表面に結合したNACFにプライマーをハイブリダイズする。ハイブリダイゼーション後、非結合のプライマーを除去し、配列決定反応を開始する。
標的配列および配列特異的プライマーの選択を介して、全体配列のうち関連するセクションのみが調査され、それによって無関係の情報の量が減少し、解析時間が短縮される。
【0083】
以下の原理が、SNP解析方法の本実施態様の根拠をなす。
調査されるNAC(全体配列)における単一ヌクレオチド多型(SNP)について、参照配列における検査されるべき位置を選択する。
1)各選択されたSNP位置の解析のために、調査される各SNP位置がプライマーの3方向にすぐ次の位置を占めるか、またはプライマーの3方向に2〜100、好ましくは、2〜50、理想的には、2〜20位置の範囲内にあるように、特異的プライマーを準備する。したがって、SNP位置は、配列決定反応中に決定された標的配列の範囲内にある。数個の特異的プライマーを用いる必要があるように、数個のSNP位置を同時に決定するのが好ましい。可能である場合、それらが均一アニーリング温度をもつ(すなわち、個々のプライマー集合体の融解温度の間の差異が、たとえば、約4度、好ましくは2度、より好ましくは1度の範囲内にある)ような方法でプライマーを選択するのが好ましい。
2)全体配列から短い核酸鎖断片(NACF)が誘導され、これらの断片は、一本鎖であり、20〜2000NT、好ましくは、30〜500NTの長さをもつ。
3)NACF分子をランダム配列で表面に固定化する。
4)表面に固定化されたNACFにおける配列特異的プライマーのハイブリダイゼーション(アニーリング)後、反応に関与する各NACF分子について標的配列を決定する周期的配列決定反応を行う。配列決定反応は、多数の分子において同時に進行する。
5)決定された標的配列は、全体配列における特定のセクションへの加入に関する情報および調査されるサンプルに関連したこのセクションにおけるSNPに関する情報を含む。標的配列の長さおよび周期の数は、配列の同定が保障されうるような方法で選択されるべきである。
【0084】
有利な態様において、決定された標的配列を参照配列と比較し、配列マッチングを割り当てる。十分に長い決定された標的配列の場合、それらをほとんど確実に参照配列中の特定の位置に割り当てることができる。たとえば、10NTを含む配列は、106以上の異なる組み合わせを形成することができ、したがって、わずか100,000NTのNACにおいてほとんど確実に明確に同定することができる。決定された標的配列の参照配列内の特定の位置への割り当てに続いて、配列における差異、SNPが認識できるようになる。
標的配列を同定するために、別の有利な態様において、既知のプライマーの数、それらの組成およびプライマー結合部位に連結する参照配列の既知の配列セクションを用いる。考慮されねばならないプライマー結合部位の近くに位置する配列のみを用い、プライマーへの標的配列の加入にしたがって、決定された標的配列をこの点に関して解析する。もし、たとえばわずか1000個のプライマーを用いるならば、10NT以下の決定された標的配列でも、対応するプライマーへの割り当てを促進するのに十分である。
【0085】
解析されるサンプルは、大部分は、たとえば、組織細胞からの数コピーのゲノムDNAまたは組織細胞からの数個の同一のmRNA集合体などの数個の同一の全体配列分子を含む。
a)SNP部位の選択
本発明方法により、既知のSNP部位を解析すること、および新たなSNP部位を決定することの両方ができる。NACにおけるいずれの位置でも、潜在的SNP部位として機能することができる。選択は、たとえば、それらの産物がある疾患に関連している遺伝子におけるSNP解析、または膜受容体をコードする遺伝子の保存されたコーディングセクションにおけるSNP解析、または細胞分割にとって重要な遺伝子の調節配列における既知のSNP部位の試験などの問題によって決定される。
解析されるSNP部位は、配列決定反応中に決定される標的配列内に位置する。数個のSNP部位は、標的配列内で決定することができる。一方、数個の標的配列を、たとえば、遺伝子内で選択することもできる。これに関連して、全体配列の中で、標的配列が互いから十分な距離に位置することが重要である。NACF当り1つの配列特異的プライマーのみがハイブリダイズするように、この距離が必要であり、該距離は、平均NACF長に従属する:NACFが短いほど、標的配列は近づくことができる。適当なプライマー選択によって、二本鎖核酸鎖の両方の鎖において、SNP部位を解析することができる。
本発明方法は、たとえば、多くの個体(集合体のランダムサンプルとして)からの数個の部位などの同時チェックの可能性も提供する。集合体のSNPプロフィールを、たとえば、それによって調査することができる。
【0086】
b)配列決定反応のためのプライマー
個々のNACF分子における配列決定反応は、プライマー分子によって促進される。全体配列内で特別な/特異的標的配列において配列決定反応を行ないうるために、本発明の配列特異的プライマーが必要である。SNP部位または標的配列の解析に使用される配列特異的プライマーは、同一構造のプライマー分子の集合体を意味する。数個の異なる標的配列の解析には、数個の異なるプライマー集合体が必要である。
配列特異的プライマーの使用を介して、当該配列セクション、標的配列のみが解析される。本発明方法においては、解析速度が増すように、配列決定される配列の長さをできるだけ短くする。
【0087】
配列特異的プライマーは、解析される配列において、そのプライマーに特異的なプライマー結合部位であるPBSに結合する。プライマーの組成および長さをいずれかの潜在的SNP部位または標的配列に対して最適化する。最適化ステップの例は、Rychlikら、NAR 1990 v. 18 p. 6409に記載されている。プライマーの選択またはPBS(プライマー結合部位)の選択において、次の面に特に留意すべきである:
1)解析されるSNP部位は、プライマーの3'末端の直後または次の2〜50NT、好ましくは、2〜20NT以内のいずれかに位置すべきである。
2)SNP部位におけるPBSの位置決定(配列の長さおよび組成の選択)は、種々のPBS配列および対応するプライマー配列が、理想的には均一なハイブリダーゼーション条件下で結合するために、できるだけ類似する”アニーリング温度”をもつような方法で行うべきである。このことは、たとえば、解析される当該SNP部位に関してPBS位置を変更することによって、またはプライマー配列の長さを変更することによって行うことができる(Rychlikら、NAR 1990 v. 18 p. 6409)。
3)全体配列中で同じ鎖に結合するプライマー間の最小距離は、平均NACF長よりも短いべきではない。
【0088】
プライマーは、二本鎖NACの両方の鎖に対して用いることができる。したがって、互いに近くに位置するSNP部位を、たとえば、記録することができ、または両方の鎖におけるSNP部位についてのチェックを行うことができる。
プライマーの長さは、6〜100NTであるのが好ましく、10〜30または30〜40または40〜50が最適である。異なるSNP部位または標的配列には異なる長さのプライマーを用いることができる。
配列特異的プライマーを用いるSNP解析のために、本発明にしたがって、プライマーをハイブリダイゼーション溶液中で、反応表面に固定化されたNACFにハイブリダイズさせる(アニーリング反応)。
【0089】
c)NACFの固定化
この実施態様では、本発明にしたがって、ランダム配列で平面的表面に結合しているNACF分子を用いて、NACFを介して、表面に対してNACFプライマー複合体を排他的に結合させる(表面に対するNACFの直接結合)。
2つの鎖の末端の1つでNACFの固定化を行うのが好ましい(上記参照)。たとえば、平面的表面上のNACFを含むサンプルを乾燥することなどの非特異的結合によっても固定化を達成することができる。固定化の密度は、100 μm2当り10〜100、100〜10,000、10,000から1,000,000NACFである。
d)ハイブリダイゼーション
のNACFの対応するプライマー結合部位へのできるだけ選択的であるプライマーの結合(アニーリング)を許容するストリンジェントな条件下でハイブリダイゼーション結合したNACFおよびプライマーをインキュベートする。最適ハイブリダイゼーション条件は、プライマー結合部位の正確な構造およびそれぞれのプライマー構造に従属し、たとえば、Rychlikら、NAR 1990 v. 18 p. 6409にしたがって計算することができる。
プライマーは、プライマー混合物を意味するのが好ましい。個々の配列特異的プライマーの濃度(プライマー集合体の個々の濃度)は、たとえば、10 pmol/l〜1mmol/l、好ましくは、0.1 μmol/l〜10 μmol/lである。プライマー混合物中のプライマーの総濃度は、好ましくは、1nmol/l〜10mmol/lである。個々のプライマー集合体間の比率は、多様である。ハイブリダイゼーション時間が短くなるように、プライマーを、固定化NACFに明らかに過剰に加えてもよい。
検出に必要な伸張可能なNACFプライマー複合体の密度は、約10〜100/100μm2である。それは、プライマーのハイブリダイゼーション前、中または後に達成することができる。
既知のNACF濃度では、1つの態様において、固定化条件を、NACFが約10〜1000/100μm2の密度で結合するような方法で選択することができる。したがって、NACFはNACFプライマー複合体の密度を決定する。
【0090】
1つの実施態様では、固定化NACFの密度を、たとえば、1,000,000/100μm2などのように1000NACF/100μm2よりも非常に大きくすることができる。光学的検出に必要なNACFプライマー複合体の密度は、プライマーハイブリダイゼーション中に達成される。ハイブリダイゼーション条件(たとえば、温度、時間、緩衝液)は、これに関連して、プライマーが固定化NACFの一部のみに結合するような方法で選択されるべきである(実施例6を参照)。
NACFの濃度が未知であり、それに対応して固定化密度が未知である場合、NACFに対するプライマーのハイブリダイゼーション(アニーリング)によって、最適密度よりも大きいNACFプライマー複合体の密度が導かれる。
【0091】
この理由のために、有利な実施態様では、最適密度の決定のためにNACFの一部を含むサンプルを用いる。この部分を反応表面に固定化し、NACFに対してプライマーをハイブリダイズし、形成されたNACFプライマー複合体を蛍光色素含有NT*の組み込みによって標識する(たとえば、Cy3-dCTP、Amersham Pharmacia Biotech)。一方では、決定された密度(ハイブリダイゼーション条件が維持される)から、最終配列決定バッチのためのオリジナルサンプルのいずれかの必要な希釈または濃度を決定することができる。他方では、たとえば、一定のままであるNACF固定化密度によるハイブリダイゼーション時間の短縮化といったような、このことから必要となるハイブリダイゼーション条件の変化を計算することができる。
プライマー集合体間の量的比率は、相異しても同一であってもよい。高濃度のプライマーを用いることによって、特定の時間中に、たとえば、より稀な配列といったような、ある配列をほとんど確実に結合することができる。
表面に固定化された配列特異的プライマーを用いる手順配列およびそれに続くこれらのプライマーに対するサンプルのハイブリダイゼーションと比較して記載した手順配置の大きな利点は、反応表面における配列特異的プライマーおよび解析されるサンプル間のハイブリダイゼーション(アニーリング)時間の明らかな短縮化である。
【0092】
実施例6
配列決定反応の準備と実行
ゲル表面の調製:
電気泳動分離用ゲル調製の一般的規定(Electrophoresis A.T. Andrews、Oxford science publications 1995)にしたがって、個々の分子との反応の解析のためのポリアクリルアミドゲルを製造する。
たとえば、紫外線または残基フォーマーによって重合反応を行う。本実施例では、残基反応に、たとえば、TEMED 0.01% v/vおよびAPS 0.04% w/vなどの過硫酸アンモニウム(APS)およびTEMED(テトラメチルエチレンジアミン)を用いる。成分組成物は、広範に変化する;個々の成分の濃度は、次の範囲にある(ready-to-use水性AA-ビスAA溶液について計算):
アクリルアミドモノマー(AA)3〜30%、理想的には、10〜20%、アクリルアミドモノマーに対するビス−アクリルアミド(ビス−AA)比率は1:10〜1:50、好ましくは1:20。
【0093】
製造目的のために、2つの清浄なガラス板(アセトン、次いで、水で洗浄)を用いる。ガラス板(P1)を好ましくは、たとえばRepel−シラン(ジメチルジクロロシラン溶液、Amersham Pharmacia-Biotech)などの撥水剤で前処理する。P2は、ゲルのための固相担体として働き、ゲルとガラス表面の間の共有結合が形成されるように、たとえばBind-シラン(メタクリルオキシプロピルトリメトキシシラン、Amersham Pharmacia-Biotech)などのゲル結合剤で前処理する。ゲル結合剤によるP2の前処理は、幾つかの反応を固定化分子と行わなければならない場合に有用である。反応の数が少ない場合、このような前処理は不要である。これらの場合、ゲルがガラス表面に対する接着力を介して純粋に付着し続けるために、P2にとって、清浄なガラス表面であれば十分である。
【0094】
厚さ約5〜30μmの層が生じるように、終了した重合溶液(残基フォーマーを含むAA/ビスAA溶液)をP1およびP2の間に注ぐ。たとえば、スペーサーブロックによってゲルの厚さをチェックすることができる。硬化後、P1を除去する。ゲルはP2に張り付いて残る。それを脱イオン水で洗浄する。
ゲルは、そのまま直接使用するか、または製造の種々のステップにおいて乾燥して貯蔵することができる。標識分子との反応の前に、通常、数分間ゲルを反応緩衝液で膨潤させ、次いで、反応に使用する。
この方法で調製したゲル表面に、乾燥によってNACFを固定化する。
たとえば、プラスミドDNAの溶液(約1μL)(加熱によって一本鎖型に転換された、約3400NT長、濃度0.1 μg/μLのHind IIIで直線化されたpMOS−ブルー−プラスミドDNA)を約10mm2のゲル表面に滴下し、90℃にて乾燥する。固定化プラスミド分子の計算密度は、約1000/1μm2であった。
オリゴヌクレオチド5'−AGTGAATTCGAGCTCGGTAC−3'をプライマーとして用いる。解析に関連する伸長部と一緒になったプライマー結合部位(下記の二重下線)は、以下の配列を有する:
5'−ATCCCCGGGTACCGAGCTCGAATTCACT−3'
【0095】
カバーとして反応表面をもつフローセル(マイクロ流体チャネル、MFC)、図6を組み立てた。このようなMFCは、ゲル表面下での迅速な流体交換を行うことができる。予備試験として、プライマー(計算されたTm(融解温度)45.3℃、50mmol/l tris-HCl pH8.7中、0.1 μmol/l)を表面において45度にて10分間プラスミドDNAとハイブリダイズした(アニーリング)。洗浄ステップの後、プラスミドプライマー複合体の密度をチェックした。チェックは、クレノーフラグメントを用い、dCTP-Cy3(Amersham Pharmacia Biotech)の組み込みによって行った(5mmol/l MgCl2を含む20mmol/l tris-HCl緩衝液、pH8.5中、2ユニット/50μL、30℃にて15分間)。この点に関して、単一のdCMP-Cy3のみが成長する鎖に組み込まれる。
CCDカメラAxioCam(Zeiss)をもつAxioplan 2e(Zeiss)、図8を検出装置として用いた。
【0096】
個々の組み込まれたdCMP-Cy3分子の信号密度は、伸長可能なプラスミドプライマー複合体の密度に対応する。上記条件下、プラスミドプライマー複合体の密度は、平均約15/100μm2であり、したがって、所望の大きさの位数であった(図8a−c)。同様の方法で調製された第2の表面(ハイブリダイズされたプライマーをもつ、加熱によって一本鎖型に転換された、約3400NT長、濃度0.1 μg/μLのHind IIIで直線化されたpMOS−ブルー−プラスミドDNA)において、可逆的停止剤として用いられるdUTP-SS-CH2CH2NH-R-Cy3)(dUTP*)およびdCTP-SS-CH2CH2NH-R-Cy3)(dCTP*)(実施例2を参照)により、周期的配列決定反応を行う。検出装置は、予備試験と同じである。周期的配列決定反応に用いた溶液は、以下の構成である:
a)組み込み反応用の反応溶液:20mmol/l tris-HCl緩衝液、pH8.5、5mmol/l MgCl2、10グリセロール、クレノーフラグメント(Amersham Pharmacia-Biotech)2U/50μL、dUTP*またはdCTP*、またはdATPおよびdGTP/10 μmol/l。
b)洗浄液:20mmol/l tris-HCl pH8.5、0.01%ナトリウムアジド。
c)切断反応用反応溶液:20mmol/l tris-HCl、pH8.5、50mmol/l メルカプトエタノール。
【0097】
標識 NT*の組み込み反応を30℃にて15分間行った。
配列決定反応の第1のサイクルにおいて、dCTP*を含む反応溶液を加えた。洗浄ステップの後、表面において、記録されている割り当てられたx,y座標をもつ単一分子シグナルを用いて検出ステップを行った(合計約11200シグナル)。次いで、組み込まれたNT*の標識を切断し(室温にて10分間)、表面を洗浄する。
第2のサイクルにおいて、dUTP*を含む反応溶液を加え、30℃にて15分間インキュベートした。続いての洗浄ステップの後、表面において単一分子シグナルを検出した(合計約200シグナル)。これは、表面へのNT*の非特異的結合によって形成されたバックグラウンドシグナルに相当する。NT*の標識を切断し(室温にて10分間)、表面を洗浄液で洗浄する。
第3のサイクルにおいて、dATPおよびdGTPを含む反応溶液を加え、30℃にて15分間インキュベートした。次いで、表面を洗浄した。
サイクル1〜3を3回繰り返し、合計約9900CCUの標的配列が決定された。これらの配列は、プライマーに明確に割り当てることができる。
【図面の簡単な説明】
【0098】
【図1】長い核酸鎖の配列決定の図式的表現 長い核酸配列(NAC)の配列決定および再構築は、ショットガン原理に基づく。DNAの長片の配列は、小断片(NACF)の配列決定および続いての再構築によって、これに関連して決定される。 1)出発物質−解析される核酸配列、全体配列 2)50〜1000 bpの断片−全体配列から断片化ステップにおいて作成されたNACF 3)それぞれ1つのプライマーを持つ断片−NACFプライマー複合体 4)固定化断片−平面的表面に対して結合したNACFプライマー複合体、本実施態様において、結合はNACFの3'末端に対して行われる 5)ポリメラーゼおよびNT*を含む溶液の添加−配列決定のサイクルにおける第1のステップ 6)洗浄ステップ組み込みステップの後、表面を洗浄する 7)検出−組み込まれた個々のNT*のシグナルを検出する 8)標識および停止をもたらす基の除去−配列決定反応を継続するために、標識および立体障害を除去する
【図2】NACFプライマー複合体の一般構造の例 図2a:本実施態様では、均一プライマー結合部位(PBS)をNACFの3'末端に連結し、均一プライマーがこのPBSに対して結合する。 図2b:本実施態様では、天然のプライマー結合部位を用いる;結果として、特異的プライマーの混合物を用いる。 1)プライマー 2)プライマー結合部位 3)NACF
【図3】表面に対する結合のための官能基を持つ均一プライマー結合部位(PBS)の連結の例 この場合、たとえば、両方の鎖に修飾などを有する(3b)二本鎖オリゴヌクレオチド複合体(3a)を二本鎖NACFにライゲートする(3c)。変性後、均一PBSをもつ一本鎖NACFが形成される(3d)。
【図4】均一プライマー結合部位(PBS)の製造の別例 この場合、NTを一本鎖NACFの3'末端に連結する(いわゆる、テーリング)。均一NTの使用を介して、均一PBSが形成される。
【図5】ゲル様反応表面へのNACFの結合の例 ゲル層(2)、たとえばポリアクリルアミドゲル(図5a)、または多数のゲルビーズ(5)、たとえばアガロースビーズ(図5b)、を固体基盤(1)に接着する。NACF(4)をゲルの表面に結合する。NACFは、たとえば、ビオチンなどの官能基を有し、ストレプトアビジンまたはアビジン(3)を介してゲルに結合する。
【図6】流動装置の例 ゲル様反応表面(1)を励起光および蛍光を透過する固定基盤(2)に固定する。それらは、一緒になって、フローセルのカバーを形成する。フローセル中の液体を、流動装置を形成する貯蔵容器(3)、ポンプ(4)およびバルブ(5)と一緒になったフローセルを用いる管理下様式に交換してもよい。NACFプライマー複合体(ここでは、図示せず)を反応表面に結合する。検出装置(6)によって組み込まれたNT*のシグナルを検出する。
【図7a】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。図7a−切断可能基および停止をもたらす立体要求基が、リンカーの部分を形成するNT構造の図式的表現。リンカーは、核酸塩基および蛍光色素の間の連結部である。 A、B、C、D、E−リンカー、A−切断後のリンカー残基、B−切断可能基、D−停止をもたらす立体要求基、F−蛍光色素。
【図7b】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーの一部を形成する切断可能基、および停止をもたらす立体要求基を同時に表す蛍光色素をもつNT構造の図式的表現。 A、B、C−リンカー、A−切断後のリンカー残基、B−切断可能基、D−停止をもたらす立体要求基、F−蛍光色素。
【図7c】切断ステップ後に組み込まれたNT*の構造の図式的表現。残存するリンカー残基(A)をもつ2つのNT*を示す。
【図7d】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーの一部を形成する停止をもたらす立体要求基を同時に構成する切断可能基をもつNT構造の図式的表現。 A、B、C、D−リンカー、A−切断後のリンカー残基、B−切断可能基、D−停止をもたらす立体要求基、F−蛍光色素。
【図7e−1】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがピリミジン環の5位に連結する好ましいNT構造の表現。
【図7e−2】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがピリミジン環の5位に連結する好ましいNT構造の表現。
【図7f−1】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがピリミジン環の5位に連結する別の好ましいNT構造の表現。
【図7f−2】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがピリミジン環の5位に連結する別の好ましいNT構造の表現。
【図7f−3】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがピリミジン環の5位に連結する別の好ましいNT構造の表現。
【図7f−4】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがピリミジン環の5位に連結する別の好ましいNT構造の表現。
【図7g−1】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがプリン環の7位に連結する好ましいNT構造の表現。
【図7g−2】本発明方法に用いることができる2'−デオキシヌクレオシド三リン酸の構造。リンカーがプリン環の7位に連結する好ましいNT構造の表現。
【図7h】リンカーへの色素の連結の例。
【図7i】リンカーへの色素の連結の例。
【図7j】リンカーへの色素の連結の例。
【図7k】本発明方法に用いうる他の2'−デオキシヌクレオシド三リン酸の構造。リンカーはピリミジン環の5位に連結する。 置換基R1,2,3,4は、選択可能であり、互いに独立して存在することができる。 1つの具体例(7k-1)において、Z基はリンカーと塩基の間の結合を表す。それは選択可能であり、アミド、カルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ基であってよい。 1つの具体例(7k-1)において、E基はリンカーの内部の一部を表す。もう1つの具体例(7k-2)において、それはリンカーと塩基の間の結合を表す。この基は選択可能であり、炭素原子数が好ましくは1〜5である非分枝アルキルまたはアルケニル鎖であってよい。しかし、E基は内部アミドカルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ結合をもつアルキルまたはアルケニル鎖であってもよい。 本実施例において、C基は化学的に切断可能な基である。具体例(7k-1,2)において、それはリンカーの内部の一部を表す。別の具体例(7k-3)において、それはリンカーと塩基の間の結合を表す。この基は選択可能であり、エステル、チオエステルおよびジスルフィド化合物であってよい。 Y基は、切断可能基(C)と蛍光色素(F)の間の結合を形成するリンカーの内部の一部を表す。この基は選択可能であり、分枝もしくは非分枝アルキルまたはアルケニル鎖であってよく、あるいは置換もしくは非置換アリール基であってもよい。さらなる可能な選択肢は、内部アミドカルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ結合をもつアルキルまたはアルケニル鎖である。 X基は、蛍光色素とリンカーの間の結合であり、この結合はリンカーおよび蛍光色素(F)の両方から誘導されうる結合である。それは選択可能であり、アミド、カルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ基であってよい。
【図7l】本発明方法に用いうる他の2'−デオキシヌクレオシド三リン酸の構造。リンカーはプリン環の7位に連結する。 置換基R1,2,3,4は、選択可能であり、互いに独立して存在することができる。 1つの具体例(7l-1)において、Z基はリンカーと塩基の間の結合を表す。それは選択可能であり、アミド、カルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ基であってよい。 1つの具体例(7l-1)において、E基はリンカーの内部の一部を表す。もう1つの具体例(7l-2)において、それはリンカーと塩基の間の結合を表す。この基は選択可能であり、炭素原子数が好ましくは1〜5である非分枝アルキルまたはアルケニル鎖であってよい。しかし、E基は内部アミドカルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ結合をもつアルキルまたはアルケニル鎖であってもよい。 本実施例において、C基は化学的に切断可能な基である。具体例(7l-1,2)において、それはリンカーの内部の一部を表す。別の具体例(7l-3)において、それはリンカーと塩基の間の結合を表す。この基は選択可能であり、エステル、チオエステルおよびジスルフィド化合物であってよい。 Y基は、切断可能基(C)と蛍光色素(F)の間の結合を形成するリンカーの内部の一部を表す。この基は選択可能であり、分枝もしくは非分枝アルキルまたはアルケニル鎖であってよく、あるいは置換もしくは非置換アリール基であってもよい。さらなる可能な選択肢は、内部アミドカルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ結合をもつアルキルまたはアルケニル鎖である。 X基は、蛍光色素とリンカーの間の結合であり、この結合はリンカーおよび蛍光色素(F)の両方から誘導されうる結合である。それは選択可能であり、アミド、カルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ基であってよい。
【図7m】本発明方法に用いうる他の2'−デオキシヌクレオシド三リン酸の構造。リンカーはピリミジン環の5位に連結する。 置換基R1,2,3,4は、選択可能であり、互いに独立して存在することができる。 Y基は、切断可能基(C)と蛍光色素(F)の間の結合を形成するリンカーの内部の一部を表す。この基は選択可能であり、分枝もしくは非分枝アルキルまたはアルケニル鎖であってよく、あるいは置換もしくは非置換アリール基であってもよい。さらなる可能な選択肢は、内部アミドカルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ結合をもつアルキルまたはアルケニル鎖である。 X基は、蛍光色素とリンカーの間の結合であり、この結合はリンカーおよび蛍光色素(F)の両方から誘導されうる結合である。それは選択可能であり、アミド、カルボアルコキシ(エステル)、スルホキシ、エーテル、チオエーテルまたはアミノ基であってよい。
【図8】検出システムの例 広視野光学検出システムを示す。標識NT*の組み込みの後、NTに連結した個々の色素分子の蛍光シグナルを検出して、表面(7)を走査しする。 図8a:走査される反応表面(グレー)のセクションの図式的表現。各ケースにおいて、円は、二次元イメージの記録に対応し、蛍光シグナルが検出される領域を表す。このことに関して、個々の分子からの幾つかのシグナル(たとえば、100〜10,000個)が同時に写真で記録される。反応表面をサイクル毎に走査し、走査処理中、幾つかの写真を表面上の異なるポイントについて撮る。このことに関して、組み込まれたNT*の数百万以下の信号を記録することができる。高度の並列処理が、この処理の速度の基準を形成する。 図8b:組み込まれた個々のNT*からのシグナルの写真(2次元イメージ)。 図8c:図8bの一部分。この部分は、組み込まれた4つのNT*のシグナルを示す。各シグナルは、個々の分子シグナルの特徴的な特性をもち(本明細書の記載を参照)、これに基づいて同定することができる(コンピュータープログラムを用いるのが好ましい)。対応するX、Y軸を同定されるシグナルのそれぞれに割り当てる。
【図9】反応表面の有利な配列の例 2つの別のフローセル(マイクロ流体チャネル、MFC)の使用によって、スループットは増加する。生化学反応および化学反応は一方のフローセルにおいて行なうが、検出は他方において行なう。次いで、フローセルを交換する。[0001]
The present invention relates to a method for analyzing a nucleic acid chain. The basis of the method is the detection of the fluorescent signal of individual nucleotide molecules, labeled with a dye incorporated into the growing nucleic acid strand by the polymerase. This reaction takes place on a planar surface. Numerous individual nucleic acid molecules are bound to the surface. These nucleic acid molecules are all under the same conditions, so that a synthesis reaction can occur simultaneously in all nucleic acid molecules.
[0002]
The method basically includes the following steps:
1) Binding of nucleic acid strands (NACFs) to a planar surface followed by hybridization of primers, or binding of primers and subsequent hybridization of NACF (this forms a NACFs primer complex).
2) Execution of a periodic synthesis reaction in which each cycle consists of the following steps:
a) Labeled nucleotides (NTs*) And addition of a solution containing the polymerase,
b) incubation of the bound NACF primer complex with the solution under conditions suitable for extension of the complementary strand by NT;
c) washing,
d) detection of individual molecule signals,
e) removal of label from incorporated nucleotides,
f) washing.
3) Analysis of the signal of each detected molecule.
4) Reconstruction of sequences obtained from individual data.
[0003]
1. Description of abbreviations and terms
DNA Deoxynucleic acid of different origin and different length (genomic DNA, cDNA, ssDNA, dsDNA)
RNA ribonucleic acid (usually mRNA)
Polymerase An enzyme that can incorporate complementary nucleotides into the growing DNA or RNA strand (eg, DNA polymerase, reverse transcriptase, RNA polymerase)
dNTP-2'-deoxynucleoside triphosphate, substrate for DNA polymerase and reverse transcriptase
NTP ribonucleoside triphosphate, substrate for RNA polymerase
NT natural nucleotide, usually dNTP unless otherwise specified.
The abbreviation "NT" is also used to indicate the length of a nucleic acid sequence, for example, 1,000 NT. In this case, “NT” represents nucleoside monophosphate.
Most abbreviations in the text are formed using the suffix "s". "NT" means, for example, "nucleotide (singular)" and "NTs" means several nucleotides.
NT* -Modified nucleotides, usually dNTPs unless otherwise indicated. NTs*Indicates a modified nucleotide (plurality).
NAC nucleic acid strand. DNA or RNA of their original length.
NACF A nucleic acid chain fragment (DNA or RNA) corresponding to a part of the entire sequence, NACFs nucleic acid chain fragment (plurality). The sum of all NACFs is equal to the entire sequence. The NACFs can be, for example, fragments of the entire DNA or RNA sequence formed after the fragmentation step.
Whole sequence One or more sequences used in the sequencing reaction (usually converted to NACFs). They may consist essentially of one or more NACs. In this context, the whole sequence means another sequence or a collection of sequences (eg mRNA, cDNA, plasmid DNA with inserted sequence, BAC, YAC) and part or equivalent of one or a different species I can do it.
Primer binding site (PBS) The portion of the sequence in NAC or NACF to which the primer binds.
Reference sequence A known sequence for which the bias in the sequence to be examined or in a plurality of sequences to be examined (whole sequence) has been determined. In the database, available sequences, for example from the NCBI database, can be used as reference sequences.
Tm Melting temperature
[0004]
Planar surface: A surface that preferably exhibits the following properties: 1) It allows the simultaneous detection of several individual molecules, preferably 100 or more, better 1000 or more, at each lens-surface distance lens position . 2) The individual molecules immobilized are located in the isofocal plane, which can be reproducibly adjusted.
Wide-field optical detection system A detection system that can simultaneously detect fluorescent signals from individual molecules distributed over a certain area (the area is about 100
Steric hindrance: To prevent incorporation in the extension reaction by the polymerase,
NTs attached to the group*Is a sterically demanding group that modifies the properties of a compound by its chemical structure.
Definition of Suspension: In this application, modified uncleaved NTs*The reversible suspension of the incorporation is defined as suspension. This term should be distinguished from the usual use of the term "stop" by dideoxyNTP in conventional sequencing.
Stopping is a modified NT*Happens after the incorporation of Modified NTs incorporated*Has a steric group that binds reversibly to this base, which is the latter complementary NT on the strand being extended by the polymerase.*Leads to the inhibition of the integration.
Gene Product A gene product is the primary gene product of the gene. Basically, these are the RNA transcripts of the gene, which are also defined as target sequences (or target nucleic acid sequences). These target sequences also include, in addition to mRNA, single- and double-stranded cDNAs derived therefrom, RNA derived from the cDNA or DNA amplified from the cDNA.
Single nucleotide polymorphisms (SNPs) Changes in the sequence that can occur as a substitution (transposition or inversion) or as a deletion or insertion of a single NT.
[0005]
2. Current state of the industry
Nucleic acid strand sequence analysis has become an important tool in many scientific fields. Several methods have been developed for analysis.
The most well-known methods are based on chain termination sequencing based on the incorporation of chain terminators by Sanger (F. Sanger et al. PNAS 1977 v. 74 p. 5463), and on base-specific modification and cleavage of nucleic acid strands The Maxam-Gilbert method (AM Maxam and W. Gilbert PNAS 1977, v. 74 p. 560). Both methods produce a number of different length nucleic acid strand fragments. These fragments are separated in the gel according to their length. In this context, all the drawbacks of electrophoresis (for example, long running times, relatively short sequence distances that can be determined in one run, limited number of runs in a single run, and relatively The need for large amounts of DNA) must be tolerated. These methods are very laborious and slow.
A further method of sequencing is based on the hybridization of a nucleic acid strand to a short oligonucleotide. In this method, the number of oligonucleotides of a particular length that must be present to determine the complete sequence is calculated by a mathematical method (ZT Strezoska et al. PNAS 1991 v. 88 p. 10089 RS Drmanac et al. Science 1993 v. 260 p. 1649). This method also suffers from several problems: only one sequence can be determined at a time, secondary structure inhibits hybridization, and sequence repeats prevent correct analysis.
[0006]
Alternative methods of sequencing have been developed by several teams (eg, Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999 v. 18 p. 1021 Metzker et al. NAR 1994 v. 22 p. 4259, Welch et al. Nucleosides & Nucleotides 1999 v. 18 p. 197). This method is abbreviated as BASS (Base Addition Sequencing Scheme) or SBS (Sequencing by Synthesis). In this method, a very large number of identical single-stranded DNA fragments are immobilized at predetermined positions on the surface, and signals from all of these many identical DNA fragments are analyzed. A complementary strand can be synthesized by adding a solution containing a polymerase and nucleotides to the immobilized DNA. The polymerase will work stepwise in this regard: only a single nucleotide is incorporated at each step. As soon as the polymerase incorporates the next nucleotide in the subsequent cycle, the later one is detected. In this method, nucleotides in which the 3'OH group of deoxyribose was modified were used. Despite successfully reducing the number of individual steps in the method, it did not evolve into a functional method. This is probably due, for example, to the following fact: During the synthesis of the complementary strand, the de-synchronization of the synthesis occurs very quickly and therefore the deficiencies accumulate at each step. This allows only short fragments to be sequenced. It should be emphasized that the BASS methods described are not all based on the detection of individual molecules. Instead, signals are recorded from a number of identical molecules that are fixed at defined locations. In this regard, the use of the terms "individual molecule" and "molecule" is intended to refer to an aggregate of a number of identical molecules, rather than individual molecules separated from one another. Just as well, these molecules have the same sequence.
[0007]
A further problem is posed by nucleotides modified at the 3 'position. On the one hand, the attachment of a large substituent at this position in the nucleotide often prevents the incorporation reaction by the polymerase. On the other hand, polymerases can cleave a number of modifications at the 3 'position.
It is therefore an object of the present invention to provide a method for sequence analysis of nucleic acid strands which does not exhibit the disadvantages of the above-described method, and in particular, allows for less expensive, faster and more efficient nucleic acid sequence analysis. It is in. In particular, the method should be able to determine multiple sequences in parallel. Thus, it can be used, for example, for the analysis of very long nucleic acid chains (several Mb) in a single run or for the analysis of variants in a large number of short chains (mutation analysis, SNP analysis).
[0008]
3. easy explanation
The object of the present invention is achieved according to the present invention by a method for parallel sequence analysis of nucleic acid sequences (nucleic acid chains, NACs), wherein the method comprises:
Producing fragments of single-stranded NACs (NACFs) about 50-1000 nucleotides in length corresponding to overlapping subsequences of the entire sequence;
NACFs bind on the reaction surface in a random arrangement in the form of a NACF primer complex using one uniform or several different primers,
The cyclic synthesis reaction of the complementary strand of NACFs is performed using one or more polymerases by the following method:
a) The NACF primer complex bound on the surface is coated with one or more polymerases and one to four modified nucleotides (NTs*) Wherein at least two NTs*NTs used by measuring different fluorescent signals when*So that they can be distinguished from each other*Are selected, and such NTs in the growing complementary strand are*Following incorporation of the polymerase, the polymerase*Are structurally modified at their bases so that they cannot be incorporated, their fluorescent dyes are cleavable, and their structural modifications are cleavable sterically demanding ligands, NTs*Add a solution containing
b) The stationary phase obtained in step a) is incubated under conditions suitable for extending the complementary strand, and the complementary strand is in each
c) fixing the stationary phase obtained in step b) to NTs not incorporated into the complementary strand;*Washing under suitable conditions to remove
d) Single NTs incorporated into the complementary strand by measuring the signal characteristic of each fluorescent dye*To determine the relative position of the individual fluorescent signals being measured simultaneously on the reaction surface,
e) NTs added to the complementary strand to form unlabeled (NTs or) NACFs*Cleaves and removes fluorescent dyes and steric ligands of
f) washing the stationary phase obtained in step e) under conditions suitable for removing fluorescent dyes and ligands,
Repeat steps a) to f) several times if appropriate,
The relative position of the individual NACF primer complexes on the reaction surface and the sequence of these NACFs are determined by specifically assigning the fluorescent signal detected at each position in step d) of the successive cycles to NTs.
[0009]
The entire sequence of NACs is determined, for example, from the determined partial sequence. In this regard, parallel sequence analysis is understood to mean simultaneous sequence analysis of multiple NACFs (eg, 1,000,000 to 10,000,000) from a homogeneous NAC assembly or several different NAC assemblies. Is done.
The assembly of overlapping subsequences obtained, for example, in novel sequencing by commercially available programs can be integrated to form the entire sequence of NACs (Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257).
In a variant analysis of a known reference sequence, a mutation or single nucleotide polymorphism can be identified by comparing the resulting overlapping subsequence to the reference sequence.
According to a specific embodiment of the present invention, a) labeled NT at each cycle*Or b) two different labeled NTs in each cycle*Or c) four different labeled NTs in each cycle*The method can be carried out by repeating steps a) to f) of the periodic synthesis several times using
[0010]
If NACs are variants of a known reference sequence, two differently labeled NTs*This step may also be performed by repeating steps a) to f) of the labeled periodic synthesis reaction several times, using the two unlabeled NTs alternately in the cycle, and determining the overall sequence compared to a reference sequence. The method can be implemented.
The object of the invention is furthermore the nucleotides depicted in FIGS. 7e, 7f and 7g, and the corresponding labeled nucleotides, for example with a fluorescent dye attached to the terminal amino group, or the labeled nucleotides depicted in FIGS. 7h, 7i or 7j. Consisting of
A further object of the invention is the use of the nucleotides depicted in FIGS. 7e, 7f and 7g and the corresponding nucleotides labeled with a fluorescent dye for the method according to the invention.
It is a further object of the present invention to provide NTs whose bases have been modified.*(See, eg, FIGS. 7k, 7L and 7m) and the use of the corresponding nucleotide labeled with a fluorescent dye for the method according to the invention.
[0011]
It is further an object of the present invention to provide kits for performing this method (reaction surfaces, reaction solutions necessary for performing the method, one or more polymerases, and nucleotides (NTs) (where one to four are fluorescent). Such NT in a complementary strand that is labeled with a dye and is growing*Following incorporation of the polymerase, the polymerase*Have been further structurally modified so that they cannot be incorporated, the fluorescent dye is cleavable, and the structural modification is a sterically demanding ligand that is cleavable (NT*Or NTs*)). The nucleotides are preferably the aforementioned nucleotides according to the invention.
According to a specific embodiment of the present invention, the kit further comprises the reagents required to produce a single strand from the double strand, single stranded nucleic acid molecules introduced into NACFs as PBS, oligonucleotide primers, fluorescent dyes and steric dyes. Includes reagents and / or washings necessary to cleave and remove required groups.
The method according to the invention serves to determine nucleic acid sequences and can be used in various areas of genetics. These include, inter alia, determination of unknown long sequences, analysis of sequence polymorphisms and point mutations and parallel analysis of numerous gene sequences.
The preparation of the substances to be analyzed (single-stranded and double-stranded nucleic acid sequences) depends on the type of task and forms a collection of relatively small single-stranded nucleic acid strand fragments (NACFs) from long nucleic acid strands. The purpose is to provide these fragments together with primers suitable for initiating the sequencing reaction (NACF primer complex) and to fix them on a planar surface.
[0012]
In this regard, individual NACFs are immobilized on a planar surface so that enzymatic reactions can take place in these molecules. Basically, various types of immobilization are possible, depending on the purpose, the nature of the NAC and the polymerase used in the reaction. During immobilization or conjugation, the NACFs are randomly distributed on the surface, ie, it is not necessary to ensure that the individual chains are correctly located. The NACF primer complex can bind to the surface via the NACF or primer. In this regard, the NACF primer complex has NT incorporated into individual NACFs.*Must be immobilized on the surface at a density that ensures that the subsequently detected signal is clearly assigned.
Following the preparation of the NACFs, the sequencing reaction begins with all NACF primer complex molecules immobilized on the surface. The synthesis of the complementary strand for each individual bound NACF is the basis for sequencing. In this regard, the sign NT*Is incorporated into the newly synthesized chain. The polymerase adds labeled NT to the growing strand.*Incorporate only one. This converts the sterically demanding group that causes termination to its NTs*By reversibly binding to Thereby, the label NT*It becomes impossible to incorporate. This steric requirement group is preferably a fluorescent dye.
[0013]
The sequencing reaction proceeds in several cycles. One cycle includes the following steps:
a) Labeled nucleotides (NTs*) And addition of a solution containing the polymerase,
b) incubation of the bound NACF primer complex with the solution under conditions suitable for extension of the complementary strand by NT;
c) washing,
d) detection of individual molecule signals,
e) removal of labeling from incorporated nucleotides,
f) washing.
If appropriate, repeat the cycle (a to f).
The reaction conditions of step b) during the cycle are such that the polymerase makes the labeled NT more than 50%, preferably more than 90%, of the NACFs (extendable NACF primer complex) involved in the sequencing reaction in one cycle.*To be able to incorporate.
In this regard, the number of cycles to be performed depends on the type of each problem and is theoretically infinite, preferably between 20 and 5000.
For each immobilized NACF, its specific sequence is based on the integrated NTs*Is then determined from the sequence. Can be reconstructed from duplicate NACF sequences
[0014]
In certain embodiments, the native NAC sequence can be reconstructed from overlapping NACF sequences ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257) In this regard, matches / duplications in the NACFs sequence are searched in the entire NACF sequence assembly, and NACFs can be aligned via these matches / duplications, for example, as follows: it can:
When sequencing known sequences, it has indeed proved worthwhile to obtain lengths of 300 bp or more in the sequence-determined fragment. Thereby, the sequence of the genome obtained from eukaryotes can be determined by the shotgun method.
In this regard, errors in the method can be detected and corrected by various means. All steps of the method can be widely automated.
Several advantages over the aforementioned BASS method arise from working on individual molecules:
1. Because the molecules are detected individually, there is no risk of signal errors as a result of desynchronization in the aggregate. Its own sequence is determined for each fixed NACF. As a result, it is immaterial whether the synthesis has proceeded further or dropped off in neighboring molecules.
2. There is no need to immobilize the molecules in a defined arrangement on the surface since the signals are emitted from individual molecules and not from spatially defined aggregates (the BASS method requires this). is there).
[0015]
4. detailed explanation
4.1 General principle of reaction
The general principle of the reaction is illustrated below by way of example using sequencing of DNA fragments of several Mb in length. The shotgun principle is the basis for sequencing and reassembly of nucleic acid sequences ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257). In this regard, the sequence of long fragments of DNA is determined by sequencing small fragments of DNA and subsequent reconstruction. The material (1) to be analyzed is prepared for the sequencing reaction (2), preferably by digestion into fragments of 50 to 1000 bp in length. Thereafter, each fragment is prepared together with a primer binding site and a primer (3). The mixture of the various DNA fragments is then immobilized on a planar surface (4). Unbound DNA fragments are removed by a washing step. Thereafter, a sequencing reaction is performed on the entire reaction surface. This reaction proceeds periodically. In
[0016]
4.2 Material selection
Using the method according to the invention, a preselected DNA sequence (for example a cloned portion of the genome in a YAC, PAC or BAC vector (R. Anand et al. NAR 1989 v. 17 p. 3425, H. Shizuya et al.) al. PNAS 1992 v. 89 p. 8794, “Construction of bacterial artificial chromosome libraries using the modified PAC system” in “Current Protocols in Human genetics” 1996 John Wiley & Sons Inc.) and unselected DNA (eg, genome) DNA and cDNA mixtures). Through pre-selection, a large amount of genetic information can be used to pre-screen appropriate information, such as, for example, sequence portions obtained from a genome or a collection of gene products, and thereby the number of sequences to be analyzed. Can be limited.
[0017]
4.3 Preparation of materials
The purpose of the material preparation is to obtain bound single-stranded NACFs (bound NACF primer complexes), preferably 50-1000 NTs in length, having a single primer binding site and hybridized primers. These NACF primer complexes have, for example, the structure shown in FIG. In particular, highly variable structures can be derived from this general structure. For clarity, some examples will now follow, with the methods described above that can be used individually or in combination.
[0018]
4.3.1 Production of short nucleic acid chain fragments (50-1000 NTs) (fragmentation step)
It is important to fragment NACs so that fragments corresponding to partial sequences of the entire sequence are obtained. This can be achieved by a method in which fragments of different lengths are formed in a random distribution as cleavage products. According to the present invention, several methods may be used, for example, by ultrasound or starting nucleases such as non-specific endonuclease mixtures ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). Nucleic acid strand fragments (NACFs) can be produced. According to the invention, ultrasonic fragmentation is preferred. Conditions can be adjusted so that a fragment of 1 kb is formed from an average length of 100 bp. The ends of these fragments are then filled in with Klenow fragment (E. coli polymerase I) or T4-DNA polymerase ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).
In addition, complementary short NACFs can be synthesized from long NACs using optional primers. This method is particularly preferred in the analysis of gene sequences, where single-stranded DNA fragments are formed in mRNA with optional primers and reverse transcriptase (Zhang-J et al. Biochem. J. 1999 v. 337 p. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 p. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 p. 264, Decraene et al. Biotechniques 1999 v. 27 p. 962).
[0019]
4.3.2 Introduction of Primer Binding Site in NACF
The primer binding site (PBS) is a sequence portion that means allowing selective binding of the primer to NACF.
In some embodiments, the primer binding sites may be different, so several different primers must be used. In this case, specific sequence portions of the entire sequence may serve as natural PBSs for specific primers. This embodiment is particularly suitable for studying known SNP moieties (see Example 5, "SNP analysis with sequence-specific primers").
In another embodiment, it is preferred that a uniform primer binding site be present in all NACFs to simplify analysis. In accordance with a preferred embodiment of the present invention, accordingly, primer binding sites are further introduced into NACFs. Thus, a primer having a uniform structure can be used for the reaction.
This aspect is described in detail below.
The composition of the primer binding site is not limited. Preferably, its length is between 20 and 50 NTs. The primer binding site can have, for example, a functional group for immobilizing NACF. This functional group may be, for example, a biotin group.
Ligation and nucleotide tailing in DNA fragments are described below as examples of the introduction of a uniform primer binding site.
[0020]
a) Ligation
In this step, a double-stranded oligonucleotide complex having a primer binding site is used (FIG. 3a). This is ligated to the DNA fragment with a commercially available ligase ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). It is important that only one primer binding site binds to the DNA fragment. This is achieved, for example, by modifying one side of the oligonucleotide complex in both strands (FIG. 3b). The results after ligation or subsequent denaturation are shown in FIGS. 3b and 3d. The modifying groups on the oligonucleotide conjugate can serve for immobilization. The synthesis and modification of such oligonucleotide conjugates can be performed according to standardized teachings. For example, a DNA synthesizer 380A Applied Biosystems can be used for synthesis. However, modified or unmodified oligonucleotides of specific composition are also commercially available as applied synthetics, for example from MWG-Biotech GmbH, Germany.
b) nucleotide tailing
Instead of ligation with oligonucleotides, some (eg, between 10 and 20) nucleotide monophosphates can be attached to the 3 'end of the ss-DNA fragment by terminal deoxynucleotidyl transferase ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v. 303, pp. 37-38), which is, for example, some guanosine monophosphate (called (G) n-tailing). The fragment formed is used to bind the primer, in this example the (C) n primer.
[0021]
4.3.3 Single-strand preparation
Single-stranded NACFs are required for the sequencing reaction. If the starting material is present in double-stranded form, there are several methods for producing single-stranded form from double-stranded DNA (eg, heat denaturation or alkali denaturation) ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).
[0022]
4.3.4 Primers for sequencing reactions
This has the function of allowing the NACF to start at a single location. It binds to the primer binding site in NACF. The composition and length of the primer are not limited. Apart from the initiation function, the primer can also perform another function, such as, for example, the establishment of a bond to the reaction surface. Primers must be tailored to the length and composition of the primer binding site so that the primers can initiate the sequencing reaction with the respective polymerase.
When using different primer binding sites (eg, a natural primer binding site in the original overall sequence), use a sequence-specific primer for each primer binding site. In this case, the primer mixture is used for sequencing.
In the case of a uniform primer binding site, for example a primer binding site bound to NACFs by ligation, a uniform primer is used.
The length of the primer is preferably between 6 and 100 NTs, ideally between 15 and 30 NTs. A primer can have a functional group that serves to immobilize the NACF, for example, such a functional group is a biotin group (see the section on immobilization). It should not inhibit the sequencing reaction. The synthesis of such primers can be performed, for example, on a DNA synthesizer 380 A Applied Biosystems, or as an applied synthesis by commercial vendors such as, for example, MWG-Biotech GmbH, Germany.
[0023]
Prior to hybridization, primers can be immobilized on the surface of the NACFs to be analyzed by various techniques, or can be synthesized directly on the surface (eg, according to McGall et al. US Patent 5412087, Barrett et al. US). Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v. 285 p. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. 15 p. 5353, Gingeras et al. NAR 1987 v. 15 p. 5373, Maskos et al. NAR 1992 v 20 p. 1679).
The primer is, for example, 100 μmTwo10-100, 100 μm perTwo100-10,000 or 100μm perTwoBound on the surface at a density of 10,000-1,000,000 per
The primer or primer mixture is incubated with NACFs under hybridization conditions such that it selectively binds to the primer binding site. This primer hybridization (annealing) can be performed before (1), during (2) or after (3) the binding of NACFs to the surface. Optimization of hybridization conditions depends on the primer binding site and the exact structure of the primer, and can be calculated according to Rychlik et al. NAR 1990 v. 18 p. 6409. These hybridization conditions are referred to below as standardized hybridization conditions.
When a primer binding site having a known structure common to all NACFs is introduced, for example, by ligation, a primer having a uniform structure can be used. The primer binding site can have, for example, a functional group useful for immobilization at its 3 'end. This group is, for example, a biotin group. The primer has a structure complementary to the primer binding site.
Examples of primer binding sites and primers are shown below:
[0024]
4.3.5 Immobilization of NACF primer complex on surface (binding or immobilization of NACFs)
The purpose of the immobilization (immobilization) is to immobilize the NACF primer complex on a suitable planar surface so that a periodic enzymatic sequencing reaction can take place. This can be done, for example, by attaching a primer (see above) or NACF to the surface.
The order of the steps in fixing the NACF primer complex may vary:
1) First, a NACF primer complex is formed by hybridization (annealing) in a solution, and then can be bound to the surface.
2) The primer can first be bound to the surface, and then the NACFs can be hybridized to the bound primer to form a NACF primer complex (NACFs bind indirectly to the surface).
3) NACFs are first bound to the surface (NACFs are directly bound to the surface), and in the next step primers can be hybridized to these bound NACFs to form a NACF primer complex.
Therefore, immobilization of NACFs on the surface can be achieved by direct or indirect binding.
For this purpose, surfaces and reaction surfaces should be considered as the same concept, unless otherwise indicated. The solid surface of any material acts as a reaction surface. This material is preferably inert to the enzymatic reaction and does not interfere with the detection. Silicon, glass, ceramic, plastic (eg, polycarbonate or polystyrene), metal (gold, silver, or aluminum) or other materials that meet these functional requirements can be used. Preferably, the surface is not deformable, otherwise signal distortion would be expected upon repeated detection.
[0025]
If a gel-like solid layer (gel surface) is used, this gel can be, for example, an agarose or polyacrylamide gel. Preferably, the gel is free to pass molecules having a molecular weight of less than 5000 Da (eg, a 1-2% agarose gel or a 10-15% polyacrylamide gel can be used). Such a gel surface may have an NT*Has the advantage that the non-specific binding of the compound takes place only considerably lower than other solid-layer surfaces. Since the NACF primer complex binds on the surface, the incorporated NT*Can be detected. Free NT*Are not bound to the gel material and are therefore not immobilized, so their signals cannot be detected. The gel is preferably attached on a solid surface (FIG. 5). This solid surface may be silicon, glass, ceramic, plastic (eg, polycarbonate or polystyrene), metal (gold, silver, or aluminum) or other material. The gel preferably has a thickness of 0.1 mm or less. The gel thickness is preferably greater than the single object depth of the lens, so that NTs non-specifically bound to the solid surface*Are not finally present in the focal plane and are therefore detected. When the object depth is, for example, 0.3 μm, the gel thickness is preferably between 1 μm and 100 μm. The surface can be formed as a continuous surface or as a discontinuous surface composed of individual small components (eg, agarose beads) (FIG. 5b). The reaction surface must be large enough to allow the required number of NACFs to be immobilized at the corresponding density. The reaction surface is preferably 20 cmTwoShould not exceed.
[0026]
Different cycling steps require the exchange of different reactants on the surface. Preferably, the reaction surface forms part of a reaction vessel. In other words, the reaction vessel preferably forms part of a reaction device having a flow device. A flow device allows for the exchange of solutions in the reaction vessel. The exchange can be performed by a computer or by a manually controlled pump device. In this regard, it is important that the surface does not dry out. Preferably, the volume of the reaction vessel is less than 50 μl. Ideally, the volume is less than 1 μl. An example of such a flow system is shown in FIG.
[0027]
If immobilization on the surface of the NACF primer complex occurs via NACFs, this can occur, for example, when the NACFs are attached to one of the two strand ends. This can be achieved by corresponding covalent, affine, or other bonds. Many examples of nucleic acid immobilization are known (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, p. 138, Allemand et al. Biophysical JouRNAl 1997, v. 73, p. 2064, Trabesinger et al. Analytical Chemistry 1999, v. 71, p. 279, Osborne et al. Analytical Chemistry 2000, v. 72, p. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. 15 p. 5353, Gingeras et al. NAR 1987 v. 15 p. 5373, Maskos et al. NAR 1992 v. 20 p. 1679). Immobilization can also be achieved by non-specific binding, for example, by drying a sample containing NACFs on a planar surface.
NACFs are, for example, 100 μmTwo10-100 NACFs per 100 μmTwo100-10,000 or 100μm perTwoBound on the surface at a density of 10,000-1,000,000 per
The density of the extensible NACF primer complex required for detection is 100 μmTwoAbout 10-100. It can be achieved before, during, or after hybridization of the primer to the gene product.
[0028]
By way of example, some methods of binding NACF primer complexes are described in more detail below: In some embodiments, immobilization of NACFs occurs via biotin-avidin or biotin-streptavidin binding. In this regard, avidin or streptavidin is covalently attached to the surface and the 5 'end of the primer contains biotin. Following hybridization of the labeled primers (in solution) with NACFs, they are immobilized on avidin / streptavidin-covered surfaces. The concentration of the biotin-labeled hybridization product and the duration of the incubation of the solution with the surface are chosen so that in this case a density suitable for the sequencing reaction is achieved.
In another preferred embodiment, primers suitable for a sequencing reaction are immobilized on a surface by a suitable method prior to the sequencing reaction (see above). For that, single-stranded NACFs, each having one primer binding site per NACF, are incubated under hybridization conditions (annealing). In this regard, they bind to the immobilized primer, and thereby bind (indirect binding), forming a primer NACF complex. The concentration of single-stranded NACFs and hybridization conditions were 100 μmTwoAre selected to achieve an immobilized density suitable for sequencing 10-100 extensible NACF primer complexes per DNA. After hybridization, unbound NACFs are removed in a washing step. In this embodiment, a surface with a high primer density is preferred because the desired NACF primer complex density is formed faster, which may be, for example, 100 μmTwoAt a density of about 1,000,000 primers per fold, or even higher, in which case only some primers bind NACFs.
[0029]
In another embodiment, NACFs are bound directly to the surface (see above) and then incubated with the primer under hybridization conditions. 100 μmTwoAt a density of about 10-100 NACF per DNA, one would attempt to provide all available NACFs with the primers and make them available for the sequencing reaction. This can be achieved, for example, by increasing the primer concentration, for example from 1 to 100 mmol / l. The density of fixed NACFs on the surface is high (eg, 100 μmTwo(10,000-1,000,000 per), the density of NACF primer complex required for optical detection can be achieved during primer hybridization. In this regard, hybridization conditions (eg, temperature, time, buffer, primer concentration) are selected such that the primer only binds to a portion of the immobilized NACFs (see Examples 5 and 6).
If the surface of the solid layer (eg silicon or glass) is used for immobilization, the blocking solution is preferably added to the surface before step (a) in each cycle, so that NTs on the surface*Can be prevented from non-specific absorption. These conditions for the blocking solution are fulfilled, for example, by an albumin solution (BSA) between
[0030]
4.4 Selection of polymerase
Basically, all DNA-dependent DNA polymerases without 3'-5 'exonuclease activity are suitable as polymerases (DNA-Replication "1992 Ed. A. Kornberg, Freeman and company NY), for example" Sequenase Version ". 2 "type modified T7 polymerase (Amersham Pharmacia Biotech), 3'-5 'exonuclease-free Klenow fragment of DNA polymerase I (Amersham Pharmacia Biotech), polymerase beta of various origins (Animal Cell DNA Polymerases" 1983, Fry M. And commercially available from CRC Press Inc., Chimerx. For example, a thermostable polymerase such as Taq polymerase (GibcoBRL), proHATM polymerase (Eurogentech).
By selecting reaction conditions for suppressing the existing 3'-5 'exonuclease, or adding NaF to the incorporation reaction, a polymerase having 3'-5' exonuclease activity can be used (for example, E. coli polymerase I). Klenow fragment), for example, it has a low pH (pH 6.5) in the Klenow fragment (Lehman and Richardson, J. Biol. Chem. 1964 v. 239 p. 233). Another possibility is to use NTs with phosphorothioate compounds.*(Kunkel et al. PNAS 1981, v. 78 p. 6734). In this case, the embedded NTs*Are not attacked by the 3'-5 'exonuclease of the polymerase. All of these polymerase types are referred to below as "polymerases."
[0031]
4.5 Chemistry
4.5.1 General principle
The sequencing reactions for highly parallel sequence analysis (up to 10,000,000 NACF sequences) on individual nucleic acid molecules included each NT*It is important to identify This includes a single NT per cycle*Only the nucleic acid needs to be incorporated into the nucleic acid strand. Polymerase may cause several NTs in the same cycle*This leads to errors in sequencing. For this reason, NTs*Incorporation must be adjusted.
For example, reversible 3′-OH-modified NTs are shown in the BASS method (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p. 1021, Metzker et al. NAR 1994, v. 22, p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197). In this regard, the cleavage is performed photochemically under mild conditions (The cleavage is in this connection to take place photochemically (Dower US Patent 5.547.839, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197) or It should be done chemically (Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p. 1021).
[0032]
Photochemically cleavable 3'-OH modified NT*The synthesis of is very expensive. Nucleic acid synthesis occurs in a very heterogeneous manner or not at many DNA positions because the polymerases exhibit significantly different affinities for these nucleotide analogs (Metzker et al. NAR 1994 v. 22). p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197). For these reasons, these analogs are not suitable for sequencing reactions or only for very limited methods. A cleavable 3 'ester bond (Canard et al. US Patent 5.798.210) is also not considered a basis for reversible termination of the synthesis. Since most polymerases cleave when the next complementary NT3'-OH ester compound is available, the label attached to the 3'-OH group is released into solution and can no longer function as a terminator (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v. 18 p. 1021, Canard et al. PNAS 1995 v. 92 p. 10859). The polymerase has several identical NTs*This can lead to erroneous signals where the can be continuously incorporated. In the BMBF Consortium project, "Sequence Analysis Using Multiple Dyes and Capillary Electrophoresis", a final report by G. Sagner, 1999, it was reported that modifications at the 3 'position of nucleotides abolished their substrate properties for polymerase.
[0033]
The difficulties in developing NT analogs suitable for this method are based on the following basic conditions:
1) Polymerases are individually NTs*The reaction must be adjusted to incorporate (stop further integration).
2) NTs*Has a dye that satisfies the conditions required for detection.
3) The dye must be able to cleave under mild conditions so that neither the NACF primer complex nor the individual components of the system are affected.
4) Cutting must occur as fast and in the right amount as possible.
5) The arrest of incorporation must be reversible and able to end under mild conditions.
To date, no practical solution to these problems has been proposed in the relevant literature.
[0034]
The conventionally known problem has been solved for the first time by the present invention. According to the present invention, NTs having a sterically demanding group in the base*Is used for sequencing.
Sterically demanding groups attached to bases can prevent further synthesis, which has been regarded in the technical literature as an undesirable property of modified NTs in the modification of nucleic acids. Fluorescent dyes such as biotin, digoxigenin, and fluorescein, tetramethylrhodamine and Cy3 dyes are examples of this type of steric requirement (Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22, p. 3418, Gebeyehu et al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, p. 166, Heer et al. BioTechniques 1994 v 16 p. 54).
In the sequencing reaction in the method according to the present reaction, the labeled NTs*Is incubated with polymerase and nucleic acids, where NTs*Has a sterically demanding group reversibly bonded to its base. Modified NTs*If a reaction mixture containing only*Can only be incorporated. Subsequent NT*Is sterically hindered. Therefore these NTs*Acts as a synthesis terminator. Following removal of the sterically demanding group, the next complementary NT*Can be incorporated. These NTs*Does not completely interfere with the further synthesis and the labeled NT*They are called semi-terminators because they only inhibit the incorporation of one more.
The difference from the 3'-OH terminator method is that the blocking of the 3'-OH group required for the synthesis is not required, but instead the group bonded to the base is used for further incorporation of steric hindrance. In this regard, the 3'-OH groups remain free.
[0035]
4.5.2 NT*General structure of
Its general features are shown in FIGS. 7a, b, d.
This structure is characterized in that the steric group (D) and the fluorescent marker (F) are bound to the base via a cleavable linker (AE).
Deoxynucleoside triphosphates having adenosine (A), guanosine (G), cytidine (C) and thymidine (T) as nucleoside residues are NTs*Be the basis of Instead of thymidine, uridine is preferably used as the nucleoside residue. Inosine can be used instead of guanosine.
[0036]
4.5.3 Markers, fluorophores
Each base is labeled with a marker (F) characteristic of it (FIG. 7). A marker is a fluorescent dye. Several factors influence the choice of fluorescent dye. The choice is not limited as long as the dye meets the following requirements:
a) The detection equipment used must be able to identify this marker as a single molecule bound to DNA under mild conditions (preferably reaction conditions). Preferably, the dye has significant light stability. Preferably, their fluorescence is not extinguished by DNA, or is minimal.
b) The dye that binds to NT must not cause any irreversible interruption of the enzymatic reaction.
c) NTs labeled with a dye*Must be incorporated into the nucleic acid strand by the polymerase.
d) In the case of labels with different dyes, the emission spectra of these dyes do not overlap significantly.
[0037]
Fluorescent dyes that can be used in connection with the present invention, along with their structural formulas, are listed in "Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes. In accordance with the present invention, the following dyes are preferably used as markers: cyanine dyes and their derivatives (eg, Cy2, Cy3, Cy5, CY7, Amersham Pharmacia Biotech, Waggoner US Patent 5.268.486), rhodamine and their derivatives. Derivatives (eg, TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, see handbook), xanthine derivatives (eg, Alexa568, Alexa594, Molecular Probes, Mao et al. US Patent 6.130.101). These dyes are commercially available.
Depending on the nature of the spectrum and the available equipment, the corresponding dye can be selected in this regard. The dye is attached to the linker, for example, via a thiocyanate or ester bond ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. 278 p. 363, Waggoner Methods in Enzymology 1995 v. 246 p. 362) See Examples 1 and 2.
[0038]
4.5.4 Properties of sterically demanding groups
The group (D) (FIGS. 7a, b, d) means the inhibition of the incorporation of further labeled complementary NT by the polymerase. Biotin, digoxigenin and fluorescent dyes are examples of such steric groups (Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22, p. 3418, Gebeyehu et. al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, p. 166, Heer et al. BioTechniques 1994 v. 16, p. 54). The chemical structure of this group is determined by the label NT*It is not limited as long as it does not significantly interfere with the incorporation of and does not irreversibly interfere with the enzymatic reaction.
This group may be present as a separate part in the linker (7a) or may be identical to the dye (7b) or the cleavable group (7d). As a result of the linker cleavage, the polymerase is further labeled NT*This steric requirement (D) is removed following detection of the signal so that can be incorporated. In the case of the structure shown in 7d, the steric group is removed by cleavage.
In a preferred embodiment, the fluorescent dye performs the function of this type of steric requirement, as the labeled nucleotide shows the structure described in FIGS. 7b, k, l.
In another preferred embodiment, photolabile groups serve the function of such a sterically demanding group (FIG. 7d).
[0039]
4.5.5 linker
Preferably, the marker (fluorescent dye) binds to the base via spacer blocks of various lengths called linkers. Examples of linkers are shown in FIGS. 7e, f, h, i, j, k, 1, m. The linker is preferably attached to one of the positions on the base that does not participate in base pairing. More preferably, the bonding position of the linker is the 5-position of the pyrimidine ring and the 7- or 8-position of the purine ring. Examples of linker linkages to bases can be obtained from the following sources (Hobbs et al. US Patent 5.047.519, Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 1996 v. 274, p. 403, Zhu et al. NAR 1994 v. 22 p. 3418, Herman et al. Methods in Enzymology 1990 v. 184 p. 584, JL Ruth et al. Molecular Pharmacology 1981 v. 20 p. 415, L. Otvos et al. v. 15 p. 1763, GE Wright et al. Pharmac Ther. 1990 v. 47, p. 447 "Nucleotide Analogs; Synthesis and Biological Function" KH Scheit 1980, Wiley-Interscience Publication, "Nucleic acid chemistry" Ed. LB Townsend, v 1-4, Wiley-Interscience Publication, “Chemistry of Nucleosides and Nucleotides” Ed. LB Townsend, v. 1-3, Plenum Press).
The total length of the linker can vary. It corresponds to the number of carbon atoms in the portions A, C, E (FIGS. 7a, b, d) and is preferably between 3 and 20. Optimally between 4 and 10. The chemical composition of the linker (A, C, E portions of FIGS. 7a, b, d) is not limited as long as it is stable under the reaction conditions and does not interfere with the enzymatic reaction.
[0040]
4.5.6 Cleavable compounds, cleavage
The linker has a cleavable compound or a cleavable group (part (B) of FIGS. 7a, b, d and part (C) of FIGS. 7k, 1). This cleavage compound allows to remove markers and steric hindrance at the end of each cycle. The choice is not limited as long as it is stable under the conditions of the enzymatic sequencing reaction, does not irreversibly interfere with the polymerase, and can be cleaved off under mild conditions. “Mild conditions” should be understood to mean conditions that do not destroy the NACF primer complex, for example, preferably between
[0041]
Preferably, the compound is a compound that can be cleaved chemically or enzymatically, or belongs to a photosensitive compound. As examples of chemically cleavable groups, esters, thioesters and disulfide compounds are preferred (FIGS. 7k, l) (“Chemistry of protein conjugation and crosslinking” Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v. 184 p. 584, Lomant et al. J. Mol. Biol. 1976 v. 104 243, "Chemistry of carboxylic acid and esters" S. Patai 1969 Interscience Publ.). Examples of photosensitive compounds (FIG. 7m) can be found in the literature at: "Protective groups in organic synthesis" 1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 p. 1, V. Pillai Org Photochem. 1987 v. 9 p. 225, academic paper "Neue photolabile Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, Konstanz.
The position of the cleavable compound / group in the linker is preferably not more than 10 atoms away from the base, but more preferably not more than 3 atoms from the base. Particularly preferred are cleavable compounds or groups present directly on the base.
[0042]
The cleavage and removal steps must be present in every cycle and proceed under mild conditions (see above) so that the nucleic acid is not damaged or altered.
Cleavage can be accomplished chemically (eg, in a weakly acid or weakly alkaline environment for ester compounds, or for the cleavage of disulfide compounds, by adding a reducing agent such as, for example, dithiothreitol or mercaptoethanol (Sigma)) (Examples). 1) or physically (e.g., irradiating the surface with light of a wavelength specific for cleavage of the photosensitive group; academic paper "Neue photolabile Schutzgruppen fur die lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, Konstanz) Is preferred.
Following cleavage, the linker radical (A) remains on the base (FIG. 7c). If the mercapto group on the linker radical released after cleavage hinders further reactions, it can be chemically modified by known methods (eg disulfide or iodoacetic acid compounds).
The synthesis of a cleavable linker is illustrated by the examples (see Examples 1 and 2).
[0043]
4.5.7 Polymerase and NT*Combination of
Overall, marker size, charge, and chemical structure, cleavable linkers and linker residues, and the choice of polymerase also play an important role. They are put together and labeled with polymerase NT*Is incorporated into the elongating nucleic acid strand and the next labeled NT*To determine if the integration of this is impeded thereby. Two conditions must be taken into account in this regard:
On the one hand, after cleavage of the linker, the incorporated modified NT*It is important that the polymerase can further extend the nucleic acid strand. It is therefore important that after cleavage, the linker residue "A" (FIG. 7c) does not significantly interfere with further synthesis. On the other hand, embedded non-cut NTs*Must show obstruction. Many NTs suitable for reaction*Can be synthesized. In particular, specific NTs for sequencing*A series of preliminary tests to test the suitability of the mold consisted of polymerases and NTs*Should be done for all combinations of
[0044]
Buffer conditions are selected according to information obtained from the polymerase manufacturer. The reaction temperature is selected according to the information obtained from the manufacturer for non-thermostable polymerases (eg 37 ° C. for Sequenase Version 2); for thermostable polymerases (eg Taq polymerase) Value (x). This temperature value (x) depends on the Tm of the NACF primer complex and is calculated, for example, as Tm (NACF primer complex) minus 5 ° C (for example, if Tm is 47 ° C, the maximum reaction temperature is 42 ° C). These buffer conditions and reaction temperatures are shown below as "optimal buffer and temperature conditions".
The reaction time (corresponding to the duration of the incorporation step in the cycle) is preferably less than 1 hour; ideally the reaction time is between 10 seconds and 10 minutes.
The following combination is NT*And polymerase as an example of a suitable combination.
a) NT with short linker residue*(Synthesis, see Example 2, FIG. 7e, h, i): nTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) (
b) NT with long linker residues*(Synthesis, see Example 1, FIG. 7f, g, j): dNTP-SS-TRITC (L14) (
[0045]
One test system examines the suitability of the linker residue at base (A) for reaction, but in this case the truncated NTs*Is continuously incorporated into the nucleic acid chain. For example, dUTP with truncated desired linker residues*Using poly-dA, oligo dT20 primer and desired polymerase as a matrix, the reaction is carried out under optimal buffer and temperature conditions suitable for each polymerase. NT*Preferably, the concentration is between 5 μmol / l and 200 μmol / l. After the reaction, NT incorporated into the nucleic acid chain*Are analyzed, for example, by separating them based on length in the gel. The following information can be used to conclude the suitability of the linker residues:*If more can be incorporated, this linker residue is suitable for sequencing reactions. Cut NT*If less than 20 are incorporated, this NT*And polymerase combinations are not optimal for sequencing reactions.
[0046]
Once a suitable linker radical has been determined, the uncleaved labeled NTs*Is tested in another test system to determine if it functions as a semi-terminator. This is because, under optimal buffer and temperature conditions appropriate for the reaction, labeled NTs*Is incubated with the polymerase and matrix and examined. NT*Preferably, the concentration is between 5 μmol / l and 200 μmol / l. The matrix contains several NTs in a row*Should be chosen to be incorporated, for example, as in the previous example, dUTP*In this case, poly-dA can be used. Ideally, the polymerase should be NT*Only one is incorporated.
[0047]
Under certain optimal buffer and temperature conditions, some NT*Are incorporated continuously, the reaction parameters (eg NT*Concentration, reaction concentration)*And polymerase. Most importantly in this regard, within a certain period of time (preferably between 10 seconds and 10 minutes), the polymerase will*Is not incorporated.
According to the invention, this adaptation in one embodiment is performed by changing the reaction temperature while keeping other reaction parameters constant.
[0048]
NT in these experiments*The concentration is usually between 5 μmol / l and 200 μmol / l, preferably between 10 μmol / l and 100 μmol / l. Polymerase concentration and buffer conditions are selected according to the manufacturer's instructions. The duration of the reaction can vary and is preferably between 10 seconds and 10 minutes, which corresponds to the duration of the integration step (a) in one cycle. For non-thermostable polymerases such as Sequenase Version 2 (Amersham Pharmacia Biotech) and the exonuclease-free Klenow fragment of DNA polymerase I (Amersham Pharmacia Biotech), lower the reaction temperature from the conventional 37 ° C to 20-30 ° C. . In the case of thermostable polymerases such as, for example, Taq polymerase (GibcoBRL), ProHATM polymerase (Eurogentech), the reaction temperature is reduced from the conventional 70-75 ° C., preferably from 30 ° C. to a temperature value (x). This temperature value (x) depends on the Tm of the NACF primer complex and is calculated as Tm (NACF primer complex) minus 5 ° C (for example, if Tm is 47 ° C, the temperature value (x) is 42 ° C) .
[0049]
In another preferred embodiment of the present invention, while maintaining other reaction parameters (buffer conditions, temperature conditions) constant, NT*The concentration is reduced to less than 5 μmol / l to adapt the reaction conditions. In this case, NT*Preferably, the concentration is between 0.5 μmol / l and 5 μmol / l. The duration of the reaction is between 10 seconds and 10 minutes. NT*Most important in the choice of concentration is that the polymerase should allow the second NT within a specified time (preferably between 10 seconds and 10 minutes).*Is not incorporated.
Individual NT*Following optimization of the reaction conditions for the incorporation of*And must be repeated. The polymerase reacts with the modified NTs under the correspondingly modified reaction parameters.*Must be continuously incorporated.
The optimization reaction corresponds to the integration step in the cycle, step (b). Conditions, temperature, NT determined for optimal reaction*The concentration, buffer conditions, and reaction time are selected for the reaction at the surface.
Under these reaction conditions, 50%, preferably more than 90% of the NACF primer complex involved in the sequencing reaction in one cycle is labeled NT*NTs in the NACF primer complex so that*Is preferably incorporated.
This is related to the fact that the reaction proceeds very slowly on many nucleic acid strands. NTs at each complementary position in each cycle*Is not necessary, since only successful integration reactions are detected and evaluated; delayed reactions in the next cycle do not result in sequencing errors.
The same polymerase is used for all NTs*It is preferably used for However, different NTs*Different polymerases can also be used.
[0050]
4.5.8 Mechanism of color coding, number of dyes
One cycle is
a) Four NTs labeled differently*,
b) Two NTs labeled differently*,
c) One label NT*,
b) Two NTs labeled differently*And two unlabeled NTs,
Can be performed by:
a) All four NTs can be labeled with different dyes, and all four can be used simultaneously in the reaction. In this case, nucleic acid strand sequencing can be achieved with a minimum number of cycles. However, this variant of the invention places great demands on the detection system: four different dyes have to be identified in each cycle.
b) Labeling with two dyes can be chosen to simplify detection. Here, two sets of NTs labeled differently*Where, for example, A and G have the label "X" and C and U have the label "Y". During the reaction of cycle (n), two NTs labeled differently*, For example, A*Combined with C*, And then use U*And G*Is added to the next cycle (n + 1).
c) In addition, all four NTs*Using only a single dye to label*Only available.
d) In a technically simplified manner, two NTs labeled differently for each cycle.*And two unlabeled NTs (2NTs*/ NTs method). This embodiment can be used to determine variants of a known sequence (eg, a mutated or alternatively spliced gene).
[0051]
4.6 Detector
Individual molecules on a surface can be examined by various methods. Several methods are known: for example, AtomForce microscope, electron microscope, near-field fluorescence microscope, wide-field fluorescence microscope, TIR microscope, etc. (Science 1999 v. 283 1667, Unger et al. BioTechniques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. 92 p. 161, Dickson et al. Science 1996 v. 274 p. 966, Xie et al. Science 1994 v. 265 p. 361, Nie et al. Science 1994 v. 266 p. 1018, Betzig et al. Science 1993 v. 262 p. 1422).
In accordance with the present invention, individual NTs incorporated into a nucleic acid strand*Is preferably obtained by a wide-field fluorescence microscope (epifluorescence) or a laser scanning microscope (epifluorescence) or a TIRF microscope (total reflection fluorescence microscope).
[0052]
Various modifications of such a device construction are possible (Weston et al. J. Chem. Phys. 1998 v. 109 p. 7474, Trabesinger et al. Anal. Chem. 1999 v. 71 p. 279, Adachi et. al. Journal of Microscopy 1999 v. 195 p. 125, Unger et al. BioTechniques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. 92 p. 161, Dickson et al. Science 1996 v. 274 p. 966, Tokunaga et al. Bichem. Biophys. Res. Com. 1997 v. 235 p. 47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R Cherry CRC Press, Inc., “Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, “Handbook of biological confocal microscopy” 1995 J Pawley Plenum Press). The differences in their specific structures result from the variable nature of their components. The device for the excitation light can function based on, for example, a laser, a lamp, or a diode. Both a CCD camera and a PMT can serve as detectors. For other examples of technical details, see "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., " Fluorescence microscopy ”1998 2 ed. Herman BIOS Scientific Publishers,“ Handbook of biological confocal microscopy ”1995 J. Pawley Plenum Press). It is not the object of the present invention to list all possible technical variants of the detection instrument. The schematic structure of a suitable device is illustrated in the schematic, FIG. It includes the following elements:
A light source (1) for exciting fluorescence,
Light guiding part (2),
Scanning table (3),
A device for selecting a spectrum (4),
Detection equipment (5),
Computer with control and analysis functions (6).
Elements of these devices are commercially available (microscope companies: Zeiss, Leica, Nikon. Olympus).
[0053]
The following is intended to propose a combination of these elements suitable for the detection of individual molecules:
Axioplan 2 (Zeiss), a wide-field fluorescence microscope with a mercury vapor lamp,
Plan-neofluar 100x lens, NA 1.4 (Zeiss),
Photometrix or AxioCam camera (Zeiss),
Computer with control and analysis software.
[0054]
The following is intended to describe the detection procedure. In this regard, the general rules for fluorescence microscopy should be followed ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc. , “Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, “Handbook of biological confocal microscopy” 1995 J Pawley Plenum Press).
Detection involves the following phases:
1) Preparation for detection
2) Perform detection steps in each cycle (each detection step is performed as a scanning step and includes the following operations):
a) Adjustment of lens position (X, Y axes)
b) Adjustment of focal plane (Z axis)
c) Detection of individual molecule signals, NT*And signal assignment to each NACF.
d) Move to the next position on the surface
NTs embedded in NACFs*Is recorded by scanning the surface. The scanning process can be performed in various ways ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, “Handbook of biological confocal microscopy” 1995 J. Pawley Plenum Press). For example, if a discontinuous scanning step is selected, the lens moves stepwise over the surface to form a two-dimensional image (2D image) of each surface position (FIG. 8a), (FIGS. 8b, c); test See Example 6 for typical setup.
2D images can be produced in various ways, for example by a laser scanning a position in the microscope field of view (laser scanning microscope), or by a camera shot at a certain position (see microscope handbook). As an example, the detection of individual molecules by a CCD camera is described.
[0055]
Detection is outlined based on the example of sequencing a 1 Mb long DNA fragment.
1) Preparation for detection:
First, determine how many NACF sequences should be analyzed to reconstruct the original sequence. Reconstruction by the shotgun method ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al. Academic Press, Huang et al, Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257), the following factors are involved: 1) Each NACF Among them, the sequence of about 300-500 NTs is determined during sequencing. 2) The total length of the sequence to be analyzed is important. 3) Certain redundancy measurements must be taken during sequencing to increase accuracy and correct errors. In general, most of the original sequence requires approximately 10 to 100 times as much of the original sequence to reconstruct, ie, in this example for 1 Mb, 10 to 100 Mb of original sequence data is used. Therefore, for an average sequence length of 400 bp for each NACF, 25,000 to 250,000 DNA fragments are required.
2) Execution of the detection step in each cycle
For sequencing, the location of NACFs must be determined so that there is a basis for assigning signals. Knowing these locations allows the signals of individual molecules to be incorporated into the integrated NTs*Derived from or randomly bound to the surface*Can be determined. These locations can be identified by various methods.
[0056]
In a preferred embodiment, the location of the bound NACF primer complex is identified during sequencing. NTs incorporated into nucleic acid chains*This takes advantage of the fact that the signals from have always the same coordinates. This is ensured by fixing the nucleic acid chains. Non-specifically bound NTs*Are randomly attached to various locations on the surface.
To identify the location of fixed NACFs, the signal is examined for a match of their coordinates from several consecutive cycles. This can be done, for example, at the beginning of sequencing. The matching coordinates are evaluated and stored as the coordinates of the DNA fragment.
The scanning system must be able to scan the surface in a reproducible manner over multiple cycles. The X, Y, and Z axes defined at each surface location can be examined by computer. The stability and reproducibility of the adjustment of the lens position in each scanning step determines the quality of the detection, ie the identity of the signals of the individual molecules.
[0057]
a) Adjustment of lens position (X, Y axes)
The mechanical instability of commercial scantables and the low level of reproducibility of repetitive adjustment of the same X, Y position make it difficult to accurately analyze the signal of individual molecules over several cycles. There are many ways to improve coordinate consistency in the case of iterative adjustment, or to monitor for possible mismatches. Take a monitoring option as an example. After a rough mechanical adjustment of the lens position, a control image of the pattern tightly bonded to the surface is formed. Even if the mechanical adjustments do not show exactly the same coordinates (deviations up to 10 μm can often occur), they can be corrected by optical inspection. The control image for the pattern is the embedded NTs*It functions as a coordinate system for an image based on a signal from. All that is required for such correction is to move the surface no further between these two images. The signals from the individual molecules are positioned relative to the pattern such that the X, Y deviation at the pattern position is the same as the X, Y deviation at the signal position of the individual molecule. Control images of the pattern can be formed before, during, or after the detection of individual molecules. This type of target image must be created for any adjustments in the new surface position.
[0058]
b) Adjustment of focal plane (Z axis)
The surface is not perfectly planar and shows various depressions. Thus, the surface-lens distance changes when peripheral positions are being scanned. These differences in distances cause individual molecules to move away from the focal plane and are therefore less likely to be analyzed.
Therefore, when scanning the surface, it is important that the focal plane adjustment be reproducible at all lens positions.
There are various methods for adjusting the focal plane with good reproducibility. For example, the following method can be used: Since the excitation of individual molecules results in the excitation of their fluorescence, a marker is added to the surface that serves to adjust the focal plane. Thereafter, detection of the signal of each molecule is continued. The marker can be of any nature (eg, dye or pattern) but must not interfere with detection and response.
[0059]
c) Detection of individual molecules, NT*And signal assignment to each NACF.
The two-dimensional image of the reaction surface generated by the detection system is based on NTs incorporated into NACFs.*Includes signal information for Before further processing, they must be extracted from the entire image information data by a suitable method. The algorithms required for weighing, transforming and filtering image information are part of the standard repertoire of digital image processing and pattern recognition (Haberacker P. "Praxis der Digitalen Bildverarbeiting und Mustererkennung". Hanser-Verlag, Munich, Vienna Galbiati LJ "Machine vision and digital image processing fundamentals". Prentice Hall, Englewood Cliffs, New Jersey, 1990). The signal extraction is preferably performed using grayscale image values that describe the brightness distribution of the reaction surface for each fluorescent channel. If multiple nucleotides with different fluorescent dyes are used in the sequencing reaction, a separate grayscale value image can be formed for each fluorescently labeled nucleotide (A, T, C, G or U) used initially. In principle, two methods can be used for this:
1. Generate a grayscale value image for each fluorescence channel using a suitable filter (Zeiss filter set).
2. By means of a suitable algorithm using an image processing program, the appropriate color channels are extracted from the recorded multi-channel color image and further processed individually in each case as a grayscale value image. In this regard, a color threshold algorithm specific to the channel in question is used for channel extraction. Thus, from 1 to N individual grayscale value images are first formed from the multi-channel color image. These images are defined as follows:
GBN = (s (x, y)) single channel grayscale value image
N = {1, ... number of fluorescent channels}.
M = {0, 1, ..., 255} amount of grayscale values
S = (s (x, y)) Image matrix of grayscale value image
X = 0, 1, ..., L-1 image lines
Y = 0, 1, ..., R-1 image columns
(x, y) spatial coordinates of the image point
s (x, y) εM The grayscale value of the image point.
[0060]
Next, appropriate image information is extracted from this large amount of data using an appropriate program. Such a program should perform the following steps:
GB1From GBNDo the following for:
I. Preprocessing of the image, for example, if appropriate, reduction of image noise resulting from digitization of the image information (eg by grayscale value compensation).
II. A test of each image point of the grayscale value image to determine whether each image point (x, y), together with its surrounding direct and more distant neighbors, satisfies the properties of a fluorescent point. These properties depend, inter alia, on the detector used and the resolution of the grayscale value image. They will show, for example, a typical distribution pattern of lightness values on a matrix surrounding an image point. Image segmentation methods that can be used range from simple thresholding to the use of ordinary networks.
If the image point (x, y) satisfies these requirements, then a comparison with the coordinate axes of the NACFs identified in the previous sequencing cycle is performed. If so, the signal for the nucleotide resulting from each fluorescent channel is assigned to this NACF. Signals with mismatched coordinates are evaluated and rejected as background signals. Analysis of the signal can be performed in parallel with the scanning step.
[0061]
In a typical embodiment, an 8-bit grayscale value image with a resolution of 1317 × 1035 pixels was used. To reduce the changes in the image caused by digitization, a pre-processing of the whole image was first performed: each image point was assigned an average of the eight brightnesses in its neighborhood. At the selected resolution, it forms the pattern of the central image point having the strongest lightness value and the neighboring image points having the lightness decreasing towards all sides, but the pattern is of the fluorescent point. It shows a special feature. If the image points meet these indices and the efferent drop in lightness is above a certain threshold (to eliminate weak fluorescent points), this central image point was evaluated as the coordinates of the fluorescent points.
d) Movement of the lens to the next position on the surface. Following detection of the signal of the individual molecule, the lens is positioned over another location on the surface.
Overall, a continuous image can be formed, for example, by monitoring the X and Y positions, adjusting the focal plane, and detecting molecules at each new lens position. These steps can be controlled by computer.
[0062]
Temporal sequence of process steps
The scanning process and the biochemical reaction take a certain amount of time. If these steps are performed continuously, optimal operation of the apparatus can be achieved. In a preferred embodiment, the reaction is performed on two separate surfaces (FIG. 9). As an example, the surface with the bound NACF primer complex can be divided into two spatially separated parts so that the reaction can proceed independently of each other in the two parts. In another example, NACFs may be immobilized on two separate surfaces from the outset.
Thereafter, the reaction is started. The principle behind it is that the second part is scanned while the reaction and washing steps proceed on one part of the surface. In this way, continuous and continuous analysis can be achieved and the sequencing rate is increased.
The number of surfaces on which the reaction proceeds may be greater than two. This may be appropriate where the reaction occurs as a time-limited step, ie, where detection of the signal on the surface proceeds faster than the reaction and washing steps. In order to match the total duration of the reaction to the detection time, each individual step in the reaction can proceed on one surface with a time delay compared to the next surface.
[0063]
Hereinafter, the present invention will be described with reference to Examples:
【Example】
[0064]
Example 1
Modified dUTP with a long cleavable linker (FIG. 7f-1). As starting materials, 5- (3-aminoallyl) -2′-deoxyuridine-5′-triphosphate, AA-dUTP (Sigma), 3,3′-dithio-bis (propionic acid N-hydroxysuccinimide ester), DTBP -NHS (Sigma), 2-mercaproethylamine, MEA (Sigma) is used. Three equivalents of DTBP-NHS in DMF (25 μl of a 0.4 mol / l solution) are added to 100 μl of a 50 mmol / l AA-dUTP solution in 100 mmol / l borate buffer (pH 8.5). Incubate the reaction mixture at room temperature for 4 hours. Then, a concentrated ammonium acetate solution (pH 9) is added until the total concentration of CH3COONH4 in the reaction solution becomes 100 mmol / l, and the reaction is further incubated. Next, 200 μl of a 1 mol / l MEA solution (pH 9) is added, and the mixture is incubated at room temperature for 1 hour. Then, to this mixture, a saturated solution of I2 in 0.3 mol / l KI solution is added dropwise until the iodine color remains. The modified nucleotides are separated from other reaction products on a DEAE cellulose column by an ammonium carbonate gradient (pH 8.5). The nucleotide having a cleavable linker is isolated by RP-HPLC. Dyes can be attached to this linker by various methods ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, p. 362, Jameson et al., Method in Enzymology 1997, v. 278, p. 363).
[0065]
Other nucleotide analogs (e.g., Hobbs et al., US Patent 5,047,519, Khan et al., US Patent 5,821,356, etc.) also produce nucleotide analogs having the structures shown in Figures 7f-2, 3, 4, and 7g-1, 2. Can be used for the reaction.
The binding of TRITC (tetramethylrhodamine isothiocyanate) is shown as an example of the binding of the dye to the linker (NT * structure, FIG. 7j).
Dissolve dNTP (300 nmol) modified with a cleavable linker in 30 μl of 100 mmol / l sodium borate buffer (pH 9) (10 mmol / l NT *). For this, 10 μl of 10 mmol / l TRITC are added to dimethylformamide (DMF) and incubated for 4 hours at room temperature. Purification of the dye-modified NT * is performed on RP-HPLC using a methanol-water gradient.
The NT * thus produced meets the requirements for incorporation in the DNA strand, proofing of the fluorescence and chain termination after incorporation and termination of inhibition, which are necessary for the success of the method according to the invention.
Example of cleavage of disulfide compound in modified NT *. Cleavage is performed by adding a 20-50 mmol / l dithiothreitol solution (DTT) or a mercaptoethanol solution (Sigma) (pH 8) to the reaction surface. The surface is incubated with this solution for 10 minutes; the solution is then removed and the surface is washed with a buffer to remove DTT or mercaptoethanol residues.
[0066]
Example 2
Modified dUTP with short cleavable linker (dUTP-SS-CH2CH2NH2) (FIG. 7e-1). As starting material, bis-dUTP, 2-mercaptoethylamine (MEA) (Sigma) synthesized according to Hanna (method described in Enzymology 1989, v. 180, p. 383) is used.
Add 100 μl of 100 mmol / l MEA solution (pH 8.5) in H 2 O to 400 μl of 100 mmol / l bis-dUTP in 40 mmol / l borate buffer (pH 8.5) and incubate at room temperature for 1 hour. Then, to this mixture, a saturated solution of I2 in 0.3 mol / l KI solution is added dropwise until the iodine color remains. For example, nucleotides (bis-dUTP and dUTP-SS-CH2CH2NH2) can be separated from other reaction products by ethanol precipitation or a DEAE cellulose column using an ammonium carbonate gradient (pH 8.5). Since bis-dUTP has no interfering effect on the subsequent attachment of the dye to the amino group of the linker, separation of dUTP-SS-CH2CH2NH2 from bis-dUTP can be performed in a final purification step.
Similarly, dCTP (FIG. 7e-2) can be modified using bis-dCTP as a starting material (synthesized according to Hanna et al., Nucleic Acid Research 1993, v. 21, p. 2073).
Dyes can be attached to this linker by various methods ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, p. 362, Jameson et al., Method in Enzymology 1997, v. 278, p. 363).
[0067]
The binding of the FluoroLink ™ Cy3 monofunctional dye (Amersham Pharmacia biotech) (NT * structure, FIG. 7i) is shown as an example of the attachment of the dye to the linker. This is a monofunctional NHS ester fluorescent dye. The reaction is performed according to the instructions for use:
Dissolve dNTPs (300 nmol) modified with a cleavable linker in 300 μl of 100 mmol / l sodium borate buffer (pH 8.5). For this, the dye (300 nmol) is added and incubated for 1 hour at room temperature. Purification of the dye-modified NT * is performed on RP-HPLC using a methanol-water gradient.
The attachment of TRITC (tetramethylrhodamine-5-isothiocyanate, Molecular Probes) is shown as a further example of attachment of the dye to the linker (dUTP-SS-TRITC, FIG. 7h).
[0068]
Dissolve dNTP (300 nmol) modified with a cleavable linker in 30 μl of 100 mmol / l sodium borate buffer (pH 9) (10 mmol / l NT *). For this, 10 μl of 10 mmol / l TRITC are added to dimethylformamide (DMF) and incubated for 4 hours at room temperature. Purification of the dye-modified NT * is performed on RP-HPLC using a methanol-water gradient.
The NT * thus produced meets the requirements for incorporation in the DNA strand, proofing of the fluorescence and chain termination after incorporation and termination of inhibition, which are necessary for the success of the method according to the invention.
Example of cleavage of disulfide compound in modified NT *. Cleavage is performed by adding a 20-50 mmol / l dithiothreitol solution (DTT) or a mercaptoethanol solution (Sigma) (pH 8) to the reaction surface. The surface is incubated with this solution for 10 minutes; the solution is then removed and the surface is washed with a buffer to remove DTT or mercaptoethanol residues.
For example, as shown in FIGS. 7k, 71, and 7m, NT * can be synthesized in a similar manner to the NT analogs described in Examples 1 and 2 and used in the method of the present invention. For individual synthesis steps, see, for example, JL Ruth et al., Molecular Pharmacology 1981 v. 20 p. 415, L. Otvos et al., NAR 1987 v. 15 p. 1763, GE Wright et al., Pharmac Ther. 1990 v. 47, p. 447 “Nucleotide Analogs; Synthesis and Biological Function” KH Scheit 1980, Wiley-Interscience Publication, “Nucleic acid chemistry” Ed. LB Townsend, v. 1-4, Wiley-Interscience Publication, “Chemistry of Nucleosides and Nucleotides” Ed. See LB Townsend, v. 1-3, Plenum Press.
[0069]
Example 3
Sequence analysis of four labeled NT *
In a preferred embodiment of the present invention, all four NT * s used in the reaction are labeled with a fluorescent dye.
[0070]
3A. Reconstruction of the original sequence according to the shotgun principle ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al., Academic Press, Huang et al., Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al., NAR 1995 v. 23 p. 4992, Miller et al., J. Comput. Biol. 1994 v. 1 p. 257). (This principle is particularly suitable for the analysis of new, unknown sequences.)
[0071]
3A-1. Sequencing of long pieces of DNA (Figure 1)
Sequencing of long nucleic acid strands should be described diagrammatically using 1 Mb long piece DNA sequencing (FIG. 1). Sequencing is based on the shotgun principle ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al., Academic Press, Huang et al., Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v 33 p. 21, Bonfield et al., NAR 1995 v. 23 p. 4992, Miller et al., J. Comput. Biol. 1994 v. 1 p. 257). Analytical material for the sequencing reaction is prepared, preferably by splitting into fragments of 50-1000 bp in length. Each fragment is then provided with a primer binding site and a primer. This mixture of DNA fragments is solidified on a planar surface. The unbound DNA fragments are removed by a washing step. The sequencing reaction is then performed on the complete reaction surface. To reconstruct a 1 Mb long DNA sequence, the sequence of NACF should be longer than 300NT, averaging about 400 bp. Only one labeled NT * is incorporated in one cycle, and sequencing requires at least 400 cycles.
In all, reconstruction of the original sequence requires about 10 to 100-fold quantification of the raw sequence, ie, 10 to 100 Mb. Therefore, for an average sequence length of about 400 bp per NACF, 25,000 to 50,000 DNA fragments are required to cover 99.995% or more of the complete sequence.
The determined NACF sequences represent a collection of overlapping partial sequences that can be tailored to the entire sequence of NAC using commercially available programs ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al., Academic Press, Huang et al., Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al., NAR 1995 v. 23 p. 4992, Miller J. Comput. Biol. 1994 v. 1 p. 257).
[0072]
3A-2. Gene product sequencing based on examples of cDNA sequencing.
In a preferred embodiment, instead of one sequence, several sequences can be analyzed at once. For example, the original sequence can be reconstructed from the original data obtained by the shotgun principle.
First, NACF is manufactured. For example, mRNA can be converted to double-stranded cDNA, and this cDNA can be fragmented with ultrasound. These NACFs are then provided with a primer binding site, denatured, fixed, and the primers are then hybridized. It should be noted that in this variation of sample preparation, the cDNA molecule represents an incomplete mRNA sequence (Method in Enzymology 1999, v. 303, p. 19 and other editorials in this book, "cDNA library protocols ”1997 Humana Press).
Another option for the production of single-stranded NACF of mRNA is to reverse transcribe the mRNA with randomized primers. In this regard, a number of relatively short antisense DNA fragments are formed (Zhang-J et al., Biochem. J. 1999 v. 337 p. 231; Ledbetter et al., J. Biol. Chem. 1994 v. 269 p. 31544, Kolls et al., Anal. Biochem. 1993 v. 208 p. 264, Decraene et al., Biotechniques 1999 v. 27 p. 962). These fragments are then provided with a primer binding site (see above). Subsequent steps follow the procedure described above. Since the randomized primer binds over the entire length of the mRNA, this method analyzes the complete mRNA sequence (5 'to 3' end).
The immobilized NACF is analyzed using one of the sequencing embodiments described above. Since the sequence of the mRNA shows, for example, much fewer repetitive sequences than genomic DNA, the number of signals detected from NT * with NACF incorporated is less than 300 and between 20 and 1000. preferable. The number of NACFs that have to be analyzed is calculated according to the same principles as for the long sequence reconstruction of the shotgun.
The original gene sequence is reconstructed from the NACF sequence according to the principle of the shotgun method.
This method allows for the simultaneous sequencing of many mRNAs without the need for pre-cloning.
[0073]
3B. Analysis of sequence variants
In confirming the testing of a known sequence or a variant of this sequence, the requirements on the length and redundancy of the determined NACF sequence are very low. Sequence processing is also simpler in this case. There is no need to reconstruct the entire sequence. Rather, NACF sequences are assigned to all sequences using a commercially available program. Such programs can be based, for example, on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
The sequence to be analyzed is converted to NACF by one of the methods described above. Using both homogeneous and homogeneous primer binding sites, as well as different sequence-specific primers and natural primer binding sites, occurring in the entire sequence being investigated for use (see Example 5), these NACF Is determined. The determined sequences of NACF are then compared to a reference sequence, rather than aligned according to the shotgun method, and their positions in the entire sequence are assigned in such a manner. Genomic or cDNA sequences are included.
Unlike shotgun reconstruction, analysis of sequence variants requires very little original sequence data. Therefore, 5-10 times the amount of the original sequence is sufficient to restore the novel mutant of the entire sequence. Using the shotgun method, reconstruction requires 10 to 100 times as much original sequence ("Automated DNA sequencing and analysis" p. 231 et seq. 1994 M. Adams et al., Academic Press, Huang et al, Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al., NAR 1995 v. 23 p. 4992, Miller et al., J. Comput. Biol. 1994 v. 1 p. 257).
The determined length of the NACF sequence must be sufficient to unambiguously assign a particular position in the reference sequence; thus, for example, a sequence having a length of 20NT (eg, including non-repetitive sections in the human genome) Even can be clearly identified. Comparative analysis of repeated sections requires longer sequences, with the exact length of the sequence depending on the task. The length of the NACF sequence determined for analysis of the non-repeat section is preferably 20NT or more. For repeating sections, 500 NT or more is preferred.
The purpose in sequencing novel variants of the previously known complete sequence may be quite different. A newly determined sequence / reference sequence comparison with a known complete sequence is primarily pursued. The two sequences in this regard start from species that differ greatly in terms of evolution. Various parameters of the construction of these two sequences can be compared. The following is an example of such an analysis: mutation or polymorphism analysis and analysis of alternatively spliced gene products.
Comparing the sequence to be examined with the reference sequence without prior reconstruction of the sequence to be analyzed should be considered in the following, graphically and on a typical basis. Such a comparison can be used, for example, for mutation or SNP analysis.
[0074]
3B-1.
For example, long sequences to be analyzed, such as 1 Mb, are split into NACFs by one of the methods described above. According to the method of the present invention, these NACFs are sequenced using uniform primers. The determined sequence of each NACF is directly compared with the reference sequence. The reference sequence serves as a basis for the assignment of the determined NACF sequence in this regard, so that expensive reconstruction by the shotgun method is achieved. The length of the NACF sequence determined in the analysis of the non-repeat section is preferably 20NT or more. For analysis of repeated sections, 500 NT or more is preferred. The number of NACFs analyzed is determined in this regard by the total length of the sequences examined, the average length of the NACF sequences and the required accuracy of sequencing. The average length of the determined NACF sequence is 100 NT, the total length of the sequence examined is 1 Mb, and the accuracy corresponding to the original sequencing (ie each position can be sequenced only once) Is about 5 times the amount of the original sequence, ie, 5 Mb, because the distribution of NACF occurs randomly over the entire sequence. Overall, 50,000 NACF must be analyzed to cover more than 99% of all sections.
The determined NACF sequence is then assigned to all sequences by a commercially available program, and mismatches are detected. Such programs are based, for example, on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
[0075]
Example 4
Sequence analysis using two labeled NT * and two unlabeled NT (2NT * / 2NT method).
In another embodiment, two modified NT * and unmodified NT are used for sequence analysis.
This method is particularly suitable for analysis of sequence variants (eg, SNP or mutation analysis, etc.) and requires recognition of a reference sequence. For this method, the entire sequence is not reconstructed; instead, a program is used to assign the determined sequence to a reference sequence and record the mismatch. Such programs are based, for example, on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
This embodiment is based on the principle that the sequence of the two signals (labeled NT *) can contain sufficient information to identify the sequence. The determined sequence is compared to a reference sequence and at a specific position, for example:
Assign
[0076]
Unknown variants of the reference sequence to be analyzed are prepared for sequencing as described above (convert NAC to NACF, ligate them to PBS, then hybridize with primers and immobilize on the reaction surface ). The NACF prepared in this manner is sequenced by the 2NT * / 2NT method. An NACF sequence is obtained using each NACF sequence representing the sequence of 2NT *. This sequence must be of sufficient length to facilitate unambiguous assignment of the determined sequence to a known reference sequence. The determined length of the NACF sequence is preferably 40 NT * or more. Since the two labeled NT * s represent only a portion of the sequence, the total length of the synthesized complementary strand is about twice the sequence of the detected NT * (if 40 NT * is detected, the total length is , For example, on average 80NT).
The synthesis of the complementary strand requires four nucleotides. Fluorescent dye-labeled NT * occurs in the present invention as a semi-terminator, i.e., if modified NT * is available, termination occurs alone, so unmodified NT is an additional step in each cycle. Must be added to the reaction. The exact location of this step in the cycle can be changed. In this regard, it is important to use labeled NT * and unmodified NT respectively.
[0077]
The cycle in this embodiment appears, for example, as follows:
a) Addition of a solution containing modified NT * and polymerase to the surface with the provided NACF
b) Incubation of this solution with the immobilized nucleic acid strand under conditions suitable for extending the complementary strand by NT
c) washing
d) Detection of signals of individual modified NT * molecules incorporated into newly synthesized chains complementary to NACF
e) for incorporated nucleotides, removal of label and terminating group
f) washing
g) Add two unmodified NT and polymerase
h) washing.
[0078]
The 2NT * / 2NT method is suitable for, for example, SNP analysis or double-stranded cDNA analysis of a genome section of a gene. It is based on the following principle.
1) The genomic information in each two complementary DNA strands is identical so that information lost in one strand can be completed by information from the other strand.
2) Complete information from double-stranded DNA can be obtained from only two NT * s by a particular pair combination of labeled NT * s. Acceptable combinations of NT * in this embodiment are: A * C *; A * G *; C * T * / C * U *; G * T * / G * U *. A combination of C * and U * is preferred.
3) The known reference sequence forms the basis for the analysis.
4) NACF originates from both chains of the NAC to be analyzed and the determined NACF sequence covers the entire length of the sequence to be analyzed.
[0079]
The following examples show how information can be obtained from a double-stranded DNA fragment with only two labeled NT * s and how the difference from the original or non-mutated sequence (reference sequence / comparison sequence) Will be described. The sequences in 1) and 2) are identical except for one position (underlined). Label A * and C *.
1) Sequence to be tested:
The sequence to be tested is sequenced by the 2NT * / 2NT method such that an assembly of NACF sequences (determined NACF sequence) results. These determined NACF sequences contain information from every strand:
2) Comparative sequence:
Analysis requires a comparison sequence (reference sequence):
3) Comparative sequence with determined matching NACF sequence:
Using the program, assign the determined NACF sequence to a specific position in the comparison sequence and detect mismatches:
[0080]
In this embodiment, the double-stranded nucleic acid can be examined for SNPs or mutations. In this regard, the determined NACF sequence is compared to a reference sequence. In the case of analysis using only two labeled NTs, the basic rules for comparing partial and complete sequences do not differ in principle from the rules that apply for comparing sequences using all four labeled NT * s. See Mutation analysis with 4 NT * s (Example 3B) and sequence comparison for SNP analysis for more information.
[0081]
Example 5
Analysis of single nucleotide polymorphisms with sequence-specific primers represents a particular embodiment of the method of the invention. In addition to
"Primer"-To clarify the intent of the invention, the following terms are distinguished in this example:
a) "Primer" means, for the purposes of the present invention, generally understood, an assembly of primer molecules having a uniform structure.
b) "Several primers" or synonyms means, in the subject matter understood, several aggregates of primer molecules having different structures.
c) "Primer molecule" means a single oligonucleotide molecule.
d) "Several primer molecules" means several individual oligonucleotide molecules; they exhibit a uniform or different structure.
“SNP position” —the position in NAC that is examined for the presence or absence of SNP.
"Target sequence"-the portion of the entire sequence that is sequenced / determined by the use of sequence specific primers in a sequencing reaction. The entire sequence can include several target sequences. The target sequence is long enough to ensure localization of the target sequence within the overall sequence. The target sequence can include, for example, one or more SNP positions.
"Recognition sequence"-the portion of the target sequence used for assignment of this target sequence in the overall sequence.
[0082]
In this embodiment of the SNP analysis, several potential SNP positions in the reference sequence being investigated in the analyzed NAC are selected. Correspondingly, different, sequence-specific primers are provided for these positions. These primers form standardized primers prepared for SNP analysis for a particular problem and are used uniformly as a kit for the analysis in question.
According to the present invention, the preparation of the material to be analyzed comprises a relatively small, single-stranded nucleic acid strand fragment (NACF) assembly of 30 to 2000 NT long from one or more nucleic acid strands (overall sequence). With the purpose of forming the body.
These NACF molecules are randomly immobilized on a planar surface at a density of 10-1,000,000 / 100
Through the selection of target sequences and sequence-specific primers, only relevant sections of the overall sequence are examined, thereby reducing the amount of irrelevant information and reducing analysis time.
[0083]
The following principle forms the basis of this embodiment of the SNP analysis method.
For a single nucleotide polymorphism (SNP) in the NAC (overall sequence) to be investigated, select the position to be examined in the reference sequence.
1) For analysis of each selected SNP position, each SNP position investigated occupies the next position in three directions of the primer, or 2-100, preferably 2-50 in three directions of the primer Prepare the specific primers, ideally in the range of 2-20 positions. Thus, the SNP position is within the range of the target sequence determined during the sequencing reaction. It is preferred to determine several SNP positions simultaneously, so that several specific primers need to be used. Where possible, they have a uniform annealing temperature (ie, the difference between the melting temperatures of the individual primer assemblies is, for example, within the range of about 4 degrees, preferably 2 degrees, more preferably 1 degree). It is preferable to select a primer by such a method.
2) Short nucleic acid strand fragments (NACF) are derived from the entire sequence, these fragments are single-stranded and have a length of 20-2000 NT, preferably 30-500 NT.
3) Immobilize NACF molecules on the surface in a random sequence.
4) After hybridization (annealing) of sequence-specific primers on NACF immobilized on the surface, a periodic sequencing reaction is performed to determine the target sequence for each NACF molecule involved in the reaction. The sequencing reaction proceeds on many molecules simultaneously.
5) The determined target sequence contains information about the entry to a particular section in the overall sequence and information about the SNPs in this section related to the sample being investigated. The length of the target sequence and the number of cycles should be chosen in such a way that the identity of the sequence can be guaranteed.
[0084]
In an advantageous embodiment, the determined target sequence is compared to a reference sequence and a sequence match is assigned. For determined target sequences that are long enough, they can almost certainly be assigned to specific positions in the reference sequence. For example, sequences containing 10NT can form over 106 different combinations, and thus can be almost certainly unambiguously identified in a NAC of only 100,000 NT. Following the assignment of the determined target sequence to a particular position in the reference sequence, differences in the sequence, the SNP, become recognizable.
In another advantageous embodiment, the number of known primers, their composition and the known sequence section of the reference sequence linked to the primer binding site are used to identify the target sequence. Only the sequences located near the primer binding site that have to be considered are used, and the determined target sequence is analyzed in this regard according to the inclusion of the target sequence in the primer. If, for example, only 1000 primers are used, a determined target sequence of 10NT or less is sufficient to facilitate assignment to the corresponding primer.
[0085]
The sample to be analyzed will for the most part contain several identical whole sequence molecules such as, for example, several copies of genomic DNA from tissue cells or several identical mRNA assemblies from tissue cells.
a) Selection of SNP site
The method of the present invention allows both the analysis of known SNP sites and the determination of new SNP sites. Any position in NAC can function as a potential SNP site. Selection can be, for example, by SNP analysis in genes whose products are associated with certain diseases, or in conserved coding sections of genes encoding membrane receptors, or in the regulatory sequences of genes important for cell division. Determined by issues such as testing for known SNP sites.
The SNP site to be analyzed is located within the target sequence determined during the sequencing reaction. Several SNP sites can be determined within the target sequence. Alternatively, several target sequences can be selected, for example, within a gene. In this context, it is important that within the overall sequence, the target sequences are located at a sufficient distance from each other. This distance is necessary so that only one sequence-specific primer per NACF hybridizes, which distance depends on the average NACF length: the shorter the NACF, the closer the target sequence can be. With appropriate primer selection, the SNP site can be analyzed in both strands of the double-stranded nucleic acid strand.
The method of the invention also offers the possibility of simultaneous checking of, for example, several sites from many individuals (as a random sample of an aggregate). The SNP profile of the aggregate can be investigated, for example, thereby.
[0086]
b) Primers for sequencing reactions
The sequencing reaction on individual NACF molecules is driven by primer molecules. In order to be able to carry out sequencing reactions on specific / specific target sequences within the overall sequence, the sequence-specific primers of the invention are required. The sequence-specific primer used for the analysis of the SNP site or the target sequence means an assembly of primer molecules having the same structure. Analysis of several different target sequences requires several different sets of primers.
Through the use of sequence-specific primers, only the relevant sequence section, the target sequence, is analyzed. In the method of the present invention, the length of the sequence to be determined is shortened as much as possible so as to increase the analysis speed.
[0087]
The sequence-specific primer, in the sequence to be analyzed, binds to PBS, a primer binding site specific for that primer. Optimize the composition and length of the primers for any potential SNP sites or target sequences. Examples of optimization steps are described in Rychlik et al., NAR 1990 v. 18 p. In the selection of primers or in the selection of PBS (primer binding site), particular attention should be paid to the following aspects:
1) The SNP site to be analyzed should be located either immediately after the 3 'end of the primer or within the next 2-50 NT, preferably within 2-20 NT.
2) Positioning of the PBS at the SNP site (selection of sequence length and composition) should be performed as little as possible in order for the various PBS sequences and the corresponding primer sequences to bind, ideally under uniform hybridization conditions. It should be done in such a way as to have a similar "annealing temperature". This can be done, for example, by changing the PBS position relative to the SNP site being analyzed or by changing the length of the primer sequence (Rychlik et al., NAR 1990 v. 18 p. 6409).
3) The minimum distance between primers binding to the same strand in the whole sequence should not be shorter than the average NACF length.
[0088]
Primers can be used for both strands of double-stranded NAC. Thus, SNP sites located close to each other can be recorded, for example, or a check can be made for SNP sites in both strands.
The length of the primer is preferably 6 to 100 NT, and most preferably 10 to 30 or 30 to 40 or 40 to 50. Different length primers can be used for different SNP sites or target sequences.
For SNP analysis using sequence-specific primers, according to the invention, the primers are hybridized in a hybridization solution to NACF immobilized on the reaction surface (annealing reaction).
[0089]
c) Immobilization of NACF
In this embodiment, in accordance with the present invention, the NACF primer complex is exclusively bound to the surface via NACF using NACF molecules bound to the planar surface in a random sequence (NACF to surface). Direct binding).
It is preferred to carry out the immobilization of the NACF at one of the ends of the two chains (see above). Immobilization can also be achieved by non-specific binding, for example, by drying a sample containing NACF on a planar surface. The density of the immobilization is 10-100, 100-100,000, 10,000-1,000,000 NACF per 100 μm2.
d) Hybridization
The hybridized NACF and the primers are incubated under stringent conditions that allow the binding (annealing) of the primer as selective as possible to the corresponding primer binding site of the NACF. Optimal hybridization conditions will depend on the exact structure of the primer binding sites and the respective primer structure, and can be calculated, for example, according to Rychlik et al., NAR 1990 v. 18 p. 6409.
Primers preferably refer to primer mixtures. The concentration of the individual sequence-specific primers (individual concentration of the primer assembly) is, for example, from 10 pmol / l to 1 mmol / l, preferably from 0.1 μmol / l to 10 μmol / l. The total concentration of the primers in the primer mixture is preferably between 1 nmol / l and 10 mmol / l. The ratio between individual primer assemblies varies. Primers may be apparently added in excess to the immobilized NACF so as to reduce the hybridization time.
The density of the extensible NACF primer complex required for detection is about 10-100 / 100 μm2. It can be achieved before, during or after hybridization of the primer.
With known NACF concentrations, in one embodiment, the immobilization conditions can be selected in such a way that the NACF binds at a density of about 10-1000 / 100
[0090]
In one embodiment, the density of the immobilized NACF can be much greater than 1000 NACF / 100 μm2, such as, for example, 1,000,000 / 100 μm2. The density of the NACF primer complex required for optical detection is achieved during primer hybridization. Hybridization conditions (eg, temperature, time, buffer) should in this connection be selected in such a way that the primers bind only to a part of the immobilized NACF (see Example 6). .
Where the concentration of NACF is unknown and the corresponding immobilization density is unknown, hybridization (annealing) of the primer to NACF will lead to a density of the NACF primer complex that is greater than the optimal density.
[0091]
For this reason, a preferred embodiment uses a sample containing a portion of the NACF for the determination of the optimal density. This moiety is immobilized on the reaction surface, the primer is hybridized to NACF, and the formed NACF primer complex is labeled by incorporation of a fluorescent dye-containing NT * (eg, Cy3-dCTP, Amersham Pharmacia Biotech). On the one hand, from the determined density (maintaining the hybridization conditions), the required dilution or concentration of any of the original samples for the final sequencing batch can be determined. On the other hand, it is possible to calculate the required change in hybridization conditions from this, such as, for example, shortening the hybridization time with a fixed NACF immobilization density.
The quantitative ratio between the primer assemblies may be different or the same. By using a high concentration of primers, it is possible to almost certainly bind certain sequences, such as, for example, rarer sequences during a certain time.
The great advantage of the described procedure arrangement compared to procedural sequences using sequence-specific primers immobilized on the surface and subsequent hybridization of the sample to these primers is that the sequence-specific primers on the reaction surface and the sample to be analyzed It is a clear shortening of the hybridization (annealing) time between.
[0092]
Example 6
Prepare and run a sequencing reaction
Preparation of gel surface:
Polyacrylamide gels are prepared for analysis of reactions with individual molecules according to the general rules for preparing gels for electrophoretic separation (Electrophoresis A.T. Andrews, Oxford science publications 1995).
For example, the polymerization reaction is performed by ultraviolet rays or a residue former. In this example, ammonium persulfate (APS) such as TEMED 0.01% v / v and APS 0.04% w / v and TEMED (tetramethylethylenediamine) are used for the residue reaction. The composition of the components varies widely; the concentrations of the individual components are in the following ranges (calculated for ready-to-use aqueous AA-bis AA solutions):
Acrylamide monomer (AA) 3-30%, ideally 10-20%, bis-acrylamide (bis-AA) ratio to acrylamide monomer 1: 10-1: 50, preferably 1:20.
[0093]
For manufacturing purposes, use two clean glass plates (washed with acetone and then with water). The glass plate (P1) is preferably pre-treated with a water repellent such as, for example, Repel-silane (dimethyldichlorosilane solution, Amersham Pharmacia-Biotech). P2 acts as a solid support for the gel and binds a gel such as Bind-silane (methacryloxypropyltrimethoxysilane, Amersham Pharmacia-Biotech) such that a covalent bond between the gel and the glass surface is formed. Pre-treat with agent. Pretreatment of P2 with a gel binder is useful when some reactions have to be performed with immobilized molecules. If the number of reactions is small, such pre-treatment is not necessary. In these cases, a clean glass surface is sufficient for P2 so that the gel continues to adhere purely via adhesion to the glass surface.
[0094]
The finished polymerization solution (AA / bis-AA solution containing residue former) is poured between P1 and P2 so that a layer about 5-30 μm thick results. For example, the thickness of the gel can be checked with a spacer block. After curing, P1 is removed. The gel sticks to P2 and remains. Wash it with deionized water.
The gel can be used directly as it is or stored dry at various steps of the manufacture. Prior to reaction with the labeled molecule, the gel is usually swollen with a reaction buffer for a few minutes and then used for the reaction.
NACF is immobilized on the gel surface prepared by this method by drying.
For example, a solution of plasmid DNA (about 1 μL) (converted to single-stranded form by heating, pMOS-blue-plasmid DNA linearized with HindIII at a concentration of about 3400 NT and a concentration of 0.1 μg / μL) is added to about 10
Oligonucleotide 5'-AGTGAATTCGAGCTCGGTAC-3 'is used as a primer. The primer binding site together with the extension relevant for the analysis (double underline below) has the following sequence:
5'-ATCCCCGGGTACCGAGCTCGAATTCACT-3 '
[0095]
A flow cell (microfluidic channel, MFC) with a reaction surface as cover, FIG. 6, was assembled. Such an MFC can provide rapid fluid exchange below the gel surface. As a preliminary test, a primer (calculated Tm (melting temperature) 45.3 ° C, 0.1 μmol / l in 50 mmol / l tris-HCl pH8.7) was hybridized with the plasmid DNA at 45 ° C for 10 minutes on the surface (annealing). ). After the washing step, the density of the plasmid primer complex was checked. The check was carried out using the Klenow fragment by incorporation of dCTP-Cy3 (Amersham Pharmacia Biotech) (2 units / 50 μL in 5 mmol / l MgCl2 in 20 mmol / l tris-HCl buffer, pH 8.5, 2 units / 50 μL, 30 ° C.) For 15 minutes). In this regard, only a single dCMP-Cy3 is incorporated into the growing chain.
Axioplan 2e (Zeiss) with a CCD camera AxioCam (Zeiss), FIG. 8 was used as the detection device.
[0096]
The signal density of each integrated dCMP-Cy3 molecule corresponds to the density of the extendable plasmid primer complex. Under the above conditions, the density of the plasmid primer complex averaged about 15/100 μm 2 and was therefore of the order of the desired size (FIGS. 8a-c). A second surface prepared in a similar manner (with hybridized primers, converted to single-stranded form by heating, pMOS- linearized with Hind III at a concentration of about 3400 NT and 0.1 μg / μL). Blue-plasmid DNA), dUTP-SS-CH2CH2NH-R-Cy3) (dUTP *) and dCTP-SS-CH2CH2NH-R-Cy3) (dCTP *) used as reversible terminator (see Example 2) Performs a periodic sequencing reaction. The detection device is the same as the preliminary test. The solution used for the periodic sequencing reaction had the following composition:
a) Reaction solution for incorporation reaction: 20 mmol / l tris-HCl buffer, pH 8.5, 5 mmol / l MgCl2, 10 glycerol, Klenow fragment (Amersham Pharmacia-Biotech) 2 U / 50 μL, dUTP * or dCTP *, or dATP and dGTP / 10 μmol / l.
b) Wash solution: 20 mmol / l tris-HCl pH 8.5, 0.01% sodium azide.
c) Reaction solution for cleavage reaction: 20 mmol / l tris-HCl, pH 8.5, 50 mmol / l mercaptoethanol.
[0097]
The incorporation reaction of labeled NT * was performed at 30 ° C. for 15 minutes.
In the first cycle of the sequencing reaction, a reaction solution containing dCTP * was added. After the washing step, a detection step was performed on the surface using a single molecule signal with the assigned x, y coordinates recorded (about 11200 signals total). The incorporated NT * label is then cleaved (10 minutes at room temperature) and the surface is washed.
In the second cycle, a reaction solution containing dUTP * was added and incubated at 30 ° C. for 15 minutes. After a subsequent washing step, a single molecule signal was detected on the surface (total about 200 signals). This corresponds to the background signal formed by non-specific binding of NT * to the surface. The label of NT * is cleaved (at room temperature for 10 minutes), and the surface is washed with a washing solution.
In the third cycle, a reaction solution containing dATP and dGTP was added and incubated at 30 ° C. for 15 minutes. Then the surface was cleaned.
[Brief description of the drawings]
[0098]
FIG. 1. Schematic representation of long nucleic acid strand sequencing. Sequencing and reassembly of long nucleic acid sequences (NAC) is based on the shotgun principle. The sequence of the long piece of DNA is determined in this context by sequencing a small fragment (NACF) and subsequent reconstruction. 1) Starting material-nucleic acid sequence to be analyzed, whole sequence 2) Fragment of 50-1000 bp-NACF generated in the fragmentation step from whole sequence 3) Fragment with one primer each-NACF primer complex 4) Immobilization Fragment-NACF primer complex bound to a planar surface, in this embodiment binding is performed to the 3 'end of NACF 5) Addition of a solution containing polymerase and NT *-in the cycle of sequencing First step 6) Wash step After washing step, wash the surface 7) Detection-detect signal of individual NT * incorporated 8) Removal of labeling and termination causing groups-Continue sequencing reaction To eliminate labels and steric hindrance
FIG. 2: Example of the general structure of the NACF primer complex FIG. 2a: In this embodiment, a uniform primer binding site (PBS) is ligated to the 3 ′ end of NACF, and the uniform primer binds to this PBS. Figure 2b: In this embodiment, a natural primer binding site is used; consequently, a mixture of specific primers is used. 1) Primer 2) Primer binding site 3) NACF
FIG. 3 shows an example of ligation of a uniform primer binding site (PBS) having a functional group for binding to a surface. ) Is ligated to double-stranded NACF (3c). After denaturation, a single-stranded NACF with homogeneous PBS is formed (3d).
FIG. 4 Another example of the production of a homogeneous primer binding site (PBS). In this case, NT is ligated to the 3 ′ end of single-stranded NACF (so-called tailing). Through the use of uniform NT, uniform PBS is formed.
FIG. 5: Example of binding of NACF to a gel-like reaction surface A gel layer (2), such as a polyacrylamide gel (FIG. 5a), or a number of gel beads (5), such as agarose beads (FIG. 5b), is applied to a solid substrate ( Adhere to 1). Bind NACF (4) to the surface of the gel. NACF has, for example, a functional group such as biotin, and binds to the gel via streptavidin or avidin (3).
FIG. 6: Example of a flow device A gel-like reaction surface (1) is fixed to a fixed base (2) that transmits excitation light and fluorescence. Together they form the cover of the flow cell. The liquid in the flow cell may be exchanged in a controlled manner using a flow cell together with a storage vessel (3), a pump (4) and a valve (5) forming a flow device. A NACF primer complex (not shown here) is bound to the reaction surface. The incorporated NT * signal is detected by the detector (6).
FIG. 7a shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Figure 7a-Schematic representation of the NT structure in which a cleavable group and a steric requesting group resulting in termination form part of a linker. A linker is the link between a nucleobase and a fluorescent dye. A, B, C, D, E-linker, linker residue after A-cleavage, B-cleavable group, D-stereorequiring group providing termination, F-fluorescent dye.
FIG. 7b shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Schematic representation of an NT structure with a fluorescent dye that simultaneously represents a cleavable group forming part of the linker and a steric group that provides termination. A, B, C-linker, linker residue after A-cleavage, B-cleavable group, D-stereorequiring group to provide termination, F-fluorescent dye.
FIG. 7c is a schematic representation of the structure of NT * incorporated after the cutting step. Two NT * s with remaining linker residues (A) are shown.
FIG. 7d shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Schematic representation of NT structures with cleavable groups that simultaneously constitute a sterically demanding group that results in termination that forms part of the linker. A, B, C, D-linker, linker residue after A-cleavage, B-cleavable group, D-stereorequiring group providing termination, F-fluorescent dye.
FIG. 7e-1 is a structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of a preferred NT structure wherein the linker is linked to
FIG. 7e-2 shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of a preferred NT structure wherein the linker is linked to
FIG. 7f-1 is a structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of another preferred NT structure wherein the linker is linked to
FIG. 7f-2 shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of another preferred NT structure wherein the linker is linked to
FIG. 7f-3 shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of another preferred NT structure wherein the linker is linked to
FIG. 7f-4 shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of another preferred NT structure wherein the linker is linked to
FIG. 7g-1 shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of a preferred NT structure wherein the linker is linked to
FIG. 7g-2 shows the structure of 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. Representation of a preferred NT structure wherein the linker is linked to
FIG. 7h is an example of linking a dye to a linker.
FIG. 7i is an example of linking a dye to a linker.
FIG. 7j is an example of linking a dye to a linker.
FIG. 7k shows the structure of another 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. The linker connects to the 5-position of the pyrimidine ring. The substituents R1,2,3,4 are optional and can be present independently of each other. In one embodiment (7k-1), the Z group represents a bond between the linker and the base. It is optional and may be an amide, carbalkoxy (ester), sulfoxy, ether, thioether or amino group. In one embodiment (7k-1), the E group represents part of the interior of the linker. In another embodiment (7k-2), it represents a bond between the linker and the base. This group is optional and may be an unbranched alkyl or alkenyl chain having preferably 1 to 5 carbon atoms. However, the E group may also be an alkyl or alkenyl chain with an internal amide carbalkoxy (ester), sulfoxy, ether, thioether or amino bond. In this example, the C group is a chemically cleavable group. In the specific example (7k-1,2), it represents a part of the interior of the linker. In another embodiment (7k-3), it represents a bond between the linker and the base. This group is optional and may be ester, thioester and disulfide compounds. The Y group represents a part of the interior of the linker that forms the bond between the cleavable group (C) and the fluorescent dye (F). This group is optional and may be a branched or unbranched alkyl or alkenyl chain, or may be a substituted or unsubstituted aryl group. Further possible options are alkyl or alkenyl chains with an internal amide carbalkoxy (ester), sulfoxy, ether, thioether or amino bond. The X group is the bond between the fluorescent dye and the linker, which is a bond that can be derived from both the linker and the fluorescent dye (F). It is optional and may be an amide, carbalkoxy (ester), sulfoxy, ether, thioether or amino group.
FIG. 71 shows structures of other 2′-deoxynucleoside triphosphates that can be used in the method of the present invention. The linker connects to position 7 of the purine ring. The substituents R1,2,3,4 are optional and can be present independently of each other. In one embodiment (71-1), the Z group represents a bond between the linker and the base. It is optional and may be an amide, carbalkoxy (ester), sulfoxy, ether, thioether or amino group. In one embodiment (71-1), the E group represents a portion of the interior of the linker. In another embodiment (71-2), it represents a bond between a linker and a base. This group is optional and may be an unbranched alkyl or alkenyl chain having preferably 1 to 5 carbon atoms. However, the E group may also be an alkyl or alkenyl chain with an internal amide carbalkoxy (ester), sulfoxy, ether, thioether or amino bond. In this example, the C group is a chemically cleavable group. In the specific example (71-1,2) it represents a part of the interior of the linker. In another embodiment (71-3), it represents a bond between the linker and the base. This group is optional and may be ester, thioester and disulfide compounds. The Y group represents a part of the interior of the linker that forms the bond between the cleavable group (C) and the fluorescent dye (F). This group is optional and may be a branched or unbranched alkyl or alkenyl chain, or may be a substituted or unsubstituted aryl group. Further possible options are alkyl or alkenyl chains with an internal amide carbalkoxy (ester), sulfoxy, ether, thioether or amino bond. The X group is the bond between the fluorescent dye and the linker, which is a bond that can be derived from both the linker and the fluorescent dye (F). It is optional and may be an amide, carbalkoxy (ester), sulfoxy, ether, thioether or amino group.
FIG. 7m shows the structure of another 2′-deoxynucleoside triphosphate that can be used in the method of the present invention. The linker connects to the 5-position of the pyrimidine ring. The substituents R1,2,3,4 are optional and can be present independently of each other. The Y group represents a part of the interior of the linker that forms the bond between the cleavable group (C) and the fluorescent dye (F). This group is optional and may be a branched or unbranched alkyl or alkenyl chain, or may be a substituted or unsubstituted aryl group. Further possible options are alkyl or alkenyl chains with an internal amide carbalkoxy (ester), sulfoxy, ether, thioether or amino bond. The X group is the bond between the fluorescent dye and the linker, which is a bond that can be derived from both the linker and the fluorescent dye (F). It is optional and may be an amide, carbalkoxy (ester), sulfoxy, ether, thioether or amino group.
FIG. 8 shows an example of a detection system. After incorporation of the labeled NT *, the surface (7) is scanned by detecting the fluorescent signal of the individual dye molecules linked to the NT. Figure 8a: Schematic representation of a section of the reaction surface (gray) scanned. In each case, the circle corresponds to the recording of the two-dimensional image and represents the area where the fluorescent signal is detected. In this regard, several signals (eg, 100- 10,000) from individual molecules are recorded simultaneously in the photograph. The reaction surface is scanned every cycle, and several photographs are taken at different points on the surface during the scanning process. In this regard, less than a few million signals of embedded NT * can be recorded. A high degree of parallelism forms the basis for the speed of this process. FIG. 8b: Photograph (two-dimensional image) of the signal from each integrated NT *. FIG. 8c: Part of FIG. 8b. This part shows the four integrated NT * signals. Each signal has the characteristic properties of an individual molecular signal (see description herein) and can be identified on this basis (preferably using a computer program). A corresponding X, Y axis is assigned to each of the identified signals.
FIG. 9: Example of an advantageous arrangement of the reaction surface Through the use of two separate flow cells (microfluidic channels, MFC) the throughput is increased. Biochemical and chemical reactions take place in one flow cell, while detection takes place in the other. Next, the flow cell is replaced.
Claims (50)
該NACFsを、1つの均一またはいくつかの相異なるプライマーを用いるNACFプライマー複合体の形で、反応表面上にランダムな配置で結合し、
以下のステップa)からf)を適すれば数回繰り返すことにより、NACFsの相補鎖の周期的合成反応を一つまたはそれ以上のポリメラーゼを使用して実行し、
連続的サイクルのステップd)において各々の位置で検出された蛍光シグナルをNTsに具体的に割り当てることにより、反応表面上の個々のNACFプライマー複合体の相対的位置およびこれらNACFsの配列を決定する、
NACsの並行配列解析方法:
a) 表面上に結合したNACFプライマー複合体に、一つまたはそれ以上のポリメラーゼ、および蛍光色素で標識された一つから四つの修飾ヌクレオチド(NTs*)であって、少なくとも二つのNTs*を併用した場合に相異なる蛍光シグナルを測定することにより使用したNTs*を互いに区別できるようにそのNTs*に存在する蛍光色素が選択されており、伸長中の相補鎖におけるこのようなNTs*の組み込みに続いてポリメラーゼが同じ鎖にさらにNT*を組み込むことができないようにその塩基において構造的に修飾されており、その蛍光色素が切断可能であり、およびその構造的修飾が切断可能な立体要求リガンドであるNTs*を含む溶液を添加し、
b) ステップa)で得られた固定相を、相補鎖を伸長するのに適した条件下でインキュベートし、その相補鎖をいずれの場合にも1NT*ずつ伸長させ、
c) ステップb)で得られた固定相を、相補鎖に組み込まれなかったNTs*を除去するのに適した条件下で洗浄し、
d) それぞれの蛍光色素に特徴的なシグナルを測定することにより相補鎖に組み込まれた単一NTs*を検出し、同時に個々の蛍光シグナルの反応表面上の相対的位置を測定し、
e) 非標識(NTsまたは)NACFsを形成するため、相補鎖に添加したNTs*の蛍光色素および立体要求リガンドを切断除去し、
f) ステップe)で得られた固定相を、蛍光色素およびリガンドを除去するのに適した条件下で洗浄する。Forming fragments (NACFs) of single-stranded nucleic acid sequences (nucleic acid chains, NACs) of about 50-1000 nucleotides in length that can correspond to overlapping subsequences of the entire sequence;
Binding the NACFs in a random arrangement on the reaction surface in the form of a NACF primer complex using one homogeneous or several different primers,
Performing the periodic synthesis reaction of the complementary strand of NACFs using one or more polymerases by repeating the following steps a) to f) several times as appropriate
Determining the relative position of the individual NACF primer complexes on the reaction surface and the sequence of these NACFs by specifically assigning NTs the fluorescent signal detected at each position in step d) of successive cycles;
Method for analyzing parallel sequences of NACs:
a) A combination of one or more polymerases and one to four modified nucleotides (NTs * ) labeled with a fluorescent dye, with at least two NTs * , in combination with the NACF primer complex bound on the surface are fluorochromes selected to present in its NTs * as NTs * a distinguishable from each other using by measuring different fluorescent signal when, in such NTs * of integration in the complementary strand of the growing Subsequently, the polymerase is structurally modified at its base so that it cannot further incorporate NT * into the same strand, its fluorescent dye is cleavable, and its structural modification is cleavable with a sterically demanding ligand. A solution containing certain NTs * is added,
b) incubating the stationary phase obtained in step a) under conditions suitable for extending the complementary strand, and in each case extending the complementary strand by 1 NT * ,
c) washing the stationary phase obtained in step b) under conditions suitable for removing NTs * not incorporated into the complementary strand,
d) detecting the single NTs * incorporated in the complementary strand by measuring the signal characteristic of each fluorescent dye, and simultaneously measuring the relative position of the individual fluorescent signals on the reaction surface,
e) To form unlabeled (NTs or) NACFs, the NTs * fluorescent dye and steric demand ligand added to the complementary strand are cleaved and removed,
f) Wash the stationary phase obtained in step e) under conditions suitable for removing fluorescent dyes and ligands.
全体配列の重複部分配列に相当する長さ約30−1000ヌクレオチドの一本鎖NACFsを準備し、
得られたNACF分子をランダムな配置で直接平面的表面に結合し、
固定化NACFsと一つまたはそれ以上の配列特異的プライマー集合体とのハイブリダイゼーション(アニーリング)を行い、個々の伸長可能なNACFプライマー複合体の密度を100μm2につき10から100の間とし、
以下のステップa)からf)を適すれば数回繰り返して、NACFsに相補的な鎖の周期的合成反応を行い、
連続的サイクルのステップd)において各々の位置で検出された蛍光シグナルをNTsに具体的に割り当てることにより、反応表面上の個々のNACFプライマー複合体の相対的位置およびこれらNACFsの配列を決定することを特徴とする、請求項1記載の方法:
a) 結合したNACFプライマー複合体に、一つまたはそれ以上のポリメラーゼ、および蛍光色素で標識された一つから四つの修飾ヌクレオチド(NTs*)であって、少なくとも二つのNTs*を併用する場合に相異なる蛍光シグナルを測定することにより使用したNTs*を互いに区別できるようにそのNTs*に存在する蛍光色素が選択されており、伸長中の相補鎖におけるこのようなNTs*の組み込みに続いてポリメラーゼが同じ鎖にさらにNT*を組み込むことができないようにその塩基において構造的に修飾されており、蛍光色素を伴う停止をもたらす基が切断可能であるNTs*を含む溶液を添加し、
b) ステップa)で得られた固定相を、相補鎖を伸長するのに適した条件下でインキュベートし、その相補鎖をいずれの場合にも1NT*ずつ伸長させ、
c) ステップb)で得られた固定相を、相補鎖に組み込まれなかったNTs*を除去するのに適した条件下で洗浄し、
d) それぞれの蛍光色素に特徴的なシグナルを測定することにより相補鎖に組み込まれた単一NTs*を検出し、同時に個々の蛍光シグナルの反応表面上の相対的位置を決定し、
e) 非標識(NTsまたは)NACFsを形成するため、相補鎖に添加したNTs*から蛍光色素を伴う停止をもたらす基を切断除去し、
f) ステップe)で得られた固定相を、蛍光色素を伴う停止をもたらす基を除去するのに適した条件下で洗浄する。The nucleic acid sequences (NACs) are part of the entire sequence, the primers are sequence-specific primers,
Preparing single-stranded NACFs of about 30-1000 nucleotides in length corresponding to the overlapping sequence of the entire sequence,
Binding the obtained NACF molecules directly to a planar surface in a random arrangement,
Performing hybridization (annealing) of the immobilized NACFs with one or more sequence-specific primer aggregates, wherein the density of each extensible NACF primer complex is between 10 and 100 per 100 μm 2 ;
The following steps a) to f) are repeated several times if appropriate to carry out a periodic synthesis reaction of a strand complementary to NACFs,
Determining the relative positions of the individual NACF primer complexes on the reaction surface and the sequence of these NACFs by specifically assigning NTs the fluorescent signal detected at each position in step d) of successive cycles The method according to claim 1, characterized in that:
a) When one or more polymerases and one to four modified nucleotides (NTs * ) labeled with a fluorescent dye are used in combination with the bound NACF primer complex and at least two NTs * are used in combination. different and fluorescent fluorochromes the NTs * used by measuring the signal present on its NTs * can be distinguished from one another is selected, the polymerase Following such NTs * of integration in the complementary strand of the growing A solution containing NTs * that is structurally modified in its base so that no further NT * can be incorporated into the same strand, and the group that results in termination with the fluorescent dye is cleavable,
b) incubating the stationary phase obtained in step a) under conditions suitable for extending the complementary strand, and in each case extending the complementary strand by 1 NT * ,
c) washing the stationary phase obtained in step b) under conditions suitable for removing NTs * not incorporated into the complementary strand,
d) detecting a single NTs * incorporated into the complementary strand by measuring the signal characteristic of each fluorescent dye, and simultaneously determining the relative position of the individual fluorescent signals on the reaction surface,
e) cleaving off the group that causes termination with a fluorescent dye from NTs * added to the complementary strand to form unlabeled (NTs) or NACFs;
f) The stationary phase obtained in step e) is washed under conditions suitable for removing groups that cause termination with the fluorescent dye.
a)二本鎖から一本鎖を形成するのに必要な試薬、
b)PBSとしてNACFsに導入される核酸分子、
c)オリゴヌクレオチドプライマー、
d)蛍光色素および立体要求リガンドを切断除去するのに必要な試薬、
および/または
e)洗浄溶液、
をさらに含むことを特徴とする、請求項29または30記載のキット。Component;
a) reagents necessary to form a single strand from a double strand,
b) nucleic acid molecules introduced into NACFs as PBS;
c) oligonucleotide primers,
d) reagents required to cleave and remove fluorescent dyes and steric ligands;
And / or e) a washing solution,
The kit according to claim 29 or 30, further comprising:
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE10120797A DE10120797B4 (en) | 2001-04-27 | 2001-04-27 | Method for analyzing nucleic acid chains |
PCT/EP2002/004659 WO2002088382A2 (en) | 2001-04-27 | 2002-04-26 | Method for analysing nucleic acid chains |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004529650A true JP2004529650A (en) | 2004-09-30 |
JP2004529650A5 JP2004529650A5 (en) | 2005-08-18 |
Family
ID=7683014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002585662A Pending JP2004529650A (en) | 2001-04-27 | 2002-04-26 | Analysis method of nucleic acid strand |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1381698A2 (en) |
JP (1) | JP2004529650A (en) |
AU (1) | AU2002304705A1 (en) |
DE (1) | DE10120797B4 (en) |
WO (1) | WO2002088382A2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010010966A1 (en) * | 2008-07-24 | 2010-01-28 | 国立大学法人九州大学 | Nucleoside triphosphate derivative, nucleic acid probe, multilabeled nucleic acid probe, method for production of multilabeled nucleic acid probe, and method for detection of target nucleic acid |
JP2011026324A (en) * | 2008-07-24 | 2011-02-10 | Kyushu Univ | Enzyme substrate-modified nucleoside triphosphate derivative |
JP2011169878A (en) * | 2010-01-22 | 2011-09-01 | Kyushu Univ | Nucleic acid detecting kit |
JP2018206417A (en) * | 2010-05-25 | 2018-12-27 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニアThe Regents Of The University Of California | Bambam: simultaneous comparison analysis of high-throughput sequencing data |
US10726945B2 (en) | 2010-05-25 | 2020-07-28 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US7875440B2 (en) | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
US9708358B2 (en) | 2000-10-06 | 2017-07-18 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding DNA and RNA |
DE20122767U1 (en) | 2000-10-06 | 2007-08-09 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for the decoding of DNA and RNA |
DE10239504A1 (en) * | 2001-08-29 | 2003-04-24 | Genovoxx Gmbh | Parallel sequencing of nucleic acid fragments, useful e.g. for detecting mutations, comprises sequential single-base extension of immobilized fragment-primer complex |
DE10246005A1 (en) * | 2001-10-04 | 2003-04-30 | Genovoxx Gmbh | Automated nucleic acid sequencer, useful e.g. for analyzing gene expression, based on parallel incorporation of fluorescently labeled terminating nucleotides |
DE10149786B4 (en) * | 2001-10-09 | 2013-04-25 | Dmitry Cherkasov | Surface for studies of populations of single molecules |
GB0129012D0 (en) | 2001-12-04 | 2002-01-23 | Solexa Ltd | Labelled nucleotides |
DE10214395A1 (en) * | 2002-03-30 | 2003-10-23 | Dmitri Tcherkassov | Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide |
US11008359B2 (en) | 2002-08-23 | 2021-05-18 | Illumina Cambridge Limited | Labelled nucleotides |
US7414116B2 (en) | 2002-08-23 | 2008-08-19 | Illumina Cambridge Limited | Labelled nucleotides |
EP3147292B1 (en) | 2002-08-23 | 2018-09-26 | Illumina Cambridge Limited | Labelled nucleotides |
GB2395954A (en) | 2002-08-23 | 2004-06-09 | Solexa Ltd | Modified nucleotides |
US8637650B2 (en) | 2003-11-05 | 2014-01-28 | Genovoxx Gmbh | Macromolecular nucleotide compounds and methods for using the same |
US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
US7981604B2 (en) | 2004-02-19 | 2011-07-19 | California Institute Of Technology | Methods and kits for analyzing polynucleotide sequences |
US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
US20090291440A1 (en) * | 2006-05-24 | 2009-11-26 | Ken Hirano | Method for synthesizing nucleic acid using dna polymerase beta and single molecule sequencing method |
EP2548972A1 (en) | 2006-06-14 | 2013-01-23 | Verinata Health, Inc | Methods for the diagnosis of fetal abnormalities |
WO2008042067A2 (en) | 2006-09-28 | 2008-04-10 | Illumina, Inc. | Compositions and methods for nucleotide sequencing |
GB2457402B (en) | 2006-12-01 | 2011-10-19 | Univ Columbia | Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators |
US9115163B2 (en) | 2007-10-19 | 2015-08-25 | The Trustees Of Columbia University In The City Of New York | DNA sequence with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators |
US20110014611A1 (en) | 2007-10-19 | 2011-01-20 | Jingyue Ju | Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequences by synthesis |
US10174368B2 (en) | 2009-09-10 | 2019-01-08 | Centrillion Technology Holdings Corporation | Methods and systems for sequencing long nucleic acids |
CN102858995B (en) | 2009-09-10 | 2016-10-26 | 森特瑞隆技术控股公司 | Targeting sequence measurement |
WO2011050938A1 (en) | 2009-10-26 | 2011-05-05 | Genovoxx Gmbh | Conjugates of nucleotides and method for the application thereof |
EP3719140A1 (en) | 2009-11-06 | 2020-10-07 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
ES2687761T3 (en) | 2011-01-31 | 2018-10-29 | F. Hoffmann-La Roche Ag | Methods of identification of multiple epitopes in cells |
US20120252682A1 (en) | 2011-04-01 | 2012-10-04 | Maples Corporate Services Limited | Methods and systems for sequencing nucleic acids |
DE102012008375A1 (en) | 2011-04-27 | 2012-10-31 | Genovoxx Gmbh | Methods and components for the detection of nucleic acid chains |
US20150086981A1 (en) | 2011-05-04 | 2015-03-26 | Genovoxx Gmbh | Nucleoside-triphosphate conjugate and methods for the use thereof |
EP3836149A1 (en) | 2011-11-07 | 2021-06-16 | QIAGEN Redwood City, Inc. | Methods and systems for identification of causal genomic variants |
JP6525872B2 (en) | 2012-08-08 | 2019-06-05 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | Increasing dynamic range to identify multiple epitopes in cells |
CA3209385A1 (en) | 2013-02-01 | 2014-08-07 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
US9411930B2 (en) | 2013-02-01 | 2016-08-09 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
WO2014144883A1 (en) | 2013-03-15 | 2014-09-18 | The Trustees Of Columbia University In The City Of New York | Raman cluster tagged molecules for biological imaging |
CN108864232B (en) | 2013-03-15 | 2022-01-04 | 伊鲁米纳剑桥有限公司 | Modified nucleosides or nucleotides |
WO2014144713A2 (en) | 2013-03-15 | 2014-09-18 | Immumetrix, Inc. | Methods of sequencing the immune repertoire |
CN103484106B (en) * | 2013-09-05 | 2015-08-19 | 上海交通大学 | Four look fluorescent mark Reversible terminal and the purposes in DNA sequencing thereof |
EP3066236B1 (en) | 2013-11-07 | 2022-08-24 | The Board of Trustees of the Leland Stanford Junior University | Cell-free nucleic acids for the analysis of the human microbiome and components thereof |
AU2014362322B2 (en) | 2013-12-11 | 2021-05-27 | The Regents For Of The University Of California | Methods for labeling DNA fragments to recontruct physical linkage and phase |
WO2016019360A1 (en) | 2014-08-01 | 2016-02-04 | Dovetail Genomics Llc | Tagging nucleic acids for sequence assembly |
GB201414098D0 (en) | 2014-08-08 | 2014-09-24 | Illumina Cambridge Ltd | Modified nucleotide linkers |
AU2016220135B2 (en) | 2015-02-17 | 2021-07-29 | Dovetail Genomics Llc | Nucleic acid sequence assembly |
US11807896B2 (en) | 2015-03-26 | 2023-11-07 | Dovetail Genomics, Llc | Physical linkage preservation in DNA storage |
CN108368542B (en) | 2015-10-19 | 2022-04-08 | 多弗泰尔基因组学有限责任公司 | Methods for genome assembly, haplotype phasing, and target-independent nucleic acid detection |
SG11201807117WA (en) | 2016-02-23 | 2018-09-27 | Dovetail Genomics Llc | Generation of phased read-sets for genome assembly and haplotype phasing |
EP3954771A1 (en) | 2016-05-13 | 2022-02-16 | Dovetail Genomics, LLC | Recovering long-range linkage information from preserved samples |
US20210371918A1 (en) | 2017-04-18 | 2021-12-02 | Dovetail Genomics, Llc | Nucleic acid characteristics as guides for sequence assembly |
CA3068273A1 (en) | 2017-06-21 | 2018-12-27 | Bluedot Llc | Systems and methods for identification of nucleic acids in a sample |
WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | Methods and systems for sample extraction |
CA3090102A1 (en) | 2018-01-31 | 2019-08-08 | Dovetail Genomics, Llc | Sample prep for dna linkage recovery |
US11166996B2 (en) | 2018-12-12 | 2021-11-09 | Flagship Pioneering Innovations V, Inc. | Anellovirus compositions and methods of use |
WO2020264185A1 (en) | 2019-06-27 | 2020-12-30 | Dovetail Genomics, Llc | Methods and compositions for proximity ligation |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9208733D0 (en) * | 1992-04-22 | 1992-06-10 | Medical Res Council | Dna sequencing method |
US5986076A (en) * | 1994-05-11 | 1999-11-16 | Trustees Of Boston University | Photocleavable agents and conjugates for the detection and isolation of biomolecules |
WO1998033939A1 (en) * | 1997-01-31 | 1998-08-06 | Hitachi, Ltd. | Method for determining nucleic acid base sequence and apparatus therefor |
CA2325399A1 (en) * | 1998-03-23 | 1999-09-30 | Invitrogen Corporation | Modified nucleotides and methods useful for nucleic acid sequencing |
DE19844931C1 (en) * | 1998-09-30 | 2000-06-15 | Stefan Seeger | Procedures for DNA or RNA sequencing |
ATE508200T1 (en) * | 1999-02-23 | 2011-05-15 | Caliper Life Sciences Inc | SEQUENCING THROUGH INCORPORATION |
ATE397092T1 (en) * | 1999-03-10 | 2008-06-15 | Asm Scient Inc | METHOD FOR DIRECT SEQUENCING OF NUCLEIC ACIDS |
US7056661B2 (en) * | 1999-05-19 | 2006-06-06 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
US6309836B1 (en) * | 1999-10-05 | 2001-10-30 | Marek Kwiatkowski | Compounds for protecting hydroxyls and methods for their use |
GB0013276D0 (en) * | 2000-06-01 | 2000-07-26 | Amersham Pharm Biotech Uk Ltd | Nucleotide analogues |
-
2001
- 2001-04-27 DE DE10120797A patent/DE10120797B4/en not_active Expired - Lifetime
-
2002
- 2002-04-26 EP EP02732680A patent/EP1381698A2/en not_active Withdrawn
- 2002-04-26 WO PCT/EP2002/004659 patent/WO2002088382A2/en active Application Filing
- 2002-04-26 JP JP2002585662A patent/JP2004529650A/en active Pending
- 2002-04-26 AU AU2002304705A patent/AU2002304705A1/en not_active Abandoned
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010010966A1 (en) * | 2008-07-24 | 2010-01-28 | 国立大学法人九州大学 | Nucleoside triphosphate derivative, nucleic acid probe, multilabeled nucleic acid probe, method for production of multilabeled nucleic acid probe, and method for detection of target nucleic acid |
JP2010047559A (en) * | 2008-07-24 | 2010-03-04 | Kyushu Univ | Enzyme substrate-modified nucleoside triphosphate, nucleic acid probe, multilabeled nucleic acid probe, method for production of multilabeled nucleic acid probe, and method for detection of target nucleic acid |
JP4621926B2 (en) * | 2008-07-24 | 2011-02-02 | 国立大学法人九州大学 | Enzyme substrate-modified nucleoside triphosphate, nucleic acid probe, multilabeled nucleic acid probe, method for producing multilabeled nucleic acid probe, and method for detecting target nucleic acid |
JP2011026324A (en) * | 2008-07-24 | 2011-02-10 | Kyushu Univ | Enzyme substrate-modified nucleoside triphosphate derivative |
US8198418B2 (en) | 2008-07-24 | 2012-06-12 | Kyushu University, National University Corporation | Nucleoside triphosphate derivative, nucleic acid probe, multilabeled nucleic acid probe, method for production of multilabeled nucleic acid probe, and method for detection of target nucleic acid |
JP2011169878A (en) * | 2010-01-22 | 2011-09-01 | Kyushu Univ | Nucleic acid detecting kit |
US10726945B2 (en) | 2010-05-25 | 2020-07-28 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10706956B2 (en) | 2010-05-25 | 2020-07-07 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
JP2018206417A (en) * | 2010-05-25 | 2018-12-27 | ザ・リージェンツ・オブ・ザ・ユニバーシティー・オブ・カリフォルニアThe Regents Of The University Of California | Bambam: simultaneous comparison analysis of high-throughput sequencing data |
US10825551B2 (en) | 2010-05-25 | 2020-11-03 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US10825552B2 (en) | 2010-05-25 | 2020-11-03 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US10878937B2 (en) | 2010-05-25 | 2020-12-29 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
US10971248B2 (en) | 2010-05-25 | 2021-04-06 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
US10991451B2 (en) | 2010-05-25 | 2021-04-27 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
US11133085B2 (en) | 2010-05-25 | 2021-09-28 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US11152080B2 (en) | 2010-05-25 | 2021-10-19 | The Regents Of The University Of California | BAMBAM: parallel comparative analysis of high-throughput sequencing data |
US11158397B2 (en) | 2010-05-25 | 2021-10-26 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US11164656B2 (en) | 2010-05-25 | 2021-11-02 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
US12040052B2 (en) | 2010-05-25 | 2024-07-16 | The Regents Of The University Of California | BamBam: parallel comparative analysis of high-throughput sequencing data |
Also Published As
Publication number | Publication date |
---|---|
WO2002088382A2 (en) | 2002-11-07 |
DE10120797B4 (en) | 2005-12-22 |
AU2002304705A1 (en) | 2002-11-11 |
DE10120797A1 (en) | 2002-11-21 |
EP1381698A2 (en) | 2004-01-21 |
WO2002088382A3 (en) | 2003-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2004529650A (en) | Analysis method of nucleic acid strand | |
US11807904B2 (en) | FRET-labeled compounds and uses therefor | |
US20050227231A1 (en) | Device for sequencing nucleic acid molecules | |
US6982146B1 (en) | High speed parallel molecular nucleic acid sequencing | |
JP2019088295A (en) | Methods for genome assembly and haplotype phasing | |
US8541172B2 (en) | Method for sequencing a polynucelotide template | |
US20060024711A1 (en) | Methods for nucleic acid amplification and sequence determination | |
US20080032307A1 (en) | Use of Single-Stranded Nucleic Acid Binding Proteins In Sequencing | |
KR20030055343A (en) | Isothermal amplification of nucleic acids on a solid support | |
JP2010213709A (en) | Length determination of nucleic acid repeat sequences by discontinuous primer extension | |
JP2004523243A (en) | Method and apparatus for analyzing polynucleotide sequences by asynchronous base extension | |
JP2002525125A (en) | Methods for nucleic acid amplification and sequencing | |
JP2002537858A (en) | Methods for direct sequencing of nucleic acids | |
WO2010068884A2 (en) | Methods and systems for direct sequencing of single dna molecules | |
JP2017512071A (en) | Systems and methods for clonal replication and amplification of nucleic acid molecules for genomic and therapeutic applications | |
CA2378569A1 (en) | Method for relative quantization of methylation of cytosin-type bases in dna samples | |
WO2005021786A1 (en) | A method of sequencing nucleic acids by ligation of labelled oligonucleotides | |
KR20180135476A (en) | Methods of attaching cellular components to a matrix | |
EP1989327A2 (en) | Methods for mutation detection | |
JP2005512544A6 (en) | Post-synthesis labeling of nucleic acids and their use | |
JP2005512544A (en) | Post-synthesis labeling of nucleic acids and their use | |
WO2024050817A1 (en) | Use of glycyrrhizic acid or derivative thereof in nucleic acid detection |