EP1100923A2 - Thermostabiler in vitro-komplex mit polymeraseaktivität - Google Patents
Thermostabiler in vitro-komplex mit polymeraseaktivitätInfo
- Publication number
- EP1100923A2 EP1100923A2 EP99942776A EP99942776A EP1100923A2 EP 1100923 A2 EP1100923 A2 EP 1100923A2 EP 99942776 A EP99942776 A EP 99942776A EP 99942776 A EP99942776 A EP 99942776A EP 1100923 A2 EP1100923 A2 EP 1100923A2
- Authority
- EP
- European Patent Office
- Prior art keywords
- protein
- thermostable
- fro
- gavlimpfw
- elongation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000000694 effects Effects 0.000 title claims description 49
- 238000000338 in vitro Methods 0.000 title abstract description 18
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 400
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 343
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 91
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 79
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 79
- 230000001419 dependent effect Effects 0.000 claims abstract description 13
- 108020004414 DNA Proteins 0.000 claims description 65
- 230000008878 coupling Effects 0.000 claims description 51
- 238000010168 coupling process Methods 0.000 claims description 51
- 238000005859 coupling reaction Methods 0.000 claims description 51
- 238000000034 method Methods 0.000 claims description 46
- 239000013598 vector Substances 0.000 claims description 37
- 108050006400 Cyclin Proteins 0.000 claims description 33
- 102000009339 Proliferating Cell Nuclear Antigen Human genes 0.000 claims description 33
- 239000002773 nucleotide Substances 0.000 claims description 31
- 125000003729 nucleotide group Chemical group 0.000 claims description 31
- 241000205042 Archaeoglobus fulgidus Species 0.000 claims description 29
- 230000014509 gene expression Effects 0.000 claims description 28
- 230000003321 amplification Effects 0.000 claims description 27
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 27
- 150000001413 amino acids Chemical class 0.000 claims description 26
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 25
- 238000012163 sequencing technique Methods 0.000 claims description 24
- 239000000872 buffer Substances 0.000 claims description 22
- 241000894006 Bacteria Species 0.000 claims description 21
- 108091035707 Consensus sequence Proteins 0.000 claims description 21
- 241000588724 Escherichia coli Species 0.000 claims description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 21
- 241000203069 Archaea Species 0.000 claims description 20
- 238000010839 reverse transcription Methods 0.000 claims description 20
- 238000002864 sequence alignment Methods 0.000 claims description 19
- 239000005546 dideoxynucleotide Substances 0.000 claims description 15
- 125000002652 ribonucleotide group Chemical group 0.000 claims description 13
- 241000206602 Eukaryota Species 0.000 claims description 12
- 241000205160 Pyrococcus Species 0.000 claims description 12
- 108091028664 Ribonucleotide Proteins 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims description 12
- 239000002336 ribonucleotide Substances 0.000 claims description 12
- 241001112695 Clostridiales Species 0.000 claims description 11
- 108020001507 fusion proteins Proteins 0.000 claims description 11
- 102000037865 fusion proteins Human genes 0.000 claims description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 10
- 102100034343 Integrase Human genes 0.000 claims description 10
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 10
- 241000893512 Aquifex aeolicus Species 0.000 claims description 7
- 230000000295 complement effect Effects 0.000 claims description 7
- 241000202974 Methanobacterium Species 0.000 claims description 6
- 241000203407 Methanocaldococcus jannaschii Species 0.000 claims description 6
- 241000205156 Pyrococcus furiosus Species 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 102000009609 Pyrophosphatases Human genes 0.000 claims description 5
- 108010009413 Pyrophosphatases Proteins 0.000 claims description 5
- 230000001580 bacterial effect Effects 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 241000620137 Carboxydothermus hydrogenoformans Species 0.000 claims description 3
- 238000009396 hybridization Methods 0.000 claims description 3
- 238000003752 polymerase chain reaction Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 101100064065 Pyrococcus horikoshii (strain ATCC 700860 / DSM 12428 / JCM 9974 / NBRC 100139 / OT-3) pol gene Proteins 0.000 claims description 2
- 239000008186 active pharmaceutical agent Substances 0.000 claims description 2
- 239000001963 growth medium Substances 0.000 claims description 2
- 230000001939 inductive effect Effects 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 108020004511 Recombinant DNA Proteins 0.000 claims 3
- 241000620141 Carboxydothermus Species 0.000 claims 2
- 241001302042 Methanothermobacter thermautotrophicus Species 0.000 claims 1
- 235000018102 proteins Nutrition 0.000 description 292
- 238000006243 chemical reaction Methods 0.000 description 49
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 33
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 32
- 210000004027 cell Anatomy 0.000 description 31
- 108010071146 DNA Polymerase III Proteins 0.000 description 20
- 102000007528 DNA Polymerase III Human genes 0.000 description 20
- 235000001014 amino acid Nutrition 0.000 description 18
- 229940024606 amino acid Drugs 0.000 description 18
- 102000004190 Enzymes Human genes 0.000 description 15
- 108090000790 Enzymes Proteins 0.000 description 15
- 230000015572 biosynthetic process Effects 0.000 description 15
- 229940088598 enzyme Drugs 0.000 description 15
- 230000000875 corresponding effect Effects 0.000 description 14
- 239000013604 expression vector Substances 0.000 description 14
- 238000000746 purification Methods 0.000 description 14
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 13
- 230000027455 binding Effects 0.000 description 12
- 239000000203 mixture Substances 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 230000010076 replication Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 10
- 101900324444 Archaeoglobus fulgidus DNA polymerase Proteins 0.000 description 10
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- ZKHQWZAMYRWXGA-KQYNXXCUSA-N Adenosine triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-N 0.000 description 9
- 102000053602 DNA Human genes 0.000 description 9
- 229920000936 Agarose Polymers 0.000 description 8
- 241000282412 Homo Species 0.000 description 8
- 239000000284 extract Substances 0.000 description 8
- 230000004543 DNA replication Effects 0.000 description 7
- 108010006785 Taq Polymerase Proteins 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000005119 centrifugation Methods 0.000 description 7
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 7
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 7
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 7
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 7
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 239000011541 reaction mixture Substances 0.000 description 7
- 238000001086 yeast two-hybrid system Methods 0.000 description 7
- 241000205046 Archaeoglobus Species 0.000 description 6
- 108060002716 Exonuclease Proteins 0.000 description 6
- 239000011543 agarose gel Substances 0.000 description 6
- 238000004587 chromatography analysis Methods 0.000 description 6
- 238000010367 cloning Methods 0.000 description 6
- 239000000287 crude extract Substances 0.000 description 6
- 102000013165 exonuclease Human genes 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 108010035532 Collagen Proteins 0.000 description 5
- 230000004568 DNA-binding Effects 0.000 description 5
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 5
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 5
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 5
- 239000004202 carbamide Substances 0.000 description 5
- 239000000499 gel Substances 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000001632 sodium acetate Substances 0.000 description 5
- 235000017281 sodium acetate Nutrition 0.000 description 5
- 239000012536 storage buffer Substances 0.000 description 5
- PCDQPRRSZKQHHS-XVFCMESISA-N CTP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-XVFCMESISA-N 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 4
- -1 PCR reactions Chemical class 0.000 description 4
- 101900050251 Pyrococcus horikoshii DNA polymerase Proteins 0.000 description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- 239000008049 TAE buffer Substances 0.000 description 4
- 241000589596 Thermus Species 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- HGEVZDLYZYVYHD-UHFFFAOYSA-N acetic acid;2-amino-2-(hydroxymethyl)propane-1,3-diol;2-[2-[bis(carboxymethyl)amino]ethyl-(carboxymethyl)amino]acetic acid Chemical compound CC(O)=O.OCC(N)(CO)CO.OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O HGEVZDLYZYVYHD-UHFFFAOYSA-N 0.000 description 4
- 230000004913 activation Effects 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000000502 dialysis Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000010369 molecular cloning Methods 0.000 description 4
- 239000008188 pellet Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 4
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 3
- 108020004635 Complementary DNA Proteins 0.000 description 3
- 108091006054 His-tagged proteins Proteins 0.000 description 3
- 101001072338 Homo sapiens Proliferating cell nuclear antigen Proteins 0.000 description 3
- 102000018779 Replication Protein C Human genes 0.000 description 3
- 108010027647 Replication Protein C Proteins 0.000 description 3
- 241000589500 Thermus aquaticus Species 0.000 description 3
- 102000002933 Thioredoxin Human genes 0.000 description 3
- HDRRAMINWIWTNU-NTSWFWBYSA-N [[(2s,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1CC[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HDRRAMINWIWTNU-NTSWFWBYSA-N 0.000 description 3
- ARLKCWCREKRROD-POYBYMJQSA-N [[(2s,5r)-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 ARLKCWCREKRROD-POYBYMJQSA-N 0.000 description 3
- 229960000723 ampicillin Drugs 0.000 description 3
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000010804 cDNA synthesis Methods 0.000 description 3
- URGJWIFLBWJRMF-JGVFFNPUSA-N ddTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)CC1 URGJWIFLBWJRMF-JGVFFNPUSA-N 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000010828 elution Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 102000044255 human PCNA Human genes 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000000638 stimulation Effects 0.000 description 3
- 108060008226 thioredoxin Proteins 0.000 description 3
- 229940094937 thioredoxin Drugs 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 239000013638 trimer Substances 0.000 description 3
- SHCMKWXVHLOSIU-UHFFFAOYSA-N 5-hydroxy-7-(4-hydroxy-2,5-dimethoxyphenyl)-2,2-dimethylpyrano[3,2-g]chromen-6-one Chemical compound C1=C(O)C(OC)=CC(C=2C(C3=C(O)C=4C=CC(C)(C)OC=4C=C3OC=2)=O)=C1OC SHCMKWXVHLOSIU-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000589969 Borreliella burgdorferi Species 0.000 description 2
- 102000008186 Collagen Human genes 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 230000006820 DNA synthesis Effects 0.000 description 2
- 241000701832 Enterobacteria phage T3 Species 0.000 description 2
- 241000701533 Escherichia virus T4 Species 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 241000186394 Eubacterium Species 0.000 description 2
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 241000590002 Helicobacter pylori Species 0.000 description 2
- 108010025076 Holoenzymes Proteins 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- 241000203353 Methanococcus Species 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- 102000016943 Muramidase Human genes 0.000 description 2
- 108010014251 Muramidase Proteins 0.000 description 2
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 241000588770 Proteus mirabilis Species 0.000 description 2
- 241000589776 Pseudomonas putida Species 0.000 description 2
- 241000522615 Pyrococcus horikoshii Species 0.000 description 2
- 241000607142 Salmonella Species 0.000 description 2
- 241000293869 Salmonella enterica subsp. enterica serovar Typhimurium Species 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 241000589499 Thermus thermophilus Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 241000902900 cellular organisms Species 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 229920001436 collagen Polymers 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000012149 elution buffer Substances 0.000 description 2
- MHMNJMPURVTYEJ-UHFFFAOYSA-N fluorescein-5-isothiocyanate Chemical compound O1C(=O)C2=CC(N=C=S)=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 MHMNJMPURVTYEJ-UHFFFAOYSA-N 0.000 description 2
- 238000002523 gelfiltration Methods 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 229940037467 helicobacter pylori Drugs 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 239000004325 lysozyme Substances 0.000 description 2
- 229960000274 lysozyme Drugs 0.000 description 2
- 235000010335 lysozyme Nutrition 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 230000001915 proofreading effect Effects 0.000 description 2
- 235000004252 protein component Nutrition 0.000 description 2
- 150000003220 pyrenes Chemical class 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000003362 replicative effect Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000013049 sediment Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- MPLHNVLQVRSVEE-UHFFFAOYSA-N texas red Chemical compound [O-]S(=O)(=O)C1=CC(S(Cl)(=O)=O)=CC=C1C(C1=CC=2CCCN3CCCC(C=23)=C1O1)=C2C1=C(CCC1)C3=[N+]1CCCC3=C2 MPLHNVLQVRSVEE-UHFFFAOYSA-N 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- BHNQPLPANNDEGL-UHFFFAOYSA-N 2-(4-octylphenoxy)ethanol Chemical compound CCCCCCCCC1=CC=C(OCCO)C=C1 BHNQPLPANNDEGL-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108090000145 Bacillolysin Proteins 0.000 description 1
- 101710117642 Beta sliding clamp Proteins 0.000 description 1
- 241001429558 Caldicellulosiruptor bescii Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 102100033270 Cyclin-dependent kinase inhibitor 1 Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 108010043332 DNA polymerase III beta subunit Proteins 0.000 description 1
- 101710150351 DNA polymerase processivity factor Proteins 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 101710160937 DNA replication protein Proteins 0.000 description 1
- 241000724228 Enterobacteria phage RB69 Species 0.000 description 1
- 241000701867 Enterobacteria phage T7 Species 0.000 description 1
- 108010008655 Epstein-Barr Virus Nuclear Antigens Proteins 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 102100024594 Histone-lysine N-methyltransferase PRDM16 Human genes 0.000 description 1
- 101000686942 Homo sapiens Histone-lysine N-methyltransferase PRDM16 Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 102100026038 Lens fiber membrane intrinsic protein Human genes 0.000 description 1
- 101710115990 Lens fiber membrane intrinsic protein Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000508310 Meiothermus chliarophilus Species 0.000 description 1
- 241000589496 Meiothermus ruber Species 0.000 description 1
- 241000508289 Meiothermus silvanus Species 0.000 description 1
- 102000035092 Neutral proteases Human genes 0.000 description 1
- 108091005507 Neutral proteases Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 229920002302 Nylon 6,6 Polymers 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 101150008755 PCNA gene Proteins 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 102000002067 Protein Subunits Human genes 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 101100394989 Rhodopseudomonas palustris (strain ATCC BAA-98 / CGA009) hisI gene Proteins 0.000 description 1
- 108091006627 SLC12A9 Proteins 0.000 description 1
- 101100117360 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) DOA1 gene Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101710142606 Sliding clamp Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000187432 Streptomyces coelicolor Species 0.000 description 1
- 101100117496 Sulfurisphaera ohwakuensis pol-alpha gene Proteins 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 108700005085 Switch Genes Proteins 0.000 description 1
- 101710194518 T4 protein Proteins 0.000 description 1
- 101710136739 Teichoic acid poly(glycerol phosphate) polymerase Proteins 0.000 description 1
- 241000204315 Thermosipho <sea snail> Species 0.000 description 1
- 241000204664 Thermotoga neapolitana Species 0.000 description 1
- 241000589501 Thermus caldophilus Species 0.000 description 1
- 241000589498 Thermus filiformis Species 0.000 description 1
- 241000557726 Thermus oshimai Species 0.000 description 1
- 241001522143 Thermus scotoductus Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108010027273 Valosin Containing Protein Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 241000193758 [Bacillus] caldotenax Species 0.000 description 1
- DLLXAZJTLIUPAI-XLPZGREQSA-N [[(2r,3s,5r)-5-(2-amino-4-oxo-1h-pyrrolo[2,3-d]pyrimidin-7-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=2NC(N)=NC(=O)C=2C=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 DLLXAZJTLIUPAI-XLPZGREQSA-N 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- BFNBIHQBYMNNAN-UHFFFAOYSA-N ammonium sulfate Chemical compound N.N.OS(O)(=O)=O BFNBIHQBYMNNAN-UHFFFAOYSA-N 0.000 description 1
- 229910052921 ammonium sulfate Inorganic materials 0.000 description 1
- 235000011130 ammonium sulphate Nutrition 0.000 description 1
- 230000003698 anagen phase Effects 0.000 description 1
- 241000617156 archaeon Species 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 238000009835 boiling Methods 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 239000012531 culture fluid Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- UFJPAQSLHAGEBL-RRKCRQDMSA-N dITP Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(N=CNC2=O)=C2N=C1 UFJPAQSLHAGEBL-RRKCRQDMSA-N 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000012215 gene cloning Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000000833 heterodimer Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000002198 insoluble material Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000001155 isoelectric focusing Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 239000012139 lysis buffer Substances 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 108091005573 modified proteins Proteins 0.000 description 1
- 102000035118 modified proteins Human genes 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000037048 polymerization activity Effects 0.000 description 1
- 229920001184 polypeptide Polymers 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000004007 reversed phase HPLC Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000009210 therapy by ultrasound Methods 0.000 description 1
- 239000005451 thionucleotide Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- 238000005829 trimerization reaction Methods 0.000 description 1
- 238000000108 ultra-filtration Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1252—DNA-directed DNA polymerase (2.7.7.7), i.e. DNA replicase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1241—Nucleotidyltransferases (2.7.7)
- C12N9/1276—RNA-directed DNA polymerase (2.7.7.49), i.e. reverse transcriptase or telomerase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
Der erfindungsgemäße thermostabile in vitro-Komplex zur Template-abhängigen Elongation von Nukleinsäuren umfaßt ein thermostabiles Gleitklammerprotein und ein thermostabiles Elongationsprotein.
Description
Thermostabiler in vitro Komplex mit Polymeraseaktivität
Beschreibung
Die Erfindung betrifft einen thermostabilen in wϊro-Komplex zur Templateabhängigen Elongation von Nukleinsäuren, einen thermostabilen in vitro Komplex sowie dafür kodierende DNA-Sequenzen und Vektoren. Die Erfindung betrifft weiterhin die Verwendung der erfindungsgemäßen Komplexe in Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wie PCR Reaktionen reversen Transkription, DNA-Markierung oder DNA- Sequenzierung, bei denen in vitro Template-abhängige DNA Strangsynthese erfolgt. Schließlich betrifft die Erfindung noch Kits bzw. Reagenzien kits zur Durchführung der erfindungsgemäßen Verfahren.
DNA-Polymerasen gehören zu einer Gruppe von Enzymen, die einzelsträngige DNA als Template für die Synthese eines komplementären DNA Stranges verwenden. Diese Enzyme spielen eine bedeutende Rolle im Nukleinsäurestoffwechsel, einschließlich der Prozesse DNA-Replikation, Reparatur und Rekombination. DNA-Polymerasen wurden in allen zellulären Organismen identifiziert, von bakteriellen bis zu menschlichen Zellen, in vielen Viren sowie in Bakteriophagen (Kornberg, A. & Baker, T. A. (1991 ) DNA Replikation WH Freeman, New York, NY). Man faßt in der Regel die Archaebakterien und die Eubakterien zusammen zu der Gruppe der Prokaryonten, der Organismen ohne echten Zellkern, und stellt ihnen die Eukaryonten, die Organismen mit echtem Zellkern, gegenüber. Gemeinsam sind vielen Polymerasen aus den verschiedensten Organismen oftmals Ähnlichkeiten in der Aminosäuresequenz sowie Ähnlichkeiten in der Struktur (Wang, J., Sattar, A.K.M.A.; Wang, C.C., Karam, J.D., Königsberg, W.H. & Steitz, T.A. (1997) Crystal Structure of pol α familily replication DNA
polymerase from bacteriophage RB69.Cell 89, 1087-1099). Organismen wie der Mensch besitzen eine Vielzahl von DNA-abhängigen Polymerasen, von denen jedoch nicht alle für die DNA-Replikation zuständig sind, sondern einige auch DNA-Reparatur durchführen. Replikative DNA-Polymerasen bestehen in vivo meist aus Proteinkomplexen mit mehreren Einheiten, welche die Chromosomen der zellulären Organismen und Viren replizieren. Eine generelle Eigenschaft dieser replizierenden Polymerasen ist im allgemeinen eine hohe Prozessivität, das heißt, deren Fähigkeit, Tausende von Nukleotiden zu polymerisieren ohne vom DNA Template abzudissoziieren (Kornberg, A. & Baker, T. A. (1991) DNA Replikation. WH Freeman, New York, NY).
Im Stand der Technik sind hochprozessive Replikationsmechanismen bekannt, wobei es sich dabei zum einen um zelluläre Mechanismen und zum anderen um die bei den Bakteriophagen T4 und T7 auftretetenden Repliaktionsmechanismen handelt.
Der Repliaktionsapparat umfaßt eine Vielzahl von Komponenten. Dazu gehören, unter anderem, a) Polymeraseaktivität aufweisende Proteine, b) Proteine, die an der Ausbildung einer Klammerstruktur beteiligt sind, wobei der Klammerstruktur unter anderem die Aufgabe zukommt, eine Polymeraseaktivität an ihr Template zu binden, die Bindung zu stabilisieren und somit die Dissoziationskonstante entsprechend zu ändern, c) Proteine, welche die Klammer auf das template laden, d) Proteine, welche das Template stabilisieren und gegebenenfalls e) Proteine, welche die Polymerase an das Template führen .
Die unter b) genannten Proteine bilden Strukturen aus, die entweder offen oder geschlossen sind, beispielsweise ringförmige oder halbringförmige Strukturen. Derlei Strukturen können durch eine oder mehrere Spezies von Proteinen ausgebildet werden. Dabei ist es möglich, daß eine der besagten Proteinspezies eine Polymeraseaktivität aufweist.
Die für die Ausbildung dieser Strukturen verantwortlichen Proteine werden, sofern sie keine Polymeraseaktivität aufweisen, hierin im folgenden als „Gleitklammerproteine" oder „Klammerproteine" bezeichnet. 5
Beispielhaft sei für einen prozessiven Replikationsapparat, der nicht geschlossen ringförmig ist, auf denjenigen des Bakteriophagen T4 oder T7 hingewiesen.
10 Beispielhaft sei für einen prozessiven Replikationsapparat, der geschlossen ringförmig ist, auf denjenigen des Bakteriums E. coli hingewiesen (Stukenberg, P.T., Studwell-Vaughan, P.S.& O'Donell, M. (1991 ) Mechanism of the ß-clamp of DNA polymerase III holoenzyme. J. Biol. Chem. 266, 11328-11334; Kuriyan, J. & O'Donnel, M. (1993) Sliding clamps of DNA polymerases. J.Mol.Biol.234,
15 915-925).
Es ist bekannt, daß der Replikationsapparat in Archaebakterien dem eukaryontischen Replikationsapparat ähnlich ist, obwohl die Genomorganisation in Eukaryonten und Archaebakterien gänzlich verschieden 20 ist und die zelluläre Struktur der Eubakterien dem der Archaea ähnelt. (Edgell, D.R. and Doolittle, W.F. (1997). Archaea and the origin(s) of DNA replication proteins. Cell 89, 995-998.).
Die Gleitklammer ist häufig über ein oder mehrere weitere Proteine an ein 25 Elongationsprotein gebunden, mit anderen Worten an das Elongationsprotein gekoppelt. Ein derartiges koppelndes Protein wird hierin im folgenden als Kopplungsprotein oder koppelnde Untereinheit bezeichnet, wobei gegebenfalls die Kopplung über eine Mehrzahl von Kopplungsproteinen erfolgen kann.
30 Unter Elongationsprotein soll hierin im übrigen ein Polymeraseaktivität- aufweisendes Protein oder Komplex verstanden werden, das oder der
mindestens eine oder mehrere der folgenden Eigenschaften aufweißt: Verwendung von RNA als Template zur Synthese von DNA und/oder RNA, Verwendung von DNA als Template zur Synthese von DNA und/oder RNA, Synthese von RNA, Synthese von DNA, Synthese von Nukleinsäuren aus DNA und RNA, Exonukleaseaktivität in 5'-3'- Richtung und Exonukleaseaktivität in 3'-5'-Richtung, Strangverdrängungsaktivität (strand-displacement activity) Thermostabilität und Prozessivität oder Nicht-Prozessivität.
Die dreidimensionale Struktur von verschiedenen Gleitklammerproteinen wurde bereits bestimmt:
- die des eukaryontischen proliferating cell nuclear antigen (PCNA) (Krishna, T.S.R., Kong, X.-P., Gary, S., Burgers, P. M. & Kuriyan, J. (1994) Crystal structure of the eukaryotic DNA polymerase processivity factor PCNA. Cell 79, 1233-1243; Gulbis, J. M., Kelman, Z., Hurwitz, J., O'Donnel, M. & Kuriyan, J. (1996) Structure of the C-terminal region of p21WAF1/CIP1 complexed with human PCNA. Cell 87, 297-306),
- die der ß-Untereinheit der Polymerase III des Eubakteriums Escherichia coli (Kong, X.-P., Onrust, R., O'Donnell, M. & Kuriyan; J. (1992) Three dimensional structure of the ß-subunit of Escherichia coli DNA polymerase III holoenzyme; a sliding DNA clamp. Cell 69, 425-437)
- und die des Gen45-Proteins des Bakteriophagens T4 Proteins (Kelman, Zvi, Hurwitz, J. O'Donnel, Mike (1998) Structure, 6, 121-125).
Die Gesamtstruktur dieser Gleitklammern ist sehr ähnlich; die Bilder der ringförmig ausgebildeten Proteingesamtstruktur von PCNA, der ß-Untereinheit und gp45-Ringe sind übereinandergelegt deckungsgleich (Kelman, Z. & O'Donnell, M. (1995) Structural and functional similarities of prokaryotic and eukaryotic sliding clamps. Nucleic Acids Res. 23, 3613-3620). Jeder Ring hat vergleichbare Dimensionen und eine zentrale Öffnung, die groß genug ist, um Duplex-DNA, also einen DNA-Doppelstrang, bestehend aus den zwei komplementären DNA-Strängen, zu umschließen.
Die Gleitklammer kann sich in vivo nicht selbst um die DNA herum positionieren, sondern muß um die DNA fixiert werden. In Prokaryonten und Eukaryonten besteht ein derartiger Proteinkomplex aus einer Vielzahl von Untereinheiten, der beim Eubakterium Escherichia coli γ-Komplex und beim Menschen Replikationsfaktor C (RF-C) genannt wird (Kelman, Z. & O'Donnell, M. (1994) DNA replication - enzymology and mechanisms. Curr. Opin. Gent. Dev. 4, 185-195). Der Proteinkomplex erkennt das 3'-Ende des Primers des „Primer-Template-Duplexes" und positioniert die Gleitklammer in Anwesenheit von ATP um die DNA.
Im Falle des Bacteriophagen T7 wird das gleiche Ziel, eine prozessive DNA- Synthese, mittels eines strukturell anderen Proteinkomplexes erreicht. Der Phage exprimiert eine eigene katalytische Polymerase, die T7-Polymerase, die das Genprodukt des gene 5, welche mit einem Protein aus dem Wirt Escherichia coli, dem Thioredoxin, eine Bindung eingeht und als Replikase eine hochprozessive DNA-Replikation ermöglicht (Proc. Natl. Acad. Sei. U S A 1992 Oct 15; 89(20):9774-9778 Genetic analysis of the interaction between bacteriophage T7 DNA polymerase and Escherichia coli thioredoxin, Himawan JS, Richardson CC). Auch hierbei kommt es zur Klammerbildung, jedoch weist diese Klammer nicht die gleiche Struktur auf, wie z.B. im Falle des eukaryontischen PCNA.
Oft ist es nötig, wie zum Beispiel im Falle der humanen Polymerase δ, daß Kopplungsproteine eine Verbindung zwischen dem katalytisch aktiven Teil der Polymerase und dem Prozessivitätsfaktor (Gleitklammer) zu schaffen. Beim Menschen ist dies die kleine Untereinheit der δ-Polymerase (Zhang, S.-J., Zeng, X.-R., Zhang, P., Toomey, N.L, Chuang, R.Y., Chang, L-S., and Lee, M.Y.W.T. (1994). A conserved region in the amino terminus of DNA polymerase δ is involved in proliferating cell nuclear antigen binding. J. Biol.
Chem. 270, 7988-7992). Im Falle der T7 Polymerase jedoch bindet der Prozessivitätsfaktor die katalytische Einheit der Polymerase direkt.
DNA-Polymerasen werden unter anderem durch zwei Eigenschaften charakterisiert, ihre Elongationsrate, das heißt die Anzahl der Nukleotide, die sie pro Sekunde in einen wachsenden DNA-Strang inkorporieren können, und ihre Dissoziationskonstante. Wenn die Polymerase nach jedem Inkorporationsschritt eines der Nukleotide in die wachsende Kette wieder vom Strang abdissoziiert (d.h. ein Elongationsschritt erfolgt pro Bindungsereignis), dann hat die Prozessivität den Wert 1 und die Polymerase ist nicht prozessiv. Diese Synthese wird distributiv genannt. Wenn die Polymerase für wiederholte Nukleinsäureinkorporationen mit dem Strang verbunden bleibt, dann wird der Replikationsmodus als prozessiv bezeichnet und kann einen Wert von mehreren Tausend erreichen (siehe hierzu auch: Methods in Enzymology Volume 262, DNA Replication, Edited by J. L. Campbell, Academic press 1995, pp. 270-280)
Für die meisten in vitro Anwendungen, wie PCR oder Sequenzierungsprozesse, ist Prozessivität eine wünschenswerte Eigenschaft, die allerdings die bislang in diesen Reaktionen eingesetzten thermostabilen Enzyme nur in geringem Maße besitzen, wohingegen die temperaturempfindlichen, mit Thioredoxin assoziierte T7 Polymerase eine Prozessivität von einigen tausend Nukleotiden aufweist. Im Vergleich - die thermostabile DNA-Polymerase aus Thermus thermophilus oder Thermus aquaticus haben nur eine Prozessivität von etwa 50 Nukleotiden (Biochim Biophys Acta 1995 Nov 7;1264(2):243-248 Inactivation of the 5'-3' exonuclease of Thermus aquaticus DNA polymerase. Merkens LS, Bryan SK, Moses RE).
Die U.S. Patente 4,683,195, 4,800,195 und 4,683,202 beschreiben die Anwendung solcher thermostabiler DNA-Polymerasen in der Polymerase-
Kettenreaktion (PCR). In der PCR wird unter Verwendung von Primem,
Template (auch Matrize genannt), Nukleotiden, einer DNA-Polymerase eines entsprechenden Puffers und geeigneten Reaktionsbedingungen DNA neu synthetisiert. Hierbei wird üblicherweise von einer doppelsträngigen DNA- Sequenz ausgegangen, von der ein bestimmter Zielbereich amplifiziert werden soll. Hierbei werden zwei Primer eingesetzt, welche zu flankierenden Bereichen der Zielsequenz auf jeweils einem Teilstrang des DNA-Doppelstranges komplementär sind. Zur Anhybridisierung der Primer werden allerdings die DNA-Doppelstränge zuerst denaturiert, insbesondere thermisch aufgeschmolzen. Nach Anhybridisierung der Primer erfolgt eine Elongation mittels der Polymerase. Daraufhin wird nochmals denaturiert und damit die neu gebildeten DNA-Stränge von den Template-Strängen getrennt, woraufhin für einen weiteren Elongationszyklus neben den ursprünglichen Template- Strängen auch die im ersten Schritt gebildeten Nukleinsäure-Stränge als Template zur Verfügung stehen, diese jeweils erneut mit Primern hybridisiert werden und eine erneute Elongation stattfindet. Diese Vorgehensweise wird zyklisch durchgeführt unter jeweils thermischer Denaturierung als Zwischenschritte. Bei der PCR kommt es bevorzugt zur Verwendung einer thermostabilen Polymerase, welche das zyklische, thermische Aufschmelzen der DNA Stränge übersteht. So wird häufig Taq DNA-Polymerase verwendet (U.S. Patent 4,965,188). Die Prozessivität der Taq DNA-Polymerase ist jedoch, wie oben ausgeführt, relativ gering im Vergleich zur T7-Polymerase.
DNA-Polymerasen finden auch bei der DNA-Sequenzbestimmung Anwendung (Sanger et al., Proc. Natl. Acad. Sei., USA 74:5463-5467 (1997)). Häufig wird bei der Sequenzierung nach Sanger eine T7-DNA-Polymerase verwendet (Tabor, S. und Richardson, CC. Proc. Natl. Acad. Sei., USA 86:4076-4080 (1989)). Später wurde das Cycle-Sequencing-Verfahren entwickelt (Murray, V. (1989) Nucleic Acids Res. 17, 8889), welches kein einzelsträngiges Template erfordert und die Initiierung der Sequenzreaktion mit verhältnismäßig geringen Mengen an Template erlaubt. Die hierbei zur Verwendung kommenden Polymerasen können z.B. die oben erwähnte Tag-Polymerase sein (U.S.
Patent 5,075, 216) oder die Polymerase von Thermotoga neapolitana (WO 96/10640) oder andere thermostabile Polymerasen. Neuere Verfahren koppeln die exponentielle Amplifikation und die Sequenzierung eines DNA-Fragmentes in einem Schritt, so daß es möglich ist, genomische DNA direkt zu 5 sequenzieren. Eines der Verfahren, das sogenannte DEXAS-Verfahren (Nucleic Acids Res 1997 May 15;25(10):2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, Pääbo S, Biol. Chem. 1997 Feb; 378(2):99-105 Direct exponential amplification and sequencing (DEXAS) of genomic DNA. Kilger C, Pääbo S und DE 19653439.9 sowie DE
10 19653494.1 ), verwendet eine Polymerasen mit verminderter Diskriminierungsfähigkeit gegenüber Dideoxynukleotiden (ddNTPs) im Vergleich zu Deoxynukleotiden (dNTPs) sowie einen Reaktionspuffer, zwei Primer, die bevorzugt nicht äquimolar vorliegen, und die oben genannten Nukleotide, um dann in mehreren Zyklen eine komplette, sequenzspezifische
15 DNA-Leiter eines Fragmentes zu erhalten, welches von den Primern flankiert ist. Eine Weiterentwicklung dieses Verfahrens besteht in der Verwendung eines Polymerasegemisches, wobei eine der beiden Polymerasen zwischen ddNTPs und dNTPs diskriminiert, während die zweite eine verminderte Diskriminierungsfähigkeit aufweist (Nucleic Acids Res. 1997 May 15;
20 25(10):2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, Pääbo S).
DNA-Polymerasen finden auch Anwendung bei der reversen Transkription von RNA in DNA. Hierbei dient RNA als Template und die Polymerase synthetisiert 25 einen komplementären DNA-Strang. Zur Anwendung kommt hier z.B. die thermostabile DNA-Polymerase aus dem Organismus Thermus thermusphilus (Tth) (U.S. Patent 5,322,770).
Es kann auch vorkommen, daß die Polymerase eine 'proof-reading' Aktivität
30 besitzt, also eine 3'-5' Exonukleaseaktivität aufweist. Diese Eigenschaft ist insbesondere dann wünschenswert, wenn das zu synthetisierende Produkt mit
einer niedrigen Fehlerrate bei der Nukleotidinkorporation hergestellt werden soll. Ein Beispiel stellen Polymerasen aus dem Organismus Pyrococcus wosei dar.
Die oben genannten Enzyme, die üblicherweise in PCR-Reaktionen eingesetzt werden, gehören in vivo größtenteils nicht zu den eigentlichen Replikationsenzymen, sondern es sind zumeist Enzyme, von denen man annimmt, daß sie bei der DNA-Reparatur beteiligt sind, weshalb deren Prozessivität relativ gering ist.
Somit war es eine Aufgabe der vorliegenden Erfindung, mehrere der vorgenannten Eigenschaften von Polymerasen, insbesondere hohe Prozessivität und Thermostabilität, für die Verwendung in in vitro Reaktionen zu vereinen.
Diese Aufgabe wurde erfindungsgemäß gelöst durch die Bereitstellung eines thermostabilen in v/Yro-Komplexes, umfassend ein thermostabiles Gleitklammerprotein und ein thermostabiles Polymeraseaktivität-aufweisendes Elongationsprotein. Der erfindungsgemäße Komplex kann dabei zur Template- abhängigen Elongation von Nukleinsäure(n) dienen.
Dieser Komplex kann in in wfro-Reaktionen, wie z.B. in PCR-Reaktionen, eingesetzt werden und weist dabei eine hohe Prozessivität auf. Von Vorteil ist zudem, daß der Komplex eine geringe Fehlerquote bei der Nukleotidinkorporation aufweist, also eine erhöhte Genauigkeit beim Baseneinbau hat. Dieser Komplex kann somit bei der Elongation, der Amplifikation, der Reversen Transkription, DNA-Markierung und der Sequenzierung von Nukleinsäuren in vorteilhafter Weise eingesetzt werden. Die vorstehend aufgezeigten Verwendungsmöglichkeiten stellen jeweils für sich besonders bevorzugte Ausführungsformen der Erfindung dar.
lm Falle der Verwendung des erfindungsgemäßen Komplexes zur Amplifikation von Nukleinsäurensäuren wurde überraschend festgestellt, daß das dabei hergestellte Amplifikationsprodukt eine besonders niedrige Basenfehlinkorporationsrate aufweist.
Bei der Verwendung eines solchen Komplexes, beispielsweise in Standard- PCR-Reaktionen, wird eine einfache Handhabung und eine hohe Prozessivität gewährleistet, wie dies beispielsweise aus Fig. 26 ersichtlich ist.
In einer Ausführungsform ist vorgesehen, daß bei dem erfindungsgemäßen in ϊro-Komplex das Gleitkammerprotein mit dem Elongationsprotein verbunden ist.
In einer bevorzugten Ausführungsform des erfindungsgemäßen thermostabilen in 'fra-Komplexes sind das Gleitklammerprotein und das Elongationsprotein über ein Kopplungsprotein verbunden.
Die Kopplung zwischen Gleitklammerprotein und Polymeraseaktivität aufweisendem Elongationsprotein kann durch kovalente, aber auch durch nicht-kovalente Bindung erfolgen. In einer bevorzugten alternativen Ausführungsform ist vorgesehen, daß eine direkte Kopplung zwischen Gleitklammerprotein und Elongationsprotein erfolgt.
Dabei kann vorgesehen sein, daß das Gleitklammerprotein und/oder das Elongationsprotein aus Archaebakterien stammen.
In einer bevorzugten Ausführungsform des erfindungsgemäßen Komplexes handelt es sich um einen prokaryontischen in w'fro-Komplex.
In einer bevorzugten Ausführungsform kann es sich bei dem erfindungsgemäßen prokaryontischen Komplex um einen archaebakteriellen in v/fro-Komplex handeln.
In einer bevorzugten alternativen Ausführungsform kann es sich bei dem erindungsgemäßen prokaryontischen Komplex um einen eubakteriellen in vitro- Komplex handeln.
In einer alternativen Ausführungsform des erfindungsgemäßen Komplexes handelt es sich um einen eukaryontischen in v/fro-Komplex.
In diesem Zusammenhang ist ein prokaryontischer in v/fro-Komplex ein solcher, bei dem das Gleitklammerprotein prokaryontischen Ursprungs ist unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist ein eubakterieller Komplex ein solcher, bei dem das Gleitklammerprotein eubakteriellen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist ein archaebakterieller Komplex ein solcher, bei dem das Gleitklammerprotein archaebakteriellen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist weiterhin ein eukaryontischer Komplex ein solcher, bei dem das Gleitklammerprotein eukaryontischen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins.
Gegenstand der vorliegenden Erfindung sind ebenfalls solche thermostabilen in wYro-Komplexe, bei denen die die Komplexe aufbauenden Proteine zum Teil aus Archaebakterien, Eukaryonten und aus Eubakterien stammen. Insoweit sind jegliche Permutationen der in ϊro-Komplexe hinsichtlich der Proteinkomponenten und ihres jeweiligen Ursprunges Gegenstand der vorliegenden Erffindung.
Ursprung im vorstehenden Sinne soll dabei jene Quelle bezeichnen, auf die das Gen, die Geninformation oder das Protein zurückzuführen ist.
Davon unabhängig ist die tatsächliche Art und Weise der Gewinnung des Gleitklammerproteins bzw. des Elongationsproteins, die beispielsweise durch chemische Synthese, gentechnologische Verfahren oder Isolierung aus den natürlichen Quellen erfolgen kann.
Insbesondere ist Gegenstand der Erfindung ein thermostabiler prokaryontischer in wϊro-Komplex zur Elongation, insbesondere zur Template- abängigen Elongation von Nukleinsäuren, der ein thermostabiles Gleitklammerprotein (Fig. 20), welches die komplementären Nukleinsäurestränge ganz oder teilweise umschließt, und ein thermostabiles, Polymeraseaktivität (Fig. 21 und Fig. 22) aufweisendes Protein umfaßt, wobei dieses Protein oder dieser Proteinkomplex mit dem Gleitklammerprotein gekoppelt oder assoziiert ist.
Im Rahmen der vorliegenden Erfindung umfaßt der Begriff Polymeraseaktivität- aufweisendes Elongationsprotein auch Polymeraseaktivität-aufweisende Proteinkomplexe oder Untereinheiten solcher Komplexe, welche die Polymeraseaktivität tragen.
Thermostabil im Sinne der vorliegenden Erfindung bedeutet, daß der in vitro- Komplex mit hoher Prozessivität Nukleotide in wachsende Nukleinsäurestränge inkorporiert, sowohl bei niedrigen als auch bei hohen Temperaturen, die in der PCR oder einer anderen Reaktion auftreten, wie z.B. der DNA-Sequenzierung.
Die PCR besteht z.B. in der Regel aus den Schritten der Denaturierung (70°C bis 98°C), dem Annealing (40°C bis 78°C) und der DNA-Strangsynthese (60°C bis 76°C). Somit muß dieser Komplex mindestens zwischen ca. 60°C und ca.
70°C, bevorzugt insbesondere zwischen 60°C und 76°C und besonders
bevorzugterweise funktionsfähig sein zwischen 40°C und 98°C. Es dürfen während der gesamten Reaktion keine irreversiblen
Denaturierungserscheinungen des Komplexes oder einzelner Komponenten auftreten, welche die Elongationsreaktion unterbinden oder inhibieren.
Die Gleitklammer
Die folgenden Ausführungen sollen dazu dienen, die Funktion und die möglichen Erscheinungsformen der Gleitkammer bzw. des Gleitklammerproteins zu veranschaulichen.
Das Gleitklammerprotein erfüllt die Funktion, das Elongationsprotein an die DNA zu binden. Wie eingangs bereits ausgeführt, umschließt das Gleitklammerprotein selbst die einzelsträngige oder doppelsträngige Nukleinsäure ganz oder teilweise oder durch Assoziation an das Polymeraseaktivität aufweisende Protein beziehungsweise an den Polymeraseaktivität-aufweisenden Proteinkomplex oder eine Untereinheit davon und bildet dadurch eine Klammer um die Nukleinsäure aus. In jedem Fall wird durch diese Klammerbildung die Prozessivität signifikant gesteigert, mindestens um das Eineinhalbfache (Beispiel 5 und Fig. 23).
Das heißt, der erfindungsgemäße in v/Yro-Komplex besitzt eine mindestens eineinhalbfache Prozessivität im Vergleich zu einem Elongationsprotein alleine, beziehungsweise im Vergleich zu einem Polymeraseaktivität-aufweisenden Proteinkomplex, bzw. einer Untereinheit davon, ohne Gleitklammer (Beispiel 5 und Fig. 23).
Als Gleitkammer können erfindungsgemäß beispielsweise Homologe oder Funktionsanaloge des "Proliferating Cell Nuclear Antigen"-Protein komplexes, kodiert im menschlichen Genom, oder Homologe des ebenfalls ringförmigen "ß-clamp"-Proteinkomplex aus E. coli dienen, welche aus thermostabilen Organismen stammen und thermostabil sind, oder sofern sie nicht-thermostabil
sind, thermostabil gemacht werden, oder aus nicht thermostabilen Organismen stammen und thermostabil sind bzw. nachträglich durch Veränderung der Aminosäuresequenz thermostabil gemacht werden (Eijsink VG, van der Zee JR, van den Burg B, Vriend G, Venema G, FEBS Lett 1991 Apr 22;282(1 ):13- 16, Improving the thermostability of the neutral protease of Bacillus stearothermophilus by replacing a buried asparagine by leucine, Bertus Van den Burg, Gert Vriend, Oene R. Veltman, Gerard Venema, and Vincent G. H. Eijsink Engineering an enzyme to resist boiling PNAS 1998 95: 2056-2060). Unter homologen Sequenzen soll hierin im folgenden Sequenzen verstanden werden, die sich dadurch auszeichnen, daß sie zu einer oder mehreren anderen Sequenzen eine Sequenzähnlichkeit aufweisen und zwar in einem Maße, bei dem nicht von einer zufälligen Ähnlichkeit ausgegangen werden kann. Der Grad der Sequenzähnlichkeit wird in Prozent ausgedrückt und Homologie genannt. Bisweilen wird auch der Begriff „Sequenzidentität" verwendet. Ein Homolog ist eine Nukleinsäure oder Aminosäuresequenz, welche zu einer Bezugssequenz eine homologe Sequenz ist.
Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein. Die im menschlichen Genom identifizierte Gleitklammer besteht aus drei PCNA- Protein Komponenten (SEQ ID NO: 11 ) (Homotrimeres), die im E. co//-Genom identifizierte Gleitklammer besteht aus zwei Komponenten (SEQ ID NO: 35) (Homodimeres ).
Als Gleitklammer im Sinne der vorliegenden Erfindung ist hierbei insbesondere jedes Protein zu verstehen, das die funktioneile Eigenschaft der Polymeraseprozessivitätssteigerung (Beispiel 5 und Fig. 23) besitzt und/oder der Senkung der Fehlerrate dient. Dazu kann die Gleitklammer eine ringförmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein anderes Protein eine ringförmige dreidimensionale Struktur bilden, durch die sie in der Lage ist, ein- und doppelsträngige Nukleinsäuren ganz oder teilweise zu umschließen.
Als Gleitklammer im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das
1. zu der menschlichen PCNA-Aminosäuresequenz (Eukaryonten)
(SEQ ID NO 11 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist oder das 2. zu der bakteriellen ß-clamp-Sequenz aus E. coli (Eubakterien)
(SEQ ID NO 35) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist oder das 3. zu der Aminosäuresequenz des PCNA-Homologen aus
Archaeoglobus fulgidus (Archaebakterien) (SEQ ID NO 12) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt 25 %ige und noch bevorzugter 30 %ige Sequenzidentität aufweist.
Sämtliche Sequenzalignments, wie sie hierin offenbart werden, wurden mit dem BLAST Algorithmus nach Altschul, S.F., Gish, W. Miller, W., Myers.E.W., and Lipman, D ., J. Mol. Biol. 215, 403-410 (1990) erstellt.
Die erfindungsgemäße Gleitklammer kann eines oder mehrere der vorgenannten Merkmale aufweisen.
Als Gleitklammer bzw. Gleitklammerproteine im Sinne der vorliegenden
Erfindung sind außerdem Proteine zu verstehen, die eine oder beide der folgenden Konsensussequenzen (Region 1 und Region 2) beinhalten und an
nicht mehr als vier Positionen von der Region 1 (SEQ ID No.: 39) oder nicht mehr als vier Positionen von der Region 2 (SEQ ID No.: 40) abweichen (Fig. 4):
Region 1 (SEQ ID No.: 39):
[GAVLIMPFW]-D-X-X-X-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-[GAVLIMPFW]- X-[GAVLI M PFW]-X-X-X-X-F-X-X-Y-X-X-D und / oder Region 2: (SEQ ID No.: 40):
[GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFW]-E
Die Aminosäuren werden hierbei gemäß der Standard IUPAC - Einbuchstaben Nomenklatur benannt und gemäß dem Prosite Pattern- Beschreibungsstandard aufgeführt. Dabei sind die folgenden Aminosäuregruppen häufig zusammengefaß: G,A,V,L,I,M.P,F oder W (Aminosäuren mit nicht polaren Seitenketten) S,T,N,Q,Y, oder C (Aminosäure mit ungeladenen polaren Seitenketten) K,R,H,D oder E (Aminosäure mit geladenen und polaren Seitenketten) Außerdem bedeutet X in den Sequenzen bzw. Sequenzprotokollen jede beliebige Aminosäure oder Insertion oder Deletion
Aus dem in Fig. 12 dargestellten multiplen Alignment von menschlichen PCNA- Homologen wurde zudem ein Hidden-Markov-Modell generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu verstehen, das mit dem so erzeugten Hidden-Markov-Modell (hierin im folgenden mit „HMM" bezeichnet) einen „Score" von mehr als 20, bevorzugt 25 am bevorzugtesten 30 aufweist (Fig. 12), wobei ein „Score" der Ausgabewert einer HMM-Analyse ist. Die Hidden-Markov-Modelle und die entsprechenden Scores wurden mit dem hmmfs Programm (Version 1.8.4, July 1997) aus dem HMMER-Paket berechnet (HMMER Protein and DNA Hidden
Markov Models (Version 1.8) von Sean Eddy, Dept. of Genetics, Washington University School of Medicine, St. Louis, USA;).
Markov-Modelle mit verstecktem Profil (engl.: profile hidden Markov modeis - profile HMMs), kurz auch „Hidden Markov Models" genannt, hierin als HMM abgekürzt, sind statistische Modelle des Konsensus der Primärstruktur einer Sequenzfamilie. Die Profile verwenden positionsspezifische Punktzahlen („scores") für Aminosäuren (oder Nukleotide) und positionsspezifische Punktzahlen zum Eröffnen oder Erweitern einer Insertion oder Deletion. Methoden zum Erstellen von Profilen, ausgehend von multiplen Alignments, wurden von Taylor (1986), Gribskov et al. (1987), Barton (1990) und Heinikoff (1996) eingeführt.
HMM stellen eine vollkommen probabilistische Beschreibung von Profilen bereit, d. h. die Lehre von Bayes legt fest, wie die gesamten Wahrscheinlichkeits- (Auswertungs-) Parameter gesetzt werden sollten (vergl. Krogh et al. 1994, Eddy 1996 und Eddy 1998). Die zentrale Idee ist die, daß ein HMM ein finites Modell ist, das eine Wahrscheinlichkeitsverteilung über eine unbegrenzte Anzahl möglicher Sequenzen beschreibt. Das HMM setzt sich aus einer Anzahl von Zuständen zusammen, die den Säulen eines multiplen Alignments, wie dies üblicherweise dargestellt wird, entsprechen. Jeder Zustand emittiert Symbole (Reste) entsprechend den (zustandsspezifischen) Symbol-Emissions- Wahrscheinlichkeiten, und die Zustände sind durch Zustand-Übergangs- Wahrscheinlichkeiten untereinander verbunden. Ausgehend von einem Anfangszustand wird eine Abfolge von Zuständen generiert, indem von einem Zustand zum anderen entsprechend den Zustands-Übergangs- Wahrscheinlichkeiten übergegangen wird, bis ein Endzustand erreicht ist. Jeder Zustand emittiert dann Symbole entsprechend den Emissions- Wahrscheinlichkeits-Verteilung dieses Zustands, was eine beobachtbare Sequenz von Symbolen erzeugt.
Das Attribut „hidden" (versteckt) leitet sich ab von der Tatsache, daß die zugrunde liegende Zustandssequenz nicht beobachtet werden kann; was gesehen wird, ist die Symbolsequenz. Eine Abschätzung der Übergangs- und Emissions-Wahrscheinlichkeiten (das Trainieren des Modells) wird durch dynamische Programmierungsalgorithmen erreicht, die in dem HMMER- Paket implementiert sind.
Wenn ein existierendes HMM und eine Sequenz gegeben sind, kann man die Wahrscheinlichkeit berechnen, daß das HMM die fragliche Sequenz erzeugen könnte. Das HMMER-Paket liefert eine numerische Größe (die Punktzahl bzw. Ausgabewert), die proportional zu dieser Wahrscheinlichkeit ist, d. h. den Informationsgehalt der Sequenz, angegeben in Bits, gemessen gemäß dem HMM.
In Zusammenhang mit HMM sei auf folgende Literaturstellen verwiesen:
Barton, G.J. (1990):
Protein multiple alignment and flexible pattern matching. Methods Ezymol. 183: 403-427.
Eddy, S.R. (1996): Hidden markov modeis. Curr. Opin. Strct. Biol. 6: 361-365.
Eddy, S.R. (1998):
Profile hidden markov modeis.
Bioinformatics. 14: 755-763.
Gribskov, M. McLachlan, A.D. und Eisenberg D. (1987):
Profile analysis: Detection of distantly related proteins.
Proc. Natl. Acad. Sei. USA. 84: 4355-5358.
Heinikoff, S. (1996):
Scores for sequence searches and alignment. Curr. Opin. Strct. Biol. 6: 353-360.
Krogh, A., Brown, M., Mian, I.S., Sjolander, K. und Haussler, D. (1994):
Hidden markov modeis in computational biology: Applications to protein modelling.
J. Mol. Biol. 235: 1501-1531.
Taylor, W.R. (1986):
Identification of protein sequence homology by consensus template alignment.
J. Mol. Biol. 188: 233-258.
Aus dem in Fig. 13 dargestelten multiplen Alignment von E. coli ß-clamp- Homologen wurde ein HMM generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, bevorzugt 30 und am bevorzugtesten 35 aufweist (Fig. 13).
Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein, die durch eine charakteristische Bindung fest aneinander gebunden sind, so daß ein stabiler ringförmiger Molekülkomplex gebildet wird, der nicht ohne weiteres von der Nukleinsäure dissoziieren kann. Dadurch wird eine feste, aber nicht kovalente Bindung an die Nukleinsäure ermöglicht, die die freie Verschiebbarkeit auf derselben aber nicht behindert. Die prozessivitätssteigernden Gleitklammerproteine haben zudem charakteristische lokale Moleküleigenschaften im Bereich der Wechselwirkungsregion zur DNA,
die die freie Verschiebbarkeit erleichtern und die durch in diese Region eingelagerte Wassermoleküle unterstützt werden kann.
Eine bevorzugte Ausführungsform der vorliegenden Erfindung ist weiterhin insbesondere ein thermostabiler prokaryontischer in wϊro-Komplex, wobei das Gleitklammerprotein eines der folgenden ist: AF 0335 aus Archaeoglobus fulgidus (SEQ ID NO.: 12) (Fig.24), MJ0247 aus Methanococcus jannaschii (SEQ ID NO.: 13), PHLA008 aus Pyrococcus horikoschii (SEQ ID NO.: 14), MTH1312 aus Methanobacterium Thermoautotrophicus (SEQ ID NO.: 15), sowie AE000761_7 aus Aquifex aeolicus (SEQ ID NO.: 36).
Insbesondere sind solche thermostabilen in w/o-Komplexe Gegenstand dieser Anmeldung, wobei das Gleitklammerprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 11 , 12, 13, 14, 15 und 36 umfaßt.
Der Gleitklammerlader
Desweiteren ist als bevorzugte Ausführungsform zu verstehen, wenn der erfindungsgemäße Komplex einen Gleitklammerlader umfaßt. Als Gleitklammerlader wird hierin ein Protein, Proteinkomplex oder Untereinheit eines Proteins verstanden, welches ein Homolog des im Menschen identifizierten "Replication Factor C"-Proteinkomplexes umfaßt.
Dieser Proteinkomplex besteht im Menschen aus fünf Untereinheiten wobei sie durch 5 separate Gene im Menschen kodiert sind. Die 4 von jeweils einem Gen kodierten kleinen Untereinheiten (hierin als Gleitklammerlader 1 bezeichnet) bilden beim Menschen einen Proteinkomplex. Das Protein der großen Untereinheit wird beim Menschen durch ein Gen kodiert (hierin als Gleitklammerlader 2 bezeichnet). Die Sequenzen der vier kleinen Untereinheiten sind als SEQ ID NO.: 1 , 32, 33, 34 dargestellt, die Sequenz der großen Untereinheit ist als SEQ ID NO.: 6 dargestellt.
Als Gleitklammerlader 1 können erfindungsgemäß Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der vorstehen genannten Sequenzen SEQ ID NO.: 1 , 32, 33, 34 verwendet werden. Dabei können die Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder eukaryontischen Ursprungs sein.
Als Gleitklammerlader 2 können erfindungsgemäß Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, der vorstehend genannten Sequenz SEQ ID NO.: 6 verwendet werden. Dabei können die Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder eukaryontischen Ursprungs sein.
Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung kann auch ein solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 1 , 32, 33, 34 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist.
Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung kann auch ein solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 6) auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige aufweist.
Gleitklammerlader-Homologe im Sinne der obigen Definition sind beispielsweise die in Fig. 1 aufgeführten Gene aus Archaebakterien. Diesen Genen entsprechen für den Gleitklammerlader 1 die Sequenzen SEQ ID NO:
2, 3, 4, und 5 und für den Gleitklammerlader 2 die Sequenzen SEQ ID NO: 7, 8, 9, und 10.
Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung kann auch ein Protein verstanden werden, das eine Sequenz gemäß der folgenden Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Alinierung siehe auch Fig. 6):
SEQ ID No. 41 : C-N-Y-X-S-[KRHDE]-I-I-X-[GAVLIMPFW]-[GAVLIMPFW]-Q-S-R-C-X-X-F-R-F- X-P-[GAVLIMPFW]
Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung kann auch ein Protein verstanden werden, das eine Sequenz gemäß der folgenden Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Alinierung siehe auch Fig. 7):
SEQ ID No.42:
K-X-X-L-L-X-G-P-P-G-X-G-K-T-[STNQYC]-X-[GAVLI M PFWj-X-X- [GAVLIMPFW]
Aus dem in Fig. 14 dargestellten multiplen Alignment von Sequenzen des Gleitklammerladers 1 umfassend die menschliche Sequenz sowie einige dazu homologe Sequenzen aus Archaebakterien, wurde zudem ein HMM generiert. Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung ist demzufolge auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, bevorzugt mehr als 30 und am bevorzugtesten mehr als 35 aufweist (Alinierung siehe auch Fig. 14).
Aus dem in Fig. 15 dargestellten multiplen Alignment von Sequenzen des Gleitklammerladers 2 umfassend die menschliche Sequenz sowie einigen dazu
homologen Sequenzen aus Archaebakterien wurde zudem ein HMM generiert. Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung ist demzufolge auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 15, bevorzugt mehr als 20 und am bevorzugtesten mehr als 25 aufweist (Alinierung siehe auch Fig. 15).
Es kann auch vorgesehen sein, daß der erfindungsgemäße in w'fro-Komplex ein dem Eubaktehum Escherichia coli γ-Komplex oder Teilen davon homologes Protein als Gleitklammerlader 1 oder Gleitklammerlader 2 umfaßt.
Ein Gleitklammerlader im Sinne der vorliegenden Erfindung kann demgemäß ein Gleitklammerlader 1 alleine, ein Gleitklammerlader 2 alleine, oder eine Kombination einer oder mehrerer Gleitklammerlader 1 bzw. Gleitklammerlader 2, jeweils wie vorstehend definiert, sein.
Außerdem ist in einer Ausführungsform des erfindungsgemäßen thermostabilen in w/ro-Komplex zur Elongation von Nukleinsäuren vorgesehen, daß dieser zusätzlich eine Verbindung umfaßt, welche bei der Spaltung Energie freisetzt, wie beispielsweise ATP, GTP, CTP, TTP, dATP, dGTP, dCTP oder dTTP.
Ohne im folgenden darauf festgelegt sein zu wollen, scheint ein Gleitklammerlader die Komponenten der Gleitklammer um den ununterbrochenen DNA-Strang herum zusammenzufügen, bzw. diese wieder zu entfernen, wenn die Reaktion beendet ist. Dabei kann die Gleitklammer eine ringförmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein anderes Protein eine ringförmige dreidimensionale Struktur bilden, durch die sie in der Lage ist, ein- oder doppelsträngige Nukleinsäuren ganz oder teilwseise zu umschließen. Der Gleitklammerlader kann dann Vorteile mit sich bringen, wenn das Template-Nukleinsäuremolekül ringförmig geschlossen vorliegt.
Insbesondere sind solche thermostabile in w'fro-Komplexe Gegenstand dieser Anmeldung, wobei der Gleitklammerlader 1 eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 2, 3, 4 und 5 umfaßt.
Insbesondere sind solche thermostabile in /ro-Komplexe Gegenstand dieser Anmeldung, wobei der Gleitklammerladder 2 eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 7, 8, 9 und 10 umfaßt.
Das Kopplungsprotein
Das Kopplungsprotein hat die Funktion, ein Elongationsprotein mit einem oder mehreren Gleitklammerproteinen oder einem Gleitklammerproteinkomplex zu verbinden. Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Protein zu verstehen, welches die oben beschriebene Funktion aufweist. Bevorzugt sind solche Kopplungsproteine, die archaebakteriellen Ursprungs sind.
Kopplungsproteine im Sinne der vorliegenden Erfindung sind beispielsweise Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der in Fig. 1 aufgeführten Sequenzen, die Homologe zu der humanen Sequenz der kleinen Untereinheit der Polymerase δ, hierin als koppelnde Untereinheit bezeichnet (Sequenzname: DPD2JHUMAN, dargestellt im Sequenzprotokoll als SEQ ID NO:16), sind. Im Sinne der vorliegenden Erfindung kann ein Kopplungsprotein ein Protein sein, das eine Sequenz umfaßt, die aus der Gruppe ausgewählt ist, die die Sequenzen SEQ ID NO: 17, 18, 19, 20 und 21 umfaßt.
Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 16 ) auf einer Länge von mindestens 150
Aminosäuren bei einem Sequenzalignment eine mindestens 18 %ige,
bevorzugt mindestens 22 %ige und noch bevorzugter mindestens 26 %ige Sequenzidentität aufweist.
Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der Aminosäuresequenz (SEQ ID NO: 19 ) von Pyrococcus horikoshii auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist, bevorzugt eine mindestens 25 %ige Sequenzidentität und am bevorzugtesten eine Sequenzidentität von mehr als 30 % .
Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist auch jedes Protein zu verstehen, das die folgende Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht. Die Generierung der Konsensussequenz wird in Fig. 5 gezeigt, die als SEQ ID No. 43 hierin offenbart wird.
SEQ ID No. 43:
[FL]-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-G-X(13)-[GAVLIMPFW]-X-[YR]-
[GAVLIMPFW]-X-[GAVLIMPFW]-A-G-[DN]-[GAVLIMPFW]-[GAVLIMPFW]-[DS]
Aus dem in Fig. 16 dargestellten multiplen Alignment von Homologen zur menschlichen koppelnden Untereinheit oder Kopplungsprotein wurde zudem ein HMM generiert. Als koppelnde Untereinheit im Sinne der vorliegenden Erfindung ist somit jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score mehr als 10, bevorzugt mehr als 15, am bevorzugtesten mehr als 20 aufweist.
Insbesondere sind solche thermostabilen in v/fro-Komplexe Gegenstand dieser Anmeldung, wobei das Kopplungsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 17, 18, 19, 20 und 21 umfaßt.
Elongationsprotein
Im Rahmen der vorliegenden Erfindung kann ein Elongationsprotein verwendet werden, das die eingangs definierten Merkmale aufweist. Darüber hinaus können Formen von Elonagtionsproteinen verwendet werden, wie sie im folgenden beschrieben werden und im Stand der Technik zumindest zum Teil bereits bekannt sind.
Es ist bekannt, daß einige Elongationsproteine die Anwesenheit eines Kopplungsproteins benötigen, um überhaupt Polymeraseaktivität aufzuweisen. Weiterhin ist bekannt, daß einige Elongationsproteine direkt an Gleitklammerproteine binden können, wohingegen andere Elongationsproteine die Anwesenheit eines Kopplungsproteins für die Bindung an die Gleitklammerproteine benötigen. Weiterhin können Elongationsproteine die beiden vorstehend genannten Eigenschaft in sich vereinen, das heißt sowohl über ein Kopplungsprotein als auch direkt, das heißt ohne ein Kopplungsprotein, an ein Gleiklammerprotein binden.
Bevorzugte Elongationsproteine für den erfindungsgemäßen in w'/ro-Komplex können ausgewählt sein aus der Gruppe, die die Organismen Carboxydothermus hydrogenoformans, Thermus aquaticus, Thermus caldophilus, Thermus chliarophilus, Thermus filiformis, Thermus flavus, Thermus oshimai, Thermus ruber, Thermus scotoductus, Thermus silvanus, Thermus species Z05, Thermus species sp. 17, Thermus thermusphilus, Therotoga maritima, Therotoga neapolitana, Thermosipho af canus, Anaerocellum thermophilum, Bacillus caldotenax, oder Bacillus stearothermophilus umfaßt, eingebracht wird.
Als Elongationsproteine sind beispielsweise auch die in Fig. 1 aufgeführten zum menschlichen Elongationsprotein (SEQ ID NO: 22) homologen oder funktionsanalogen Elonagationsproteine aus Archaebakterien geeignet (SEQ ID NO: 23, 24, 25, 26).
Insbesondere sind solche thermostabile in w-ro-Komplexe Gegenstand der Erfindung, wobei das Elongationsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 23, 24, 25, 26, 27, 28, 29, 30 und 31 umfaßt.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 22) auf einer Länge von mindestens 200 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität, bevorzugt 25 %ige Sequenzidentität, am bevorzugtesten 30 %ige Sequenzidentität aufweist.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist auch insbesondere ein Protein zu verstehen, das die folgende Konsensussequenz (SEQ ID No. 44) beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht. Die Fig. 8 zeigt das Alignment, das der Konsensussequenz zugrunde liegt.
SEQ ID No.44:
D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y-[GAVLIMPFW]-X- X-R-A
Aus dem in Fig. 17 dargestellten multiplen Alignment von Homologen zum menschlichen Elongationsprotein (SEQ ID NO: 22) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit auch ein solches Protein zu verstehen, das zu der archaebakteriellen Aminosäuresequenz (SEQ ID NO: 27) auf einer Länge von mindestens 400 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität, bevorzugt mindestens 30 %ige Sequenzidentität, am bevorzugtesten mindestens 35 %ige Sequenzidentität aufweist. Beispielsweise sind geeignet die aus Archaebakterien stammenden Proteine mit der SEQ ID NO: 27, 28, 29, 30 oder 31.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher insbesondere auch jedes Protein zu verstehen, das die folgende Konsensussequenz, hierin als SEQ ID No.: 45 bezeichnet, beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht. (Die Fig. 9 zeigt das Alignment, das der Konsensussequenz zu Grunde liegt.)
SEQ ID No. 45:
A-[GAVLIMPFW]-R-T-A-[GAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMPFW]-T-E-
G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I
Aus dem in Fig. 18 dargestellten multiplen Alignment von Homologen zum archaebakteriellen Elongationsprotein (SEQ ID NO: 27) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Protein zu verstehen, daß mit dem so erzeugten HMM einen Score mehr als 35, bevorzugt mehr als 40 und noch bevorzugter mehr als 45 aufweist (Fig. 18).
Das Elongationsprotein kann auch eubakteriellen Ursprungs sein.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit ebenfalls ein solches Protein zu verstehen, das zu der eubakteriellen Aminosäuresequenz (SEQ ID NO: 37) auf einer Länge von mindestens 300
Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige,
bevorzugt mindestens 30 %ige und noch bevorzugter mindestens 35 %ige Sequenzidentität aufweist.
Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher auch insbesondere jedes Protein zu verstehen, das die folgende Konsensussequenz beinhaltet und an nicht mehr als acht Positionen von dieser Sequenz abweicht (Fig. 10):
SEQ ID No. 46: [GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- [GAVLIMPFW]-V-A-X-A-[GAVLIMPFW]-X-I-T-D-[GAVLIMPFW]-D-P- [GAVLIMPFW]-X-X-X-[GAVLIMPFW]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFW]-S- M-P-D
Aus dem in Fig. 19 dargestellten multiplen Alignment von Homologen zum eubakteriellen Elongationsprotein (SEQ ID NO: 37) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist.
Insbesondere sind solche thermostabile in w'/ro-Komplexe Gegenstand dieser Anmeldung, wobei das Elongationsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 38 umfaßt.
Verwendungen des erfindungsgemäßen in fro-Komplexes:
Bisher wurden DNA-Polymerasen als Elongationsproteine ohne Kopplungsprotein und ohne Gleitklammer für Standard-PCR-Reaktionen eingesetzt, so z.B. DNA-Polymerase I aus Pyrococcus furiosus (US No. 5,545,552) oder Pyrococcus species (EP-A-0 547 359). Diese Enzyme zeichnen sich durch die Eigenschaft aus, thermostabil zu sein und häufig eine
3'-5'-Exonuklease-Aktivität (,proof-reading' Aktivität) zu besitzen. Erst vor kurzem wurde ein Heterodimer mit Polymeraseaktivität in Pyrococcus furiosus entdeckt (Uemori, T., Sato, Y., Kato, I., Doi, H., and Ishino, Y. (1997). A novel DNA polymerase in the hyperthermophilic archaeon, Pyrococcus furiosus: gene cloning, expression, and characterization. Genes to Cells 2, 499-512. )
Es ist auch möglich, durch Deletionen oder Mutationen oder durch das Anfügen von Aminosäuren die Eigenschaften dieser Proteine zu optimieren. Diese veränderten Proteine sind ebenfalls Gegenstand der vorliegenden Erfindung, solange sie den erfindungsgemäßen in vitro Komplex zur Elongation von Nukleinsäuren bilden und die oben näher spezifizierten Funktionen erfüllen.
Fig. 3 veranschaulicht beispielhaft eine Ausführungsform des erfindungsgemäßen thermostabilen in w'fro-Komplexes, wobei hier die Gleitklammer über ein Kopplungsprotein an das Elongationsprotein bindet.
Der erfindungsgemäße in v/fro-Komplex bzw. der diesen enthaltende erfindungsgemäße Reaktionsansatz, kann desweiteren eine Nukleinsäure umfassen, wobei die Nukleinsäure die beispielsweise zu elongierende, zu sequenzierende, zu amplifizierende oder die revers zu transkribierende Nukleinsäure ist und/oder ein Primer, wobei dieser Primer bevorzugterweise an eine Nukleinsäure hybridisiert ist.
Primer sind in der Regel Oligonukleotide, welche komplementär zu einer Zielsequenz sind, um an diese binden zu können, wobei sie in gegensätzlicher Orientierung, ihre 3'-Enden zueinander gerichtet, den zu elongierenden, zu sequenzierenden, zu amplifizierenden oder revers zu transkribierenden Nukleinsäureabschnitt einschließt. Sie dienen als Startpunkt der Enzymaktivität und stellen in der Regel ein freies 3'-OH Ende für die Polymerase zur Inkorporation eines Nukleotides zur Verfügung.
Während der Verwendung des erfindungsgemäßen thermostabilen in vitro- Komplexes zur Amplifikation, Elongation, Reversen Transkription und/oder Sequenzierung liegt der erfindungsgemäße Komplex, gegebenenfalls in einem Reaktionsansatz, bevorzugterweise in einem geeigneten Puffer vor. Geeignete Puffer sind solche, die für PCR, Sequenzierung, Nukleinsäuremarkierung und andere in w'rro-Nukleinsäure-Elongationsreaktionen mittels Polymerase Anwendung finden. Geeignete Puffer werden beispielweise beschrieben in Methods in Molecular Biology, Vol. 15 Humana Press Totowa, New Jersey, 1993, Hrsg. Bruce A. White.
Bei der Verwendung des erfindungsgemäßen thermostabilen in vi'tro- Komplexes zur Elongation, Amplifikation, Reversen Transkription und/oder Sequenzierung kann zusätzlich zu dem erfindungsgemäßen Komplex ein Nukleotid oder ein Gemisch aus Nukleotiden vorliegen bzw. verwendet werden bzw. umfaßt sein. Deoxynukleotide können aus dGTP, dATP, dTTP und dCTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Zusätzlich können auch Derivate von Deoxynukleotiden verwendet werden, die als solche Deoxynukleotide definiert sind, die in der Lage sind, durch eine thermostabile Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden. Solche Derivate umfassen die Thionukleotide, 7-deaza-2' -dGTP, 7-deaza-2' - dATP, Digoxigenin-dUTP (Boehringer Mannheim)-dATP sowie Deoxyinosine- Triphosphat, das auch als Ersatz-Deoxynukleotid für dATP, dGTP, dTTP oder dCTP verwendet werden kann, sind aber nicht auf diese beschränkt. Ebenso können markierte Deoxynukleotide verwendet werden. Auch die Verwendung von Pyrenen und Pyrenderivaten ist möglich. Alle bekannten und/oder zu dem erfindungsgemäßen Zweck geeigneten Markierungen können dabei vorliegen bzw. verwendet werden.
Dideoxynukleotide können aus ddGTP, ddATP, ddTTP und ddCTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Alternativ können auch
Derivate von Dideoxynukleotiden verwendet werden, die als solche
Dideoxynukleotide definiert sind, die in der Lage sind, durch eine Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate können radioaktive Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP) sein oder Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP) sein, die mit z.B. FITC, Cy5, Cy5.5, Cy7, Texas- Rot oder anderen Farbstoffen markiert sind, sind aber nicht auf diese beschränkt. Im Rahmen einer Sequenzierung unter Verwendung des erfindungsgemäßen thermostabilen in ϊro-Komplexes können auch markierte Deoxynukleotide zusammen mit unmarkierten Dideoxynukleotiden eingesetzt werden.
Ribonukleotide können aus GTP, ATP, TTP und CTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Zusätzlich können gemäß der Erfindung auch Derivate von Ribonukleotiden verwendet werden, die als solche Ribonukleotide definiert sind, die in der Lage sind, durch eine Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate können radioaktive Ribonukleotide (ATP, GTP, TTP und CTP) oder Ribonukleotide (ATP, GTP, TTP und CTP), welche mit z.B. FITC, Cy5, Cy5.5, Cy7 und Texas-Rot oder anderen markiert sind, umfassen, sind aber nicht auf diese beschränkt.
Während der Verwendung des Proteinkomplexes zur Amplifikation, Elongation und Sequenzierung kann es sich als vorteilhaft erweisen, wenn bei der Reaktion oder im Reaktionsansatz eine Pyrophosphatase anwesend ist.
Reaktionsansatz umfassend den erfindungsgemäßen thermostabilen in fro-Komplex:
Weiterhin ist Gegenstand der vorliegenden Erfindung ein Reaktionsansatz, der den erfindungsgemäßen in w' ro-Komplex umfaßt. Dabei kann vorgesehen sein,
daß der Reaktionsansatz weiterhin ein oder mehrer Elongationsproteine umfaßt, die mindestens eine oder mehrere der vorstehenden Eigenschaften Aktivitäten aufweisen. Ein derartiges zusätliches Elongationsprotein ist dabei vorteilhafterweise eine thermostabile Polymerase. Ein derartiger Reaktionsansatz erlaubt eine verglichen mit der Verwendung der bekannten thermostabilen Polymerasen erhöhte Prozessivität.
Identifizierung der Gene, Klonierung der Gene, Expression dieser und Reinigung der Proteine der erfindungsgemäßen in ro-Komplexe:
In der Regel können die Komplexe, bevorzugt vollständig oder teilweise bestehend aus rekombinanten Proteinen, mit den folgenden Schritten bereitgestellt werden: Bereitstellung des Nukleinsäurefragmentes, welches für das gewünschte Protein kodiert, Ligation in einen Expressionsvektor, Transformation in einen Wirt, Expression und Aufreinigung des Proteins (Fig. 25). In Übereinstimmung mit der vorliegenden Erfindung kann es vorkommen, daß Gene, insbesondere aus den Archaebakterien, Inteine (Proc. Natl. Acad. Sei. U S A 1992 Jun 15;89(12):5577-5581 , Intervening sequences in an Archaea DNA polymerase gene, Perler FB, Comb DG, Jack WE, Moran LS, Qiang B, Kucera RB, Benner J, Slatko BE, Nwankwo DO, Hempstead SK, et al) enthalten können, welche zunächst entfernt werden können.
Die Identifizierung weiterer für den erfindungsgemäßen Komplex geeigneter Gene und/oder Proteine kann z.B. erfolgen durch Homologiesuchen in Datenbanken, welche Genome aus Prokaryonten umfassen. Programme, die dafür geeignet sind, umfassen beispielsweise das Programm BLAST, BLASTP und FASTA, sind aber nicht darauf beschränkt. (Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new
generation of protein database search programs", Nucleic Acids Res. 25:3389- 3402. W.R. Pearson & D . Lipman PNAS (1988) 85:2444-2448).
Die Identifizierung kann auch dadurch geschehen, daß DNA-Sonden verwendet werden, um in z.B. gesamtgenomischen Banken aus Prokaryonten oder Eukaryonten nach den entsprechenden Genen zu screenen. Die hierfür nötigen experimentellen Verfahren finden sich in Maniatis et al. (Molecular Cloning (2"d edition, 3 Volume set): A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(1989)) oder in Ausubel et al (Current Protocols in Molecular Biology, John Wiley and Sons (1988)).
Die Bereitstellung der gereinigten Nukleinsäure der Gene, die die erfindungsgemäßen Komplexe aufbauenden Proteine kann z.B. über deren Isolierung aus einer genomischen Bank des relevanten Organismus geschehen oder durch synthetische DNA-Herstellung, jeweils gewünschtenfalls kombiniert mit einer Amplifikation mittels PCR, unter Zuhilfenahme von Primern, welche für den gewünschten Genabschnitt spezifisch sind. Übliche Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y. (1989)) beschrieben.
Die Gene der Proteine der erfindungsgemäßen in ϊra-Komplexe können unter Anwendung einer Vielzahl von Methoden kloniert werden und somit mittels eines Expressionsvektors zur Proteinexpression in einem Wirtsorganismus zur Verfügung gestellt werden. Gängige Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(1989)) beschrieben. Die Gene der Komplexe können hierbei z.B. zunächst in einen ,high-copy' Vektor, z.B. pUC18, pBst oder pBR322 kloniert werden und dann erst in einen prokaryontischen Expressionsvektor, z.B. pTrc99, pQE30, pQE31 oder pQE32, umkloniert werden, oder aber direkt in einen prokaryontischen oder viralen Expressionsvektor kloniert werden. Unter Vektoren sind hierbei Nukleinsäuren zu verstehen, die in der Lage sind, ein
anderes Nukleinsäuremolekül in oder zwischen verschiedenen Organismen, bzw. genetischen Hintergründen zu transportieren. Sie haben in der Regel die Fähigkeit zur autonomen Replikation und/oder zur Expression (Expressionsvektoren) des operativ verbundenen Nukleinsäuremoleküls. "Operativ verbunden" bedeutet hierin, daß das transportierte Nukleinsäuremolekül so mit dem Vektor verbunden ist, daß es unter der Transkriptions- und Translationskontrolle von Expressionskontrollsequenzen des Vektors steht und in einer Wirtszelle exprimiert werden kann. Bakterielle und virale Expressionssysteme, deren bevorzugte Verwendung, sowie eine Auswahl an Vektorsystemen ist z.B. in ,Gene Expression Technology, (Meth. Enzymol., Vol 185, Goeddel, Ed., Academic Press, N.Y. (1990)) beschrieben. Geeignete Vektoren für die vorliegende Erfindung sollten eine unterschiedlich starke Expression der Proteine dadurch ermöglichen, daß sie einige oder alle der folgenden Eigenschaften besitzen: (1 ) Promotoren, oder Transkriptionsinitiationsstellen, entweder unmittelbar neben dem Start des Proteins oder als Fusionsprotein, (2) Operatoren, verwendet werden können, um die Genexpression an oder aus zu schalten, (3) ribosomale Bindungsstellen für eine verbesserte Translation, und (4) Terminationsstellen für die Transkription oder Translation, die zu verbesserter Stabilität des Transkriptes führen.
Expressionsvektoren, die mit eukaryontischen Zellen, bevorzugterweise mit Vertebratenzellen kompatibel sind, können auch Verwendung finden. Einige bekannte Vektoren sind pSVL und pKSV-10 (Pharmacia), pBPV-1/pML2d (International Biotechnologies, Inc.), pAcHLT-ABC (Pharmingen) und pTDTI (ATCC 31255). Die Verwendung eines retroviralen Expressionsvektors ist auch möglich.
Weitere Gegenstände der vorliegenden Erfindung sind daher DNA-Sequenzen, welche für die erfindungsgemäßen thermostabilen in wYro-Komplexe codieren, sowie entsprechende Vektoren, vorzugsweise Expressionsvektoren.
Die erfindungsgemäßen Vektoren enthalten mindestens ein Gen für das Gleitklammerprotein oder mindestents ein Gen für das Kopplungsprotein oder mindestens ein Gen für einen Gleitklammerlader 1 und/oder 2 oder mindestens ein Gen für ein Elongationsprotein. In einer Ausführungsform enthalten die Vektoren gleichzeitig mehrere der verschiedenen vorstehend genannten Gene, beispielsweise die Gene für ein Elongationsprotein und ein Gleitklammerprotein.
Es ist dabei im Rahmen der Erfindung bevorzugt, wenn der Vektor neben den darin bereits enthaltenen DNA-Sequenzen noch geeignete Restriktionsschnittstellen und ggf. Polylinker zur Insertion weiterer DNA- Sequenzen enthält. Besonders bevorzugt ist es, wenn die räumliche Anordnung von bereits enthaltener DNA-Sequenz und zusätzlicher Insertionsstelle nach Expression zur Ausbildung eines Fusionsproteins führt.
Ebenfalls bevorzugt ist es, wenn der erfindungsgemäße Vektor Promotor- und/oder Operatorbereiche enthält, wobei es besonders bevorzugt ist, wenn derartige Promotor- und/oder Operatorbereiche induzierbar oder reprimierbar sind. Dadurch wird eine Steuerung der Expression in Wirtszellen erheblich vereinfacht und kann besonders effizient gestaltet werden.
Derartige Promotor/Operatorbereiche können in einem Expressionsvektor auch mehrfach vorkommen, so daß ggf. eine unabhängige Expression mehrerer DNA-Sequenzen unter Verwendung nur eines Expressionsvektors ermöglicht wird.
Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Wirtszelle, enthaltend einen oder mehrere erfindungsgemäße(n) Vektor(en), wobei in dieser Wirtszelle unter geeigneten Bedingungen die Expression zu Proteinen
erfolgen kann. Geeignete Bedingungen schließen beispielsweise Anwesenheit eines Repressors, Induktors oder eines Derepressors ein.
Für die Transformation, Phageninfektion und Zellkultur existieren Standardprotokolle in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.). Aus der Vielzahl der vorhandenen E. co//-Stämme, die zur Transformation geeignet sind, sind bevorzugt JM101 (ATCC No. 33876), XL1 (Stratagene), RRI (ATCC No. 31343)M15[prep4] (QIAGEN) und BL21 (Pharmacia). Proteinexpression kann z.B. auch geschehen unter Zuhilfenahme des E. coli Stammes INVαF' (Invitrogen).
Die Transformanten werden unter den geeigneten Wachstumsbedingungen des Wirtsstammes kultiviert. So werden die meisten E. co//-Stämme z.B. in LB- Medium bei 30°C bis 42°C bis zur logarithmischen oder stationären Wachstumsphase kultiviert. Die Proteine können aus einer transformierten Kultur gereinigt werden, wobei dies entweder aus einem Zellpellet, nach Zentrifugation, oder aber aus der Kulturlflüssigkeit geschehen kann. Sofern die Proteine aus dem Zellpellet gereinigt werden, werden die Zellen in einem geeigneten Puffer resuspendiert und mittels Ultraschallbehandlung, enzymatischer Behandlung oder Einfrieren und Auftauen aufgebrochen. Sofern die Reinigung aus der Kultursuspension geschieht, sei es ohne oder mit einem Fusionsprotein, wird der Überstand von den Zellen mittels bekannter Verfahren, wie Zentrifugation abgetrennt.
Die Trennung und Reinigung der Proteine der erfindungsgemäßen Komplexe entweder aus dem Überstand der Kulturlösung oder aus dem Zellextrakt kann durch bekannte Separations- oder Reinigungverfahren geschehen. Diese Methoden sind z.B. solche, die die Löslichkeiten betreffen, wie Salzfällungen und Lösungsmittelfällungen, Methoden, die sich die unterschiedlichen Molekulargewichte zunutze machen, wie Dialyse, Ultrafiltration, Gelfiltration, und SDS-Polyacrylamidgelelektrophorese, Methoden die sich die unterschiedlichen Ladungen zunutze machen, wie
lonenaustauschchromatographie, Methoden die sich die unterschiedliche Hydrophobie zunutze machen, wie reverse-phase HPLC (High Performance Liquid Chromatography), Methoden, die sich bestimmte Affinitäten zunutze machen, wie Affinitätschromatographie (Beispiel 6, 7 Fig. 24 und Fig. 25), und Methoden, die sich Unterschiede im isoelektrischen Punkt zunutze machen, wie isoelektrische Fokussierung. Es ist auch vorstellbar, daß Zellextrakte, entweder aus dem Organismus, welcher das Gen des akzessorischen Komplexes trägt, gemacht werden können, welcher die erfindungsgemäße Aufgabe erfüllt, oder aus dem rekombinanten Wirtsorganismus, z.B. E. coli. Mit diesen Extraktionen könnte man andere Reinigungsschritte vermeiden.
Die oben beschriebenen Verfahren können in einer Vielzahl von Kombinationen eingesetzt werden, um die Proteine des in w'r/o-Komplexes bereitzustellen.
Elongation von Nukleinsäuren
Der erfindungsgemäße thermostabile in v/ o-Komplexe kann zur Elongation von Nukleinsäuren verwendet werden, z. B. zur Polymerase-Ketten-Reaktion, (Beispiel 3, 4, sowie Fig. 21 ; Fig. 22) DNA-Sequenzierung, zur Markierung von Nukleinsäuren und anderen Reaktionen, die die in vitro Synthese von Nukleinsäuren beinhalten.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wobei die Nukleinsäure nötigenfalls denaturiert, mit mindestens einem Primer unter Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend komplementär zu einem flankierenden Bereich einer gewünschten Nukleinsäuresequenz des Template-Strangs ist und mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-Elongation erfolgt, wobei als
Polymerase ein erfindungsgemäßer thermostabiler in w'f/o-Komplex eingesetzt wird.
Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, bei denen die Elongation ausgehend von einem Primer erfolgt, der an die Template- Nukleinsäure anhybridisiert wurde und ein freies 3'-OH-Ende für die Elongation zur Verfügung stellt, sind dem Fachmann bekannt. Zur Amplifikation wird insbesondere eine PCR-Polymerasekettenreaktion durchgeführt.
Reverse Transkription
Es ist auch die Anwendung des erfindungsgemäßen thermostabilen in-vitro- Komplexes in der reversen Transkription möglich, wobei entweder der erfindungsgemäße Komplex selbst Reverse-Transkriptase-Aktivität besitzt, oder aber zusätzlich ein geeignetes Enzym hinzugefügt wird, das eine Reverse-Transkriptase-Aktivität aufweist, unabhängig davon ob der thermostabile in ϊra-Komplex selbst eine Reverse-Transkriptase-Aktivität hat.
Zur erfindungsgemäß bevorzugten reversen Transkription von RNA in DNA wird ebenfalls ein erfindungsgemäßer thermostabiler in w'fro-Komplex eingesetzt, wobei dessen Elongationsprotein selbst eine Reverse Transkriptase-Aktivität aufweist. Diese Reverse Transkriptase-Aktivität kann die einzige Polymeraseaktivität des Elongationsproteins sein, kann aber auch zusätzlich zu einer vorhandenen 5'-3'-DNA-Polymeraseaktivität vorliegen. Eine erfindungsgemäß bevorzugte Ausführungsform des in w'fro-Komplex umfaßt das Elongationsprotein aus dem Organismus Carboxydothermus hydrogenoformans, wie offenbart in EP-A 0 834 569.
Sequenzierung
Eine weitere bevorzugte Verwendung des erfindungsgemäßen in vi'tro- Komplexes ist die Sequenzierung von Nukleinsäuren gemäß der Methode von Sanger. Ausgehend von mindestens einem Primer, der zu einem Teil der zu sequenzierenden Nukleinsäure hinreichend komplementär ist, wird eine Template-abhängige Elongation vorgenommen. Im Falle der Sequenzierung von RNA ist es nötig, eine reverse Transkription durchzuführen. Als Deoxynukleotide oder Dideoxynukleotide werden im Rahmen dieser bevorzugten Ausführungsform auch die oben beschriebenen jeweiligen Derivate als geeignet angesehen. Insbesondere ist es für die erfindungsgemäßen Verfahren zur Elongation von Nukleinsäuren bevorzugt, daß die gebildeten Nukleinsäuren markiert werden. Hierzu ist es möglich, markierte Primer und/oder markierte Deoxynukleotide und/oder markierte Dideoxynukleotide und/oder markierte Ribonukleotide oder jeweils entsprechende Derivate, wie sie oben bereits beispielsweise beschrieben sind, einzusetzen.
Markierung von Nukleinsäuren
Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Markierung von Nukleinsäuren, z.B. durch Einfügung einzelner Brüche in Phosphodiesterbindungen der Nukleinsäurekette und Ersatz eines Nukleotids an den Bruchstellen durch ein markiertes Nukleotid mit Hilfe einer Polymerase, wobei als Polymerase ein erfindungsgemäßer thermostabiler in w'fro-Komplex eingesetzt wird.
Ein bevorzugtes Verfahren stellt das allgemein als Nick-Translation bezeichnete Verfahren dar, das eine einfache Markierung von Nukleinsäuren ermöglicht. Alle oben bereits beschriebenen markierten Ribonukleotide oder Deoxyribonukleotide oder Derivate davon sind hierfür geeignet, solange die Polymerase sie als Substrat akzeptiert.
Markierung im vorstehenden Sinne ist auch eine Markierung, die im Rahmen einer PCR-Reaktion erfolgt, wobei in diesem Fall markierte Nukleotide oder Derivate davon in die Nukleinsäuresequenz eingebaut werden.
Gegenstand der vorliegenden Erfindung ist ebenfalls ein Kit zur Elongation und/oder Amplifikation und/oder Reversen Transkription und/oder Sequenzierung von Nukleinsäuren, wobei dieser Kit ein oder mehrere Behälter umfassen kann.
Der Kit selbst umfaßt a) einen erfindungsgemäßen thermostabilen in w'fro-Komplex oder b) einen thermostabilen in w'fro-Komplex und ggf. separat davon ein Polymeraseaktivität aufweisendes Elongationsprotein sowie ggf. eine oder mehrere der Komponenten, die ausgewählt sind aus der Gruppe, die Primer, Puffersubstanzen, Nukleotide, ATP, andere Kofaktoren und Pyrophosphatase umfaßt.
Dabei ist es möglich, daß der erfindungsgemäße thermostabile in w'fro- Komplex in besagtem Kit in Form seiner Einzelbestandteile, das heißt als thermostabiles Gleitklammerprotein sowie thermostabiles Elongationsprotein vorliegt, getrennt oder vereint in einem Behältnis, und sich als solches erst zu einem späteren Zeitpunkt ausbildet.
Insbesondere ist Gegenstand der vorliegenden Erfindung ein Kit zur Elongation, Amplifikation, Reversen Transkription, Markierung bzw. Sequenzierung von Nukleinsäuren, wobei zusätzlich Deoxynukleotide bzw. deren Derivate enthaltend sind.
Gegebenenfalls können in dem erfindungsgemäßen Kit auch Ribonukleotide oder Derivate davon umfaßt sein, nämlich dann, wenn ein Elongationsprotein eingesetzt wird, das Ribonukleotide als Substrat akzeptiert.
Eine bevorzugte Ausführungsform des erfindungsgemäßen Kits ist ein Kit zur Sequenzierung von Nukleinsäuren, wobei zusätzlich zu Deoxynukleotiden bzw. deren Derivaten, Dideoxynukleotide bzw. deren Derivate zur Kettentermination umfaßt sind.
Desweiteren ist insbesondere Gegenstand der vorliegenden Erfindung ein Kit zur reversen Transkrition von Nukleinsäuren, wobei entweder der erfindungsgemäße Komplex selbst reverse Transkriptase-Aktivität besitzt, oder aber zusätzlich ein geeignetes Enzym anwesend ist, das reverse Transkriptase-Aktivität besitzt, wobei Deoxynukleotide bzw. deren Derivaten im Reaktionsgemisch enthalten sein können.
In einer weiteren besonders bevorzugten Ausführungsform enthält der Kit Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide und/oder Ribonukleotide und/oder deren jeweilige Derivate in markierter Form.
Insbesondere für die Sequenzierung von Nukleinsäuren ist es nötig, eine Markierung einzufügen. Geeignete Markierungen sind weiter oben bereits in beispielhafter Form beschrieben. Geeignete Markierungsmittel sind in einer bevorzugten Ausführungsform des erfindungsgemäßen Kits umfaßt.
Im Rahmen der vorliegenden Erfindung ist es weiterhin möglich, daß der Kit (hierin auch als Reagenzienkit bezeichnet) zur Markierung von Nukleinsäuren eingesetzt wird. In diesem Fall enthält der Reagenzienkit die Bestandteile a) oder b) und markierte Nukleotide, wobei Puffersubstanzen, ATP oder andere Kofaktoren und/oder Pyrophosphatase ebenfalls anwesend sein können.
Insbesondere ist ein Kit bevorzugt, der einen geeigneten Puffer umfaßt, wie oben beschrieben. Bevorzugt ist ebenfalls, daß der erfindungsgemäße Kit zusätzlich eine Pyrophosphatase, ATP und/oder andere Kofaktoren umfaßt.
Gegenstand der vorliegenden Erfindung ist desweiteren die Verwendung eines thermostabilen Gleitklammerproteins in in vitro Verfahren zur Elongation, Amplifikation, Markierung bzw. Sequenzierung oder reversen Transkription von Nukleinsäuren.
Der erfindungsgemäße thermostabile in w'fro-Komplex kann zu Zwecken der Sequenzierung, Amplifikation, reversen Transkription und dergleichen sowohl mit kurzen als auch mit langen Nukleinsäurefragmenten verwendet werden, wobei insgesamt eine verringerte Fehlerhäufigkeit
(Nukleotidfehlinkorporation) gegenüber der Verwendung thermostabiler Elongationsproteine alleine erreicht wird.
In einer bevorzugten Alternative wird der thermostabile in w'fro-Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen Transkription von langen Nukleinsäurefragmenten verwendet.
In einer weiteren bevorzugten Alternative wird der thermostabile in w'fro- Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen Transkription von solchen Nukleinsäurefragmenten verwendet, die Sekundärstruktur ausbilden.
Die folgenden Beispiele sollen in Verbindung mit den Figuren die Erfindung näher erläutern und Vorteile veranschaulichen:
Figuren:
lm folgendenden werden häufig Sequenznamen verwendet, unter denen die Protein- oder Nukleinsäuresequenzen in der Genbank und der EMBL Datenbank stehen. Dabei zeigt:
Fig. 1 tabellarisch Proteinsequenznamen des erfindungsgemäßen in w'fro-Komplexes, sowie Werte aus paarweisen Alignments und multiplen Alignments zwischen Archaebakterien und zwischen Archaebakterien und den entsprechenden humanen Genen;
Fig. 2 eine Tabelle ähnlich der von Fig. 1 , jedoch beschränkt auf
Gleitklammerprotein und Elongationsprotein von E. coli und A. aeolicus;
Fig. 3 eine schematische Dartstellung des erfindungsgemäßen thermostabilen in w'fro-Komplexes;
Fig. 4 Alignments zweier konservierter Regionen des
Gleitklammerproteins;
Fig. 5 ein Alignment einer konservierten Region des Kopplungsproteins;
Fig. 6 ein Alignment einer konservierten Region des
Gleitklammerladers;
Fig. 7 ein Alignment einer konservierten Region des
Gleitklammerladers 2;
Fig. 8 ein Alignment einer konservierten Region des
Elongationsproteins 1 ;
Fig. 9 ein Alignment einer konservierten Region des
Elongationsproteins 2;
Fig. 10 ein Alignment einer konservierten Region des Elongationsproteins aus Eubakterien;
Fig. 11 ein Alignment einer konservierten Region der Gleitklammer aus
Eubakterien;
Fig. 12 bis 19 multiple Alignments verschiedener Proteinsequenzen zur
Generierung von Hidden Markov Modellen (HMM);
Fig. 20 eine chromatographische Analyse einer rekombinanten
Gleitkammer (Archaeoglobus fulgidus PCNA (AF 0335));
Fig. 21 und 22 das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w'fro-Komplexes ist;
Fig. 23 den Vergleich der Aktivität eines Elongationsproteins mit und ohne Gleitklammerprotein;
Fig. 24 das Resultat der Reinigung eines Gleitklammerproteins;
Fig. 25 die Expression und Reinigung der Archaeoglobus fulgidus-
DNA-Polymerase;
Fig. 26 die Ergebnisse der Verwendung eines erfindungsgemäßen in w'fro-Komplexes in der PCR;
Fig. 27 die Ergebnisse eines Y2H Experimentes;
Fig. 28 das PCR-Amplifikationsergebnis des humanen Kollagen-Gens unter Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplex
Fig. 29 eine tabellarische Übersicht derjenigen Gene, wie sie den in
Fig. 1 angegebenen Proteinsequenznummern entsprechen und aus den jeweiligen Datenbanken erhalten werden können; und
Fig. 30 eine tabellarische Darstellung der Hintergrundinformation zu den verschiedenen Datenbanken in englischer Sprache, aus denen die hierin angegebenen Nukleinsäuresequenz- und Aminosäuresequenzdaten erhalten werden können.
Detaillierte Beschreibung der Figuren
Fig. 1 :
Figur 1 listet tabellarisch Proteinsequenznamen des erfindungsgemäßen thermostabilen in w'fro-Komplexes auf sowie Werte aus paarweisen Alignments und multiplen Alignments zwischen Archaebakterien und zwischen Archaebakterien und den entsprechenden humanen Genen. Hierbei bedeutet die Annotation „1" die Prozentidentität (%) zu dem entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „2" Prozentidentität zu dem entsprechneden Gen von Archaeoglobus fulgidus, berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „3" Prozenzidentität zu dem entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment mit FASTA 3.1t02 [March, 1998]§. Die Verfahren werden näher beschrieben in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped
BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402 und W.R. Pearson & DJ. Lipman Proc. Natl. Acad. Sei. (1988) 85:2444-2448. Die Fig. 1 zeigt im Falle des Gleitklammerladers 1 , des Gleitklammerlader 2, des Gleitklammer, des Kopplungsprotein und des Elongationsprotein 1 die Sequenznamen aus den Datenbanken und ebenso deren SEQ ID Nummer, wobei die Werte in den Klammern jeweils Prozent Identät je Anzahl Aminosäuren darstellen. Im Falle des Elongationsprotein 2 beziehen sich die Werte auf Prozent Sequenzidentität zu der Archaeoglobus fulgidus- Sequenz. Auch hier sind die Sequenznamen aus den Datenbanken und ebenso deren "SEQ ID No." gezeigt.
Fig. 2:
Fig. 2 zeigt Proteinsequenzen, paarweise Alignments und multiple Alignments aus Eubakterien des Replikationsapparates. Wobei die Annotation 1 %ldentität zu dem entsprechneden Gen aus E. coli bedeutet, berechnet aus dem paarweisen Alignment (siehe Anhang) mit BLASTP 2.0.4 [Feb-24-1998]#. Das Verfahren wird in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402, näher beschrieben.
Fig. 3:
Fig. 3 zeigt eine Skizze einer möglichen Form des erfindungsgemäßen thermostabilen in w'fro-Komplexes, wobei die Gleitkammer über ein Kopplungsprotein an das Elongationsprotein bindet.
Fig. 4:
Fig. 4 zeigt Alignments zweier konservierter Regionen des Gleitklammerproteins, sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: PCNA human (aus SEQ ID NO: 11 ) und die entsprechenden Sequenzen aus Archaeoglobus fulgidus (aus SEQ ID NO: 12), aus Methanococcus janashii (aus SEQ ID NO: 13), aus Pyrococcus horikoschii (aus SEQ ID NO: 14) und aus Methanococcus thermoautothrophicus (aus SEQ ID NO: 15).
Fig. 5:
Fig. 5 zeigt ein Alignment einer konservierten Region des Kopplungsproteins sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: PfuORF2, DPD2JHUMAN, AF1790 und MJ0702. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 6:
Fig. 6 zeigt ein Alignment einer konservierten Region der koppelnden Untereinheit sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AC11_HUMAN, AF2060 , MTH0241 , PHBN012 und MJ1422. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 7:
Fig. 7 zeigt ein Alignment einer konservierten Region des Gleitklammerlader 2 sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AC15_HUMAN, MJ0884 , AF1195, MTH0240 und MTH0240. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 8:
Fig. 8 zeigt ein Alignment einer konservierten Region des Elongationsproteins 1 , sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DPODJHUMAN, MJ0885 , MTH1208, PHBT047und DPOL_ARCFU. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 9:
Fig. 9 zeigt ein Alignment einer konservierten Region des Elongationsproteins 2, sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AF1722, MJ1630 , PfuORF3, MTH1536 und PHBN021. Die SEQ ID Nummern können Fig. 1 entnommen werden.
Fig. 10:
Fig. 10 zeigt ein Alignment einer konservierten Region des Elongationsproteins aus Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3A_HELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimuhum).
Fig. 11 :
Fig. 11 zeigt ein Alignment einer konservierten Region der Gleitklammer aus Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgende
Gene sind gezeigt: AAPOL3B, DP3B_ECOLI, S.TYPHIM, DP3B_PROMI, DP3B_PSEPU und DP3B_STRC0 (AAP0L3B: Aquifex aeolicus Sektion 93: DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicoloή.
Fig. 12:
Fig. 12 zeigt ein multiples Alignment der Gleitklammerprotein-Sequenzen zur Generierung des HMM.
Fig. 13:
Fig. 13 zeigt ein multiples Alignment der eubakteriellen Gleitklammerprotein- Sequenzen zur Generierung des HMM (AAPOL3B: Aqufex Aeolicus Sektion 93: DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicolor).
Fig. 14:
Fig. 14 zeigt ein multiples Alignment der Gleitklammerlader 1- Proteinsequenzen zur Generierung des HMM.
Fig. 15:
Fig. 15 zeigt ein multiples Alignment der Gleitklammerlader 2- Proteinsequenzen zur Generierung des HMM.
Fig. 16:
Fig. 16 zeigt ein multiples Alignment der Proteinsequenzen der Kopplungsproteine zur Generierung des HMM.
Fig. 17:
Fig. 17 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine
1 zur Generierung des Hidden Markov Models.
Fig. 18:
Fig. 18 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine
2 zur Generierung des Hidden Markov Models.
Fig. 19:
Fig. 19 zeigt ein multiples Alignment der Sequenzen der eubakteriellen Elongationsproteine zur Generierung des HMM. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3AJHELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimurium).
Fig. 20: (Beispiel 2)
Fig. 20 zeigt eine chromatographische Analyse von rekombinatem Archaeoglobus fulgidus PCNA (AF 0335):
Rekombinantes Archaeoglobus fulgidus-PCNA (AF 0335) liegt unter nativen Bedingungen als Trimer vor. Fig. 20 A zeigt Proteine mit His-Tag (Histidin- Tag) in den Fraktionen 15 (Spur 1 ), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4), 23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgeführten Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1), 11 (Spur 2), 12 (Spur 3), 13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur 7),17 (Spur 8), der in Anwesenheit von Harnstoff durchgeführten denaturierenden Chromatographie.
Fig. 21 : (Beispiel 3)
Fig. 21 zeigt das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w'fro-Komplexes ist:
Jeweils 1 μl (Spur 4), 2,5 μl (Spur 5) und 5 μl (Spur 6) Pyrococcus horikoshii DNA-Polymerase (PH1947; Grobextrakt s. Fig. 25) wurden zum Aktivitätsvergleich mit 1 Einheit Taq Polymerase (Spur 2) und 1 μl Archaeoglobus fulgidus DNA-Polymerase (AF 0497)-Grobextrakt (s. Fig.25) (Spur 3) individuell in Standard PCR Reaktionen eingesetzt.; Spur 1 zeigt einen DNA-Größenmarker (New England Biolabs; Mischung aus 1 kb DNA ladder und 100 bp DNA ladder).
Fig. 22: (Beispiel 4)
Fig. 22 zeigt das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w'fro-Komplexes ist:
Proben der PCR mit Archaeoglobus fulgidus DNA-Polymerase AF 0497 wurde nach unterschiedlichen Zyklenzahlen (Z) entnommen und auf einem
1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt. Spur 2: 16Z; Spur 3:21 Z; Spur 4: 26Z; Spur 5: 28Z; Spur 6. 30Z; Spur 7: 32Z; Spur 8: 34Z; Spur 9: 36Z; Spur 10: 38Z; Spur 11 : 40Z; Spur 1 zeigt einen DNA Größenmarker (New England Biolabs; Mischung aus 1 kb DNA ladder und 100 bp DNA ladder). Der obere Abschnitt zeigt Reaktionsprodukte der Taq Polymerase; der untere Abschnitt zeigt Reaktionsprodukte der Archaeoglobus fulgidus DNA-Polymerase AF 0497.
Fig. 23: (Beispiel 5)
Fig. 23 zeigt einen Vergleich der Aktivität eines Elongationsproteins mit und ohne Gleitklammerprotein. Probe 1 repräsentiert einen enzymfreien Ansatz. Proben 2-12 enthielten außerdem je 3μl einer 1 :1000 Verdünnung einer Fraktion von rekombinanter Archaeoglobus /u/gr/divs-DNA-Polymerase (Ausgangskonzentration 7,5 μg/μl). Proben 3-7 sowie 8-12 außerdem 0,5; 1 ; 2; 4 und 8 μl einer Fraktion von rekombinantem Gleitklammerprotein aus Archaeoglobus fulgidus PCNA. Intensitätsauswertung mit AIDA: Intensität Hintergrund Spur 1 : 46,4; Spur 2= 258,5; Spur 3= 164,4; Spur 4= 122,8; Spur 5= 162,1 ; Spur 6= 297,4; Spur 7=359,5
Fig. 24: (Beispiel 6)
Fig. 24 zeigt das Ergebnis der Reinigung eines Gleitklammerproteins: Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500 μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung des Herstellers zum Lauf von NuPage Gelen (NOVEX; Fig. 25) behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta Agarosesäule nach der Dialyse. Durch Reinigung über Ni-NTA-
Agarose (Qiagen) werden hochreine Fraktionen des Gleitklammerproteins des Organismus Archaeoglobus fulgidus erhalten (siehe Spuren 4 und 5).
Fig. 25: (Beispiel 7) Fig. 25 zeigt die Expression und Reinigung der Archaeoglobus fulgidus DNA- Polymerase (siehe auch Beispiel 7):
Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta Agarosesäule nach der Dialyse. Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Spuren 4 und 5 zeigen hochreine Fraktionen der Archaeoglobus fulgidus DNA-Polymerase, die durch Reinigung über Ni-NTA- Agarose werden erhalten.
Fig. 26: (Beispiel 8)
In Fig. 26 sind die Ergebnisse der Verwendung eines erfindungsgemäßen in w'fro-Komplexes in der PCR gezeigt. Spur eins zeigt eine PCR Reaktion ohne Verwendung einer Gleitklammer, wohingegen in der Spur 2 das Ergebnis einer PCR Reaktion unter Verwendung eines Gleitklammerproteins gezeigt ist.
Fig. 27: (Beispiel 9)
Fig. 27 zeigt die Ergebnisse eines „Yeast-Two-Hybrid"-Experiments, hierin als Y2H- Experiment bezeichnet, wobei die Reihe A mit Zellen bestückt ist, die den leeren pGAD424 Vektor (Clontech, Palo Alto, USA) tragen, sodaß die Transkriptions-Aktivierungsdomäne exprimiert wird, die Reihe B mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das
Sacharomyces cerevesiae-Gen CDC48 als Fusionsprotein mit der Transkriptions-Aktivierungsdomäne exprimiert wird, die Reihe C mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Gleitklammergen aus Archaeoglobus fulgidus als Fusionsprotein mit der Transkriptions- Aktivierungsdomäne exprimiert wird, die Reihe D nicht mit Zellen bestückt ist und die Reihe E mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Elongationsproteingen aus Archaeoglobus fulgidus als Fusionsprotein mit der Transkriptions-Aktivierungsdomäne exprimiert wird.
Die Spalte 1 ist mit Zellen bestückt, die den leeren pGBT9 Vektor (Clontech, Palo Alto, USA) tragen, sodaß die DNA-Bindedomäne exprimiert wird, die Spalte 2 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Saccharomyces cerevisiae-Gen UFD3 als Fusionsprotein mit der DNA- Bindedomäne exprimiert wird, die Spalte 3 ist bestückt mit Zellen, die den pGBT9-Vektor tragen, von dem das Gleitklammerprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird, die Spalte 4 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Kopplungsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird und die Spalte 5 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Elongationsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird.
Fig. 28: (Beispiel 10) In Fig. 28 ist das PCR-Amplifikationsergebnis des humanen Kollagen-Gens jeweils unter Verwendung des erfindungsgemäßen thermostabilen in w'fro- Komplexes und ohne diesen dargestellt. Das erwartete Amplifikat hat in beiden Fällen eine Größe von etwa 1 Kb. Spur 1 zeigt einen Molekulargewichtsmarker, Spur 2 zeigt das Ergebnis der Amplifikation unter Verwendung eines erfindungsgemäßen Elongationsproteins ohne
Gleitklammer und Spur 3 zeigt das Ergebnis der Amplifikation unter Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplexes.
Beispiele:
Die Erfindung wird durch die folgenden Beispiele näher beschrieben, ist aber nicht auf diese beschränkt.
Beispiel 1 :
Die DNA wird mittels der bekannten Verfahren aus dem Organismus Archaeoglobus fulgidus (DSM No. 4304) gereinigt. Die Aufzucht der Organismen erfolgte hierbei durch die DSM (Deutsche Sammlung für Mikroorganismen). Um die entsprechenden Gene (Gleitklammerlader 1/2, Gleitklammer, Elongationsproteine 1/2, koppelnde Untereinheit) in die Expressionsvektoren pTrc99 und pQE30 zu klonieren, werden für jedes Gen Primer entwickelt, die den vollständigen offenen Leserahmen samt Stopcodon umspannen. Nur für die Klonierung in pTRC99 ist in den Primer- Sequenzen ebenfalls das Startcodon enthalten. Die entsprechenden Primer zur Klonierung in pQE30 enthalten die dem Startcodon unmittelbar folgenden Nukleotide als erste genspezifische Sequenzen. Hierbei werden den Primern jeweils Restriktionsenden hinzugefügt, die die gerichtete Klonierung in den Expressionsvektor erleichtern. Unter Verwendung von etwa 200 ng gesamtgenomischer DNA werden mit den entsprechenden Annealing- Temperaturen PCR-Reaktionen gefahren (etwa 35 Zyklen) und die daraus resultierenden Produkte gereinigt. Nach der Reinigung werden die Produkte mit Restriktionsenzymen behandelt und über ein Agarosegel gereinigt, um zur Ligation bereit zu stehen. Der Expressionsvektor wird mittels Restriktionsenzymen so linearisiert, gereinigt und verdünnt, daß er zur Ligation mit den Amplifikaten der Gene des erfindungsgemäßen in vitro-
Komplexes aus der obigen PCR bereit ist. Die Ligation wird angesetzt und nach Inkubation ein Aliquote in einen der E. coli Stämme INValphaF' (Invitrogen) odert XL1 blue oder M15 [prep4] transformiert. Von jedem Gen werden mindestens 3 positive Kolonien gepickt, Plasmid-DNA präpariert und die Inserts auf Vollständigkeit und Richtigkeit mittels DNA-Sequenzierung überprüft. Korrekte Klone werden ausgesucht und erneut zur Vereinzelung auf Agarplatten (Ampicillin; Ampicillin und Kanamycin) ausgebracht. Kolonien werden gepickt und Übernachtkulturen angesetzt. Ein Aliquot (500 μl) der Übernachtkultur wird in eine ein bis fünf Liter Kultur von LB (Ampicillin: 80 mg/l bzw zusätzlich 25μg/ml Kanamycin für M15 [prep4]Stämme) gegeben. Die Kulturen wachsen bis zu einer OD66o von 0.8 bei 37°C. Nun wird zur Induktion IPTG zugegeben (125 mg/l). Diese Kulturen wachsen nun weitere 4-21 Stunden. Die Kulturen werden zentrifugiert und ausgehend von dem Vektor pQE30 exprimierte rekombinante Proteine gemäß protocol 8 und 11 aus „The QIAexpressionist" (Dritte Auflage, QIAGEN) extrahiert und gereinigt. In alternativen Reinigungsprotokollen werden die Pellets in einem Puffer aufgenommen (Puffer A: 50 mM Tris-HCI pH 7.9, 50 mM Dextrose, 1 mM EDTA). Nach Zentrifugation werden die Zellen erneut aufgenommen, jedoch enthält Puffer A nun zusätzlich Lysozym (4 mg/ml). Nach Inkubation (15 min.) wird ein gleiches Volumen Puffer B zugegeben (B: 10 mM Tris-HCI (pH 7.9), 50 mM KCI, 1 mM EDTA, 1 mM PMSF, 0.5 % Tween 20, 0.5 % Nonidet P40) und die Lyse zur Inkubation bei 75°C für eine Stunde gegeben. Nach Zentrifugation wird der Überstand entnommen und die überexprimierten Proteine werden mittels (NH )2S04 ausgefällt. Die Pellets werden nach Zentrifugation gesammelt und die Proteine mit Puffer A resuspendiert. Die resuspendierten Proteine werden gegen Aufbewahrungspuffer (50 mM Tris-HCI (pH 7.9), 50 mM KCI, 0.1 mM EDTA, 1 mM DTT, 0.5 mM PMSF, 50 % Glycerol) dialysiert und anschließend bei +4°C bis -70°C gelagert.
Um die Aktivität der Proteine zu testen, werden Reaktionen wie folgt zusammengesetzt. Aliquots der Proteine werden in unterschiedlichen Konfigurationen und Molaritäten vereint, Gleitklammerlader 1/2 mit Gleitklammer, koppelnder Untereinheit und Elongationsprotein 1 , oder Gleitklammerlader 1/2 mit Gleitklammer, mit und ohne koppelnder Untereinheit und Elongationsprotein 2, oder Gleitklammer, und Elongationsprotein 1 oder 2 und schließlich nur Elongationsprotein 1 oder 2; als Puffer dient der obige Aufbewahrungspuffer. DNA- Polymerisationsaktivität wird mittels Inkorporation von (methyl-3H) TTP in Trichlorsäure-unlösliches Material oder mittels Inkorporation von Digoxigenin- dUTP in unmarkierte DNA-Doppelstrangbereiche mit freien internen 3'- Enden gemessen (Ishino, Y., Iwasaki, H., Fukui, H., Mineno, J., Kato, I., & Schinigawa, H. (1992) Biochimie 74, 131-136). Um die Prozessivität zu bestimmen, werden die obigen Proteingemische in Primer- Elongationsexperimenten verwendet. Ein M13-Einzelstrangtemplate wird in 10 mM Tris-HCI (pH 9.4) eingebracht und gemeinsam mit einem Universal- primer (New England Biolabs) (5'-FITC markiert) erhitzt (92°C) und abgekühlt (Raumtemperatur). Verdünnungsserien des so generierten Template-Primer- Gemisches werden in einer Reaktion bestehend aus Nukleotiden (etwa 200 μM bis 1 mM), Reaktionspuffer (Endkonzentration: 50 mM KCI, 10 mM Tris- HCI (pH 8.3), 1.5-5 mM MgCI2, ATP (0 mM - 200 mM) und proteinstabilisierenden Agenzien zusammengeführt und für 10 Minuten bei 37°C, 52°, 62°, 68°, 74°, und 78° inkubiert. Ein Aliquot wird zur Analyse auf einen Sequenzautomaten geladen (z.B. Alf, Pharmacie Biotech). Alternativ kann eine qualitative Analyse der Steigerung der Prozessivität auch nach Maga G., Jόnssom Z.O., Stucki M., Spadari S. und Hübscher U.( J. Mol. Biol. 1999; 285: 259-267, Dual Mode of Interaction of DNA-Polymerase ε with Proliferating Cell Nuclear Antigen in Primer Binding and DNA Synthesis) über den Nachweis einer Stimulation des Einbaus von Nukleotiden in Doppelstrangbereiche mit freien internen 3 '-Enden unter geeigneten Reaktionsbedingungen erfolgen (s. Fig. 23) Die obigen Proteingemische
dienen auch dazu Fidelity und Exonukleaseaktivität zu messen, wobei die in Kohler et al. (Proc. Natl. Acad. Sei. USA 88:7958-7962 (1991 ) oder Chase et al. (J. Biol. Chem., 249:4545-4552 (1972) beschriebenen Verfahren zur Anwendung kommen. Ebenso werden die Proteingemische in der PCR eingesetzt (Fig. 26; Methods in Molecular Biology Vol. 15 Humana Press Totowa, New Jersey, 1993, edited by Bruce A. White).
Beispiel 2: Trimerisierung von PCNA
In folgenden Experimenten wird gezeigt, daß rekombinantes Archaeoglobus fulgidus PCNA-Protein (AF 0335) unter nativen Bedingungen als Trimer vorliegt und somit eine für die Klammerbildung geignete Struktur einnehmen kann.
Für das in Fig. 20 A abgebildete Experiment wurden 350 μl Ni-NTA Agarose Eluat von PCNA (s. Fig. 24) und 150 μl einer rohen DNA-Polymerase Fraktion (s. Fig. 25) mit Lagerpuffer ohne Glyzerin (s. Fig. 25) auf 1 ml aufgefüllt und nach Vorschrift des Herstellers auf einer Superdex 200 HR (Pharmacia) FPLC Säule im gleichen Puffer die Proteine nach Molekulargewicht aufgetrennt. Es wurden während des gesamten Laufes Fraktionen zu je 1 ml gesammelt. Für das in Fig. 20 B. dargestellte Experiment wurden gleiche Mengen der gleichen Proteinfraktionen in Storagepuffer ohne Glyzerin mit 8 M Harnstoff auf 1 ml aufgefüllt, 10 Minuten bei 95°C denaturiert und anschließend die Proteine im gleichen Puffer wie für Fig. 20 A dargestellt nach Molekulargewicht aufgetrennt. Je 8 μl einzelner Fraktionen wurden anschließend auf einem NuPage Bis-Tris Gel aufgetrennt (NOVEX; s. Fig. 25) und nach Angaben des Herstellers mittels eines Blot-Modules (NOVEX) auf Nitrocellulosemembran geblottet. Der Nachweis von Proteinen mit His-Tag erfolgte nach Angaben der Hersteller mittels des RGS His Antibody (QIAGEN) und des DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim). Fig. 20 A zeigt Proteine mit His-Tag in den Fraktionen 15 (Spur 1), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4), 23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgeführten
Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1), 11 (Spur 2), 12 (Spur 3),13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur 7), 17 (Spur 8) der in Anwesenheit Harnstoff durchgeführten denaturierenden Chromatographie. Archaeoglobus fulgidus DNA- Polymerase (AF0497) hat ein errechnetes Molekulargewicht von Mr = 90 kDa; Archaeoglobus fulgidus-PC A (AF0335) hat ein errechnetes Molekulargewicht von Mr = 27 kDa. Wenn Archaeoglobus fulgidus-PC A (AF 335), wie das homologe Protein aus Eukaryonten, als Homotrimer vorliegt, hat der native Faktor daher ein theoretisches Molekulargewicht von Mr = 81 KDa. Die in Fig. 20A gezeigten Ergebnisse bestätigen diese Annahme, nach der natives PCNA ein ähnliches Molekulargewicht aufweist, wie die DNA- Polymerase, für das rekombinante Protein: Beide Proteine eluieren unter nativen Bedingungen in den gleichen Fraktionen von der Gelfiltrationssäule (Fig 20 A, Spuren 1-3). Das Maximum der PCNA Menge eluiert dabei etwas später als das Maximum der DNA-Polymerasemenge und korelliert mit der etwas geringeren Größe des postulierten Trimers (81 kDa gegenüber 90 KDa). Die in Fig. 20 B gezeigten Daten belegen, daß diese Beobachtung auf einer Oligomerisierung des PCNA beruht, da unter denaturierenden Bedingungen, die Protein/Protein Interaktionen nicht zulassen, PCNA deutlich später von der Säule eluiert als die DNA-Polymerase (Fig. 20 B , Spuren 1-7), was dem geringeren Molekulargewicht des Monomers entspricht.
Beispiel 3: Isolierung, Bereitsstellung und Verwendung eines Elongationsproteins (Pyrococcus horikoshii DNA-Polymerase (PH1947)) zur Ausbildung des erfindungsgemäßen in fro-Komplexes.
Das Elongationsprotein aus Pyrococcus horikoshii (Pyrococcus horikoshii- DNA-Polymerase (PH 1947)) wurde in PCR-Reaktionen verwendet und führt zu effizenter Amplifikation eines spezifischen DNA Produktes.
1 (Spur 4), 2,5 (Spur 5)und 5 μl (Spur 6) Pyrococcus horikoshii DNA- Polymerase (PH1947; Rohextrakt s. Fig. 25) wurden zum Aktivitätsvergleich mit 1 Einheit Taq Polymerase (Spur 2) und 1 μl Archaeoglobus fulgidus-DNA- Polymerase (Af 497) Rohextrakt (s. Fig.25) (Spur 3) individuell in Standard PCR-Reaktionen eingesetzt.; Spur 1 zeigt einen DNA-Größenmarker (New England Biolabs; Mischung aus 1 kb DNA Molekulargewichtsgrößenmarker und 100 bp DNA-Molekulargewichtsgrößenmarker). Jede Reaktion enthielt neben dem Enzym 5 ng template DNA (421 bp Rsa I-Fragment mit Adaptoren in PCR 2.1 kloniert; (Kaiser C, v. Stein O., Laux G., Hoffmann M., Electrophoresis 1999; 20: 261-268, Functional Genomics in Cancer Research: Identification of Target Genes of the Epstein-Barr Virus Nuclear Antigen 2 by Subtractive cDNA Cloning and High-throughput Differential Screening using High-density Agarose Gels); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Adaptor-Primer (Kaiser et al., (1999)); 50 mM KCI; 2 mM MgCI2; 10 mM Tris HCI (pH 8,3 für Taq-Reaktionen; pH 7,5 für Archaeoglobus fulgidus und Pyrococcus
Reaktionen) bei einem Gesamtvolumen von 50 μl pro Reaktion. Die Proben durchliefen 40 Zyklen bestehend aus 30 s bei 95°C; 30 s bei 55°C und 120 s bei 68°C. Anschließend wurden 5 μl der Ansätze entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt.
Beispiel 4: Verwendung eines Elongationsproteins
Die Archaeoglobus fw/g/'dus-DNA-Polymerase AF 0497 kann PCR-Produkte ebenso effizient wie Taq-Polymerase generieren.1 Einheit Taq-Polymerase und 1 μl Archaeoglobus fu/g/dus-DNA-Polymerase AF 0497 Rohextrakt (s. Fig. 25) wurden zum Aktivitätsvergleich individuell in Standard-PCR- Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym 20 ng M13 MP18 ssDNA; je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM DNA
Primer folgender Nukleotidsequenz:
GGATTGACCGTAATGGGATAGGTTACGTT (SEQ ID NO.: 47) bzw AGCGGATAACAATTTCACACAGGAAACAG (SEQ ID NO.: 48) in 50 mM KCI; 2 mM MgCI2; 10 mM Tris HCI (pH 8,3 für Taq Reaktionen; pH 7,5 für Archaeoglobus fulgidus Polymerase-Reaktionen) bei einem Gesamtvolumen von 50μl pro Reaktion. Die Proben durchliefen eine unterschiedliche Anzahl von Zyklen bestehend aus 30 s bei 95°C; 30 s bei 59°C und 60 s bei 68°C. Nach unterschiedlichen Zyklenzahlen (Z) wurden 5 μl der Ansätze entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris- Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt (Siehe Fig. 22).
Beispiel 5: Bereitssteliung und Verwendung eines erfindungsgemäßen thermostabilen in v/'fro-Komplexes:
In einem Endvolumen von 50 μl waren unter anderem folgende Komponenten eines erfindungsgemäßen in w'fro-Komplexes enthalten: 10 mM Tris/HCI pH 7,5; 50 mM KCI; 2 mM MgCI2; 10 μg BSA (kann auch weggelassen werden); 0,5 mM Digoxigenin-dUTP (DIG-dUTP, Boehringer Mannheim); 40 nM ; 0,5μg Poly dA/40 nM OligodT (20mer) Hybrid. Probe 1 ohne Elongationsprotein. Proben 2-12 enthielten außerdem je 3μl einer 1 :1000 Verdünnung einer Fraktion von rekombinanter Archaeoglobus ftv/g/dus-DNA-Polymerase (Elongationsprotein). Proben 3-7 sowie 8-12 außerdem 0,5; 1 ; 2; 4 und 8 μl einer Fraktion von rekombinantem Gleitklammerprotein aus Archaeoglobus fulgidus.
Die Proben wurden 30 Minuten bei 68°C inkubiert und Nukleinsäuren anschließend durch Präzipitation mit 3 Volumenteilen Ethanol / 3 M Natriumacetat pH 5,2 (30/1 ). Gefällt. Das Präzipitat wurde in 20 μl 100 mM Tris-HCI (pH 7,9) resuspendiert und je 10μl in einzelne Kavitäten einer 96- Well Silent Screen plate with Nylon 66 Biodyne B 0,45μm pore (Nalge Nunc)
aufgetropft und die Nukleinsäuren 10 Minuten bei 70°C auf der Membran fixiert. Die Detection von inkorporiertem Digoxigenin-dUTP (Boehringer Mannheim) erfolgte mittels des DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim). Zum Nachweis der Chemilumineszenz wurde auf die Membran abschließend für 30 s ein Röntgenfilm aufgelegt. PCNA stimuliert die Einbindung von DIG-dUTP durch die DNA-Polymerase deutlich (vgl. Spuren 3-7 mit Spur 2). Die verwendete PCNA- Fraktion weist keine endogene Polymeraseaktivität auf (Spuren 8-12).
Beispiel 6: Amplifikation; Klonierung, Expression und Reinigung eines
Gleitkiammerproteins aus Archaeoglobus fulgidus:
Nach Amplifikation des erfindungsgemäßen Gleitklammerprotein Gens aus Archaeglobus fulgidus wurde das Gen in die Expressionsvektoren pTrc99 und pQE30 kloniert. Die Expression, Reinigung und gelelektrophoretische Auftrennung von Archaeoglobus fulgidus-Gleitklammerprotein (PCNA (AF 0335)) erfolgte, wie für das Elonagationsprotein (die DNA-Polymerase AF 0497) in Fig. 25 dargestellt.
Beispiel 7: Bereitstellung eines Elongationsproteins Expression und Reinigung der Archaeoglobus fu/g/dus-DNA-Polymerase: pQE 30 Plasmid-DNA (QIAGEN) mit in korrektem Leseraster inseriertem Gen für das Elongationsprotein, die Archaeoglobus fulgidus DNA- Polymerase AF 0497, wurde nach Anleitung aus "The QIAexpressionist (dritte Auflage; QIAGEN)" in kompetente E.coli M15 [prep 4] transformiert. Übertragung auf 1 L Kulturmedium und induzierte Proteinexpression erfolgte ebenfalls nach den dort vorgegebenen Schemata. Nach 16 Stunden Induktionszeit wurden die Bakterien 10 Minuten bei 5000 g sedimentiert. Zum Erhalt hochreiner Fraktionen wurde gemäß The QIAexpressionist (dritte Auflage; QIAGEN; protocol 8, protocol 11 ) verfahren. Lediglich die Elution der gebundenen Proteine erfolgte mit 2 x 2 ml Elutionspuffer und nicht wie
dort beschrieben mit 4 x 0,5 ml Elutionspuffer. Zum Erhalt von Rohextrakten rekombinanter Proteine wurden die Bakteriensedimente alternativ mit 100 ml Puffer A (50 mM Tris-HCI pH 7,9; 50 mM Glukose;1 mM EDTA) gewaschen und nach erneuter Zentrifugation in 50 ml Puffer A mit 4mg/ml Lysozym resuspendiert. Nach 15 Minuten bei Raumtemperatur erfolgte die Zugabe von 50 ml Lysepuffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA; 0,5% Tween 20; 0,5% IGPAL) und E. coli-Proteine wurden durch 60-minütige Inkubation bei 75°C im Wasserbad denaturiert. Nach anschließender Zentrifugation für 15 Minuten bei 27000 g wurde der Überstand durch langsame unter permanentem Rühren erfolgte Zugabe von 40 mg kristallinem Ammoniumsulfat pro ml Extrakt präzipitiert. Präzipitierte Proteine wurden 10 Minuten bei 27000 g sedimentiert und das Sediment in 20 ml Puffer A resuspendiert. Sowohl diese Rohextrakte als auch die Elutionsfraktionen aus der Ni NTA-Agarose wurden je 2-mal 8 Stunden gegen mindestens je 50 Volumenteile Lagerpuffer (Puffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA; 50% Glyzerin; 1 m>M Dithiothreitol; 0,5 mM Phenylmethylsulfonylfluorid) dialysiert und bei -20°C aufbewahrt. Zur Analyse der Proteinzusammensetzung der erhaltenen Fraktionen wurden Teile davon nach Anweisungen des Herstellers auf NuPAge™ 10% Bis-Tris Gelen (NOVEX) elektrophoretisch aufgetrennt und die enthaltenen Proteine mit Coomassie brilliant blue angefärbt. Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta-Agarosesäule nach der Dialyse. Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Durch Reinigung über Ni- NTA-Agarose werden hochreine Fraktionen der Archaeoglobus fulgidus DNA-Polymerase erhalten (Spuren 4 und 5). Aber bereits im Grobextrakt stellt dieses Enzym das dominierende Polypeptid dar.
i
- 65 -
Beispiel 8: Verwendung eines erfindungsgemäßen in vitro Komplexes in der PCR
Der Einsatz von Archeoglobus fulgidus PCNA (AF 0335) in PCR Reaktionen mit Archeoglobus fulgidus DNA-Polymerase (AF 0497) führt zu einer effizienteren Amplifikation eines spezifischen DNA-Produkts im Vergleich zu einer PCR-Reaktion ohne PCNA. Die Auswertung der amplifizierten DNA- Mengen laut AIDA (Advanced Image Data Analyzer, Software Version AIDA 2.1 , Firma Raytest) zeigt einen Hintergrund von 94, eine Wert von 104,9 für Spur 1 und einen Wert von 228,4 für Spur 2. Zieht man von den Werten aus den Spuren 1 und 2, den Hindergrund ab, folgt daraus eine 12,3-fache prozessive Stimulation durch PCNA in der Reaktion dessen Ergebnis in Spur 2 gezeigt ist.
0,3 μl Archeoglobus fu/g/dus-DNA-Polymerase (7.5 μg/μl Proteinkonzentration von AF497; Rohextrakt siehe Fig. 25) wurden zur Analyse einer Stimulation der PCR-Aktivität durch Archeoglobus fulgidus- PCNA (NiNTA Eluat; Fig.24) mit 0 μl und 0,01 μl individuell in PCR Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym und 0,05 μl (2.8 μg) des Gleitklammerproteins von Archaeglobus fulgidus (homolog zu proliferating-cell-nuclear antigen, PCNA) eines mittels PCR amplifizierten und nicht aufgereinigten PCNA-Gen-Fragments (PCR Reaktion zur spezifischen Amplifikation des PCNA-Fragments: 0,5 μl Archeoglobus fulgidus Polymerase; je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Primer (5'-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 49); 5'-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ ID No.:50); 50 mM KCI; 2 mM MgCI2; 10 mM Tris-HCI (pH 7,5) sowie 50 ng eines pQE30 Plasmids, das die kodierenden Sequenzen von Archaeoglobus fulgidus PCNA in die BamHI- und Kpn I- Restriktionsstellen insertiert trägt, bei einem Gesamtvolumen von 50 μl pro
Reaktion und bei einer Zyklenzahl von 40 bestehend aus 30 s bei 95°C; 30 s bei 61 °C; 240 s bei 68°C); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Primer
(5'-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 51 ); und 5'-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ ID No.: 52); 50 mM KCI; 2 mM MgCI2; 10 mM Tris HCI pH 7,5 bei einem Gesamtvolumen von 50 μl pro Reaktion. Die Proben durchliefen 40 Zyklen bestehend aus 30s bei 95°C; 120s bei 61 °C; 240s bei 68°C. Anschließend wurden 5 μl der Ansätze entnommen und auf ein 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA; pH 7,2) mit 10 V/cm aufgetrennt.
Beispiel 9: Y2H-Experimente:
Interaktionen von Proteinen des erfindungsgemäßen Komplexes aus Archaeoglobus fulgidus wurden mit dem Y2H-System gezeigt. Die kodierenden Bereiche von Genen aus Archaeoglobus fulgidus, deren Genprodukte im erfindungsgemäßen thermostabilen in w'fro-Komplex verwendeten werden, wurden mittels PCR amplifiziert, in die Vektoren pGBT9 (vertikale Spalten der Fig. 27) und pGAD424 (horizontale Reihen der Fig. 27) kloniert und durch gap-repair in Hefe PJ69-4a (für pGAD424) und PJ69-4alpha (für pGBT9) als Hybridproteine zur Expression gebracht. Ebenso wurde eine positive Kontrolle mittels PCR amplifiziert, in die Vektoren pGBT9 (siehe auch vertikale Spalten der Fig. 27) und pGAD424 (siehe auch horizontale Reihen der Fig. 27) kloniert und durch gap-repair in den Hefestamm PJ69-4a (für pGAD424) und PJ69-4alpha (für pGBT9) als Hybridproteine zur Expression gebracht. Diploide Zellen, die beide Vektoren enthalten, wurden durch Paarung entsprechend dem gezeigten Raster in Fig. 27 erzeugt. Die Expression von drei unabhängigen Reportern (HIS3, ADE2 und MEL1) wurde gemessen. Gezeigt ist in Fig. 27 das Wachstum auf Medium ohne Histidin und Adenin. In diesem Experiment wachsen jene Zellen, die beide Vektoren tragen und in dessen zudem die
Expressionsprodukte dieser beiden Vektoren einander binden. In Folge der Bindung der Expressionsprodukte wird Transkription der Reportergene initiiert, so daß die Histidin- und Adenin-Auxotrophie aufgehoben wird und diese Zellen in der Lage sind in besagtem Medium zu wachsen.
Alle hier positiven Klone waren auch positiv bezüglich der Expression des MEL ' -Gens. Die Handhabung des yeast two-hybrid (Y2H)systems erfolgte gemäß der Anleitung der Firma Clontech (yeast protocols handbook, PT3024-1 ). Fig. 27 zeigt eine Bindung zwischen den Proteinen der Positivkontrolle, dem Elongationsprotein und dem Gleitklammerprotein, dem Gleitklammerprotein und dem Gleitklammerprotein und dem Kopplungsprotein und dem Gleitklammerprotein.
Beispiel 10: Verwendung eines erfindungsgemäßen thermostabilen in vitro-Komplexes:
Der erfindungsgemäße thermostabile in w'fro-Komplex läßt sich sehr gut bei der Amplifikation von genomischen DNA Fragmenten einsetzen. Hierbei kommt es auch bei Verwendung von geringen Mengen eines Templates oder eines Elongationsproteins zu effizienter Amplifikation. In Beispiel 10 wurde eine Abschnitt des humanen Kollagen-Gens amplifiziert, einmal unter Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplexes und einmal unter Verwendung eines Elongatiosnproteins alleine. In einem Gesamtvolumen von 50 μl wurden 0,5 μl Nukleotidmix (25 mM Ausgangslösung beinhaltend jedes Nukleotid A, C, G und T), 0,2 μl jedes Primers (100 pmol/μl Ausgangslösung "Collagen Forward" 5'-TAA AGG GTC ACC GTG GCT TC-3' (SEQ ID NO.: 53), 100 pmol/μl Ausgangslösung "Collagen Reverse" 5'- CGA ACC ACA TTG GCA TCA TC-3' SEQ ID NO.: 54), 0,8 μl DNA (200 ng/μl human genomic DNA von Boehringer Mannheim), 5 μl 10 x PCR Puffer (pH 7.5) (100mM Tris-HCI pH7.5, 500 mM KCI,15 mM
MgCI2), 1 μl Elongatinsprotein (AF1722, 7.5 μg/μl Proteinkonzentration) und 8 μl Gleitklammerprotein (AF 0335, Proteinkonzentration 0,3 μg/μl) eingesetzt und in einer PCR-Maschine dem folgenden Zyklus unterworfen, anfangs 5 min. bei 95°C und dann 30-mal, 30 s bei 95°C, 30 s bei 59°C und abschließend 6 min. bei 68°C. Die Fig. 28 zeigt deutlich den Vorteil der Verwendung des erfindungsgemäßen thermostabilen in w'fro-Komplexes.
Die in der vorstehenden Beschreibung sowie in den Ansprüchen offenbarten Merkmale der Erfindung können sowohl einzeln als auch in beliebiger Kombination für die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen wesentlich sein.
Claims
1. Thermostabiler in w'fro-Komplex zur Template-abhängigen Elongation von Nukleinsäuren, umfassend ein thermostabiles
Gleitklammerprotein und ein thermostabiles Elongationsprotein.
2. Thermostabiler in w'fro-Komplex nach Anspruch 1 , dadurch gekennzeichnet, daß das Gleitklammerprotein mit einem Elongationsprotein verbunden ist.
3. Thermostabiler in w'fro-Komplex nach Anspruch 1 , dadurch gekennzeichnet, daß ein Gleitkammerprotein mit einem Elongationsprotein direkt verbunden ist.
4. Thermostabiler in w'fro-Komplex nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Gleitklammerprotein und das Elongationsprotein über ein Kopplungsprotein verbunden sind.
5. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Gleitklammerprotein und/oder das Elongationsprotein aus Archaebakterien stammen.
6. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet,
dass das Gleitklammerprotein eine ringförmige Struktur aufweist, welche die Template-Nukleinsäurestränge ganz oder teilweise umschließt.
7. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Gleitklammerprotein eine oder beide der folgenden
Aminosäurekonsensussequenzen umfaßt: SEQ ID No.:39 [GAVLIMPFW]-D-X-X-X-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X- [GAVLIMPFW]-X-[GAVLIMPFW]-X-X-X-X-F-X-X-Y-X-X-D und / oder SEQ ID No.: 40 [GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFW]-E.
8. Thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass das Gleitklammerprotein zu der menschlichen (Eukaryonten) PCNA Aminosäuresequenz (SEQ ID NO. 11 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder das Gleitklammerprotein zu der bakterielle ß-clamp Sequenz aus E.coli (Eubakteria) (SEQ ID NO. 35) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder das Gleitklammerprotein zu der
Aminosäuresequenz des PCNA-Homologen aus Archaeoglobus fulgidus (SEQ ID NO. 12) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist.
9. Thermostabiler Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Gleitklammerprotein mit einem aus einem Alignment aus Fig. 12 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/oder wobei das Gleitklammerprotein mit einem aus einem
Alignment aus Fig. 13 generierten Hidden Markow Modell einen Score von mindestens 25 ergibt.
10. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Gleitklammerprotein ein
Gleitklammerprotein ist, das aus einem Organismus stammt, der ausgewählt ist aus der Gruppe, die Archaeoglobus fulgidus, Methanoccus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Aquifex aeolicus und Carboxydothermus hydrogenofhormans u mf a ßt.
11. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Gleitklammerprotein ausgewählt ist aus der Gruppe, die
AF0335 aus Archaeoglobus fulgidus, MJ0247 aus Methanococcus jannaschii, PHLA008 aus Pyrococcus horikoschii, MTH1312 aus Methanobacterium thermoautotrophicus sowie AE000761_7 aus Aquifex aeolicus umfaßt.
12. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden
Ansprüche, dadurch gekennzeichnet,
dass das Elongationsprotein eine 5'-3'-Polymeraseaktivität und/oder eine Reverse-Transkriptaseaktivität aufweist.
13. Thermostabiler in w'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein mindestens eine der folgenden Konsensussequenzen umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht: SEQ ID NO. 44: D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y- [GAVKUNOFW]-X-X-R-A SEQ ID NO. 45
A-[GAVLIMPFW]-R-T-A-[FAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMPFW]-T- E-G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I SEQ ID NO. 46
[GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- [GAVKUNOFW]-V-A-X-A-[GAVLIMPFW]-X-l-T-D-[GAVKUNOFW]-D-P- [GAVLIMPFW]-X-X-X-[GAVLIMPFW]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFW]- S-M-P-D.
14. Thermostabiler in w'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein eine zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO. 22) auf einer Länge von mindestens 200 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder zur archaebakteriellen Aminosäuresequenz (SEQ ID NO. 27) auf einer Länge von mindestens 400 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität aufweist und/oder zur eubakteriellen Aminosäuresequenz (SEQ ID NO. 37) auf einer Länge von mindestens 300 Aminosäuren bei
einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität aufweist.
15. Thermostabiler in w'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein mit einem aus einem Alignment aus Fig. 17 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/oder das Elongationsprotein mit einem aus einem Alignment aus Fig. 18 generierten Hidden Markow Modell einen Score von mindestens 35 ergibt und/oder das Elongationsprotein mit einem aus einem Alignment aus Abbildung 19 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt.
16. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Elongationsprotein ein
Elongationsprotein ist, das aus einem Organismus stammt, der aus der Gruppe ausgewählt ist, die Archaeglobus fulgidus, Methanococcus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Pyrococcus furiosus und Carboxydothermus hydrogenoformans umfaßt.
17. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Elongationsprotein ausgewählt ist aus der Gruppe, die
AF0497 oder AF1722 aus Archaoglobus fulgidus, MJ0885 oder MJ1630 aus Methanococcus jannaschii, PHBT047 oder PHBN021 aus Pyrococcus horikoschii, MTH1208 oder MTH1536 aus Methanobacterium thermoautotrophicus sowie PFUORF3 aus Pyrococcus furiosus umfaßt.
18. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein die folgende Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht: (SEQ ID N0.43:)
[FL]-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-G-X(13)-[GAVLIMPFW]-X-[YR]- [GAVLIMPFW]-X-[GAVLIMPFW]-A-G-[DN]-[GAVLIMPFW]-[GAVLIMPFW]- [DS].
19. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 16 ) auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 18 %ige Sequenzidentität aufweist.
20. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein mit einem aus einem Alignment aus Abbildung 16 generierten Hidden Markow Modell einen Score von mindestens 10 ergibt.
21. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Kopplungsprotein ein Kopplungsprotein ist, das aus einem Organismus stammt, der aus der
Gruppe ausgewählt ist, die Archaeglobus fulgidus, Methanococcus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Pyrococcus furiosus und Carboxydothermus hydrogenophormans umfaßt. 5
22. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein augewählt ist aus der Gruppe, die AF1790 10 aus Archaeoglobus fulgidus, MJ0702 aus Methanococcus jannaschii,
PHBN023 aus Pyrococcus horikoschii, MTH1405 aus Methanobacterium thermoautothrophicum sowie PFUORF2 aus Pyrococcus umfaßt.
15 23. Thermostabiler in w'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Komplex mit einem Protein assoziiert ist, welches als Gleitklammerlader fungiert. 0
24. Thermostabiler Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Komplex mit ATP oder einem anderen Kofaktor assoziiert vorliegt. 25
25. Rekombinante DNA-Sequenz, dadurch gekennzeichnet, dass sie für einen thermostabilen in w'fro-Komplex gemäß einem der Ansprüche 1 bis 24. 30
26. Vektor,
dadurch gekennzeichnet, dass er eine für ein Gleitklammerprotein und ein Kopplungsprotein und/oder ein Elongationsprotein codierende, rekombinante DNA- 5 Sequenz enthält.
27. Vektor nach Anspruch 26, dadurch gekennzeichnet, dass er zusätzlich mindestens eine weitere DNA-Sequenz mit 10 mindestens einer geeigneten Restriktionsschnittstelle zur Insertion weiterer DNA-Sequenzen in einer solchen Anordnung enthält, dass sich ein Fusionsprotein aus Gleitklammerprotein und dem Expressionsprodukt der weiteren DNA-Sequenzen ergibt.
15 28. Vektor nach Anspruch 26 oder 27, dadurch gekennzeichnet, dass er geeignete, die Expression der DNA-Sequenz(en) steuernde Promotor- und/oder Operatorbereiche enthält.
20 29. Vektor nach Anspruch 28, dadurch gekennzeichnet, dass er mehrere Promotor- und/oder Operatorbereiche zur getrennten Expression mehrerer DNA-Sequenzen enthält.
25 30. Vektor nach einem der Ansprüche 26 bis 29, dadurch gekennzeichnet, dass er reprimier- und/oder induzierbare Promotor- und/oder Operatorbereiche enthält.
31. Vektor nach einem der Ansprüche 26 bis 30, dadurch gekennzeichnet, dass er eine DNA-Sequenz nach Anspruch 25 enthält.
5 32. Wirtszelle, dadurch gekennzeichnet, dass sie mit einem oder mehreren Vektoren nach einem der Ansprüche 26 bis 31 transformiert ist.
10 33. Verfahren zur Herstellung eines thermostabilen in w'fro-Komplexes gemäß einem der Ansprüche 1 bis 24, dadurch gekennzeichnet, dass eine entsprechende rekombinante DNA-Sequenz gemäß Anspruch 25 oder einen oder mehrere der Vektoren gemäß einem der 15 Ansprüche 26 bis 31 in eine Wirtszelle einbringt, die Expression der
Proteine bewirkt und diese aus dem Kulturmedium oder nach Zellaufschluss isoliert und gegebenenfalls noch mit weiteren Komplexbestandteilen koppelt.
20 34. Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wobei die Nukleinsäure nötigenfalls denaturiert wird, mit mindestens einem Primer unter Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend komplementär zu einem flankierenden Bereich einer gewünschten Nukleinsäuresequenz des Template-Strangs ist und 25 mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-
Elongation erfolgt, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in w'fro-Komplex gemäß einem der Ansprüche 1 bis 24 verwendet wird.
35. Verfahren nach Anspruch 34, dadurch gekennzeichnet, dass man zur Amplifikation von DNA-Sequenzen zwei die gewünschte 5 Nukleinsäuresequenz flankierende Primer und Deoxynukleotide und/oder Derivate davon und/oder Ribonukleotide und/oder Derivate davon verwendet.
36. Verfahren nach Anspruch 35,
10 dadurch gekennzeichnet, dass man eine Polymerase-Ketten-Reaktion durchführt.
37. Verfahren nach Anspruch 34, dadurch gekennzeichnet,
15 dass man zur Reversen-Transkription von RNA in DNA einen thermostabilen in w'fro-Komplex gemäß einem der Ansprüche 1 bis 24 einsetzt, dessen Elongationsprotein Reverse-Transkriptase-Aktivität aufweist.
20 38. Verfahren nach einem der Ansprüche 34 bis 37 dadurch gekennzeichnet, dass man zur Sequenzierung von Nukleinsäuren ausgehend von einem Primer, der zu einem der zu sequenzierenden Nukleinsäure benachbarten Bereich komplementär ist, eine Template-abhängige Elongation bzw. 25 Reverse-Transkription unter Verwendung von Deoxynukleotiden und Dideoxynukleotiden oder deren jeweiligen Derivaten gemäß der Methode von Sanger durchführt.
31. Verfahren nach einem der Ansprüche 34 bis 38, dadurch gekennzeichnet, dass man bei der Elongation der Nukleinsäuren Markierungen einfügt.
5 40. Verfahren nach Anspruch 39, dadurch gekennzeichnet, dass man markierte Primer und/oder markierte Deoxynukleotide und/oder deren Derivate und/oder markierte Dideoxynukleotide und/oder deren Derivate und/oder markierte Ribonukleotide und/oder 10 deren Derivate einsetzt.
41. Verfahren zur Markierung von Nukleinsäuren durch Erzeugung einzelner Brüche in Phosphodiesterbindungen der Nukleinsäurekette und Ersatz eines Nukleotids an den Bruchstellen durch ein markiertes 15 Nukleotid mit Hilfe einer Polymerase, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in w'fro-Komplex nach einem der Ansprüche 1 bis 24 eingesetzt wird.
20 42. Reagenzien-Kit zur Elongation und/oder Amplifikation und/oder reversen Transkription und/oder Sequenzierung und/oder Markierung von Nukleinsäuren, enthaltend in einem oder mehreren getrennten Behältern a) einen thermostabilen in w'fro-Komplex nach einem der 25 Ansprüche 1 bis 24 oder b) einen thermostabilen in w'fro-Komplex nach einem der Ansprüche 1 bis 24 und separat davon ein Polymeraseaktivität aufweisendes Elongationsprotein,
sowie gegebenenfalls Primer, Puffersubstanzen, Nukleotide, ATP, einen oder mehrere andere Kofaktoren und/oder Pyrophosphatase.
43. Kit nach Anspruch 42,
5 dadurch gekennzeichnet, dass er zur Amplifikation von Nukleinsäuren neben den Komponenten a) oder b), welche 5'-3'-Polymeraseaktivität aufweisen, Deoxynukleotide und/oder Derivate davon enthält.
10 44. Kit nach Anspruch 42, dadurch gekennzeichnet, dass er zur reversen Transkription die Komponenten a) oder b) enthält, welche reverse Transkriptase-Aktivität aufweisen, sowie Deoxynukleotide und/oder Derivate davon.
15
45. Kit nach einem der Ansprüche 42 bis 44, dadurch gekennzeichnet, dass er zur Sequenzierung neben Deoxynukleotiden oder Ribonukleotiden und/oder deren Derivaten, Dideoxynukleotide 20 und/oder deren Derivate enthält.
46. Kit nach einem der Ansprüche 42 bis 45, dadurch gekennzeichnet, dass er Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide 25 in markierter Form enthält.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP99942776A EP1100923A2 (de) | 1998-08-06 | 1999-08-06 | Thermostabiler in vitro-komplex mit polymeraseaktivität |
Applications Claiming Priority (8)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19835653 | 1998-08-06 | ||
DE19835653 | 1998-08-06 | ||
DE19840771 | 1998-09-07 | ||
DE19840771A DE19840771A1 (de) | 1998-08-06 | 1998-09-07 | Thermostabiler in vitro-Komplex mit Polymeraseaktivität |
EP99111795 | 1999-06-18 | ||
EP99111795 | 1999-06-18 | ||
PCT/DE1999/002480 WO2000008164A2 (de) | 1998-08-06 | 1999-08-06 | Thermostabiler in vitro-komplex mit polymeraseaktivität |
EP99942776A EP1100923A2 (de) | 1998-08-06 | 1999-08-06 | Thermostabiler in vitro-komplex mit polymeraseaktivität |
Publications (1)
Publication Number | Publication Date |
---|---|
EP1100923A2 true EP1100923A2 (de) | 2001-05-23 |
Family
ID=56289931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
EP99942776A Withdrawn EP1100923A2 (de) | 1998-08-06 | 1999-08-06 | Thermostabiler in vitro-komplex mit polymeraseaktivität |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1100923A2 (de) |
JP (1) | JP2002522042A (de) |
AU (1) | AU5617199A (de) |
CA (1) | CA2338185A1 (de) |
WO (1) | WO2000008164A2 (de) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2792651B1 (fr) * | 1999-04-21 | 2005-03-18 | Centre Nat Rech Scient | Sequence genomique et polypeptides de pyrococcus abyssi, leurs fragments et leurs utilisations |
DE19937230A1 (de) * | 1999-08-06 | 2001-02-08 | Lion Bioscience Ag | Chimäre Proteine |
US6627424B1 (en) * | 2000-05-26 | 2003-09-30 | Mj Bioworks, Inc. | Nucleic acid modifying enzymes |
US7285631B2 (en) * | 2001-08-10 | 2007-10-23 | Serono Genetics Institute S.A. | Human cDNAs and proteins and uses thereof |
WO2016084879A1 (ja) * | 2014-11-28 | 2016-06-02 | 東洋紡株式会社 | 核酸増幅試薬 |
WO2016084880A1 (ja) * | 2014-11-28 | 2016-06-02 | 東洋紡株式会社 | Pcna単量体 |
WO2017090685A1 (ja) * | 2015-11-27 | 2017-06-01 | 国立大学法人九州大学 | Dnaポリメラーゼ変異体 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5583026A (en) * | 1994-08-31 | 1996-12-10 | Cornell Research Foundation, Inc. | Process for reconstituting the polymerase III* and other subassemblies of E. coli DNA polymerase III holoenzyme from peptide subunits |
WO1993015115A1 (en) * | 1992-01-24 | 1993-08-05 | Cornell Research Foundation, Inc. | E. coli dna polymerase iii holoenzyme and subunits |
US5633159A (en) * | 1995-03-10 | 1997-05-27 | Becton, Dickinson And Company | DNA polymerase III β-subunit from mycobacteriophage DS6A |
AU7683998A (en) * | 1997-04-08 | 1998-10-30 | Rockfeller University, The | Enzyme derived from thermophilic organisms that functions as a chromosomal replicase, and preparation and uses thereof |
US6238905B1 (en) * | 1997-09-12 | 2001-05-29 | University Technology Corporation | Thermophilic polymerase III holoenzyme |
WO1999053074A1 (en) * | 1998-04-09 | 1999-10-21 | The Rockfeller University | Enzyme derived from thermophilic organisms that functions as a chromosomal replicase, and preparation and uses thereof |
-
1999
- 1999-08-06 EP EP99942776A patent/EP1100923A2/de not_active Withdrawn
- 1999-08-06 AU AU56171/99A patent/AU5617199A/en not_active Abandoned
- 1999-08-06 WO PCT/DE1999/002480 patent/WO2000008164A2/de not_active Application Discontinuation
- 1999-08-06 CA CA002338185A patent/CA2338185A1/en not_active Abandoned
- 1999-08-06 JP JP2000563788A patent/JP2002522042A/ja active Pending
Non-Patent Citations (1)
Title |
---|
See references of WO0008164A2 * |
Also Published As
Publication number | Publication date |
---|---|
WO2000008164A3 (de) | 2000-05-11 |
WO2000008164A2 (de) | 2000-02-17 |
AU5617199A (en) | 2000-02-28 |
JP2002522042A (ja) | 2002-07-23 |
CA2338185A1 (en) | 2000-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69923180T2 (de) | Thermostabiles Enzym welches die Genauigkeit thermostabiler DNA Polymerasen erhöht - zur Verbesserung der Nucleinsäuresynthese und in vitro Amplifikation | |
DE60112746T2 (de) | Kälteempfindliche dna-polymerasemutanten | |
EP2077322B1 (de) | Verfahren und Kit zur Amplifikation von heteropolymerer oder poly(C)- RNA | |
EP1050587B1 (de) | Reaktionsgemisch und Verfahren für RT-PCR mittels einer homopolymeren Nukleinsäure | |
Ishino et al. | DNA polymerases as useful reagents for biotechnology–the history of developmental research in the field | |
Pavlov et al. | Roles of DNA polymerases in replication, repair, and recombination in eukaryotes | |
DE69730926T2 (de) | Modifizierte thermostabile DNA Polymerase | |
DE69838724T2 (de) | Polymerase-verbessernder faktor (pef)-enthaltende extrakte, pef proteinkomplexe, isoliertes pef protein und verfahren zur reinigung und identifizierung | |
Bocquier et al. | Archaeal primase: bridging the gap between RNA and DNA polymerases | |
DE19810879A1 (de) | Polymerasenchimären | |
CN106164261A (zh) | 适用于高温核酸合成的新颖逆转录酶 | |
DE60301325T2 (de) | Mutation von dna polymerasen aus archaeobakterien | |
US20050196392A1 (en) | Lesion repair polymerase compositions | |
WO2000008164A2 (de) | Thermostabiler in vitro-komplex mit polymeraseaktivität | |
Böhlke et al. | Archaeal DNA replication: spotlight on a rapidly moving field | |
MacNeill | Understanding the enzymology of archaeal DNA replication: progress in form and function | |
WO2011098588A1 (en) | Thermostable primase/dna polymerase of the thermococcus nautilus 30/1 plasmid ptn2 and its applications | |
EP3697930B1 (de) | Primerunabhängige dna-polymerasen und ihre verwendung zur dna-synthese | |
DE19840771A1 (de) | Thermostabiler in vitro-Komplex mit Polymeraseaktivität | |
JP5641939B2 (ja) | 変異型逆転写dnaポリメラーゼ | |
EP1198571A2 (de) | Chimäre proteine | |
DE112022003266T5 (de) | Chimäre DNA-Polymerase und zugehöriges Herstellungsverfahren | |
WO2007137701A1 (de) | Mutierte dna-polymerase mit erhöhter reverse transkriptase aktivität | |
EP1326964B1 (de) | THERMOSTABILE POLYMERASE AUS i THERMOCOCCUS PACIFICUS /i | |
WO1997035988A1 (de) | Thermostabile dna-polymerase aus thermococcus spec. ty |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase |
Free format text: ORIGINAL CODE: 0009012 |
|
17P | Request for examination filed |
Effective date: 20010202 |
|
AK | Designated contracting states |
Kind code of ref document: A2 Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE |
|
AX | Request for extension of the european patent |
Free format text: AL;LT;LV;MK;RO;SI |
|
17Q | First examination report despatched |
Effective date: 20030716 |
|
RAP1 | Party data changed (applicant data changed or rights of an application transferred) |
Owner name: LION BIOSCIENCE AG |
|
STAA | Information on the status of an ep patent application or granted ep patent |
Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN |
|
18D | Application deemed to be withdrawn |
Effective date: 20040127 |