EP1100923A2

EP1100923A2 - Thermostabiler in vitro-komplex mit polymeraseaktivität

Info

Publication number: EP1100923A2
Application number: EP99942776A
Authority: EP
Inventors: Christian Kilger; Ingo Kober; Hartmut Voss; Gerd Moeckel
Original assignee: Lion Bioscience AG
Current assignee: Sygnis Pharma AG
Priority date: 1998-08-06
Filing date: 1999-08-06
Publication date: 2001-05-23
Also published as: WO2000008164A3; WO2000008164A2; AU5617199A; JP2002522042A; CA2338185A1

Abstract

Der erfindungsgemäße thermostabile in vitro-Komplex zur Template-abhängigen Elongation von Nukleinsäuren umfaßt ein thermostabiles Gleitklammerprotein und ein thermostabiles Elongationsprotein.

Description

Thermostabiler in vitro Komplex mit Polymeraseaktivität

Beschreibung

Die Erfindung betrifft einen thermostabilen in wϊro-Komplex zur Templateabhängigen Elongation von Nukleinsäuren, einen thermostabilen in vitro Komplex sowie dafür kodierende DNA-Sequenzen und Vektoren. Die Erfindung betrifft weiterhin die Verwendung der erfindungsgemäßen Komplexe in Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wie PCR Reaktionen reversen Transkription, DNA-Markierung oder DNA- Sequenzierung, bei denen in vitro Template-abhängige DNA Strangsynthese erfolgt. Schließlich betrifft die Erfindung noch Kits bzw. Reagenzien kits zur Durchführung der erfindungsgemäßen Verfahren.

DNA-Polymerasen gehören zu einer Gruppe von Enzymen, die einzelsträngige DNA als Template für die Synthese eines komplementären DNA Stranges verwenden. Diese Enzyme spielen eine bedeutende Rolle im Nukleinsäurestoffwechsel, einschließlich der Prozesse DNA-Replikation, Reparatur und Rekombination. DNA-Polymerasen wurden in allen zellulären Organismen identifiziert, von bakteriellen bis zu menschlichen Zellen, in vielen Viren sowie in Bakteriophagen (Kornberg, A. & Baker, T. A. (1991 ) DNA Replikation WH Freeman, New York, NY). Man faßt in der Regel die Archaebakterien und die Eubakterien zusammen zu der Gruppe der Prokaryonten, der Organismen ohne echten Zellkern, und stellt ihnen die Eukaryonten, die Organismen mit echtem Zellkern, gegenüber. Gemeinsam sind vielen Polymerasen aus den verschiedensten Organismen oftmals Ähnlichkeiten in der Aminosäuresequenz sowie Ähnlichkeiten in der Struktur (Wang, J., Sattar, A.K.M.A.; Wang, C.C., Karam, J.D., Königsberg, W.H. & Steitz, T.A. (1997) Crystal Structure of pol α familily replication DNA polymerase from bacteriophage RB69.Cell 89, 1087-1099). Organismen wie der Mensch besitzen eine Vielzahl von DNA-abhängigen Polymerasen, von denen jedoch nicht alle für die DNA-Replikation zuständig sind, sondern einige auch DNA-Reparatur durchführen. Replikative DNA-Polymerasen bestehen in vivo meist aus Proteinkomplexen mit mehreren Einheiten, welche die Chromosomen der zellulären Organismen und Viren replizieren. Eine generelle Eigenschaft dieser replizierenden Polymerasen ist im allgemeinen eine hohe Prozessivität, das heißt, deren Fähigkeit, Tausende von Nukleotiden zu polymerisieren ohne vom DNA Template abzudissoziieren (Kornberg, A. & Baker, T. A. (1991) DNA Replikation. WH Freeman, New York, NY).

Im Stand der Technik sind hochprozessive Replikationsmechanismen bekannt, wobei es sich dabei zum einen um zelluläre Mechanismen und zum anderen um die bei den Bakteriophagen T4 und T7 auftretetenden Repliaktionsmechanismen handelt.

Der Repliaktionsapparat umfaßt eine Vielzahl von Komponenten. Dazu gehören, unter anderem, a) Polymeraseaktivität aufweisende Proteine, b) Proteine, die an der Ausbildung einer Klammerstruktur beteiligt sind, wobei der Klammerstruktur unter anderem die Aufgabe zukommt, eine Polymeraseaktivität an ihr Template zu binden, die Bindung zu stabilisieren und somit die Dissoziationskonstante entsprechend zu ändern, c) Proteine, welche die Klammer auf das template laden, d) Proteine, welche das Template stabilisieren und gegebenenfalls e) Proteine, welche die Polymerase an das Template führen .

Die unter b) genannten Proteine bilden Strukturen aus, die entweder offen oder geschlossen sind, beispielsweise ringförmige oder halbringförmige Strukturen. Derlei Strukturen können durch eine oder mehrere Spezies von Proteinen ausgebildet werden. Dabei ist es möglich, daß eine der besagten Proteinspezies eine Polymeraseaktivität aufweist. Die für die Ausbildung dieser Strukturen verantwortlichen Proteine werden, sofern sie keine Polymeraseaktivität aufweisen, hierin im folgenden als „Gleitklammerproteine" oder „Klammerproteine" bezeichnet. 5

Beispielhaft sei für einen prozessiven Replikationsapparat, der nicht geschlossen ringförmig ist, auf denjenigen des Bakteriophagen T4 oder T7 hingewiesen.

10 Beispielhaft sei für einen prozessiven Replikationsapparat, der geschlossen ringförmig ist, auf denjenigen des Bakteriums E. coli hingewiesen (Stukenberg, P.T., Studwell-Vaughan, P.S.& O'Donell, M. (1991 ) Mechanism of the ß-clamp of DNA polymerase III holoenzyme. J. Biol. Chem. 266, 11328-11334; Kuriyan, J. & O'Donnel, M. (1993) Sliding clamps of DNA polymerases. J.Mol.Biol.234,

15 915-925).

Es ist bekannt, daß der Replikationsapparat in Archaebakterien dem eukaryontischen Replikationsapparat ähnlich ist, obwohl die Genomorganisation in Eukaryonten und Archaebakterien gänzlich verschieden 20 ist und die zelluläre Struktur der Eubakterien dem der Archaea ähnelt. (Edgell, D.R. and Doolittle, W.F. (1997). Archaea and the origin(s) of DNA replication proteins. Cell 89, 995-998.).

Die Gleitklammer ist häufig über ein oder mehrere weitere Proteine an ein 25 Elongationsprotein gebunden, mit anderen Worten an das Elongationsprotein gekoppelt. Ein derartiges koppelndes Protein wird hierin im folgenden als Kopplungsprotein oder koppelnde Untereinheit bezeichnet, wobei gegebenfalls die Kopplung über eine Mehrzahl von Kopplungsproteinen erfolgen kann.

30 Unter Elongationsprotein soll hierin im übrigen ein Polymeraseaktivität- aufweisendes Protein oder Komplex verstanden werden, das oder der mindestens eine oder mehrere der folgenden Eigenschaften aufweißt: Verwendung von RNA als Template zur Synthese von DNA und/oder RNA, Verwendung von DNA als Template zur Synthese von DNA und/oder RNA, Synthese von RNA, Synthese von DNA, Synthese von Nukleinsäuren aus DNA und RNA, Exonukleaseaktivität in 5'-3'- Richtung und Exonukleaseaktivität in 3'-5'-Richtung, Strangverdrängungsaktivität (strand-displacement activity) Thermostabilität und Prozessivität oder Nicht-Prozessivität.

Die dreidimensionale Struktur von verschiedenen Gleitklammerproteinen wurde bereits bestimmt:

- die des eukaryontischen proliferating cell nuclear antigen (PCNA) (Krishna, T.S.R., Kong, X.-P., Gary, S., Burgers, P. M. & Kuriyan, J. (1994) Crystal structure of the eukaryotic DNA polymerase processivity factor PCNA. Cell 79, 1233-1243; Gulbis, J. M., Kelman, Z., Hurwitz, J., O'Donnel, M. & Kuriyan, J. (1996) Structure of the C-terminal region of p21WAF1/CIP1 complexed with human PCNA. Cell 87, 297-306),

- die der ß-Untereinheit der Polymerase III des Eubakteriums Escherichia coli (Kong, X.-P., Onrust, R., O'Donnell, M. & Kuriyan; J. (1992) Three dimensional structure of the ß-subunit of Escherichia coli DNA polymerase III holoenzyme; a sliding DNA clamp. Cell 69, 425-437)

- und die des Gen45-Proteins des Bakteriophagens T4 Proteins (Kelman, Zvi, Hurwitz, J. O'Donnel, Mike (1998) Structure, 6, 121-125).

Die Gesamtstruktur dieser Gleitklammern ist sehr ähnlich; die Bilder der ringförmig ausgebildeten Proteingesamtstruktur von PCNA, der ß-Untereinheit und gp45-Ringe sind übereinandergelegt deckungsgleich (Kelman, Z. & O'Donnell, M. (1995) Structural and functional similarities of prokaryotic and eukaryotic sliding clamps. Nucleic Acids Res. 23, 3613-3620). Jeder Ring hat vergleichbare Dimensionen und eine zentrale Öffnung, die groß genug ist, um Duplex-DNA, also einen DNA-Doppelstrang, bestehend aus den zwei komplementären DNA-Strängen, zu umschließen. Die Gleitklammer kann sich in vivo nicht selbst um die DNA herum positionieren, sondern muß um die DNA fixiert werden. In Prokaryonten und Eukaryonten besteht ein derartiger Proteinkomplex aus einer Vielzahl von Untereinheiten, der beim Eubakterium Escherichia coli γ-Komplex und beim Menschen Replikationsfaktor C (RF-C) genannt wird (Kelman, Z. & O'Donnell, M. (1994) DNA replication - enzymology and mechanisms. Curr. Opin. Gent. Dev. 4, 185-195). Der Proteinkomplex erkennt das 3'-Ende des Primers des „Primer-Template-Duplexes" und positioniert die Gleitklammer in Anwesenheit von ATP um die DNA.

Im Falle des Bacteriophagen T7 wird das gleiche Ziel, eine prozessive DNA- Synthese, mittels eines strukturell anderen Proteinkomplexes erreicht. Der Phage exprimiert eine eigene katalytische Polymerase, die T7-Polymerase, die das Genprodukt des gene 5, welche mit einem Protein aus dem Wirt Escherichia coli, dem Thioredoxin, eine Bindung eingeht und als Replikase eine hochprozessive DNA-Replikation ermöglicht (Proc. Natl. Acad. Sei. U S A 1992 Oct 15; 89(20):9774-9778 Genetic analysis of the interaction between bacteriophage T7 DNA polymerase and Escherichia coli thioredoxin, Himawan JS, Richardson CC). Auch hierbei kommt es zur Klammerbildung, jedoch weist diese Klammer nicht die gleiche Struktur auf, wie z.B. im Falle des eukaryontischen PCNA.

Oft ist es nötig, wie zum Beispiel im Falle der humanen Polymerase δ, daß Kopplungsproteine eine Verbindung zwischen dem katalytisch aktiven Teil der Polymerase und dem Prozessivitätsfaktor (Gleitklammer) zu schaffen. Beim Menschen ist dies die kleine Untereinheit der δ-Polymerase (Zhang, S.-J., Zeng, X.-R., Zhang, P., Toomey, N.L, Chuang, R.Y., Chang, L-S., and Lee, M.Y.W.T. (1994). A conserved region in the amino terminus of DNA polymerase δ is involved in proliferating cell nuclear antigen binding. J. Biol. Chem. 270, 7988-7992). Im Falle der T7 Polymerase jedoch bindet der Prozessivitätsfaktor die katalytische Einheit der Polymerase direkt.

DNA-Polymerasen werden unter anderem durch zwei Eigenschaften charakterisiert, ihre Elongationsrate, das heißt die Anzahl der Nukleotide, die sie pro Sekunde in einen wachsenden DNA-Strang inkorporieren können, und ihre Dissoziationskonstante. Wenn die Polymerase nach jedem Inkorporationsschritt eines der Nukleotide in die wachsende Kette wieder vom Strang abdissoziiert (d.h. ein Elongationsschritt erfolgt pro Bindungsereignis), dann hat die Prozessivität den Wert 1 und die Polymerase ist nicht prozessiv. Diese Synthese wird distributiv genannt. Wenn die Polymerase für wiederholte Nukleinsäureinkorporationen mit dem Strang verbunden bleibt, dann wird der Replikationsmodus als prozessiv bezeichnet und kann einen Wert von mehreren Tausend erreichen (siehe hierzu auch: Methods in Enzymology Volume 262, DNA Replication, Edited by J. L. Campbell, Academic press 1995, pp. 270-280)

Für die meisten in vitro Anwendungen, wie PCR oder Sequenzierungsprozesse, ist Prozessivität eine wünschenswerte Eigenschaft, die allerdings die bislang in diesen Reaktionen eingesetzten thermostabilen Enzyme nur in geringem Maße besitzen, wohingegen die temperaturempfindlichen, mit Thioredoxin assoziierte T7 Polymerase eine Prozessivität von einigen tausend Nukleotiden aufweist. Im Vergleich - die thermostabile DNA-Polymerase aus Thermus thermophilus oder Thermus aquaticus haben nur eine Prozessivität von etwa 50 Nukleotiden (Biochim Biophys Acta 1995 Nov 7;1264(2):243-248 Inactivation of the 5'-3' exonuclease of Thermus aquaticus DNA polymerase. Merkens LS, Bryan SK, Moses RE).

Die U.S. Patente 4,683,195, 4,800,195 und 4,683,202 beschreiben die Anwendung solcher thermostabiler DNA-Polymerasen in der Polymerase-

Kettenreaktion (PCR). In der PCR wird unter Verwendung von Primem, Template (auch Matrize genannt), Nukleotiden, einer DNA-Polymerase eines entsprechenden Puffers und geeigneten Reaktionsbedingungen DNA neu synthetisiert. Hierbei wird üblicherweise von einer doppelsträngigen DNA- Sequenz ausgegangen, von der ein bestimmter Zielbereich amplifiziert werden soll. Hierbei werden zwei Primer eingesetzt, welche zu flankierenden Bereichen der Zielsequenz auf jeweils einem Teilstrang des DNA-Doppelstranges komplementär sind. Zur Anhybridisierung der Primer werden allerdings die DNA-Doppelstränge zuerst denaturiert, insbesondere thermisch aufgeschmolzen. Nach Anhybridisierung der Primer erfolgt eine Elongation mittels der Polymerase. Daraufhin wird nochmals denaturiert und damit die neu gebildeten DNA-Stränge von den Template-Strängen getrennt, woraufhin für einen weiteren Elongationszyklus neben den ursprünglichen Template- Strängen auch die im ersten Schritt gebildeten Nukleinsäure-Stränge als Template zur Verfügung stehen, diese jeweils erneut mit Primern hybridisiert werden und eine erneute Elongation stattfindet. Diese Vorgehensweise wird zyklisch durchgeführt unter jeweils thermischer Denaturierung als Zwischenschritte. Bei der PCR kommt es bevorzugt zur Verwendung einer thermostabilen Polymerase, welche das zyklische, thermische Aufschmelzen der DNA Stränge übersteht. So wird häufig Taq DNA-Polymerase verwendet (U.S. Patent 4,965,188). Die Prozessivität der Taq DNA-Polymerase ist jedoch, wie oben ausgeführt, relativ gering im Vergleich zur T7-Polymerase.

DNA-Polymerasen finden auch bei der DNA-Sequenzbestimmung Anwendung (Sanger et al., Proc. Natl. Acad. Sei., USA 74:5463-5467 (1997)). Häufig wird bei der Sequenzierung nach Sanger eine T7-DNA-Polymerase verwendet (Tabor, S. und Richardson, CC. Proc. Natl. Acad. Sei., USA 86:4076-4080 (1989)). Später wurde das Cycle-Sequencing-Verfahren entwickelt (Murray, V. (1989) Nucleic Acids Res. 17, 8889), welches kein einzelsträngiges Template erfordert und die Initiierung der Sequenzreaktion mit verhältnismäßig geringen Mengen an Template erlaubt. Die hierbei zur Verwendung kommenden Polymerasen können z.B. die oben erwähnte Tag-Polymerase sein (U.S. Patent 5,075, 216) oder die Polymerase von Thermotoga neapolitana (WO 96/10640) oder andere thermostabile Polymerasen. Neuere Verfahren koppeln die exponentielle Amplifikation und die Sequenzierung eines DNA-Fragmentes in einem Schritt, so daß es möglich ist, genomische DNA direkt zu 5 sequenzieren. Eines der Verfahren, das sogenannte DEXAS-Verfahren (Nucleic Acids Res 1997 May 15;25(10):2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, Pääbo S, Biol. Chem. 1997 Feb; 378(2):99-105 Direct exponential amplification and sequencing (DEXAS) of genomic DNA. Kilger C, Pääbo S und DE 19653439.9 sowie DE

10 19653494.1 ), verwendet eine Polymerasen mit verminderter Diskriminierungsfähigkeit gegenüber Dideoxynukleotiden (ddNTPs) im Vergleich zu Deoxynukleotiden (dNTPs) sowie einen Reaktionspuffer, zwei Primer, die bevorzugt nicht äquimolar vorliegen, und die oben genannten Nukleotide, um dann in mehreren Zyklen eine komplette, sequenzspezifische

15 DNA-Leiter eines Fragmentes zu erhalten, welches von den Primern flankiert ist. Eine Weiterentwicklung dieses Verfahrens besteht in der Verwendung eines Polymerasegemisches, wobei eine der beiden Polymerasen zwischen ddNTPs und dNTPs diskriminiert, während die zweite eine verminderte Diskriminierungsfähigkeit aufweist (Nucleic Acids Res. 1997 May 15;

20 25(10):2032-2034 Direct DNA sequence determination from total genomic DNA. Kilger C, Pääbo S).

DNA-Polymerasen finden auch Anwendung bei der reversen Transkription von RNA in DNA. Hierbei dient RNA als Template und die Polymerase synthetisiert 25 einen komplementären DNA-Strang. Zur Anwendung kommt hier z.B. die thermostabile DNA-Polymerase aus dem Organismus Thermus thermusphilus (Tth) (U.S. Patent 5,322,770).

Es kann auch vorkommen, daß die Polymerase eine 'proof-reading' Aktivität

30 besitzt, also eine 3'-5' Exonukleaseaktivität aufweist. Diese Eigenschaft ist insbesondere dann wünschenswert, wenn das zu synthetisierende Produkt mit einer niedrigen Fehlerrate bei der Nukleotidinkorporation hergestellt werden soll. Ein Beispiel stellen Polymerasen aus dem Organismus Pyrococcus wosei dar.

Die oben genannten Enzyme, die üblicherweise in PCR-Reaktionen eingesetzt werden, gehören in vivo größtenteils nicht zu den eigentlichen Replikationsenzymen, sondern es sind zumeist Enzyme, von denen man annimmt, daß sie bei der DNA-Reparatur beteiligt sind, weshalb deren Prozessivität relativ gering ist.

Somit war es eine Aufgabe der vorliegenden Erfindung, mehrere der vorgenannten Eigenschaften von Polymerasen, insbesondere hohe Prozessivität und Thermostabilität, für die Verwendung in in vitro Reaktionen zu vereinen.

Diese Aufgabe wurde erfindungsgemäß gelöst durch die Bereitstellung eines thermostabilen in v/Yro-Komplexes, umfassend ein thermostabiles Gleitklammerprotein und ein thermostabiles Polymeraseaktivität-aufweisendes Elongationsprotein. Der erfindungsgemäße Komplex kann dabei zur Template- abhängigen Elongation von Nukleinsäure(n) dienen.

Dieser Komplex kann in in wfro-Reaktionen, wie z.B. in PCR-Reaktionen, eingesetzt werden und weist dabei eine hohe Prozessivität auf. Von Vorteil ist zudem, daß der Komplex eine geringe Fehlerquote bei der Nukleotidinkorporation aufweist, also eine erhöhte Genauigkeit beim Baseneinbau hat. Dieser Komplex kann somit bei der Elongation, der Amplifikation, der Reversen Transkription, DNA-Markierung und der Sequenzierung von Nukleinsäuren in vorteilhafter Weise eingesetzt werden. Die vorstehend aufgezeigten Verwendungsmöglichkeiten stellen jeweils für sich besonders bevorzugte Ausführungsformen der Erfindung dar. lm Falle der Verwendung des erfindungsgemäßen Komplexes zur Amplifikation von Nukleinsäurensäuren wurde überraschend festgestellt, daß das dabei hergestellte Amplifikationsprodukt eine besonders niedrige Basenfehlinkorporationsrate aufweist.

Bei der Verwendung eines solchen Komplexes, beispielsweise in Standard- PCR-Reaktionen, wird eine einfache Handhabung und eine hohe Prozessivität gewährleistet, wie dies beispielsweise aus Fig. 26 ersichtlich ist.

In einer Ausführungsform ist vorgesehen, daß bei dem erfindungsgemäßen in ϊro-Komplex das Gleitkammerprotein mit dem Elongationsprotein verbunden ist.

In einer bevorzugten Ausführungsform des erfindungsgemäßen thermostabilen in ^'fra-Komplexes sind das Gleitklammerprotein und das Elongationsprotein über ein Kopplungsprotein verbunden.

Die Kopplung zwischen Gleitklammerprotein und Polymeraseaktivität aufweisendem Elongationsprotein kann durch kovalente, aber auch durch nicht-kovalente Bindung erfolgen. In einer bevorzugten alternativen Ausführungsform ist vorgesehen, daß eine direkte Kopplung zwischen Gleitklammerprotein und Elongationsprotein erfolgt.

Dabei kann vorgesehen sein, daß das Gleitklammerprotein und/oder das Elongationsprotein aus Archaebakterien stammen.

In einer bevorzugten Ausführungsform des erfindungsgemäßen Komplexes handelt es sich um einen prokaryontischen in w^'fro-Komplex. In einer bevorzugten Ausführungsform kann es sich bei dem erfindungsgemäßen prokaryontischen Komplex um einen archaebakteriellen in v/fro-Komplex handeln.

In einer bevorzugten alternativen Ausführungsform kann es sich bei dem erindungsgemäßen prokaryontischen Komplex um einen eubakteriellen in vitro- Komplex handeln.

In einer alternativen Ausführungsform des erfindungsgemäßen Komplexes handelt es sich um einen eukaryontischen in v/fro-Komplex.

In diesem Zusammenhang ist ein prokaryontischer in v/fro-Komplex ein solcher, bei dem das Gleitklammerprotein prokaryontischen Ursprungs ist unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist ein eubakterieller Komplex ein solcher, bei dem das Gleitklammerprotein eubakteriellen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist ein archaebakterieller Komplex ein solcher, bei dem das Gleitklammerprotein archaebakteriellen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins. Entsprechend ist weiterhin ein eukaryontischer Komplex ein solcher, bei dem das Gleitklammerprotein eukaryontischen Ursprungs ist, unabhängig vom Ursprung des Elongationsproteins.

Gegenstand der vorliegenden Erfindung sind ebenfalls solche thermostabilen in wYro-Komplexe, bei denen die die Komplexe aufbauenden Proteine zum Teil aus Archaebakterien, Eukaryonten und aus Eubakterien stammen. Insoweit sind jegliche Permutationen der in ϊro-Komplexe hinsichtlich der Proteinkomponenten und ihres jeweiligen Ursprunges Gegenstand der vorliegenden Erffindung. Ursprung im vorstehenden Sinne soll dabei jene Quelle bezeichnen, auf die das Gen, die Geninformation oder das Protein zurückzuführen ist.

Davon unabhängig ist die tatsächliche Art und Weise der Gewinnung des Gleitklammerproteins bzw. des Elongationsproteins, die beispielsweise durch chemische Synthese, gentechnologische Verfahren oder Isolierung aus den natürlichen Quellen erfolgen kann.

Insbesondere ist Gegenstand der Erfindung ein thermostabiler prokaryontischer in wϊro-Komplex zur Elongation, insbesondere zur Template- abängigen Elongation von Nukleinsäuren, der ein thermostabiles Gleitklammerprotein (Fig. 20), welches die komplementären Nukleinsäurestränge ganz oder teilweise umschließt, und ein thermostabiles, Polymeraseaktivität (Fig. 21 und Fig. 22) aufweisendes Protein umfaßt, wobei dieses Protein oder dieser Proteinkomplex mit dem Gleitklammerprotein gekoppelt oder assoziiert ist.

Im Rahmen der vorliegenden Erfindung umfaßt der Begriff Polymeraseaktivität- aufweisendes Elongationsprotein auch Polymeraseaktivität-aufweisende Proteinkomplexe oder Untereinheiten solcher Komplexe, welche die Polymeraseaktivität tragen.

Thermostabil im Sinne der vorliegenden Erfindung bedeutet, daß der in vitro- Komplex mit hoher Prozessivität Nukleotide in wachsende Nukleinsäurestränge inkorporiert, sowohl bei niedrigen als auch bei hohen Temperaturen, die in der PCR oder einer anderen Reaktion auftreten, wie z.B. der DNA-Sequenzierung.

Die PCR besteht z.B. in der Regel aus den Schritten der Denaturierung (70°C bis 98°C), dem Annealing (40°C bis 78°C) und der DNA-Strangsynthese (60°C bis 76°C). Somit muß dieser Komplex mindestens zwischen ca. 60°C und ca.

70°C, bevorzugt insbesondere zwischen 60°C und 76°C und besonders bevorzugterweise funktionsfähig sein zwischen 40°C und 98°C. Es dürfen während der gesamten Reaktion keine irreversiblen

Denaturierungserscheinungen des Komplexes oder einzelner Komponenten auftreten, welche die Elongationsreaktion unterbinden oder inhibieren.

Die Gleitklammer

Die folgenden Ausführungen sollen dazu dienen, die Funktion und die möglichen Erscheinungsformen der Gleitkammer bzw. des Gleitklammerproteins zu veranschaulichen.

Das Gleitklammerprotein erfüllt die Funktion, das Elongationsprotein an die DNA zu binden. Wie eingangs bereits ausgeführt, umschließt das Gleitklammerprotein selbst die einzelsträngige oder doppelsträngige Nukleinsäure ganz oder teilweise oder durch Assoziation an das Polymeraseaktivität aufweisende Protein beziehungsweise an den Polymeraseaktivität-aufweisenden Proteinkomplex oder eine Untereinheit davon und bildet dadurch eine Klammer um die Nukleinsäure aus. In jedem Fall wird durch diese Klammerbildung die Prozessivität signifikant gesteigert, mindestens um das Eineinhalbfache (Beispiel 5 und Fig. 23).

Das heißt, der erfindungsgemäße in v/Yro-Komplex besitzt eine mindestens eineinhalbfache Prozessivität im Vergleich zu einem Elongationsprotein alleine, beziehungsweise im Vergleich zu einem Polymeraseaktivität-aufweisenden Proteinkomplex, bzw. einer Untereinheit davon, ohne Gleitklammer (Beispiel 5 und Fig. 23).

Als Gleitkammer können erfindungsgemäß beispielsweise Homologe oder Funktionsanaloge des "Proliferating Cell Nuclear Antigen"-Protein komplexes, kodiert im menschlichen Genom, oder Homologe des ebenfalls ringförmigen "ß-clamp"-Proteinkomplex aus E. coli dienen, welche aus thermostabilen Organismen stammen und thermostabil sind, oder sofern sie nicht-thermostabil sind, thermostabil gemacht werden, oder aus nicht thermostabilen Organismen stammen und thermostabil sind bzw. nachträglich durch Veränderung der Aminosäuresequenz thermostabil gemacht werden (Eijsink VG, van der Zee JR, van den Burg B, Vriend G, Venema G, FEBS Lett 1991 Apr 22;282(1 ):13- 16, Improving the thermostability of the neutral protease of Bacillus stearothermophilus by replacing a buried asparagine by leucine, Bertus Van den Burg, Gert Vriend, Oene R. Veltman, Gerard Venema, and Vincent G. H. Eijsink Engineering an enzyme to resist boiling PNAS 1998 95: 2056-2060). Unter homologen Sequenzen soll hierin im folgenden Sequenzen verstanden werden, die sich dadurch auszeichnen, daß sie zu einer oder mehreren anderen Sequenzen eine Sequenzähnlichkeit aufweisen und zwar in einem Maße, bei dem nicht von einer zufälligen Ähnlichkeit ausgegangen werden kann. Der Grad der Sequenzähnlichkeit wird in Prozent ausgedrückt und Homologie genannt. Bisweilen wird auch der Begriff „Sequenzidentität" verwendet. Ein Homolog ist eine Nukleinsäure oder Aminosäuresequenz, welche zu einer Bezugssequenz eine homologe Sequenz ist.

Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein. Die im menschlichen Genom identifizierte Gleitklammer besteht aus drei PCNA- Protein Komponenten (SEQ ID NO: 11 ) (Homotrimeres), die im E. co//-Genom identifizierte Gleitklammer besteht aus zwei Komponenten (SEQ ID NO: 35) (Homodimeres ).

Als Gleitklammer im Sinne der vorliegenden Erfindung ist hierbei insbesondere jedes Protein zu verstehen, das die funktioneile Eigenschaft der Polymeraseprozessivitätssteigerung (Beispiel 5 und Fig. 23) besitzt und/oder der Senkung der Fehlerrate dient. Dazu kann die Gleitklammer eine ringförmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein anderes Protein eine ringförmige dreidimensionale Struktur bilden, durch die sie in der Lage ist, ein- und doppelsträngige Nukleinsäuren ganz oder teilweise zu umschließen. Als Gleitklammer im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das

1. zu der menschlichen PCNA-Aminosäuresequenz (Eukaryonten)

(SEQ ID NO 11 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist oder das 2. zu der bakteriellen ß-clamp-Sequenz aus E. coli (Eubakterien)

(SEQ ID NO 35) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist oder das 3. zu der Aminosäuresequenz des PCNA-Homologen aus

Archaeoglobus fulgidus (Archaebakterien) (SEQ ID NO 12) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt 25 %ige und noch bevorzugter 30 %ige Sequenzidentität aufweist.

Sämtliche Sequenzalignments, wie sie hierin offenbart werden, wurden mit dem BLAST Algorithmus nach Altschul, S.F., Gish, W. Miller, W., Myers.E.W., and Lipman, D ., J. Mol. Biol. 215, 403-410 (1990) erstellt.

Die erfindungsgemäße Gleitklammer kann eines oder mehrere der vorgenannten Merkmale aufweisen.

Als Gleitklammer bzw. Gleitklammerproteine im Sinne der vorliegenden

Erfindung sind außerdem Proteine zu verstehen, die eine oder beide der folgenden Konsensussequenzen (Region 1 und Region 2) beinhalten und an nicht mehr als vier Positionen von der Region 1 (SEQ ID No.: 39) oder nicht mehr als vier Positionen von der Region 2 (SEQ ID No.: 40) abweichen (Fig. 4):

Region 1 (SEQ ID No.: 39):

[GAVLIMPFW]-D-X-X-X-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-[GAVLIMPFW]- X-[GAVLI M PFW]-X-X-X-X-F-X-X-Y-X-X-D und / oder Region 2: (SEQ ID No.: 40):

[GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFW]-E

Die Aminosäuren werden hierbei gemäß der Standard IUPAC - Einbuchstaben Nomenklatur benannt und gemäß dem Prosite Pattern- Beschreibungsstandard aufgeführt. Dabei sind die folgenden Aminosäuregruppen häufig zusammengefaß: G,A,V,L,I,M.P,F oder W (Aminosäuren mit nicht polaren Seitenketten) S,T,N,Q,Y, oder C (Aminosäure mit ungeladenen polaren Seitenketten) K,R,H,D oder E (Aminosäure mit geladenen und polaren Seitenketten) Außerdem bedeutet X in den Sequenzen bzw. Sequenzprotokollen jede beliebige Aminosäure oder Insertion oder Deletion

Aus dem in Fig. 12 dargestellten multiplen Alignment von menschlichen PCNA- Homologen wurde zudem ein Hidden-Markov-Modell generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu verstehen, das mit dem so erzeugten Hidden-Markov-Modell (hierin im folgenden mit „HMM" bezeichnet) einen „Score" von mehr als 20, bevorzugt 25 am bevorzugtesten 30 aufweist (Fig. 12), wobei ein „Score" der Ausgabewert einer HMM-Analyse ist. Die Hidden-Markov-Modelle und die entsprechenden Scores wurden mit dem hmmfs Programm (Version 1.8.4, July 1997) aus dem HMMER-Paket berechnet (HMMER Protein and DNA Hidden Markov Models (Version 1.8) von Sean Eddy, Dept. of Genetics, Washington University School of Medicine, St. Louis, USA;).

Markov-Modelle mit verstecktem Profil (engl.: profile hidden Markov modeis - profile HMMs), kurz auch „Hidden Markov Models" genannt, hierin als HMM abgekürzt, sind statistische Modelle des Konsensus der Primärstruktur einer Sequenzfamilie. Die Profile verwenden positionsspezifische Punktzahlen („scores") für Aminosäuren (oder Nukleotide) und positionsspezifische Punktzahlen zum Eröffnen oder Erweitern einer Insertion oder Deletion. Methoden zum Erstellen von Profilen, ausgehend von multiplen Alignments, wurden von Taylor (1986), Gribskov et al. (1987), Barton (1990) und Heinikoff (1996) eingeführt.

HMM stellen eine vollkommen probabilistische Beschreibung von Profilen bereit, d. h. die Lehre von Bayes legt fest, wie die gesamten Wahrscheinlichkeits- (Auswertungs-) Parameter gesetzt werden sollten (vergl. Krogh et al. 1994, Eddy 1996 und Eddy 1998). Die zentrale Idee ist die, daß ein HMM ein finites Modell ist, das eine Wahrscheinlichkeitsverteilung über eine unbegrenzte Anzahl möglicher Sequenzen beschreibt. Das HMM setzt sich aus einer Anzahl von Zuständen zusammen, die den Säulen eines multiplen Alignments, wie dies üblicherweise dargestellt wird, entsprechen. Jeder Zustand emittiert Symbole (Reste) entsprechend den (zustandsspezifischen) Symbol-Emissions- Wahrscheinlichkeiten, und die Zustände sind durch Zustand-Übergangs- Wahrscheinlichkeiten untereinander verbunden. Ausgehend von einem Anfangszustand wird eine Abfolge von Zuständen generiert, indem von einem Zustand zum anderen entsprechend den Zustands-Übergangs- Wahrscheinlichkeiten übergegangen wird, bis ein Endzustand erreicht ist. Jeder Zustand emittiert dann Symbole entsprechend den Emissions- Wahrscheinlichkeits-Verteilung dieses Zustands, was eine beobachtbare Sequenz von Symbolen erzeugt. Das Attribut „hidden" (versteckt) leitet sich ab von der Tatsache, daß die zugrunde liegende Zustandssequenz nicht beobachtet werden kann; was gesehen wird, ist die Symbolsequenz. Eine Abschätzung der Übergangs- und Emissions-Wahrscheinlichkeiten (das Trainieren des Modells) wird durch dynamische Programmierungsalgorithmen erreicht, die in dem HMMER- Paket implementiert sind.

Wenn ein existierendes HMM und eine Sequenz gegeben sind, kann man die Wahrscheinlichkeit berechnen, daß das HMM die fragliche Sequenz erzeugen könnte. Das HMMER-Paket liefert eine numerische Größe (die Punktzahl bzw. Ausgabewert), die proportional zu dieser Wahrscheinlichkeit ist, d. h. den Informationsgehalt der Sequenz, angegeben in Bits, gemessen gemäß dem HMM.

In Zusammenhang mit HMM sei auf folgende Literaturstellen verwiesen:

Barton, G.J. (1990):

Protein multiple alignment and flexible pattern matching. Methods Ezymol. 183: 403-427.

Eddy, S.R. (1996): Hidden markov modeis. Curr. Opin. Strct. Biol. 6: 361-365.

Eddy, S.R. (1998):

Profile hidden markov modeis.

Bioinformatics. 14: 755-763.

Gribskov, M. McLachlan, A.D. und Eisenberg D. (1987):

Profile analysis: Detection of distantly related proteins. Proc. Natl. Acad. Sei. USA. 84: 4355-5358.

Heinikoff, S. (1996):

Scores for sequence searches and alignment. Curr. Opin. Strct. Biol. 6: 353-360.

Krogh, A., Brown, M., Mian, I.S., Sjolander, K. und Haussler, D. (1994):

Hidden markov modeis in computational biology: Applications to protein modelling.

J. Mol. Biol. 235: 1501-1531.

Taylor, W.R. (1986):

Identification of protein sequence homology by consensus template alignment.

J. Mol. Biol. 188: 233-258.

Aus dem in Fig. 13 dargestelten multiplen Alignment von E. coli ß-clamp- Homologen wurde ein HMM generiert. Als Gleitklammer im Sinne der vorliegenden Erfindung ist somit insbesondere auch jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, bevorzugt 30 und am bevorzugtesten 35 aufweist (Fig. 13).

Die Gleitklammer kann aus mehreren Komponenten aufgebaut sein, die durch eine charakteristische Bindung fest aneinander gebunden sind, so daß ein stabiler ringförmiger Molekülkomplex gebildet wird, der nicht ohne weiteres von der Nukleinsäure dissoziieren kann. Dadurch wird eine feste, aber nicht kovalente Bindung an die Nukleinsäure ermöglicht, die die freie Verschiebbarkeit auf derselben aber nicht behindert. Die prozessivitätssteigernden Gleitklammerproteine haben zudem charakteristische lokale Moleküleigenschaften im Bereich der Wechselwirkungsregion zur DNA, die die freie Verschiebbarkeit erleichtern und die durch in diese Region eingelagerte Wassermoleküle unterstützt werden kann.

Eine bevorzugte Ausführungsform der vorliegenden Erfindung ist weiterhin insbesondere ein thermostabiler prokaryontischer in wϊro-Komplex, wobei das Gleitklammerprotein eines der folgenden ist: AF 0335 aus Archaeoglobus fulgidus (SEQ ID NO.: 12) (Fig.24), MJ0247 aus Methanococcus jannaschii (SEQ ID NO.: 13), PHLA008 aus Pyrococcus horikoschii (SEQ ID NO.: 14), MTH1312 aus Methanobacterium Thermoautotrophicus (SEQ ID NO.: 15), sowie AE000761_7 aus Aquifex aeolicus (SEQ ID NO.: 36).

Insbesondere sind solche thermostabilen in w/o-Komplexe Gegenstand dieser Anmeldung, wobei das Gleitklammerprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 11 , 12, 13, 14, 15 und 36 umfaßt.

Der Gleitklammerlader

Desweiteren ist als bevorzugte Ausführungsform zu verstehen, wenn der erfindungsgemäße Komplex einen Gleitklammerlader umfaßt. Als Gleitklammerlader wird hierin ein Protein, Proteinkomplex oder Untereinheit eines Proteins verstanden, welches ein Homolog des im Menschen identifizierten "Replication Factor C"-Proteinkomplexes umfaßt.

Dieser Proteinkomplex besteht im Menschen aus fünf Untereinheiten wobei sie durch 5 separate Gene im Menschen kodiert sind. Die 4 von jeweils einem Gen kodierten kleinen Untereinheiten (hierin als Gleitklammerlader 1 bezeichnet) bilden beim Menschen einen Proteinkomplex. Das Protein der großen Untereinheit wird beim Menschen durch ein Gen kodiert (hierin als Gleitklammerlader 2 bezeichnet). Die Sequenzen der vier kleinen Untereinheiten sind als SEQ ID NO.: 1 , 32, 33, 34 dargestellt, die Sequenz der großen Untereinheit ist als SEQ ID NO.: 6 dargestellt. Als Gleitklammerlader 1 können erfindungsgemäß Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der vorstehen genannten Sequenzen SEQ ID NO.: 1 , 32, 33, 34 verwendet werden. Dabei können die Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder eukaryontischen Ursprungs sein.

Als Gleitklammerlader 2 können erfindungsgemäß Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, der vorstehend genannten Sequenz SEQ ID NO.: 6 verwendet werden. Dabei können die Homologen prokaryontischen, wie eubakteriellen oder archaebakteriellen, oder eukaryontischen Ursprungs sein.

Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung kann auch ein solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 1 , 32, 33, 34 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige Sequenzidentität aufweist.

Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung kann auch ein solches Protein verstanden werden, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 6) auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität, bevorzugt mindestens 25 %ige und noch bevorzugter mindestens 30 %ige aufweist.

Gleitklammerlader-Homologe im Sinne der obigen Definition sind beispielsweise die in Fig. 1 aufgeführten Gene aus Archaebakterien. Diesen Genen entsprechen für den Gleitklammerlader 1 die Sequenzen SEQ ID NO: 2, 3, 4, und 5 und für den Gleitklammerlader 2 die Sequenzen SEQ ID NO: 7, 8, 9, und 10.

Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung kann auch ein Protein verstanden werden, das eine Sequenz gemäß der folgenden Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Alinierung siehe auch Fig. 6):

SEQ ID No. 41 : C-N-Y-X-S-[KRHDE]-I-I-X-[GAVLIMPFW]-[GAVLIMPFW]-Q-S-R-C-X-X-F-R-F- X-P-[GAVLIMPFW]

Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung kann auch ein Protein verstanden werden, das eine Sequenz gemäß der folgenden Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht (Alinierung siehe auch Fig. 7):

SEQ ID No.42:

K-X-X-L-L-X-G-P-P-G-X-G-K-T-[STNQYC]-X-[GAVLI M PFWj-X-X- [GAVLIMPFW]

Aus dem in Fig. 14 dargestellten multiplen Alignment von Sequenzen des Gleitklammerladers 1 umfassend die menschliche Sequenz sowie einige dazu homologe Sequenzen aus Archaebakterien, wurde zudem ein HMM generiert. Als Gleitklammerlader 1 im Sinne der vorliegenden Erfindung ist demzufolge auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 25, bevorzugt mehr als 30 und am bevorzugtesten mehr als 35 aufweist (Alinierung siehe auch Fig. 14).

Aus dem in Fig. 15 dargestellten multiplen Alignment von Sequenzen des Gleitklammerladers 2 umfassend die menschliche Sequenz sowie einigen dazu homologen Sequenzen aus Archaebakterien wurde zudem ein HMM generiert. Als Gleitklammerlader 2 im Sinne der vorliegenden Erfindung ist demzufolge auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 15, bevorzugt mehr als 20 und am bevorzugtesten mehr als 25 aufweist (Alinierung siehe auch Fig. 15).

Es kann auch vorgesehen sein, daß der erfindungsgemäße in w^'fro-Komplex ein dem Eubaktehum Escherichia coli γ-Komplex oder Teilen davon homologes Protein als Gleitklammerlader 1 oder Gleitklammerlader 2 umfaßt.

Ein Gleitklammerlader im Sinne der vorliegenden Erfindung kann demgemäß ein Gleitklammerlader 1 alleine, ein Gleitklammerlader 2 alleine, oder eine Kombination einer oder mehrerer Gleitklammerlader 1 bzw. Gleitklammerlader 2, jeweils wie vorstehend definiert, sein.

Außerdem ist in einer Ausführungsform des erfindungsgemäßen thermostabilen in w/ro-Komplex zur Elongation von Nukleinsäuren vorgesehen, daß dieser zusätzlich eine Verbindung umfaßt, welche bei der Spaltung Energie freisetzt, wie beispielsweise ATP, GTP, CTP, TTP, dATP, dGTP, dCTP oder dTTP.

Ohne im folgenden darauf festgelegt sein zu wollen, scheint ein Gleitklammerlader die Komponenten der Gleitklammer um den ununterbrochenen DNA-Strang herum zusammenzufügen, bzw. diese wieder zu entfernen, wenn die Reaktion beendet ist. Dabei kann die Gleitklammer eine ringförmige dreidimensionale Struktur aufweisen oder durch Kopplung an ein anderes Protein eine ringförmige dreidimensionale Struktur bilden, durch die sie in der Lage ist, ein- oder doppelsträngige Nukleinsäuren ganz oder teilwseise zu umschließen. Der Gleitklammerlader kann dann Vorteile mit sich bringen, wenn das Template-Nukleinsäuremolekül ringförmig geschlossen vorliegt. Insbesondere sind solche thermostabile in w^'fro-Komplexe Gegenstand dieser Anmeldung, wobei der Gleitklammerlader 1 eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 2, 3, 4 und 5 umfaßt.

Insbesondere sind solche thermostabile in /ro-Komplexe Gegenstand dieser Anmeldung, wobei der Gleitklammerladder 2 eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 7, 8, 9 und 10 umfaßt.

Das Kopplungsprotein

Das Kopplungsprotein hat die Funktion, ein Elongationsprotein mit einem oder mehreren Gleitklammerproteinen oder einem Gleitklammerproteinkomplex zu verbinden. Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Protein zu verstehen, welches die oben beschriebene Funktion aufweist. Bevorzugt sind solche Kopplungsproteine, die archaebakteriellen Ursprungs sind.

Kopplungsproteine im Sinne der vorliegenden Erfindung sind beispielsweise Homologe oder Funktionsanaloge, einzeln oder in beliebiger Kombination, einer jeden der in Fig. 1 aufgeführten Sequenzen, die Homologe zu der humanen Sequenz der kleinen Untereinheit der Polymerase δ, hierin als koppelnde Untereinheit bezeichnet (Sequenzname: DPD2JHUMAN, dargestellt im Sequenzprotokoll als SEQ ID NO:16), sind. Im Sinne der vorliegenden Erfindung kann ein Kopplungsprotein ein Protein sein, das eine Sequenz umfaßt, die aus der Gruppe ausgewählt ist, die die Sequenzen SEQ ID NO: 17, 18, 19, 20 und 21 umfaßt.

Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 16 ) auf einer Länge von mindestens 150

Aminosäuren bei einem Sequenzalignment eine mindestens 18 %ige, bevorzugt mindestens 22 %ige und noch bevorzugter mindestens 26 %ige Sequenzidentität aufweist.

Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der Aminosäuresequenz (SEQ ID NO: 19 ) von Pyrococcus horikoshii auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist, bevorzugt eine mindestens 25 %ige Sequenzidentität und am bevorzugtesten eine Sequenzidentität von mehr als 30 % .

Als Kopplungsprotein im Sinne der vorliegenden Erfindung ist auch jedes Protein zu verstehen, das die folgende Konsensussequenz umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht. Die Generierung der Konsensussequenz wird in Fig. 5 gezeigt, die als SEQ ID No. 43 hierin offenbart wird.

SEQ ID No. 43:

[FL]-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-G-X(13)-[GAVLIMPFW]-X-[YR]-

[GAVLIMPFW]-X-[GAVLIMPFW]-A-G-[DN]-[GAVLIMPFW]-[GAVLIMPFW]-[DS]

Aus dem in Fig. 16 dargestellten multiplen Alignment von Homologen zur menschlichen koppelnden Untereinheit oder Kopplungsprotein wurde zudem ein HMM generiert. Als koppelnde Untereinheit im Sinne der vorliegenden Erfindung ist somit jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score mehr als 10, bevorzugt mehr als 15, am bevorzugtesten mehr als 20 aufweist.

Insbesondere sind solche thermostabilen in v/fro-Komplexe Gegenstand dieser Anmeldung, wobei das Kopplungsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 17, 18, 19, 20 und 21 umfaßt. Elongationsprotein

Im Rahmen der vorliegenden Erfindung kann ein Elongationsprotein verwendet werden, das die eingangs definierten Merkmale aufweist. Darüber hinaus können Formen von Elonagtionsproteinen verwendet werden, wie sie im folgenden beschrieben werden und im Stand der Technik zumindest zum Teil bereits bekannt sind.

Es ist bekannt, daß einige Elongationsproteine die Anwesenheit eines Kopplungsproteins benötigen, um überhaupt Polymeraseaktivität aufzuweisen. Weiterhin ist bekannt, daß einige Elongationsproteine direkt an Gleitklammerproteine binden können, wohingegen andere Elongationsproteine die Anwesenheit eines Kopplungsproteins für die Bindung an die Gleitklammerproteine benötigen. Weiterhin können Elongationsproteine die beiden vorstehend genannten Eigenschaft in sich vereinen, das heißt sowohl über ein Kopplungsprotein als auch direkt, das heißt ohne ein Kopplungsprotein, an ein Gleiklammerprotein binden.

Bevorzugte Elongationsproteine für den erfindungsgemäßen in w^'/ro-Komplex können ausgewählt sein aus der Gruppe, die die Organismen Carboxydothermus hydrogenoformans, Thermus aquaticus, Thermus caldophilus, Thermus chliarophilus, Thermus filiformis, Thermus flavus, Thermus oshimai, Thermus ruber, Thermus scotoductus, Thermus silvanus, Thermus species Z05, Thermus species sp. 17, Thermus thermusphilus, Therotoga maritima, Therotoga neapolitana, Thermosipho af canus, Anaerocellum thermophilum, Bacillus caldotenax, oder Bacillus stearothermophilus umfaßt, eingebracht wird.

Als Elongationsproteine sind beispielsweise auch die in Fig. 1 aufgeführten zum menschlichen Elongationsprotein (SEQ ID NO: 22) homologen oder funktionsanalogen Elonagationsproteine aus Archaebakterien geeignet (SEQ ID NO: 23, 24, 25, 26). Insbesondere sind solche thermostabile in w-ro-Komplexe Gegenstand der Erfindung, wobei das Elongationsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 23, 24, 25, 26, 27, 28, 29, 30 und 31 umfaßt.

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist insbesondere ein solches Protein zu verstehen, das zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 22) auf einer Länge von mindestens 200 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität, bevorzugt 25 %ige Sequenzidentität, am bevorzugtesten 30 %ige Sequenzidentität aufweist.

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist auch insbesondere ein Protein zu verstehen, das die folgende Konsensussequenz (SEQ ID No. 44) beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht. Die Fig. 8 zeigt das Alignment, das der Konsensussequenz zugrunde liegt.

SEQ ID No.44:

D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y-[GAVLIMPFW]-X- X-R-A

Aus dem in Fig. 17 dargestellten multiplen Alignment von Homologen zum menschlichen Elongationsprotein (SEQ ID NO: 22) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit auch ein Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit auch ein solches Protein zu verstehen, das zu der archaebakteriellen Aminosäuresequenz (SEQ ID NO: 27) auf einer Länge von mindestens 400 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität, bevorzugt mindestens 30 %ige Sequenzidentität, am bevorzugtesten mindestens 35 %ige Sequenzidentität aufweist. Beispielsweise sind geeignet die aus Archaebakterien stammenden Proteine mit der SEQ ID NO: 27, 28, 29, 30 oder 31.

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher insbesondere auch jedes Protein zu verstehen, das die folgende Konsensussequenz, hierin als SEQ ID No.: 45 bezeichnet, beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht. (Die Fig. 9 zeigt das Alignment, das der Konsensussequenz zu Grunde liegt.)

SEQ ID No. 45:

A-[GAVLIMPFW]-R-T-A-[GAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMPFW]-T-E-

G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I

Aus dem in Fig. 18 dargestellten multiplen Alignment von Homologen zum archaebakteriellen Elongationsprotein (SEQ ID NO: 27) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit insbesondere jedes Protein zu verstehen, daß mit dem so erzeugten HMM einen Score mehr als 35, bevorzugt mehr als 40 und noch bevorzugter mehr als 45 aufweist (Fig. 18).

Das Elongationsprotein kann auch eubakteriellen Ursprungs sein.

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit ebenfalls ein solches Protein zu verstehen, das zu der eubakteriellen Aminosäuresequenz (SEQ ID NO: 37) auf einer Länge von mindestens 300

Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige, bevorzugt mindestens 30 %ige und noch bevorzugter mindestens 35 %ige Sequenzidentität aufweist.

Als Elongationsprotein im Sinne der vorliegenden Erfindung ist daher auch insbesondere jedes Protein zu verstehen, das die folgende Konsensussequenz beinhaltet und an nicht mehr als acht Positionen von dieser Sequenz abweicht (Fig. 10):

SEQ ID No. 46: [GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- [GAVLIMPFW]-V-A-X-A-[GAVLIMPFW]-X-I-T-D-[GAVLIMPFW]-D-P- [GAVLIMPFW]-X-X-X-[GAVLIMPFW]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFW]-S- M-P-D

Aus dem in Fig. 19 dargestellten multiplen Alignment von Homologen zum eubakteriellen Elongationsprotein (SEQ ID NO: 37) wurde zudem ein HMM generiert. Als Elongationsprotein im Sinne der vorliegenden Erfindung ist somit jedes Protein zu verstehen, das mit dem so erzeugten HMM einen Score von mehr als 20, bevorzugt mehr als 25, am bevorzugtesten mehr als 30 aufweist.

Insbesondere sind solche thermostabile in w^'/ro-Komplexe Gegenstand dieser Anmeldung, wobei das Elongationsprotein eine Aminosäuresequenz umfaßt, die ausgewählt ist aus der Gruppe, die SEQ ID No. 38 umfaßt.

Verwendungen des erfindungsgemäßen in fro-Komplexes:

Bisher wurden DNA-Polymerasen als Elongationsproteine ohne Kopplungsprotein und ohne Gleitklammer für Standard-PCR-Reaktionen eingesetzt, so z.B. DNA-Polymerase I aus Pyrococcus furiosus (US No. 5,545,552) oder Pyrococcus species (EP-A-0 547 359). Diese Enzyme zeichnen sich durch die Eigenschaft aus, thermostabil zu sein und häufig eine 3'-5'-Exonuklease-Aktivität (,proof-reading' Aktivität) zu besitzen. Erst vor kurzem wurde ein Heterodimer mit Polymeraseaktivität in Pyrococcus furiosus entdeckt (Uemori, T., Sato, Y., Kato, I., Doi, H., and Ishino, Y. (1997). A novel DNA polymerase in the hyperthermophilic archaeon, Pyrococcus furiosus: gene cloning, expression, and characterization. Genes to Cells 2, 499-512. )

Es ist auch möglich, durch Deletionen oder Mutationen oder durch das Anfügen von Aminosäuren die Eigenschaften dieser Proteine zu optimieren. Diese veränderten Proteine sind ebenfalls Gegenstand der vorliegenden Erfindung, solange sie den erfindungsgemäßen in vitro Komplex zur Elongation von Nukleinsäuren bilden und die oben näher spezifizierten Funktionen erfüllen.

Fig. 3 veranschaulicht beispielhaft eine Ausführungsform des erfindungsgemäßen thermostabilen in w^'fro-Komplexes, wobei hier die Gleitklammer über ein Kopplungsprotein an das Elongationsprotein bindet.

Der erfindungsgemäße in v/fro-Komplex bzw. der diesen enthaltende erfindungsgemäße Reaktionsansatz, kann desweiteren eine Nukleinsäure umfassen, wobei die Nukleinsäure die beispielsweise zu elongierende, zu sequenzierende, zu amplifizierende oder die revers zu transkribierende Nukleinsäure ist und/oder ein Primer, wobei dieser Primer bevorzugterweise an eine Nukleinsäure hybridisiert ist.

Primer sind in der Regel Oligonukleotide, welche komplementär zu einer Zielsequenz sind, um an diese binden zu können, wobei sie in gegensätzlicher Orientierung, ihre 3'-Enden zueinander gerichtet, den zu elongierenden, zu sequenzierenden, zu amplifizierenden oder revers zu transkribierenden Nukleinsäureabschnitt einschließt. Sie dienen als Startpunkt der Enzymaktivität und stellen in der Regel ein freies 3'-OH Ende für die Polymerase zur Inkorporation eines Nukleotides zur Verfügung. Während der Verwendung des erfindungsgemäßen thermostabilen in vitro- Komplexes zur Amplifikation, Elongation, Reversen Transkription und/oder Sequenzierung liegt der erfindungsgemäße Komplex, gegebenenfalls in einem Reaktionsansatz, bevorzugterweise in einem geeigneten Puffer vor. Geeignete Puffer sind solche, die für PCR, Sequenzierung, Nukleinsäuremarkierung und andere in w^'rro-Nukleinsäure-Elongationsreaktionen mittels Polymerase Anwendung finden. Geeignete Puffer werden beispielweise beschrieben in Methods in Molecular Biology, Vol. 15 Humana Press Totowa, New Jersey, 1993, Hrsg. Bruce A. White.

Bei der Verwendung des erfindungsgemäßen thermostabilen in vi^'tro- Komplexes zur Elongation, Amplifikation, Reversen Transkription und/oder Sequenzierung kann zusätzlich zu dem erfindungsgemäßen Komplex ein Nukleotid oder ein Gemisch aus Nukleotiden vorliegen bzw. verwendet werden bzw. umfaßt sein. Deoxynukleotide können aus dGTP, dATP, dTTP und dCTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Zusätzlich können auch Derivate von Deoxynukleotiden verwendet werden, die als solche Deoxynukleotide definiert sind, die in der Lage sind, durch eine thermostabile Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden. Solche Derivate umfassen die Thionukleotide, 7-deaza-2' -dGTP, 7-deaza-2' - dATP, Digoxigenin-dUTP (Boehringer Mannheim)-dATP sowie Deoxyinosine- Triphosphat, das auch als Ersatz-Deoxynukleotid für dATP, dGTP, dTTP oder dCTP verwendet werden kann, sind aber nicht auf diese beschränkt. Ebenso können markierte Deoxynukleotide verwendet werden. Auch die Verwendung von Pyrenen und Pyrenderivaten ist möglich. Alle bekannten und/oder zu dem erfindungsgemäßen Zweck geeigneten Markierungen können dabei vorliegen bzw. verwendet werden.

Dideoxynukleotide können aus ddGTP, ddATP, ddTTP und ddCTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Alternativ können auch

Derivate von Dideoxynukleotiden verwendet werden, die als solche Dideoxynukleotide definiert sind, die in der Lage sind, durch eine Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate können radioaktive Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP) sein oder Dideoxynukleotide (ddATP, ddGTP, ddTTP und ddCTP) sein, die mit z.B. FITC, Cy5, Cy5.5, Cy7, Texas- Rot oder anderen Farbstoffen markiert sind, sind aber nicht auf diese beschränkt. Im Rahmen einer Sequenzierung unter Verwendung des erfindungsgemäßen thermostabilen in ϊro-Komplexes können auch markierte Deoxynukleotide zusammen mit unmarkierten Dideoxynukleotiden eingesetzt werden.

Ribonukleotide können aus GTP, ATP, TTP und CTP ausgewählt werden, sind jedoch nicht auf diese beschränkt. Zusätzlich können gemäß der Erfindung auch Derivate von Ribonukleotiden verwendet werden, die als solche Ribonukleotide definiert sind, die in der Lage sind, durch eine Polymerase in wachsende Nukleinsäure-Moleküle inkorporiert zu werden, die in der Reaktion synthetisiert werden. Solche Derivate können radioaktive Ribonukleotide (ATP, GTP, TTP und CTP) oder Ribonukleotide (ATP, GTP, TTP und CTP), welche mit z.B. FITC, Cy5, Cy5.5, Cy7 und Texas-Rot oder anderen markiert sind, umfassen, sind aber nicht auf diese beschränkt.

Während der Verwendung des Proteinkomplexes zur Amplifikation, Elongation und Sequenzierung kann es sich als vorteilhaft erweisen, wenn bei der Reaktion oder im Reaktionsansatz eine Pyrophosphatase anwesend ist.

Reaktionsansatz umfassend den erfindungsgemäßen thermostabilen in fro-Komplex:

Weiterhin ist Gegenstand der vorliegenden Erfindung ein Reaktionsansatz, der den erfindungsgemäßen in w^' ro-Komplex umfaßt. Dabei kann vorgesehen sein, daß der Reaktionsansatz weiterhin ein oder mehrer Elongationsproteine umfaßt, die mindestens eine oder mehrere der vorstehenden Eigenschaften Aktivitäten aufweisen. Ein derartiges zusätliches Elongationsprotein ist dabei vorteilhafterweise eine thermostabile Polymerase. Ein derartiger Reaktionsansatz erlaubt eine verglichen mit der Verwendung der bekannten thermostabilen Polymerasen erhöhte Prozessivität.

Identifizierung der Gene, Klonierung der Gene, Expression dieser und Reinigung der Proteine der erfindungsgemäßen in ro-Komplexe:

In der Regel können die Komplexe, bevorzugt vollständig oder teilweise bestehend aus rekombinanten Proteinen, mit den folgenden Schritten bereitgestellt werden: Bereitstellung des Nukleinsäurefragmentes, welches für das gewünschte Protein kodiert, Ligation in einen Expressionsvektor, Transformation in einen Wirt, Expression und Aufreinigung des Proteins (Fig. 25). In Übereinstimmung mit der vorliegenden Erfindung kann es vorkommen, daß Gene, insbesondere aus den Archaebakterien, Inteine (Proc. Natl. Acad. Sei. U S A 1992 Jun 15;89(12):5577-5581 , Intervening sequences in an Archaea DNA polymerase gene, Perler FB, Comb DG, Jack WE, Moran LS, Qiang B, Kucera RB, Benner J, Slatko BE, Nwankwo DO, Hempstead SK, et al) enthalten können, welche zunächst entfernt werden können.

Die Identifizierung weiterer für den erfindungsgemäßen Komplex geeigneter Gene und/oder Proteine kann z.B. erfolgen durch Homologiesuchen in Datenbanken, welche Genome aus Prokaryonten umfassen. Programme, die dafür geeignet sind, umfassen beispielsweise das Programm BLAST, BLASTP und FASTA, sind aber nicht darauf beschränkt. (Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389- 3402. W.R. Pearson & D . Lipman PNAS (1988) 85:2444-2448).

Die Identifizierung kann auch dadurch geschehen, daß DNA-Sonden verwendet werden, um in z.B. gesamtgenomischen Banken aus Prokaryonten oder Eukaryonten nach den entsprechenden Genen zu screenen. Die hierfür nötigen experimentellen Verfahren finden sich in Maniatis et al. (Molecular Cloning (2"^d edition, 3 Volume set): A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(1989)) oder in Ausubel et al (Current Protocols in Molecular Biology, John Wiley and Sons (1988)).

Die Bereitstellung der gereinigten Nukleinsäure der Gene, die die erfindungsgemäßen Komplexe aufbauenden Proteine kann z.B. über deren Isolierung aus einer genomischen Bank des relevanten Organismus geschehen oder durch synthetische DNA-Herstellung, jeweils gewünschtenfalls kombiniert mit einer Amplifikation mittels PCR, unter Zuhilfenahme von Primern, welche für den gewünschten Genabschnitt spezifisch sind. Übliche Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y. (1989)) beschrieben.

Die Gene der Proteine der erfindungsgemäßen in ϊra-Komplexe können unter Anwendung einer Vielzahl von Methoden kloniert werden und somit mittels eines Expressionsvektors zur Proteinexpression in einem Wirtsorganismus zur Verfügung gestellt werden. Gängige Verfahren sind in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.(1989)) beschrieben. Die Gene der Komplexe können hierbei z.B. zunächst in einen ,high-copy' Vektor, z.B. pUC18, pBst oder pBR322 kloniert werden und dann erst in einen prokaryontischen Expressionsvektor, z.B. pTrc99, pQE30, pQE31 oder pQE32, umkloniert werden, oder aber direkt in einen prokaryontischen oder viralen Expressionsvektor kloniert werden. Unter Vektoren sind hierbei Nukleinsäuren zu verstehen, die in der Lage sind, ein anderes Nukleinsäuremolekül in oder zwischen verschiedenen Organismen, bzw. genetischen Hintergründen zu transportieren. Sie haben in der Regel die Fähigkeit zur autonomen Replikation und/oder zur Expression (Expressionsvektoren) des operativ verbundenen Nukleinsäuremoleküls. "Operativ verbunden" bedeutet hierin, daß das transportierte Nukleinsäuremolekül so mit dem Vektor verbunden ist, daß es unter der Transkriptions- und Translationskontrolle von Expressionskontrollsequenzen des Vektors steht und in einer Wirtszelle exprimiert werden kann. Bakterielle und virale Expressionssysteme, deren bevorzugte Verwendung, sowie eine Auswahl an Vektorsystemen ist z.B. in ,Gene Expression Technology, (Meth. Enzymol., Vol 185, Goeddel, Ed., Academic Press, N.Y. (1990)) beschrieben. Geeignete Vektoren für die vorliegende Erfindung sollten eine unterschiedlich starke Expression der Proteine dadurch ermöglichen, daß sie einige oder alle der folgenden Eigenschaften besitzen: (1 ) Promotoren, oder Transkriptionsinitiationsstellen, entweder unmittelbar neben dem Start des Proteins oder als Fusionsprotein, (2) Operatoren, verwendet werden können, um die Genexpression an oder aus zu schalten, (3) ribosomale Bindungsstellen für eine verbesserte Translation, und (4) Terminationsstellen für die Transkription oder Translation, die zu verbesserter Stabilität des Transkriptes führen.

Expressionsvektoren, die mit eukaryontischen Zellen, bevorzugterweise mit Vertebratenzellen kompatibel sind, können auch Verwendung finden. Einige bekannte Vektoren sind pSVL und pKSV-10 (Pharmacia), pBPV-1/pML2d (International Biotechnologies, Inc.), pAcHLT-ABC (Pharmingen) und pTDTI (ATCC 31255). Die Verwendung eines retroviralen Expressionsvektors ist auch möglich.

Weitere Gegenstände der vorliegenden Erfindung sind daher DNA-Sequenzen, welche für die erfindungsgemäßen thermostabilen in wYro-Komplexe codieren, sowie entsprechende Vektoren, vorzugsweise Expressionsvektoren. Die erfindungsgemäßen Vektoren enthalten mindestens ein Gen für das Gleitklammerprotein oder mindestents ein Gen für das Kopplungsprotein oder mindestens ein Gen für einen Gleitklammerlader 1 und/oder 2 oder mindestens ein Gen für ein Elongationsprotein. In einer Ausführungsform enthalten die Vektoren gleichzeitig mehrere der verschiedenen vorstehend genannten Gene, beispielsweise die Gene für ein Elongationsprotein und ein Gleitklammerprotein.

Es ist dabei im Rahmen der Erfindung bevorzugt, wenn der Vektor neben den darin bereits enthaltenen DNA-Sequenzen noch geeignete Restriktionsschnittstellen und ggf. Polylinker zur Insertion weiterer DNA- Sequenzen enthält. Besonders bevorzugt ist es, wenn die räumliche Anordnung von bereits enthaltener DNA-Sequenz und zusätzlicher Insertionsstelle nach Expression zur Ausbildung eines Fusionsproteins führt.

Ebenfalls bevorzugt ist es, wenn der erfindungsgemäße Vektor Promotor- und/oder Operatorbereiche enthält, wobei es besonders bevorzugt ist, wenn derartige Promotor- und/oder Operatorbereiche induzierbar oder reprimierbar sind. Dadurch wird eine Steuerung der Expression in Wirtszellen erheblich vereinfacht und kann besonders effizient gestaltet werden.

Derartige Promotor/Operatorbereiche können in einem Expressionsvektor auch mehrfach vorkommen, so daß ggf. eine unabhängige Expression mehrerer DNA-Sequenzen unter Verwendung nur eines Expressionsvektors ermöglicht wird.

Ein weiterer Gegenstand der vorliegenden Erfindung ist eine Wirtszelle, enthaltend einen oder mehrere erfindungsgemäße(n) Vektor(en), wobei in dieser Wirtszelle unter geeigneten Bedingungen die Expression zu Proteinen erfolgen kann. Geeignete Bedingungen schließen beispielsweise Anwesenheit eines Repressors, Induktors oder eines Derepressors ein.

Für die Transformation, Phageninfektion und Zellkultur existieren Standardprotokolle in Maniatis et al. (Molecular Cloning: A laboratory Manual, Cold Spring Harbor Laboratory Press, N.Y.). Aus der Vielzahl der vorhandenen E. co//-Stämme, die zur Transformation geeignet sind, sind bevorzugt JM101 (ATCC No. 33876), XL1 (Stratagene), RRI (ATCC No. 31343)M15[prep4] (QIAGEN) und BL21 (Pharmacia). Proteinexpression kann z.B. auch geschehen unter Zuhilfenahme des E. coli Stammes INVαF' (Invitrogen).

Die Transformanten werden unter den geeigneten Wachstumsbedingungen des Wirtsstammes kultiviert. So werden die meisten E. co//-Stämme z.B. in LB- Medium bei 30°C bis 42°C bis zur logarithmischen oder stationären Wachstumsphase kultiviert. Die Proteine können aus einer transformierten Kultur gereinigt werden, wobei dies entweder aus einem Zellpellet, nach Zentrifugation, oder aber aus der Kulturlflüssigkeit geschehen kann. Sofern die Proteine aus dem Zellpellet gereinigt werden, werden die Zellen in einem geeigneten Puffer resuspendiert und mittels Ultraschallbehandlung, enzymatischer Behandlung oder Einfrieren und Auftauen aufgebrochen. Sofern die Reinigung aus der Kultursuspension geschieht, sei es ohne oder mit einem Fusionsprotein, wird der Überstand von den Zellen mittels bekannter Verfahren, wie Zentrifugation abgetrennt.

Die Trennung und Reinigung der Proteine der erfindungsgemäßen Komplexe entweder aus dem Überstand der Kulturlösung oder aus dem Zellextrakt kann durch bekannte Separations- oder Reinigungverfahren geschehen. Diese Methoden sind z.B. solche, die die Löslichkeiten betreffen, wie Salzfällungen und Lösungsmittelfällungen, Methoden, die sich die unterschiedlichen Molekulargewichte zunutze machen, wie Dialyse, Ultrafiltration, Gelfiltration, und SDS-Polyacrylamidgelelektrophorese, Methoden die sich die unterschiedlichen Ladungen zunutze machen, wie lonenaustauschchromatographie, Methoden die sich die unterschiedliche Hydrophobie zunutze machen, wie reverse-phase HPLC (High Performance Liquid Chromatography), Methoden, die sich bestimmte Affinitäten zunutze machen, wie Affinitätschromatographie (Beispiel 6, 7 Fig. 24 und Fig. 25), und Methoden, die sich Unterschiede im isoelektrischen Punkt zunutze machen, wie isoelektrische Fokussierung. Es ist auch vorstellbar, daß Zellextrakte, entweder aus dem Organismus, welcher das Gen des akzessorischen Komplexes trägt, gemacht werden können, welcher die erfindungsgemäße Aufgabe erfüllt, oder aus dem rekombinanten Wirtsorganismus, z.B. E. coli. Mit diesen Extraktionen könnte man andere Reinigungsschritte vermeiden.

Die oben beschriebenen Verfahren können in einer Vielzahl von Kombinationen eingesetzt werden, um die Proteine des in w^'r/o-Komplexes bereitzustellen.

Elongation von Nukleinsäuren

Der erfindungsgemäße thermostabile in v/ o-Komplexe kann zur Elongation von Nukleinsäuren verwendet werden, z. B. zur Polymerase-Ketten-Reaktion, (Beispiel 3, 4, sowie Fig. 21 ; Fig. 22) DNA-Sequenzierung, zur Markierung von Nukleinsäuren und anderen Reaktionen, die die in vitro Synthese von Nukleinsäuren beinhalten.

Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wobei die Nukleinsäure nötigenfalls denaturiert, mit mindestens einem Primer unter Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend komplementär zu einem flankierenden Bereich einer gewünschten Nukleinsäuresequenz des Template-Strangs ist und mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-Elongation erfolgt, wobei als Polymerase ein erfindungsgemäßer thermostabiler in w^'f/o-Komplex eingesetzt wird.

Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, bei denen die Elongation ausgehend von einem Primer erfolgt, der an die Template- Nukleinsäure anhybridisiert wurde und ein freies 3'-OH-Ende für die Elongation zur Verfügung stellt, sind dem Fachmann bekannt. Zur Amplifikation wird insbesondere eine PCR-Polymerasekettenreaktion durchgeführt.

Reverse Transkription

Es ist auch die Anwendung des erfindungsgemäßen thermostabilen in-vitro- Komplexes in der reversen Transkription möglich, wobei entweder der erfindungsgemäße Komplex selbst Reverse-Transkriptase-Aktivität besitzt, oder aber zusätzlich ein geeignetes Enzym hinzugefügt wird, das eine Reverse-Transkriptase-Aktivität aufweist, unabhängig davon ob der thermostabile in ϊra-Komplex selbst eine Reverse-Transkriptase-Aktivität hat.

Zur erfindungsgemäß bevorzugten reversen Transkription von RNA in DNA wird ebenfalls ein erfindungsgemäßer thermostabiler in w^'fro-Komplex eingesetzt, wobei dessen Elongationsprotein selbst eine Reverse Transkriptase-Aktivität aufweist. Diese Reverse Transkriptase-Aktivität kann die einzige Polymeraseaktivität des Elongationsproteins sein, kann aber auch zusätzlich zu einer vorhandenen 5'-3'-DNA-Polymeraseaktivität vorliegen. Eine erfindungsgemäß bevorzugte Ausführungsform des in w^'fro-Komplex umfaßt das Elongationsprotein aus dem Organismus Carboxydothermus hydrogenoformans, wie offenbart in EP-A 0 834 569.

Sequenzierung Eine weitere bevorzugte Verwendung des erfindungsgemäßen in vi^'tro- Komplexes ist die Sequenzierung von Nukleinsäuren gemäß der Methode von Sanger. Ausgehend von mindestens einem Primer, der zu einem Teil der zu sequenzierenden Nukleinsäure hinreichend komplementär ist, wird eine Template-abhängige Elongation vorgenommen. Im Falle der Sequenzierung von RNA ist es nötig, eine reverse Transkription durchzuführen. Als Deoxynukleotide oder Dideoxynukleotide werden im Rahmen dieser bevorzugten Ausführungsform auch die oben beschriebenen jeweiligen Derivate als geeignet angesehen. Insbesondere ist es für die erfindungsgemäßen Verfahren zur Elongation von Nukleinsäuren bevorzugt, daß die gebildeten Nukleinsäuren markiert werden. Hierzu ist es möglich, markierte Primer und/oder markierte Deoxynukleotide und/oder markierte Dideoxynukleotide und/oder markierte Ribonukleotide oder jeweils entsprechende Derivate, wie sie oben bereits beispielsweise beschrieben sind, einzusetzen.

Markierung von Nukleinsäuren

Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Markierung von Nukleinsäuren, z.B. durch Einfügung einzelner Brüche in Phosphodiesterbindungen der Nukleinsäurekette und Ersatz eines Nukleotids an den Bruchstellen durch ein markiertes Nukleotid mit Hilfe einer Polymerase, wobei als Polymerase ein erfindungsgemäßer thermostabiler in w^'fro-Komplex eingesetzt wird.

Ein bevorzugtes Verfahren stellt das allgemein als Nick-Translation bezeichnete Verfahren dar, das eine einfache Markierung von Nukleinsäuren ermöglicht. Alle oben bereits beschriebenen markierten Ribonukleotide oder Deoxyribonukleotide oder Derivate davon sind hierfür geeignet, solange die Polymerase sie als Substrat akzeptiert. Markierung im vorstehenden Sinne ist auch eine Markierung, die im Rahmen einer PCR-Reaktion erfolgt, wobei in diesem Fall markierte Nukleotide oder Derivate davon in die Nukleinsäuresequenz eingebaut werden.

Gegenstand der vorliegenden Erfindung ist ebenfalls ein Kit zur Elongation und/oder Amplifikation und/oder Reversen Transkription und/oder Sequenzierung von Nukleinsäuren, wobei dieser Kit ein oder mehrere Behälter umfassen kann.

Der Kit selbst umfaßt a) einen erfindungsgemäßen thermostabilen in w^'fro-Komplex oder b) einen thermostabilen in w^'fro-Komplex und ggf. separat davon ein Polymeraseaktivität aufweisendes Elongationsprotein sowie ggf. eine oder mehrere der Komponenten, die ausgewählt sind aus der Gruppe, die Primer, Puffersubstanzen, Nukleotide, ATP, andere Kofaktoren und Pyrophosphatase umfaßt.

Dabei ist es möglich, daß der erfindungsgemäße thermostabile in w^'fro- Komplex in besagtem Kit in Form seiner Einzelbestandteile, das heißt als thermostabiles Gleitklammerprotein sowie thermostabiles Elongationsprotein vorliegt, getrennt oder vereint in einem Behältnis, und sich als solches erst zu einem späteren Zeitpunkt ausbildet.

Insbesondere ist Gegenstand der vorliegenden Erfindung ein Kit zur Elongation, Amplifikation, Reversen Transkription, Markierung bzw. Sequenzierung von Nukleinsäuren, wobei zusätzlich Deoxynukleotide bzw. deren Derivate enthaltend sind.

Gegebenenfalls können in dem erfindungsgemäßen Kit auch Ribonukleotide oder Derivate davon umfaßt sein, nämlich dann, wenn ein Elongationsprotein eingesetzt wird, das Ribonukleotide als Substrat akzeptiert. Eine bevorzugte Ausführungsform des erfindungsgemäßen Kits ist ein Kit zur Sequenzierung von Nukleinsäuren, wobei zusätzlich zu Deoxynukleotiden bzw. deren Derivaten, Dideoxynukleotide bzw. deren Derivate zur Kettentermination umfaßt sind.

Desweiteren ist insbesondere Gegenstand der vorliegenden Erfindung ein Kit zur reversen Transkrition von Nukleinsäuren, wobei entweder der erfindungsgemäße Komplex selbst reverse Transkriptase-Aktivität besitzt, oder aber zusätzlich ein geeignetes Enzym anwesend ist, das reverse Transkriptase-Aktivität besitzt, wobei Deoxynukleotide bzw. deren Derivaten im Reaktionsgemisch enthalten sein können.

In einer weiteren besonders bevorzugten Ausführungsform enthält der Kit Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide und/oder Ribonukleotide und/oder deren jeweilige Derivate in markierter Form.

Insbesondere für die Sequenzierung von Nukleinsäuren ist es nötig, eine Markierung einzufügen. Geeignete Markierungen sind weiter oben bereits in beispielhafter Form beschrieben. Geeignete Markierungsmittel sind in einer bevorzugten Ausführungsform des erfindungsgemäßen Kits umfaßt.

Im Rahmen der vorliegenden Erfindung ist es weiterhin möglich, daß der Kit (hierin auch als Reagenzienkit bezeichnet) zur Markierung von Nukleinsäuren eingesetzt wird. In diesem Fall enthält der Reagenzienkit die Bestandteile a) oder b) und markierte Nukleotide, wobei Puffersubstanzen, ATP oder andere Kofaktoren und/oder Pyrophosphatase ebenfalls anwesend sein können. Insbesondere ist ein Kit bevorzugt, der einen geeigneten Puffer umfaßt, wie oben beschrieben. Bevorzugt ist ebenfalls, daß der erfindungsgemäße Kit zusätzlich eine Pyrophosphatase, ATP und/oder andere Kofaktoren umfaßt.

Gegenstand der vorliegenden Erfindung ist desweiteren die Verwendung eines thermostabilen Gleitklammerproteins in in vitro Verfahren zur Elongation, Amplifikation, Markierung bzw. Sequenzierung oder reversen Transkription von Nukleinsäuren.

Der erfindungsgemäße thermostabile in w^'fro-Komplex kann zu Zwecken der Sequenzierung, Amplifikation, reversen Transkription und dergleichen sowohl mit kurzen als auch mit langen Nukleinsäurefragmenten verwendet werden, wobei insgesamt eine verringerte Fehlerhäufigkeit

(Nukleotidfehlinkorporation) gegenüber der Verwendung thermostabiler Elongationsproteine alleine erreicht wird.

In einer bevorzugten Alternative wird der thermostabile in w^'fro-Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen Transkription von langen Nukleinsäurefragmenten verwendet.

In einer weiteren bevorzugten Alternative wird der thermostabile in w^'fro- Komplex zu Zwecken der Sequenzierung, Amplifikation und reversen Transkription von solchen Nukleinsäurefragmenten verwendet, die Sekundärstruktur ausbilden.

Die folgenden Beispiele sollen in Verbindung mit den Figuren die Erfindung näher erläutern und Vorteile veranschaulichen:

Figuren: lm folgendenden werden häufig Sequenznamen verwendet, unter denen die Protein- oder Nukleinsäuresequenzen in der Genbank und der EMBL Datenbank stehen. Dabei zeigt:

Fig. 1 tabellarisch Proteinsequenznamen des erfindungsgemäßen in w^'fro-Komplexes, sowie Werte aus paarweisen Alignments und multiplen Alignments zwischen Archaebakterien und zwischen Archaebakterien und den entsprechenden humanen Genen;

Fig. 2 eine Tabelle ähnlich der von Fig. 1 , jedoch beschränkt auf

Gleitklammerprotein und Elongationsprotein von E. coli und A. aeolicus;

Fig. 3 eine schematische Dartstellung des erfindungsgemäßen thermostabilen in w^'fro-Komplexes;

Fig. 4 Alignments zweier konservierter Regionen des

Gleitklammerproteins;

Fig. 5 ein Alignment einer konservierten Region des Kopplungsproteins;

Fig. 6 ein Alignment einer konservierten Region des

Gleitklammerladers;

Fig. 7 ein Alignment einer konservierten Region des

Gleitklammerladers 2;

Fig. 8 ein Alignment einer konservierten Region des

Elongationsproteins 1 ; Fig. 9 ein Alignment einer konservierten Region des

Elongationsproteins 2;

Fig. 10 ein Alignment einer konservierten Region des Elongationsproteins aus Eubakterien;

Fig. 11 ein Alignment einer konservierten Region der Gleitklammer aus

Eubakterien;

Fig. 12 bis 19 multiple Alignments verschiedener Proteinsequenzen zur

Generierung von Hidden Markov Modellen (HMM);

Fig. 20 eine chromatographische Analyse einer rekombinanten

Gleitkammer (Archaeoglobus fulgidus PCNA (AF 0335));

Fig. 21 und 22 das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w^'fro-Komplexes ist;

Fig. 23 den Vergleich der Aktivität eines Elongationsproteins mit und ohne Gleitklammerprotein;

Fig. 24 das Resultat der Reinigung eines Gleitklammerproteins;

Fig. 25 die Expression und Reinigung der Archaeoglobus fulgidus-

DNA-Polymerase;

Fig. 26 die Ergebnisse der Verwendung eines erfindungsgemäßen in w^'fro-Komplexes in der PCR;

Fig. 27 die Ergebnisse eines Y2H Experimentes; Fig. 28 das PCR-Amplifikationsergebnis des humanen Kollagen-Gens unter Verwendung des erfindungsgemäßen thermostabilen in w^'fro-Komplex

Fig. 29 eine tabellarische Übersicht derjenigen Gene, wie sie den in

Fig. 1 angegebenen Proteinsequenznummern entsprechen und aus den jeweiligen Datenbanken erhalten werden können; und

Fig. 30 eine tabellarische Darstellung der Hintergrundinformation zu den verschiedenen Datenbanken in englischer Sprache, aus denen die hierin angegebenen Nukleinsäuresequenz- und Aminosäuresequenzdaten erhalten werden können.

Detaillierte Beschreibung der Figuren

Fig. 1 :

Figur 1 listet tabellarisch Proteinsequenznamen des erfindungsgemäßen thermostabilen in w^'fro-Komplexes auf sowie Werte aus paarweisen Alignments und multiplen Alignments zwischen Archaebakterien und zwischen Archaebakterien und den entsprechenden humanen Genen. Hierbei bedeutet die Annotation „^1" die Prozentidentität (%) zu dem entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „^2" Prozentidentität zu dem entsprechneden Gen von Archaeoglobus fulgidus, berechnet aus dem paarweisen Alignment (siehe Figuren) mit BLASTP 2.0.4 [Feb-24-1998] und die Annotation „^3" Prozenzidentität zu dem entsprechneden humanen Gen, berechnet aus dem paarweisen Alignment mit FASTA 3.1t02 [March, 1998]^§. Die Verfahren werden näher beschrieben in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402 und W.R. Pearson & DJ. Lipman Proc. Natl. Acad. Sei. (1988) 85:2444-2448. Die Fig. 1 zeigt im Falle des Gleitklammerladers 1 , des Gleitklammerlader 2, des Gleitklammer, des Kopplungsprotein und des Elongationsprotein 1 die Sequenznamen aus den Datenbanken und ebenso deren SEQ ID Nummer, wobei die Werte in den Klammern jeweils Prozent Identät je Anzahl Aminosäuren darstellen. Im Falle des Elongationsprotein 2 beziehen sich die Werte auf Prozent Sequenzidentität zu der Archaeoglobus fulgidus- Sequenz. Auch hier sind die Sequenznamen aus den Datenbanken und ebenso deren "SEQ ID No." gezeigt.

Fig. 2:

Fig. 2 zeigt Proteinsequenzen, paarweise Alignments und multiple Alignments aus Eubakterien des Replikationsapparates. Wobei die Annotation ¹ %ldentität zu dem entsprechneden Gen aus E. coli bedeutet, berechnet aus dem paarweisen Alignment (siehe Anhang) mit BLASTP 2.0.4 [Feb-24-1998]#. Das Verfahren wird in: Altschul, Stephen F., Thomas L. Madden, AIejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402, näher beschrieben.

Fig. 3:

Fig. 3 zeigt eine Skizze einer möglichen Form des erfindungsgemäßen thermostabilen in w^'fro-Komplexes, wobei die Gleitkammer über ein Kopplungsprotein an das Elongationsprotein bindet. Fig. 4:

Fig. 4 zeigt Alignments zweier konservierter Regionen des Gleitklammerproteins, sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: PCNA human (aus SEQ ID NO: 11 ) und die entsprechenden Sequenzen aus Archaeoglobus fulgidus (aus SEQ ID NO: 12), aus Methanococcus janashii (aus SEQ ID NO: 13), aus Pyrococcus horikoschii (aus SEQ ID NO: 14) und aus Methanococcus thermoautothrophicus (aus SEQ ID NO: 15).

Fig. 5:

Fig. 5 zeigt ein Alignment einer konservierten Region des Kopplungsproteins sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: PfuORF2, DPD2JHUMAN, AF1790 und MJ0702. Die SEQ ID Nummern können Fig. 1 entnommen werden.

Fig. 6:

Fig. 6 zeigt ein Alignment einer konservierten Region der koppelnden Untereinheit sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AC11_HUMAN, AF2060 , MTH0241 , PHBN012 und MJ1422. Die SEQ ID Nummern können Fig. 1 entnommen werden.

Fig. 7:

Fig. 7 zeigt ein Alignment einer konservierten Region des Gleitklammerlader 2 sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AC15_HUMAN, MJ0884 , AF1195, MTH0240 und MTH0240. Die SEQ ID Nummern können Fig. 1 entnommen werden. Fig. 8:

Fig. 8 zeigt ein Alignment einer konservierten Region des Elongationsproteins 1 , sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DPODJHUMAN, MJ0885 , MTH1208, PHBT047und DPOL_ARCFU. Die SEQ ID Nummern können Fig. 1 entnommen werden.

Fig. 9:

Fig. 9 zeigt ein Alignment einer konservierten Region des Elongationsproteins 2, sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AF1722, MJ1630 , PfuORF3, MTH1536 und PHBN021. Die SEQ ID Nummern können Fig. 1 entnommen werden.

Fig. 10:

Fig. 10 zeigt ein Alignment einer konservierten Region des Elongationsproteins aus Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3A_HELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimuhum).

Fig. 11 :

Fig. 11 zeigt ein Alignment einer konservierten Region der Gleitklammer aus Eubakterien sowie die daraus hergeleiteten Konsensussequenzen. Folgende Gene sind gezeigt: AAPOL3B, DP3B_ECOLI, S.TYPHIM, DP3B_PROMI, DP3B_PSEPU und DP3B_STRC0 (AAP0L3B: Aquifex aeolicus Sektion 93: DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicoloή.

Fig. 12:

Fig. 12 zeigt ein multiples Alignment der Gleitklammerprotein-Sequenzen zur Generierung des HMM.

Fig. 13:

Fig. 13 zeigt ein multiples Alignment der eubakteriellen Gleitklammerprotein- Sequenzen zur Generierung des HMM (AAPOL3B: Aqufex Aeolicus Sektion 93: DP3B_ECOLI : DNA Pol III, beta chain, Escherichia coli S.TYPHIM: DNA Pol III, beta chain, Salmonella typhimurium P3B_PROMI : DNA Pol III, beta chain, Proteus mirabilis DP3B_PSEPU: DNA Pol III, beta chain, Pseudomonas putida DP3B_STRCO: DNA Pol III, beta chain, Streptomyces coelicolor).

Fig. 14:

Fig. 14 zeigt ein multiples Alignment der Gleitklammerlader 1- Proteinsequenzen zur Generierung des HMM. Fig. 15:

Fig. 15 zeigt ein multiples Alignment der Gleitklammerlader 2- Proteinsequenzen zur Generierung des HMM.

Fig. 16:

Fig. 16 zeigt ein multiples Alignment der Proteinsequenzen der Kopplungsproteine zur Generierung des HMM.

Fig. 17:

Fig. 17 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine

1 zur Generierung des Hidden Markov Models.

Fig. 18:

Fig. 18 zeigt ein multiples Alignment der Sequenzen der Elongationsproteine

2 zur Generierung des Hidden Markov Models.

Fig. 19:

Fig. 19 zeigt ein multiples Alignment der Sequenzen der eubakteriellen Elongationsproteine zur Generierung des HMM. Folgende Gene sind gezeigt: DP3A_ECOLI: DNA Pol III, alpha subunit, Escherichia coli, BB0579: DNA Pol III, alpha subunit, Borrelia burgdorferi, DP3AJHELPY: DNA Pol III, alpha subunit, Helicobacter pylori AA50: Aquifex aeolicus, section 50 und DP3A_SALTY: DNA Pol III, alpha subunit, Salmonella typhimurium). Fig. 20: (Beispiel 2)

Fig. 20 zeigt eine chromatographische Analyse von rekombinatem Archaeoglobus fulgidus PCNA (AF 0335):

Rekombinantes Archaeoglobus fulgidus-PCNA (AF 0335) liegt unter nativen Bedingungen als Trimer vor. Fig. 20 A zeigt Proteine mit His-Tag (Histidin- Tag) in den Fraktionen 15 (Spur 1 ), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4), 23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgeführten Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1), 11 (Spur 2), 12 (Spur 3), 13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur 7),17 (Spur 8), der in Anwesenheit von Harnstoff durchgeführten denaturierenden Chromatographie.

Fig. 21 : (Beispiel 3)

Fig. 21 zeigt das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w^'fro-Komplexes ist:

Jeweils 1 μl (Spur 4), 2,5 μl (Spur 5) und 5 μl (Spur 6) Pyrococcus horikoshii DNA-Polymerase (PH1947; Grobextrakt s. Fig. 25) wurden zum Aktivitätsvergleich mit 1 Einheit Taq Polymerase (Spur 2) und 1 μl Archaeoglobus fulgidus DNA-Polymerase (AF 0497)-Grobextrakt (s. Fig.25) (Spur 3) individuell in Standard PCR Reaktionen eingesetzt.; Spur 1 zeigt einen DNA-Größenmarker (New England Biolabs; Mischung aus 1 kb DNA ladder und 100 bp DNA ladder).

Fig. 22: (Beispiel 4)

Fig. 22 zeigt das Ergebnis einer PCR unter Verwendung eines Elongationsproteins, wie es Bestandteil eines erfindungsgemäßen thermostabilen in w^'fro-Komplexes ist:

Proben der PCR mit Archaeoglobus fulgidus DNA-Polymerase AF 0497 wurde nach unterschiedlichen Zyklenzahlen (Z) entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt. Spur 2: 16Z; Spur 3:21 Z; Spur 4: 26Z; Spur 5: 28Z; Spur 6. 30Z; Spur 7: 32Z; Spur 8: 34Z; Spur 9: 36Z; Spur 10: 38Z; Spur 11 : 40Z; Spur 1 zeigt einen DNA Größenmarker (New England Biolabs; Mischung aus 1 kb DNA ladder und 100 bp DNA ladder). Der obere Abschnitt zeigt Reaktionsprodukte der Taq Polymerase; der untere Abschnitt zeigt Reaktionsprodukte der Archaeoglobus fulgidus DNA-Polymerase AF 0497.

Fig. 23: (Beispiel 5)

Fig. 23 zeigt einen Vergleich der Aktivität eines Elongationsproteins mit und ohne Gleitklammerprotein. Probe 1 repräsentiert einen enzymfreien Ansatz. Proben 2-12 enthielten außerdem je 3μl einer 1 :1000 Verdünnung einer Fraktion von rekombinanter Archaeoglobus /u/gr/divs-DNA-Polymerase (Ausgangskonzentration 7,5 μg/μl). Proben 3-7 sowie 8-12 außerdem 0,5; 1 ; 2; 4 und 8 μl einer Fraktion von rekombinantem Gleitklammerprotein aus Archaeoglobus fulgidus PCNA. Intensitätsauswertung mit AIDA: Intensität Hintergrund Spur 1 : 46,4; Spur 2= 258,5; Spur 3= 164,4; Spur 4= 122,8; Spur 5= 162,1 ; Spur 6= 297,4; Spur 7=359,5

Fig. 24: (Beispiel 6)

Fig. 24 zeigt das Ergebnis der Reinigung eines Gleitklammerproteins: Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500 μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung des Herstellers zum Lauf von NuPage Gelen (NOVEX; Fig. 25) behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta Agarosesäule nach der Dialyse. Durch Reinigung über Ni-NTA- Agarose (Qiagen) werden hochreine Fraktionen des Gleitklammerproteins des Organismus Archaeoglobus fulgidus erhalten (siehe Spuren 4 und 5).

Fig. 25: (Beispiel 7) Fig. 25 zeigt die Expression und Reinigung der Archaeoglobus fulgidus DNA- Polymerase (siehe auch Beispiel 7):

Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta Agarosesäule nach der Dialyse. Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Spuren 4 und 5 zeigen hochreine Fraktionen der Archaeoglobus fulgidus DNA-Polymerase, die durch Reinigung über Ni-NTA- Agarose werden erhalten.

Fig. 26: (Beispiel 8)

In Fig. 26 sind die Ergebnisse der Verwendung eines erfindungsgemäßen in w^'fro-Komplexes in der PCR gezeigt. Spur eins zeigt eine PCR Reaktion ohne Verwendung einer Gleitklammer, wohingegen in der Spur 2 das Ergebnis einer PCR Reaktion unter Verwendung eines Gleitklammerproteins gezeigt ist.

Fig. 27: (Beispiel 9)

Fig. 27 zeigt die Ergebnisse eines „Yeast-Two-Hybrid"-Experiments, hierin als Y2H- Experiment bezeichnet, wobei die Reihe A mit Zellen bestückt ist, die den leeren pGAD424 Vektor (Clontech, Palo Alto, USA) tragen, sodaß die Transkriptions-Aktivierungsdomäne exprimiert wird, die Reihe B mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Sacharomyces cerevesiae-Gen CDC48 als Fusionsprotein mit der Transkriptions-Aktivierungsdomäne exprimiert wird, die Reihe C mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Gleitklammergen aus Archaeoglobus fulgidus als Fusionsprotein mit der Transkriptions- Aktivierungsdomäne exprimiert wird, die Reihe D nicht mit Zellen bestückt ist und die Reihe E mit Zellen bestückt ist, die den pGAD424 Vektor tragen, von dem das Elongationsproteingen aus Archaeoglobus fulgidus als Fusionsprotein mit der Transkriptions-Aktivierungsdomäne exprimiert wird.

Die Spalte 1 ist mit Zellen bestückt, die den leeren pGBT9 Vektor (Clontech, Palo Alto, USA) tragen, sodaß die DNA-Bindedomäne exprimiert wird, die Spalte 2 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Saccharomyces cerevisiae-Gen UFD3 als Fusionsprotein mit der DNA- Bindedomäne exprimiert wird, die Spalte 3 ist bestückt mit Zellen, die den pGBT9-Vektor tragen, von dem das Gleitklammerprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird, die Spalte 4 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Kopplungsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird und die Spalte 5 ist bestückt mit Zellen, die den pGBT9 Vektor tragen, von dem das Elongationsprotein aus Archaeoglobus fulgidus als Fusionsprotein mit der DNA-Bindedomäne exprimiert wird.

Fig. 28: (Beispiel 10) In Fig. 28 ist das PCR-Amplifikationsergebnis des humanen Kollagen-Gens jeweils unter Verwendung des erfindungsgemäßen thermostabilen in w^'fro- Komplexes und ohne diesen dargestellt. Das erwartete Amplifikat hat in beiden Fällen eine Größe von etwa 1 Kb. Spur 1 zeigt einen Molekulargewichtsmarker, Spur 2 zeigt das Ergebnis der Amplifikation unter Verwendung eines erfindungsgemäßen Elongationsproteins ohne Gleitklammer und Spur 3 zeigt das Ergebnis der Amplifikation unter Verwendung des erfindungsgemäßen thermostabilen in w^'fro-Komplexes.

Beispiele:

Die Erfindung wird durch die folgenden Beispiele näher beschrieben, ist aber nicht auf diese beschränkt.

Beispiel 1 :

Die DNA wird mittels der bekannten Verfahren aus dem Organismus Archaeoglobus fulgidus (DSM No. 4304) gereinigt. Die Aufzucht der Organismen erfolgte hierbei durch die DSM (Deutsche Sammlung für Mikroorganismen). Um die entsprechenden Gene (Gleitklammerlader 1/2, Gleitklammer, Elongationsproteine 1/2, koppelnde Untereinheit) in die Expressionsvektoren pTrc99 und pQE30 zu klonieren, werden für jedes Gen Primer entwickelt, die den vollständigen offenen Leserahmen samt Stopcodon umspannen. Nur für die Klonierung in pTRC99 ist in den Primer- Sequenzen ebenfalls das Startcodon enthalten. Die entsprechenden Primer zur Klonierung in pQE30 enthalten die dem Startcodon unmittelbar folgenden Nukleotide als erste genspezifische Sequenzen. Hierbei werden den Primern jeweils Restriktionsenden hinzugefügt, die die gerichtete Klonierung in den Expressionsvektor erleichtern. Unter Verwendung von etwa 200 ng gesamtgenomischer DNA werden mit den entsprechenden Annealing- Temperaturen PCR-Reaktionen gefahren (etwa 35 Zyklen) und die daraus resultierenden Produkte gereinigt. Nach der Reinigung werden die Produkte mit Restriktionsenzymen behandelt und über ein Agarosegel gereinigt, um zur Ligation bereit zu stehen. Der Expressionsvektor wird mittels Restriktionsenzymen so linearisiert, gereinigt und verdünnt, daß er zur Ligation mit den Amplifikaten der Gene des erfindungsgemäßen in vitro- Komplexes aus der obigen PCR bereit ist. Die Ligation wird angesetzt und nach Inkubation ein Aliquote in einen der E. coli Stämme INValphaF' (Invitrogen) odert XL1 blue oder M15 [prep4] transformiert. Von jedem Gen werden mindestens 3 positive Kolonien gepickt, Plasmid-DNA präpariert und die Inserts auf Vollständigkeit und Richtigkeit mittels DNA-Sequenzierung überprüft. Korrekte Klone werden ausgesucht und erneut zur Vereinzelung auf Agarplatten (Ampicillin; Ampicillin und Kanamycin) ausgebracht. Kolonien werden gepickt und Übernachtkulturen angesetzt. Ein Aliquot (500 μl) der Übernachtkultur wird in eine ein bis fünf Liter Kultur von LB (Ampicillin: 80 mg/l bzw zusätzlich 25μg/ml Kanamycin für M15 [prep4]Stämme) gegeben. Die Kulturen wachsen bis zu einer OD₆6o von 0.8 bei 37°C. Nun wird zur Induktion IPTG zugegeben (125 mg/l). Diese Kulturen wachsen nun weitere 4-21 Stunden. Die Kulturen werden zentrifugiert und ausgehend von dem Vektor pQE30 exprimierte rekombinante Proteine gemäß protocol 8 und 11 aus „The QIAexpressionist" (Dritte Auflage, QIAGEN) extrahiert und gereinigt. In alternativen Reinigungsprotokollen werden die Pellets in einem Puffer aufgenommen (Puffer A: 50 mM Tris-HCI pH 7.9, 50 mM Dextrose, 1 mM EDTA). Nach Zentrifugation werden die Zellen erneut aufgenommen, jedoch enthält Puffer A nun zusätzlich Lysozym (4 mg/ml). Nach Inkubation (15 min.) wird ein gleiches Volumen Puffer B zugegeben (B: 10 mM Tris-HCI (pH 7.9), 50 mM KCI, 1 mM EDTA, 1 mM PMSF, 0.5 % Tween 20, 0.5 % Nonidet P40) und die Lyse zur Inkubation bei 75°C für eine Stunde gegeben. Nach Zentrifugation wird der Überstand entnommen und die überexprimierten Proteine werden mittels (NH )₂S0₄ ausgefällt. Die Pellets werden nach Zentrifugation gesammelt und die Proteine mit Puffer A resuspendiert. Die resuspendierten Proteine werden gegen Aufbewahrungspuffer (50 mM Tris-HCI (pH 7.9), 50 mM KCI, 0.1 mM EDTA, 1 mM DTT, 0.5 mM PMSF, 50 % Glycerol) dialysiert und anschließend bei +4°C bis -70°C gelagert. Um die Aktivität der Proteine zu testen, werden Reaktionen wie folgt zusammengesetzt. Aliquots der Proteine werden in unterschiedlichen Konfigurationen und Molaritäten vereint, Gleitklammerlader 1/2 mit Gleitklammer, koppelnder Untereinheit und Elongationsprotein 1 , oder Gleitklammerlader 1/2 mit Gleitklammer, mit und ohne koppelnder Untereinheit und Elongationsprotein 2, oder Gleitklammer, und Elongationsprotein 1 oder 2 und schließlich nur Elongationsprotein 1 oder 2; als Puffer dient der obige Aufbewahrungspuffer. DNA- Polymerisationsaktivität wird mittels Inkorporation von (methyl-³H) TTP in Trichlorsäure-unlösliches Material oder mittels Inkorporation von Digoxigenin- dUTP in unmarkierte DNA-Doppelstrangbereiche mit freien internen 3^'- Enden gemessen (Ishino, Y., Iwasaki, H., Fukui, H., Mineno, J., Kato, I., & Schinigawa, H. (1992) Biochimie 74, 131-136). Um die Prozessivität zu bestimmen, werden die obigen Proteingemische in Primer- Elongationsexperimenten verwendet. Ein M13-Einzelstrangtemplate wird in 10 mM Tris-HCI (pH 9.4) eingebracht und gemeinsam mit einem Universal- primer (New England Biolabs) (5'-FITC markiert) erhitzt (92°C) und abgekühlt (Raumtemperatur). Verdünnungsserien des so generierten Template-Primer- Gemisches werden in einer Reaktion bestehend aus Nukleotiden (etwa 200 μM bis 1 mM), Reaktionspuffer (Endkonzentration: 50 mM KCI, 10 mM Tris- HCI (pH 8.3), 1.5-5 mM MgCI₂, ATP (0 mM - 200 mM) und proteinstabilisierenden Agenzien zusammengeführt und für 10 Minuten bei 37°C, 52°, 62°, 68°, 74°, und 78° inkubiert. Ein Aliquot wird zur Analyse auf einen Sequenzautomaten geladen (z.B. Alf, Pharmacie Biotech). Alternativ kann eine qualitative Analyse der Steigerung der Prozessivität auch nach Maga G., Jόnssom Z.O., Stucki M., Spadari S. und Hübscher U.( J. Mol. Biol. 1999; 285: 259-267, Dual Mode of Interaction of DNA-Polymerase ε with Proliferating Cell Nuclear Antigen in Primer Binding and DNA Synthesis) über den Nachweis einer Stimulation des Einbaus von Nukleotiden in Doppelstrangbereiche mit freien internen 3 '-Enden unter geeigneten Reaktionsbedingungen erfolgen (s. Fig. 23) Die obigen Proteingemische dienen auch dazu Fidelity und Exonukleaseaktivität zu messen, wobei die in Kohler et al. (Proc. Natl. Acad. Sei. USA 88:7958-7962 (1991 ) oder Chase et al. (J. Biol. Chem., 249:4545-4552 (1972) beschriebenen Verfahren zur Anwendung kommen. Ebenso werden die Proteingemische in der PCR eingesetzt (Fig. 26; Methods in Molecular Biology Vol. 15 Humana Press Totowa, New Jersey, 1993, edited by Bruce A. White).

Beispiel 2: Trimerisierung von PCNA

In folgenden Experimenten wird gezeigt, daß rekombinantes Archaeoglobus fulgidus PCNA-Protein (AF 0335) unter nativen Bedingungen als Trimer vorliegt und somit eine für die Klammerbildung geignete Struktur einnehmen kann.

Für das in Fig. 20 A abgebildete Experiment wurden 350 μl Ni-NTA Agarose Eluat von PCNA (s. Fig. 24) und 150 μl einer rohen DNA-Polymerase Fraktion (s. Fig. 25) mit Lagerpuffer ohne Glyzerin (s. Fig. 25) auf 1 ml aufgefüllt und nach Vorschrift des Herstellers auf einer Superdex 200 HR (Pharmacia) FPLC Säule im gleichen Puffer die Proteine nach Molekulargewicht aufgetrennt. Es wurden während des gesamten Laufes Fraktionen zu je 1 ml gesammelt. Für das in Fig. 20 B. dargestellte Experiment wurden gleiche Mengen der gleichen Proteinfraktionen in Storagepuffer ohne Glyzerin mit 8 M Harnstoff auf 1 ml aufgefüllt, 10 Minuten bei 95°C denaturiert und anschließend die Proteine im gleichen Puffer wie für Fig. 20 A dargestellt nach Molekulargewicht aufgetrennt. Je 8 μl einzelner Fraktionen wurden anschließend auf einem NuPage Bis-Tris Gel aufgetrennt (NOVEX; s. Fig. 25) und nach Angaben des Herstellers mittels eines Blot-Modules (NOVEX) auf Nitrocellulosemembran geblottet. Der Nachweis von Proteinen mit His-Tag erfolgte nach Angaben der Hersteller mittels des RGS His Antibody (QIAGEN) und des DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim). Fig. 20 A zeigt Proteine mit His-Tag in den Fraktionen 15 (Spur 1), 17 (Spur 2), 19 (Spur 3), 21 (Spur 4), 23 (Spur 5), 25 (Spur 6) der ohne Harnstoff durchgeführten Chromatographie. Fig. 20B zeigt Proteine mit His-Tag in den Fraktionen 10 (Spur 1), 11 (Spur 2), 12 (Spur 3),13 (Spur 4),14 (Spur 5),15 (Spur 6), 16 (Spur 7), 17 (Spur 8) der in Anwesenheit Harnstoff durchgeführten denaturierenden Chromatographie. Archaeoglobus fulgidus DNA- Polymerase (AF0497) hat ein errechnetes Molekulargewicht von Mr = 90 kDa; Archaeoglobus fulgidus-PC A (AF0335) hat ein errechnetes Molekulargewicht von Mr = 27 kDa. Wenn Archaeoglobus fulgidus-PC A (AF 335), wie das homologe Protein aus Eukaryonten, als Homotrimer vorliegt, hat der native Faktor daher ein theoretisches Molekulargewicht von Mr = 81 KDa. Die in Fig. 20A gezeigten Ergebnisse bestätigen diese Annahme, nach der natives PCNA ein ähnliches Molekulargewicht aufweist, wie die DNA- Polymerase, für das rekombinante Protein: Beide Proteine eluieren unter nativen Bedingungen in den gleichen Fraktionen von der Gelfiltrationssäule (Fig 20 A, Spuren 1-3). Das Maximum der PCNA Menge eluiert dabei etwas später als das Maximum der DNA-Polymerasemenge und korelliert mit der etwas geringeren Größe des postulierten Trimers (81 kDa gegenüber 90 KDa). Die in Fig. 20 B gezeigten Daten belegen, daß diese Beobachtung auf einer Oligomerisierung des PCNA beruht, da unter denaturierenden Bedingungen, die Protein/Protein Interaktionen nicht zulassen, PCNA deutlich später von der Säule eluiert als die DNA-Polymerase (Fig. 20 B , Spuren 1-7), was dem geringeren Molekulargewicht des Monomers entspricht.

Beispiel 3: Isolierung, Bereitsstellung und Verwendung eines Elongationsproteins (Pyrococcus horikoshii DNA-Polymerase (PH1947)) zur Ausbildung des erfindungsgemäßen in fro-Komplexes.

Das Elongationsprotein aus Pyrococcus horikoshii (Pyrococcus horikoshii- DNA-Polymerase (PH 1947)) wurde in PCR-Reaktionen verwendet und führt zu effizenter Amplifikation eines spezifischen DNA Produktes. 1 (Spur 4), 2,5 (Spur 5)und 5 μl (Spur 6) Pyrococcus horikoshii DNA- Polymerase (PH1947; Rohextrakt s. Fig. 25) wurden zum Aktivitätsvergleich mit 1 Einheit Taq Polymerase (Spur 2) und 1 μl Archaeoglobus fulgidus-DNA- Polymerase (Af 497) Rohextrakt (s. Fig.25) (Spur 3) individuell in Standard PCR-Reaktionen eingesetzt.; Spur 1 zeigt einen DNA-Größenmarker (New England Biolabs; Mischung aus 1 kb DNA Molekulargewichtsgrößenmarker und 100 bp DNA-Molekulargewichtsgrößenmarker). Jede Reaktion enthielt neben dem Enzym 5 ng template DNA (421 bp Rsa I-Fragment mit Adaptoren in PCR 2.1 kloniert; (Kaiser C, v. Stein O., Laux G., Hoffmann M., Electrophoresis 1999; 20: 261-268, Functional Genomics in Cancer Research: Identification of Target Genes of the Epstein-Barr Virus Nuclear Antigen 2 by Subtractive cDNA Cloning and High-throughput Differential Screening using High-density Agarose Gels); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Adaptor-Primer (Kaiser et al., (1999)); 50 mM KCI; 2 mM MgCI₂; 10 mM Tris HCI (pH 8,3 für Taq-Reaktionen; pH 7,5 für Archaeoglobus fulgidus und Pyrococcus Reaktionen) bei einem Gesamtvolumen von 50 μl pro Reaktion. Die Proben durchliefen 40 Zyklen bestehend aus 30 s bei 95°C; 30 s bei 55°C und 120 s bei 68°C. Anschließend wurden 5 μl der Ansätze entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt.

Beispiel 4: Verwendung eines Elongationsproteins

Die Archaeoglobus fw/g/^'dus-DNA-Polymerase AF 0497 kann PCR-Produkte ebenso effizient wie Taq-Polymerase generieren.1 Einheit Taq-Polymerase und 1 μl Archaeoglobus fu/g/dus-DNA-Polymerase AF 0497 Rohextrakt (s. Fig. 25) wurden zum Aktivitätsvergleich individuell in Standard-PCR- Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym 20 ng M13 MP18 ssDNA; je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM DNA Primer folgender Nukleotidsequenz:

GGATTGACCGTAATGGGATAGGTTACGTT (SEQ ID NO.: 47) bzw AGCGGATAACAATTTCACACAGGAAACAG (SEQ ID NO.: 48) in 50 mM KCI; 2 mM MgCI₂; 10 mM Tris HCI (pH 8,3 für Taq Reaktionen; pH 7,5 für Archaeoglobus fulgidus Polymerase-Reaktionen) bei einem Gesamtvolumen von 50μl pro Reaktion. Die Proben durchliefen eine unterschiedliche Anzahl von Zyklen bestehend aus 30 s bei 95°C; 30 s bei 59°C und 60 s bei 68°C. Nach unterschiedlichen Zyklenzahlen (Z) wurden 5 μl der Ansätze entnommen und auf einem 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris- Acetat; 20 mM Natriumacetat; 10 mM EDTA ; pH 7,2) mit 10V/cm aufgetrennt (Siehe Fig. 22).

Beispiel 5: Bereitssteliung und Verwendung eines erfindungsgemäßen thermostabilen in v/^'fro-Komplexes:

In einem Endvolumen von 50 μl waren unter anderem folgende Komponenten eines erfindungsgemäßen in w^'fro-Komplexes enthalten: 10 mM Tris/HCI pH 7,5; 50 mM KCI; 2 mM MgCI₂; 10 μg BSA (kann auch weggelassen werden); 0,5 mM Digoxigenin-dUTP (DIG-dUTP, Boehringer Mannheim); 40 nM ; 0,5μg Poly dA/40 nM OligodT (20mer) Hybrid. Probe 1 ohne Elongationsprotein. Proben 2-12 enthielten außerdem je 3μl einer 1 :1000 Verdünnung einer Fraktion von rekombinanter Archaeoglobus ftv/g/dus-DNA-Polymerase (Elongationsprotein). Proben 3-7 sowie 8-12 außerdem 0,5; 1 ; 2; 4 und 8 μl einer Fraktion von rekombinantem Gleitklammerprotein aus Archaeoglobus fulgidus.

Die Proben wurden 30 Minuten bei 68°C inkubiert und Nukleinsäuren anschließend durch Präzipitation mit 3 Volumenteilen Ethanol / 3 M Natriumacetat pH 5,2 (30/1 ). Gefällt. Das Präzipitat wurde in 20 μl 100 mM Tris-HCI (pH 7,9) resuspendiert und je 10μl in einzelne Kavitäten einer 96- Well Silent Screen plate with Nylon 66 Biodyne B 0,45μm pore (Nalge Nunc) aufgetropft und die Nukleinsäuren 10 Minuten bei 70°C auf der Membran fixiert. Die Detection von inkorporiertem Digoxigenin-dUTP (Boehringer Mannheim) erfolgte mittels des DIG Luminiscent Detection Kit for Nucleic Acids (Boehringer Mannheim). Zum Nachweis der Chemilumineszenz wurde auf die Membran abschließend für 30 s ein Röntgenfilm aufgelegt. PCNA stimuliert die Einbindung von DIG-dUTP durch die DNA-Polymerase deutlich (vgl. Spuren 3-7 mit Spur 2). Die verwendete PCNA- Fraktion weist keine endogene Polymeraseaktivität auf (Spuren 8-12).

Beispiel 6: Amplifikation; Klonierung, Expression und Reinigung eines

Gleitkiammerproteins aus Archaeoglobus fulgidus:

Nach Amplifikation des erfindungsgemäßen Gleitklammerprotein Gens aus Archaeglobus fulgidus wurde das Gen in die Expressionsvektoren pTrc99 und pQE30 kloniert. Die Expression, Reinigung und gelelektrophoretische Auftrennung von Archaeoglobus fulgidus-Gleitklammerprotein (PCNA (AF 0335)) erfolgte, wie für das Elonagationsprotein (die DNA-Polymerase AF 0497) in Fig. 25 dargestellt.

Beispiel 7: Bereitstellung eines Elongationsproteins Expression und Reinigung der Archaeoglobus fu/g/dus-DNA-Polymerase: pQE 30 Plasmid-DNA (QIAGEN) mit in korrektem Leseraster inseriertem Gen für das Elongationsprotein, die Archaeoglobus fulgidus DNA- Polymerase AF 0497, wurde nach Anleitung aus "The QIAexpressionist (dritte Auflage; QIAGEN)" in kompetente E.coli M15 [prep 4] transformiert. Übertragung auf 1 L Kulturmedium und induzierte Proteinexpression erfolgte ebenfalls nach den dort vorgegebenen Schemata. Nach 16 Stunden Induktionszeit wurden die Bakterien 10 Minuten bei 5000 g sedimentiert. Zum Erhalt hochreiner Fraktionen wurde gemäß The QIAexpressionist (dritte Auflage; QIAGEN; protocol 8, protocol 11 ) verfahren. Lediglich die Elution der gebundenen Proteine erfolgte mit 2 x 2 ml Elutionspuffer und nicht wie dort beschrieben mit 4 x 0,5 ml Elutionspuffer. Zum Erhalt von Rohextrakten rekombinanter Proteine wurden die Bakteriensedimente alternativ mit 100 ml Puffer A (50 mM Tris-HCI pH 7,9; 50 mM Glukose;1 mM EDTA) gewaschen und nach erneuter Zentrifugation in 50 ml Puffer A mit 4mg/ml Lysozym resuspendiert. Nach 15 Minuten bei Raumtemperatur erfolgte die Zugabe von 50 ml Lysepuffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA; 0,5% Tween 20; 0,5% IGPAL) und E. coli-Proteine wurden durch 60-minütige Inkubation bei 75°C im Wasserbad denaturiert. Nach anschließender Zentrifugation für 15 Minuten bei 27000 g wurde der Überstand durch langsame unter permanentem Rühren erfolgte Zugabe von 40 mg kristallinem Ammoniumsulfat pro ml Extrakt präzipitiert. Präzipitierte Proteine wurden 10 Minuten bei 27000 g sedimentiert und das Sediment in 20 ml Puffer A resuspendiert. Sowohl diese Rohextrakte als auch die Elutionsfraktionen aus der Ni NTA-Agarose wurden je 2-mal 8 Stunden gegen mindestens je 50 Volumenteile Lagerpuffer (Puffer (10 mM Tris-HCI pH 7.9; 50 mM KCI; 1 mM EDTA; 50% Glyzerin; 1 m>M Dithiothreitol; 0,5 mM Phenylmethylsulfonylfluorid) dialysiert und bei -20°C aufbewahrt. Zur Analyse der Proteinzusammensetzung der erhaltenen Fraktionen wurden Teile davon nach Anweisungen des Herstellers auf NuPAge™ 10% Bis-Tris Gelen (NOVEX) elektrophoretisch aufgetrennt und die enthaltenen Proteine mit Coomassie brilliant blue angefärbt. Spur 1 zeigt einen Molekulargewichtsstandard ((BIO RAD Cat Nr 161-0317). Für Spur 2 wurden 500μl Bakterien direkt vor der Induktion sedimentiert, gemäß der Anweisung zum Lauf von NuPage Gelen behandelt und aufgetragen. Spur 3 zeigt die gleiche Menge Bakterien 16 Stunden nach der Elution. Spuren 4 und 5 zeigen je 8μl der beiden Eluate der Ni-Nta-Agarosesäule nach der Dialyse. Spur 6 zeigt 8 ml eines dialysierten Grobextraktes. Durch Reinigung über Ni- NTA-Agarose werden hochreine Fraktionen der Archaeoglobus fulgidus DNA-Polymerase erhalten (Spuren 4 und 5). Aber bereits im Grobextrakt stellt dieses Enzym das dominierende Polypeptid dar. i

- 65 -

Beispiel 8: Verwendung eines erfindungsgemäßen in vitro Komplexes in der PCR

Der Einsatz von Archeoglobus fulgidus PCNA (AF 0335) in PCR Reaktionen mit Archeoglobus fulgidus DNA-Polymerase (AF 0497) führt zu einer effizienteren Amplifikation eines spezifischen DNA-Produkts im Vergleich zu einer PCR-Reaktion ohne PCNA. Die Auswertung der amplifizierten DNA- Mengen laut AIDA (Advanced Image Data Analyzer, Software Version AIDA 2.1 , Firma Raytest) zeigt einen Hintergrund von 94, eine Wert von 104,9 für Spur 1 und einen Wert von 228,4 für Spur 2. Zieht man von den Werten aus den Spuren 1 und 2, den Hindergrund ab, folgt daraus eine 12,3-fache prozessive Stimulation durch PCNA in der Reaktion dessen Ergebnis in Spur 2 gezeigt ist.

0,3 μl Archeoglobus fu/g/dus-DNA-Polymerase (7.5 μg/μl Proteinkonzentration von AF497; Rohextrakt siehe Fig. 25) wurden zur Analyse einer Stimulation der PCR-Aktivität durch Archeoglobus fulgidus- PCNA (NiNTA Eluat; Fig.24) mit 0 μl und 0,01 μl individuell in PCR Reaktionen eingesetzt. Jede Reaktion enthielt neben dem Enzym und 0,05 μl (2.8 μg) des Gleitklammerproteins von Archaeglobus fulgidus (homolog zu proliferating-cell-nuclear antigen, PCNA) eines mittels PCR amplifizierten und nicht aufgereinigten PCNA-Gen-Fragments (PCR Reaktion zur spezifischen Amplifikation des PCNA-Fragments: 0,5 μl Archeoglobus fulgidus Polymerase; je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Primer (5^'-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 49); 5^'-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ ID No.:50); 50 mM KCI; 2 mM MgCI₂; 10 mM Tris-HCI (pH 7,5) sowie 50 ng eines pQE30 Plasmids, das die kodierenden Sequenzen von Archaeoglobus fulgidus PCNA in die BamHI- und Kpn I- Restriktionsstellen insertiert trägt, bei einem Gesamtvolumen von 50 μl pro Reaktion und bei einer Zyklenzahl von 40 bestehend aus 30 s bei 95°C; 30 s bei 61 °C; 240 s bei 68°C); je 0,2 mM dATP, dTTP, dCTP und dGTP; je 1 ,5 μM der spezifischen Primer

(5'-ACG CGC GGA TCC ATA GAC GTC ATA ATG ACC GG-3' (SEQ ID No.: 51 ); und 5'-TAC GGG GTA CCC GAG CCA AAA TTG GGT AAA G-3' (SEQ ID No.: 52); 50 mM KCI; 2 mM MgCI₂; 10 mM Tris HCI pH 7,5 bei einem Gesamtvolumen von 50 μl pro Reaktion. Die Proben durchliefen 40 Zyklen bestehend aus 30s bei 95°C; 120s bei 61 °C; 240s bei 68°C. Anschließend wurden 5 μl der Ansätze entnommen und auf ein 1 % Agarosegel in 1 x TAE Puffer (40 mM Tris-Acetat; 20 mM Natriumacetat; 10 mM EDTA; pH 7,2) mit 10 V/cm aufgetrennt.

Beispiel 9: Y2H-Experimente:

Interaktionen von Proteinen des erfindungsgemäßen Komplexes aus Archaeoglobus fulgidus wurden mit dem Y2H-System gezeigt. Die kodierenden Bereiche von Genen aus Archaeoglobus fulgidus, deren Genprodukte im erfindungsgemäßen thermostabilen in w^'fro-Komplex verwendeten werden, wurden mittels PCR amplifiziert, in die Vektoren pGBT9 (vertikale Spalten der Fig. 27) und pGAD424 (horizontale Reihen der Fig. 27) kloniert und durch gap-repair in Hefe PJ69-4a (für pGAD424) und PJ69-4alpha (für pGBT9) als Hybridproteine zur Expression gebracht. Ebenso wurde eine positive Kontrolle mittels PCR amplifiziert, in die Vektoren pGBT9 (siehe auch vertikale Spalten der Fig. 27) und pGAD424 (siehe auch horizontale Reihen der Fig. 27) kloniert und durch gap-repair in den Hefestamm PJ69-4a (für pGAD424) und PJ69-4alpha (für pGBT9) als Hybridproteine zur Expression gebracht. Diploide Zellen, die beide Vektoren enthalten, wurden durch Paarung entsprechend dem gezeigten Raster in Fig. 27 erzeugt. Die Expression von drei unabhängigen Reportern (HIS3, ADE2 und MEL1) wurde gemessen. Gezeigt ist in Fig. 27 das Wachstum auf Medium ohne Histidin und Adenin. In diesem Experiment wachsen jene Zellen, die beide Vektoren tragen und in dessen zudem die Expressionsprodukte dieser beiden Vektoren einander binden. In Folge der Bindung der Expressionsprodukte wird Transkription der Reportergene initiiert, so daß die Histidin- und Adenin-Auxotrophie aufgehoben wird und diese Zellen in der Lage sind in besagtem Medium zu wachsen.

Alle hier positiven Klone waren auch positiv bezüglich der Expression des MEL ' -Gens. Die Handhabung des yeast two-hybrid (Y2H)systems erfolgte gemäß der Anleitung der Firma Clontech (yeast protocols handbook, PT3024-1 ). Fig. 27 zeigt eine Bindung zwischen den Proteinen der Positivkontrolle, dem Elongationsprotein und dem Gleitklammerprotein, dem Gleitklammerprotein und dem Gleitklammerprotein und dem Kopplungsprotein und dem Gleitklammerprotein.

Beispiel 10: Verwendung eines erfindungsgemäßen thermostabilen in vitro-Komplexes:

Der erfindungsgemäße thermostabile in w^'fro-Komplex läßt sich sehr gut bei der Amplifikation von genomischen DNA Fragmenten einsetzen. Hierbei kommt es auch bei Verwendung von geringen Mengen eines Templates oder eines Elongationsproteins zu effizienter Amplifikation. In Beispiel 10 wurde eine Abschnitt des humanen Kollagen-Gens amplifiziert, einmal unter Verwendung des erfindungsgemäßen thermostabilen in w^'fro-Komplexes und einmal unter Verwendung eines Elongatiosnproteins alleine. In einem Gesamtvolumen von 50 μl wurden 0,5 μl Nukleotidmix (25 mM Ausgangslösung beinhaltend jedes Nukleotid A, C, G und T), 0,2 μl jedes Primers (100 pmol/μl Ausgangslösung "Collagen Forward" 5'-TAA AGG GTC ACC GTG GCT TC-3' (SEQ ID NO.: 53), 100 pmol/μl Ausgangslösung "Collagen Reverse" 5'- CGA ACC ACA TTG GCA TCA TC-3' SEQ ID NO.: 54), 0,8 μl DNA (200 ng/μl human genomic DNA von Boehringer Mannheim), 5 μl 10 x PCR Puffer (pH 7.5) (100mM Tris-HCI pH7.5, 500 mM KCI,15 mM MgCI₂), 1 μl Elongatinsprotein (AF1722, 7.5 μg/μl Proteinkonzentration) und 8 μl Gleitklammerprotein (AF 0335, Proteinkonzentration 0,3 μg/μl) eingesetzt und in einer PCR-Maschine dem folgenden Zyklus unterworfen, anfangs 5 min. bei 95°C und dann 30-mal, 30 s bei 95°C, 30 s bei 59°C und abschließend 6 min. bei 68°C. Die Fig. 28 zeigt deutlich den Vorteil der Verwendung des erfindungsgemäßen thermostabilen in w^'fro-Komplexes.

Die in der vorstehenden Beschreibung sowie in den Ansprüchen offenbarten Merkmale der Erfindung können sowohl einzeln als auch in beliebiger Kombination für die Verwirklichung der Erfindung in ihren verschiedenen Ausführungsformen wesentlich sein.

Claims

Patentansprüche

1. Thermostabiler in w^'fro-Komplex zur Template-abhängigen Elongation von Nukleinsäuren, umfassend ein thermostabiles

Gleitklammerprotein und ein thermostabiles Elongationsprotein.

2. Thermostabiler in w^'fro-Komplex nach Anspruch 1 , dadurch gekennzeichnet, daß das Gleitklammerprotein mit einem Elongationsprotein verbunden ist.

3. Thermostabiler in w^'fro-Komplex nach Anspruch 1 , dadurch gekennzeichnet, daß ein Gleitkammerprotein mit einem Elongationsprotein direkt verbunden ist.

4. Thermostabiler in w^'fro-Komplex nach Anspruch 1 oder 2, dadurch gekennzeichnet, dass das Gleitklammerprotein und das Elongationsprotein über ein Kopplungsprotein verbunden sind.

5. Thermostabiler in w^'fro-Komplex nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, dass das Gleitklammerprotein und/oder das Elongationsprotein aus Archaebakterien stammen.

6. Thermostabiler in w^'fro-Komplex nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, dass das Gleitklammerprotein eine ringförmige Struktur aufweist, welche die Template-Nukleinsäurestränge ganz oder teilweise umschließt.

7. Thermostabiler in w^'fro-Komplex nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, dass das Gleitklammerprotein eine oder beide der folgenden

Aminosäurekonsensussequenzen umfaßt: SEQ ID No.:39 [GAVLIMPFW]-D-X-X-X-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X- [GAVLIMPFW]-X-[GAVLIMPFW]-X-X-X-X-F-X-X-Y-X-X-D und / oder SEQ ID No.: 40 [GAVLIMPFW]-X(3)-L-A-P-[KRHDE]-[GAVLIMPFW]-E.

8. Thermostabiler in w^'fro-Komplex nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, dass das Gleitklammerprotein zu der menschlichen (Eukaryonten) PCNA Aminosäuresequenz (SEQ ID NO. 11 ) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder das Gleitklammerprotein zu der bakterielle ß-clamp Sequenz aus E.coli (Eubakteria) (SEQ ID NO. 35) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder das Gleitklammerprotein zu der

Aminosäuresequenz des PCNA-Homologen aus Archaeoglobus fulgidus (SEQ ID NO. 12) auf einer Länge von mindestens 100 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist.

9. Thermostabiler Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Gleitklammerprotein mit einem aus einem Alignment aus Fig. 12 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/oder wobei das Gleitklammerprotein mit einem aus einem

Alignment aus Fig. 13 generierten Hidden Markow Modell einen Score von mindestens 25 ergibt.

10. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Gleitklammerprotein ein

Gleitklammerprotein ist, das aus einem Organismus stammt, der ausgewählt ist aus der Gruppe, die Archaeoglobus fulgidus, Methanoccus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Aquifex aeolicus und Carboxydothermus hydrogenofhormans u mf a ßt.

11. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Gleitklammerprotein ausgewählt ist aus der Gruppe, die

AF0335 aus Archaeoglobus fulgidus, MJ0247 aus Methanococcus jannaschii, PHLA008 aus Pyrococcus horikoschii, MTH1312 aus Methanobacterium thermoautotrophicus sowie AE000761_7 aus Aquifex aeolicus umfaßt.

12. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden

Ansprüche, dadurch gekennzeichnet, dass das Elongationsprotein eine 5'-3'-Polymeraseaktivität und/oder eine Reverse-Transkriptaseaktivität aufweist.

13. Thermostabiler in w^'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein mindestens eine der folgenden Konsensussequenzen umfaßt und an nicht mehr als vier Positionen von dieser Sequenz abweicht: SEQ ID NO. 44: D-[GAVLIMPFW]-[GAVLIMPFW]-X-X-Y-N-X-X-X-F-D-X-P-Y- [GAVKUNOFW]-X-X-R-A SEQ ID NO. 45

A-[GAVLIMPFW]-R-T-A-[FAVLIMPFW]-A-[GAVLIMPFW]-[GAVLIMPFW]-T- E-G-[GAVLIMPFW]-V-X-A-P-[GAVLIMPFW]-E-G-I-A-X-V-[KRHDE]-I SEQ ID NO. 46

[GAVLIMPFW]-P-V-G-[GAVLIMPFW]-G-R-G-S-X-[GAVLIMPFW]-G-S- [GAVKUNOFW]-V-A-X-A-[GAVLIMPFW]-X-l-T-D-[GAVKUNOFW]-D-P- [GAVLIMPFW]-X-X-X-[GAVLIMPFW]-L-F-E-R-F-L-N-P-E-R-[GAVLIMPFW]- S-M-P-D.

14. Thermostabiler in w^'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein eine zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO. 22) auf einer Länge von mindestens 200 Aminosäuren bei einem Sequenzalignment eine mindestens 20 %ige Sequenzidentität aufweist und/oder zur archaebakteriellen Aminosäuresequenz (SEQ ID NO. 27) auf einer Länge von mindestens 400 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität aufweist und/oder zur eubakteriellen Aminosäuresequenz (SEQ ID NO. 37) auf einer Länge von mindestens 300 Aminosäuren bei einem Sequenzalignment eine mindestens 25 %ige Sequenzidentität aufweist.

15. Thermostabiler in w^'fro-Komplex nach Anspruch 12, dadurch gekennzeichnet, dass das Elongationsprotein mit einem aus einem Alignment aus Fig. 17 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt und/oder das Elongationsprotein mit einem aus einem Alignment aus Fig. 18 generierten Hidden Markow Modell einen Score von mindestens 35 ergibt und/oder das Elongationsprotein mit einem aus einem Alignment aus Abbildung 19 generierten Hidden Markow Modell einen Score von mindestens 20 ergibt.

16. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Elongationsprotein ein

Elongationsprotein ist, das aus einem Organismus stammt, der aus der Gruppe ausgewählt ist, die Archaeglobus fulgidus, Methanococcus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Pyrococcus furiosus und Carboxydothermus hydrogenoformans umfaßt.

17. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Elongationsprotein ausgewählt ist aus der Gruppe, die

AF0497 oder AF1722 aus Archaoglobus fulgidus, MJ0885 oder MJ1630 aus Methanococcus jannaschii, PHBT047 oder PHBN021 aus Pyrococcus horikoschii, MTH1208 oder MTH1536 aus Methanobacterium thermoautotrophicus sowie PFUORF3 aus Pyrococcus furiosus umfaßt.

18. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein die folgende Konsensussequenz beinhaltet und an nicht mehr als vier Positionen von dieser Sequenz abweicht: (SEQ ID N0.43:)

[FL]-[GAVLIMPFW]-X-X-[GAVLIMPFW]-X-G-X(13)-[GAVLIMPFW]-X-[YR]- [GAVLIMPFW]-X-[GAVLIMPFW]-A-G-[DN]-[GAVLIMPFW]-[GAVLIMPFW]- [DS].

19. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein zu der menschlichen (Eukaryonten) Aminosäuresequenz (SEQ ID NO: 16 ) auf einer Länge von mindestens 150 Aminosäuren bei einem Sequenzalignment eine mindestens 18 %ige Sequenzidentität aufweist.

20. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein mit einem aus einem Alignment aus Abbildung 16 generierten Hidden Markow Modell einen Score von mindestens 10 ergibt.

21. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß das Kopplungsprotein ein Kopplungsprotein ist, das aus einem Organismus stammt, der aus der Gruppe ausgewählt ist, die Archaeglobus fulgidus, Methanococcus jannaschii, Pyrococcus horikoschii, Methanobacterium thermoautotrophicus, Pyrococcus furiosus und Carboxydothermus hydrogenophormans umfaßt. 5

22. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass das Kopplungsprotein augewählt ist aus der Gruppe, die AF1790 10 aus Archaeoglobus fulgidus, MJ0702 aus Methanococcus jannaschii,

PHBN023 aus Pyrococcus horikoschii, MTH1405 aus Methanobacterium thermoautothrophicum sowie PFUORF2 aus Pyrococcus umfaßt.

15 23. Thermostabiler in w^'fro-Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Komplex mit einem Protein assoziiert ist, welches als Gleitklammerlader fungiert. 0

24. Thermostabiler Komplex nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, dass der Komplex mit ATP oder einem anderen Kofaktor assoziiert vorliegt. 25

25. Rekombinante DNA-Sequenz, dadurch gekennzeichnet, dass sie für einen thermostabilen in w^'fro-Komplex gemäß einem der Ansprüche 1 bis 24. 30

26. Vektor,

dadurch gekennzeichnet, dass er eine für ein Gleitklammerprotein und ein Kopplungsprotein und/oder ein Elongationsprotein codierende, rekombinante DNA- 5 Sequenz enthält.

27. Vektor nach Anspruch 26, dadurch gekennzeichnet, dass er zusätzlich mindestens eine weitere DNA-Sequenz mit 10 mindestens einer geeigneten Restriktionsschnittstelle zur Insertion weiterer DNA-Sequenzen in einer solchen Anordnung enthält, dass sich ein Fusionsprotein aus Gleitklammerprotein und dem Expressionsprodukt der weiteren DNA-Sequenzen ergibt.

15 28. Vektor nach Anspruch 26 oder 27, dadurch gekennzeichnet, dass er geeignete, die Expression der DNA-Sequenz(en) steuernde Promotor- und/oder Operatorbereiche enthält.

20 29. Vektor nach Anspruch 28, dadurch gekennzeichnet, dass er mehrere Promotor- und/oder Operatorbereiche zur getrennten Expression mehrerer DNA-Sequenzen enthält.

25 30. Vektor nach einem der Ansprüche 26 bis 29, dadurch gekennzeichnet, dass er reprimier- und/oder induzierbare Promotor- und/oder Operatorbereiche enthält.

31. Vektor nach einem der Ansprüche 26 bis 30, dadurch gekennzeichnet, dass er eine DNA-Sequenz nach Anspruch 25 enthält.

5 32. Wirtszelle, dadurch gekennzeichnet, dass sie mit einem oder mehreren Vektoren nach einem der Ansprüche 26 bis 31 transformiert ist.

10 33. Verfahren zur Herstellung eines thermostabilen in w^'fro-Komplexes gemäß einem der Ansprüche 1 bis 24, dadurch gekennzeichnet, dass eine entsprechende rekombinante DNA-Sequenz gemäß Anspruch 25 oder einen oder mehrere der Vektoren gemäß einem der 15 Ansprüche 26 bis 31 in eine Wirtszelle einbringt, die Expression der

Proteine bewirkt und diese aus dem Kulturmedium oder nach Zellaufschluss isoliert und gegebenenfalls noch mit weiteren Komplexbestandteilen koppelt.

20 34. Verfahren zur Template-abhängigen Elongation von Nukleinsäuren, wobei die Nukleinsäure nötigenfalls denaturiert wird, mit mindestens einem Primer unter Hybridisierungsbedingungen versehen wird, wobei der Primer hinreichend komplementär zu einem flankierenden Bereich einer gewünschten Nukleinsäuresequenz des Template-Strangs ist und 25 mit Hilfe einer Polymerase in Anwesenheit von Nukleotiden eine Primer-

Elongation erfolgt, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in w^'fro-Komplex gemäß einem der Ansprüche 1 bis 24 verwendet wird.

35. Verfahren nach Anspruch 34, dadurch gekennzeichnet, dass man zur Amplifikation von DNA-Sequenzen zwei die gewünschte 5 Nukleinsäuresequenz flankierende Primer und Deoxynukleotide und/oder Derivate davon und/oder Ribonukleotide und/oder Derivate davon verwendet.

36. Verfahren nach Anspruch 35,

10 dadurch gekennzeichnet, dass man eine Polymerase-Ketten-Reaktion durchführt.

37. Verfahren nach Anspruch 34, dadurch gekennzeichnet,

15 dass man zur Reversen-Transkription von RNA in DNA einen thermostabilen in w^'fro-Komplex gemäß einem der Ansprüche 1 bis 24 einsetzt, dessen Elongationsprotein Reverse-Transkriptase-Aktivität aufweist.

20 38. Verfahren nach einem der Ansprüche 34 bis 37 dadurch gekennzeichnet, dass man zur Sequenzierung von Nukleinsäuren ausgehend von einem Primer, der zu einem der zu sequenzierenden Nukleinsäure benachbarten Bereich komplementär ist, eine Template-abhängige Elongation bzw. 25 Reverse-Transkription unter Verwendung von Deoxynukleotiden und Dideoxynukleotiden oder deren jeweiligen Derivaten gemäß der Methode von Sanger durchführt.

31. Verfahren nach einem der Ansprüche 34 bis 38, dadurch gekennzeichnet, dass man bei der Elongation der Nukleinsäuren Markierungen einfügt.

5 40. Verfahren nach Anspruch 39, dadurch gekennzeichnet, dass man markierte Primer und/oder markierte Deoxynukleotide und/oder deren Derivate und/oder markierte Dideoxynukleotide und/oder deren Derivate und/oder markierte Ribonukleotide und/oder 10 deren Derivate einsetzt.

41. Verfahren zur Markierung von Nukleinsäuren durch Erzeugung einzelner Brüche in Phosphodiesterbindungen der Nukleinsäurekette und Ersatz eines Nukleotids an den Bruchstellen durch ein markiertes 15 Nukleotid mit Hilfe einer Polymerase, dadurch gekennzeichnet, dass als Polymerase ein thermostabiler in w^'fro-Komplex nach einem der Ansprüche 1 bis 24 eingesetzt wird.

20 42. Reagenzien-Kit zur Elongation und/oder Amplifikation und/oder reversen Transkription und/oder Sequenzierung und/oder Markierung von Nukleinsäuren, enthaltend in einem oder mehreren getrennten Behältern a) einen thermostabilen in w^'fro-Komplex nach einem der 25 Ansprüche 1 bis 24 oder b) einen thermostabilen in w^'fro-Komplex nach einem der Ansprüche 1 bis 24 und separat davon ein Polymeraseaktivität aufweisendes Elongationsprotein, sowie gegebenenfalls Primer, Puffersubstanzen, Nukleotide, ATP, einen oder mehrere andere Kofaktoren und/oder Pyrophosphatase.

43. Kit nach Anspruch 42,

5 dadurch gekennzeichnet, dass er zur Amplifikation von Nukleinsäuren neben den Komponenten a) oder b), welche 5'-3'-Polymeraseaktivität aufweisen, Deoxynukleotide und/oder Derivate davon enthält.

10 44. Kit nach Anspruch 42, dadurch gekennzeichnet, dass er zur reversen Transkription die Komponenten a) oder b) enthält, welche reverse Transkriptase-Aktivität aufweisen, sowie Deoxynukleotide und/oder Derivate davon.

15

45. Kit nach einem der Ansprüche 42 bis 44, dadurch gekennzeichnet, dass er zur Sequenzierung neben Deoxynukleotiden oder Ribonukleotiden und/oder deren Derivaten, Dideoxynukleotide 20 und/oder deren Derivate enthält.

46. Kit nach einem der Ansprüche 42 bis 45, dadurch gekennzeichnet, dass er Primer und/oder Deoxynukleotide und/oder Dideoxynukleotide 25 in markierter Form enthält.