DE60034953T2

DE60034953T2 - Genklonierung

Info

Publication number: DE60034953T2
Application number: DE60034953T
Authority: DE
Inventors: Alexey Tempe FOMENKOV; Yiping Tempe HUANG; Michael G. Chandler CHAPARIAN; Shu-Xian Peoria ZHENG
Original assignee: Omniscience Pharmaceuticals Inc
Current assignee: Omniscience Pharmaceuticals Inc
Priority date: 1999-08-19
Filing date: 2000-08-18
Publication date: 2008-01-24
Anticipated expiration: 2020-08-19
Also published as: ATE362980T1; EP1210460A1; EP1210460B1; DE60034953D1; WO2001012861A1; EP1210460A4; AU6916900A

Description

1. GEBIET DER ERFINDUNG
Die vorliegende Erfindung betrifft im Allgemeinen Verfahren und Materialien zur Verwendung bei der Genklonierung. Insbesondere betrifft die vorliegende Erfindung Gen-Sonden/Primer zur Verwendung beim Ermitteln und Charakterisieren von eine bioaktive Verbindung kodierenden Genen und Genclustern.
2. BESCHREIBUNG DES ZUGEHÖRIGEN STANDES DER TECHNIK
Die fundamentalen Herausforderungen beim Entwickeln bzw. Entdecken von Arzneimitteln bzw. Wirkstoffen bestehen darin, eine Leitverbindung mit gewünschter Wirksamkeit zu bestimmen und die Leitverbindung so zu optimieren, dass sie Kriterien, die zur Weiterentwicklung des Wirkstoffs notwendig sind, erfüllt. Ein üblicher Ansatz für das Entwickeln von Wirkstoffen umfasst das Präsentieren von Makromolekülen, die mit dem Hervorrufen einer Krankheit (Krankheitsziele) in Zusammenhang stehen, in Bioassays, in denen potentielle Wirkstoffkandidaten auf therapeutische Wirksamkeit hin untersucht werden. Solche Moleküle können Rezeptoren, Enzyme oder Transkriptionsfaktoren sein.
Ein weiterer Ansatz beinhaltet das Präsentieren von ganzen Zellen oder Organismen, die für den Verursacher der Krankheit typisch sind. Solche Wirkstoffe umfassen Bakterien und Tumorzelllinien.
Üblicherweise gibt es zwei Quellen für potentielle Wirkstoffkandidaten: Sammlungen von natürlichen Produkten und synthetischen Chemikalien. Die Bestimmung von Leitverbindungen wird durch Random Screening von solchen Sammlungen, die einen möglichst breiten Bereich von strukturellen Arten umfassen, erreicht. Die neuere Entwicklung von synthetischen kombinatorischen chemischen Bibliotheken wird die Zahl und Vielfalt von zum Screening verfügbaren Verbindungen weiter erhöhen. Allerdings ist die Vielfältigkeit in einer synthetischen chemischen Bibliothek auf die menschliche Vorstellungskraft und Synthesefertigkeiten beschränkt.
Das „Random Screening" von natürlichen Produkten aus Quellen, wie beispielsweise Bodenbakterien, Pilzen, wirbellosen Tieren und Pflanzen, hat zur Entdeckung von vielen wichtigen Wirkstoffen geführt (Franco u.a. 1991, Critical Rev Biotechnol 11:193-276; Goodfellow u.a. 1989, in „Microbial Products; New Approaches", Cambridge University Press, Seite 343-383; Berdy 1974, Adv Appl Microbiol 18:309-406; Suffness u.a. 1988, in Biomedical Importance of Marine Organisms, D.G. Fautin, California Academy of Sciences, Seite 151-157). Über 10.000 dieser Naturprodukte sind biologisch wirksam und mindestens 100 davon werden gegenwärtig verwendet und decken das ganze therapeutische Spektrum ab, einschließlich Antibiotika, Krebsmittel und Herz-Kreislauf-Mittel und auch als Agrochemikalien. Der Erfolg dieses Ansatzes zum Entdecken von Wirkstoffen hängt stark davon ab, wie viele Verbindungen in ein Screeningprogramm gelangen und wie wirksam das Screening durchgeführt werden kann. Daher haben für diesen Zweck indikationsspezifische Verbindungsbibliotheken enorme Vorteile.
Typischerweise durchsuchen Pharmafirmen Verbindungssammlungen, die hunderttausende von natürlichen und synthetischen Verbindungen enthalten. Allerdings hat sich das Verhältnis von neuen zu zuvor entdeckten Verbindungen im Lauf der Zeit verringert. Bei Screenings nach Krebsmitteln beispielsweise können die meisten mikrobiellen Spezies, die biologisch aktiv sind, Verbindungen ergeben, die bereits beschrieben sind. Dies liegt teilweise an den Schwierigkeiten, beständig und in ausreichender Weise neue Naturproduktproben zu finden, zu reproduzieren und bereitzustellen. Da biologische Vielfalt stark von der zugrunde liegenden molekularen Vielfalt abhängt, gibt es eine unzureichende biologische Vielfalt bei den Organismen, die gegenwärtig für das „Random Screening" ausgewählt werden, was die Möglichkeit zur Isolierung von neuen Verbindungen reduziert.
Neue Bioaktivität wird beständig in verschiedenen natürlichen Quellen gefunden. Siehe beispielsweise Cragg u.a. 1994 (in „Ethnobotany and the search for new drugs" Wiley, Chichester, Seite 178-196). Wenige dieser Quellen sind systematisch und gründlich auf neue Wirkstoff-Leitverbindungen hin erforscht worden. Zum Beispiel ist geschätzt worden, dass nur 5000 Pflanzenarten gründlich auf eine mögliche medizinische Verwendung hin untersucht wurden. Dies ist ein kleiner Teil der insgesamt schätzungsweise 250.000 bis 3.000.000 Arten, von denen die meisten in den Tropen wachsen (Abelson 1990, Science 247:513). Darüber hinaus ist von den schätzungsweise Millionen Arten von Meeresmikroorganismen nur eine kleine Zahl beschrieben. Es gibt tatsächlich eine enorme Artenvielfalt, die als Quellen für Leitverbindungen nicht erschlossen werden. Herkömmliche Verfahren zum Entdecken von Verbindungen aus diesen Quellen ist eine Voraussetzung für die erfolgreiche Laborkultur der mikrobiellen Flora, ein Verfahren, das nur ungefähr 1 % Wirksamkeit zeigt. Deshalb kann die große Mehrzahl von Mikroorganismen aus der Umwelt nicht in einem Labor wachsen gelassen werden und daher können alle potentiellen bioaktiven Verbindungen, die sie erzeugen, nicht untersucht werden.
Bodenmikroorganismen, Pilze, wirbellose Tiere und Pflanzen werden historisch als Quellen für natürliche Produkte verwendet. Allerdings gibt es abgesehen von mehreren gut untersuchten Organismengruppen, wie beispielsweise den Aktinomyzeten, die für das Wirkstoff-Screening und die kommerzielle Produktion entwickelt wurden, noch immer Probleme bei der Reproduzierbarkeit und Herstellung. Zum Beispiel ist das Antitumormittel TAXOL^TM ein Bestandteil der Rinde von voll entwickelten pazifischen Eiben und seine Bereitstellung als klinisches Mittel hat Bedenken im Hinblick auf den Schaden für das lokale ökologische System hervorgerufen. Taxol enthält 11 chirale Zentren mit 2048 möglichen diastereoisomeren Formen, so dass die de novo Synthese im kommerziellen Umfang unwahrscheinlich erscheint (Phillipson, 1994, Trans Royal Sco Trop Med Hyg 88 Supp 1:17-19).
Wirbellose Meerestiere stellen eine viel versprechende Quelle für neue Verbindungen dar, aber es bestehen größere Schwächen bezüglich der Technologie zum Durchführen von Wirkstoff-Screenings und einer Bereitstellung im großen Umfang. Zum Beispiel können wirbellose Meerestiere schwer zu sammeln sein und viele weisen saisonal bedingte Schwankungen im Hinblick auf den natürlichen Produktgehalt auf.
Meeresmikroorganismen sind eine viel versprechende Quelle für neue Verbindungen, aber es bestehen auch größere Schwächen bezüglich der Technologie zum Durchführen von Wirkstoff-Screenings und einer industriellen Fermentation mit Meeresmikroorganismen. Zum Beispiel sind Meeresmikroorganismen schwer zu sammeln, zu etablieren und in der Kultur zu halten, und viele haben spezielle Nahrungsanforderungen. Eine zuverlässige Zufuhr von nicht verschmutztem Meerwasser ist für die Fermentation im Allgemeinen wichtig. Schätzungsweise überleben mindestens 99 % der Meeresbakterienarten nicht auf Labormedien. Weiter ist eine verfügbare kommerzielle Fermentationsausrüstung für die Verwendung unter Salzbedingungen oder unter hohem Druck nicht optimal.
Bestimmte Verbindungen treten in der Natur nur auf, wenn bestimmte Organismen miteinander und mit der Umgebung in Wechselwirkung treten. Pathogene können die Pflanzen-Genexpression ändern und die Synthese von Verbindungen, wie beispielsweise Phytoalexinen, einleiten, die es der Pflanze ermöglichen, einem Angriff zu widerstehen. Zum Beispiel erhöht die wilde Tabakpflanze Nicotiana sylvestris ihre Alkaloidsynthese, wenn sie von den Larven von Manduca sexta angegriffen wird. In ähnlicher Weise können Pilze auf Phytoalexine durch Entgiftung oder Verhinderung von deren Ansammlung reagieren. Solche Metabolite gehen durch herkömmliche Screenings mit hohem Durchsatz ("High-throughput screenings"), die einen Pilz nicht zusammen mit seinem Pflanzenwirt bewerten, verloren. Ein drastisches Beispiel für den Einfluss der natürlichen Umgebung auf einen Organismus lässt sich am Pfeilgiftfrosch sehen. Während eine letale Dosis des Natriumkanalagonistalkaloids Batrachotoxin durch Reiben mit einer Pfeilspitze über den Drüsenrücken eines in der Wildnis lebenden Tiers gewonnen werden konnte, konnte Batrachotoxin in der zweiten Generation von im Terrarium aufgezogenen Fröschen nicht festgestellt werden (Daly, 1995, Proc. Natl. Acad. Sci. 92:9-13). Wenn nur die herkömmlichen Screeningverfahren für Wirkstoffe angewendet werden, können potentiell wertvolle Moleküle wie diese nie entdeckt werden. Außerdem können mikrobielle Symbionten von Pflanzen und Wirbeltieren manchmal unabhängig voneinander ursprünglich entdeckte, bioaktive Verbindungen von der Wirtspflanze biosynthetisieren. Tatsächlich erzeugt in vielen Fällen (z.B. Taxanen) die Symbiontenpopulation einen viel größeren Bereich an verwandten Verbindungen. Es wird davon ausgegangen, dass als Ergebnis eines horizontalen Gentransfers ähnliche biosynthetische Pathways sowohl beim Wirt als auch beim Symbiont bestehen. Daher stellen Symbionten-Mikroorganismen eine praktisch unberührte Quelle für neue Naturprodukte dar, aber nur, wenn neue Verfahren zur Verfügung gestellt werden, die die Begrenzungen der herkömmlichen Verfahren bei der Fermentation/Kultivierung und Entdeckung von Verbindungen aus Umweltmikroorganismen überwinden können.
Darüber hinaus wird eine Leitverbindung, die durch „Random Screening" entdeckt wurde, kaum zu einem Arzneimittel, da ihre Potenz, Selektivität, Bioverfügbarkeit oder Stabilität vielleicht nicht angemessen sein wird. Typischerweise ist eine bestimmte Menge an Leitverbindung notwendig, um sie strukturell zu modifizieren und so ihre anfängliche Wirksamkeit zu verbessern. Allerdings sind die gängigen Verfahren für die Synthese und Entwicklung von Leitverbindungen aus natürlichen Quellen, insbesondere Pflanzen, relativ ineffizient. Es gibt erhebliche Hindernisse in Verbindung mit verschiedenen Stufen bei der Wirkstoffentwicklung, wie beispielsweise das Sammeln, das Wachstum eines Wirkstoff erzeugenden Organismus, die Replikation, Stammverbesserung, Medienverbesserung und Produktionssteigerung. Diese Probleme verzögern den klinischen Test von neuen Verbindungen und beeinträchtigen die Ökonomie der Verwendung dieser neuen Quellen von Wirkstoff-Leitverbindungen.
Gegenwärtig werden die oben erwähnten Meeres-, Botanik- und Tierquellen von Naturprodukten zu wenig verwendet. Derzeit verfügbare Verfahren zum Erzeugen und Screening von Leitverbindungen können nicht wirksam auf diese zu wenig erforschten Quellen angewendet werden. Anders als einige Bodenbakterien und Pilze sind diese Wirkstoff erzeugenden Organismen nicht ohne weiteres industriellen Fermentationsverfahren zugänglich. Gleichzeitig wird der Druck zum Auffinden von neuen Quellen für Wirkstoffe durch neue hochwirksame Screening-Verfahren mit hohem Durchsatz intensiviert. Es besteht daher ein allgemeiner Bedarf nach Verfahren zum Nutzbarmachen der genetischen Ressourcen und chemischen Vielfalt dieser noch nicht erschlossenen Verbindungsquellen, um neue Wirkstoffe zu entdecken. Die Entdeckung durch mikrobielle Symbionten bietet eine Möglichkeit, wenn Verfahren entwickelt werden können, die die der herkömmlichen Entdeckung aus Umweltmikroorganismen inhärenten Begrenzungen überwinden.
Die neuesten Wirkstoffentwicklungsprogramme haben sich auf Mechanismen-basierte Wirkstoff-Screenings verlagert. Wenn einmal ein molekulares Ziel identifiziert ist (z. B. ein Hormonrezeptor, der an der Regulation der Krankheit beteiligt ist), werden Assays entwickelt, um therapeutische Agenzien zu identifizieren und/oder zu synthetisieren, die auf der molekularen Ebene mit dem Ziel in Wechselwirkung stehen.
Genexpressionsbibliotheken werden verwendet, um die Zielmoleküle zu identifizieren, zu erforschen und zu erzeugen. Expressionsklonieren ist ein übliches Verfahren geworden, mit dem man das ein einzelnes Protein kodierendes Zielgen ohne Kenntnis der physikalischen Eigenschaften des Proteins erhalten kann.
Viele Proteine, die durch Screening von Genexpressionsbibliotheken identifiziert werden, die aus den Geweben von Menschen und Säugetieren erstellt werden, sind potentielle Krankheitsziele, z.B. Rezeptoren (Simonsen u.a. 1994, Trends Pharmacol Sci 15:437-441; Nakayama u.a. 1992, Curr Opin Biotechnol 3:497-505; Aruffo, 1991, Curr Opin Biotechnol, 2:735-741) und signalübertragende Proteine. Siehe Seed u.a., 1987, Proc. Natl. Acad Sci 84:3365-3369; Yamasaki u.a., 1988, Science 241:825-828; und Lin u.a., 1992, Cell 68:775-785, (Typ III TGF-β Rezeptor) als Beispiele für Proteine, die durch funktionelles Expressionsklonieren in Säugetierzellen identifiziert werden.
Sobald ein Krankheitsziel identifiziert wurde, werden das Proteinziel oder die genmodifizierten Wirtszellen, die das Proteinziel exprimieren, in biologischen Assays zum Screening nach Leitverbindungen verwendet (Luyten u.a. 1993, Trends Biotechnol 11:247-54). Daher wird im Projekt der Wirkstoffentdeckung die Verwendung von Genexpressionsbibliotheken weitgehend auf die Identifikation und Produktion von potentiellen Krankheitszielen auf Proteinebene beschränkt. Nur in den Fällen, in denen der Wirkstoff ein Protein oder kleines Peptid, z. B. Antikörper, ist, werden Expressionsbibliotheken hergestellt, um Moleküle mit der gewünschten biologischen Aktivität zu erzeugen und nach ihnen zu screenen (Huse u.a., 1991, Ciba Foundation Symp 159:91-102).
Allerdings gibt es andere Anwendungen von Genexpressionsbibliotheken, die für die Wirkstoffentdeckung relevant sind. Genbibliotheken von Mikroorganismen sind zum Identifizieren von Genen hergestellt worden, die an den biosynthetischen Wegen bzw. Pathways beteiligt sind, die arzneilich wirksame Metabolite und spezielle Chemikalien erzeugen. Diese Pathways erfordern mehrere Proteine (insbesondere Enzyme), die zu einer größeren Komplexität als die einzelnen, als Wirkstoffziele verwendeten Proteine führen. Zum Beispiel wurden Gene, die die Pathways von bakteriellen Polyketidsynthasen (PKSs) kodieren, durch Screening von Genbibliotheken des Organismus identifiziert (Malpartida u.a. 1984, Nature 309:462; Donadio u.a. 1991, Science 252:675-679). PKSs katalysieren mehrere Schritte der Biosynthese von Polyketiden, eine wichtige Klasse von therapeutischen Verbindungen, und steuern die strukturelle Vielfalt der erzeugten Polyketide. Es wurde ein Wirt-Vektor-System in Streptomyces entwickelt, das eine gerichtete Mutation and Expression von klonierten PKS Genen ermöglicht (McDaniel u.a. 1993, Science 262:1546-1550; Kao u.a. 1994, Science 265:509-512). Dieses spezifische Wirts-Vektor-System wird verwendet, um wirksamere Wege zur Herstellung von Polyketiden zu entwickeln und um vernünftig neue Polyketide zu entwickeln (Khosla u.a., WO 95/08548 ).
Ein weiteres Beispiel ist die Herstellung des Textilfarbstoffs Indigo durch Fermentation in einem E. coli Wirt. Zwei Operone, die die den Multienzym-Biosynthese-Pathway kodierenden Gene enthalten, wurden gentechnisch manipuliert, um die Herstellung von Indigo durch den fremden E. coli Wirt zu verbessern (Ensley u.a. 1983, Science 222:167-169; Murdock u.a. 1993, Bio/Technology 11:381-386). Herkömmliche Gesamtstudien zur heterologen Expression von Genen, die einen metabolischen Weg kodieren, beinhalten das Klonieren, die Sequenzanalyse, das „Designen" von Mutationen und die Neuanordnung von bestimmten Genen, die Proteine kodieren, die bekanntermaßen an den zuvor bezeichneten metabolischen Pathways beteiligt sind.
WO 95/04150 A offenbart die Entwicklung von zwei Primern, die der S. avermitilis DNA zugegeben werden, um ein PCR Produkt zu erhalten.
WO 92/7078 A offenbart die Amplifikation von L. mesenteroides pUC9 Plasmiden mittels PCR unter Verwendung von Oligonukleotiden, um Fragmente von genomischer DNA aus L. mesenteroides zu isolieren.
WO 97/33988 A offenbart neue Mutantenformen von humaner Dihydrofolatreduktase (DHFR).
WO 94/24277 A offenbart einen DNA Vektor, der eine DNA umfasst, die eine mutante, antifolatresistente Dihydrofolatreduktase kodiert, die an einer Stelle in den Vektor eingeführt wird, deren Vorhandensein für die Replikation des Vektors nicht wesentlich ist.
WO 99/10539 A offenbart ein Verfahren zum Identifizieren von Klonen mit einer interessanten spezifischen Wirkung, umfassend (a) das Erzeugen von einer oder mehreren Expressionsbibliotheken, die von Nukleinsäuren stammen, die aus der Umgebung bzw. Umwelt direkt isoliert wurden; und (b) Screening der Bibliotheken mittels einer DNA Sonde, die an einen Liganden gebunden sind, wobei die Sonde mindestens einem Teil der kodierenden Sequenz einer DNA für eine bekannte Bioaktivität umfasst.
WO 98/17811 A offenbart eine mobilisierbare kombinatorische Genexpressionsbibliothek, umfassend einen Pool von Expressionskonstrukten, die jeweils einen Shuttle-Vektor (SV) umfassen, der in der Lage ist, in unterschiedlichen Arten von Stämmen einer Wirtszelle zu replizieren, wobei SV ein cDNA- oder ein genomisches DNA-Fragment enthält, das von Arten der Spenderorganismen stammt, wobei das cDNA- oder das genomische DNA-Fragment funktionsfähig mit mindestens einer regulatorischen Region verbunden ist, die die Expression von Genen erzielt, die durch das cDNA- oder das genomische DNA-Fragment in einem geeigneten Wirtsorganismus kodiert wird.
WO 96/40968 A offenbart ein Verfahren zur Herstellung einer kombinatorischen Polyketidbibliothek (CPL), umfassend: (a) das Bereitstellen einer Population von Vektoren, wobei die Vektoren eine willkürliche Auswahl von Polyketidsynthase (PKS) Genen, Modulen, aktiven Stellen oder Teilen und mindestens eine funktionsfähig mit den Genen verbundene Steuersequenz umfassen; (b) das Transformieren einer Population von Wirtszellen mit der Population von Vektoren, und (c) das Kultivieren der Population von Wirtszellen unter Bedingungen, unter denen die Gene im Gencluster transkribiert und translatiert werden können, wodurch eine kombinatorische Polyketid-Bibliothek erzeugt wird.
WO 96/34112 A offenbart ein neues Wirkstoffabgabesystem („drug delivery system") zum Erzeugen und Screening auf molekulare Vielfalt hin.
Im Hinblick auf zahlreiche Vorteile beim Verständnis der Krankheitsmechanismen und der Identifikation von Wirkstoffzielen, gibt es einen steigenden Bedarf an innovativen Strategien und Verfahren, um Leitverbindungen schnell zu identifizieren und sie der klinischen Testung zuzuführen.
Die Geschwindigkeit und Verfügbarkeit der automatisierten Nukleinsäuresynthese hat in der biologischen Forschung zu schnellen technologischen Fortschritten geführt. Zum Beispiel hat es die Verfügbarkeit von synthetischen Primern zur Sequenzierung den Forschern erlaubt, ihre Zeit und Arbeit, die die Sequenzierung einer bestimmten Nukleinsäure umfasst, um etwa 60 % zu reduzieren. Ein weiteres Verfahren, das durch synthetische Oligonukleotide erleichtert wird, ist die Polymerasekettenreaktion (PCR). Diese Technik, die die exponentielle Amplifikation von Sequenzen zwischen zwei synthetischen Primern beinhaltet, bietet beispiellose Detektionsebenen und erlaubt eine genetische Manipulation der amplifizierten Sequenz. Weiter ermöglicht die Verfügbarkeit von synthetischen Primern eine Vielzahl von genetischen Manipulationen, die mit relativ einfachen Verfahren durchzuführen sind, einschließlich die ortsgerichtete Mutagenese und die Maßanfertigung von genetischen Vektoren.
Zu klonierende Sequenzen werden auch routinemäßig mit synthetischen Oligonukleotiden modifiziert. Die Modifikationen entweder des Vektors oder der Insertsequenz können von der Zugabe einer einfachen Sequenz, die eine Restriktionsenzymstelle kodieren, bis zu komplizierteren Systemen reichen, die das Modifizieren des Translationsprodukts der klonierten Sequenz mit einem bestimmten Peptid oder einer Auswahl von Peptidsequenzen beinhalten. Daher haben diese technologischen Vorteile in Verbindung mit synthetischen Oligonukleotiden Forschern viele Möglichkeiten gegeben, um vielfältige biologische Phänomene ausführlicher und schneller sowie genauer zu untersuchen.
Die Oligonukleotidsynthese schreitet über die lineare Kopplung von einzelnen Monomeren in einer Stufenreaktion voran. Die Reaktionen werden generell auf einem Festphasenträger durch anfängliche Kopplung des 3' Endes des ersten Monomers an den Träger durchgeführt. Das zweite Monomer wird dem 5' Ende des ersten Monomers in einer Kondensationsreaktion zugegeben, um ein an den festen Träger gekoppeltes Dinukleotid zu erhalten. Am Ende jeder Kopplungsreaktion werden die Nebenprodukte und nicht reagierte freie Monomere weggewaschen, so dass das Ausgangsmaterial für die nächste Runde der Synthese das reine an den Träger angelagerte Oligonukleotid ist. Bei diesem Reaktionssystem stellt die stufenweise Zugabe von einzelnen Monomeren zu einem einzelnen wachsenden Ende eines Oligonukleotids eine präzise Synthese der gewünschten Sequenz sicher. Außerdem werden nicht gewünschte Nebenreaktionen ausgeschaltet, wie beispielsweise die Kondensation von zwei Oligonukleotiden, was zu hohen Produktausbeuten führt.
In einigen Fällen ist es gewünscht, dass synthetische Oligonukleotide willkürliche Nukleotidsequenzen aufweisen. Dieses Ergebnis kann durch Zugabe von gleichen Mengen an allen vier Nukleotiden in den Monomerkopplungsreaktionen erzielt werden, was zur willkürlichen Einarbeitung von allen Nukleotiden führt und eine Oligonukleotidpopulation mit willkürlichen Sequenzen erzeugt. Da alle möglichen Kombinationen an Nukleotidsequenzen in der Population repräsentiert werden, sind auch alle möglichen Kodontriplets repräsentiert. Wenn es das Ziel ist, ausschließlich willkürliche Peptidprodukte zu erzeugen, hat dieser Ansatz eine ernste Limitierung, weil die willkürlichen synthetisierten Kodons die Aminosäuren beeinflussen, die während der Translation der DNA durch die Zelle in die Polypeptide eingearbeitet werden.
Die Beeinflussung wird durch die Redundanz des genetischen Codes verursacht. Es gibt vier Nukleotidmonomere, was zu 64 möglichen Tripletkodons führt. Da nur 20 Aminosäuren zu spezifizieren sind, werden viele der Aminosäuren durch mehrere Kodons kodiert. Daher kodiert eine Oligonukleotidpopulation, die durch sequentielle Addition von Monomeren aus einer willkürlichen Population synthetisiert wird, keine Peptide, deren Aminosäuresequenz alle möglichen Kombinationen der 20 unterschiedlichen Aminosäuren in gleichen Verhältnissen repräsentiert. Das heißt, dass die Häufigkeit der Aminosäuren, die in Polypeptide eingearbeitet werden, zu den Aminosäuren hin beeinflusst wird, die durch mehrere Kodons spezifiziert sind.
Um die Aminosäurebeeinflussung aufgrund der Redundanz des genetischen Codes zu mindern, können die Oligonukleotide aus Nukleotidtriplets synthetisiert werden. Hier wird ein Triplet, das für jede der 20 Aminosäuren kodiert, aus einzelnen Monomeren kodiert. Sobald sie einmal synthetisiert sind, werden die Triplets anstelle von einzelnen Monomeren in den Kopplungsreaktionen verwendet. Durch Mischen von gleichen Triplet-Mengen kann die Oligonukleotidsynthese mit zufälligen Kodons erreicht werden. Allerdings übersteigen die Kosten der Synthese von solchen Triplets bei weitem die der Synthese von einzelnen Monomeren, weil Triplets nicht im Handel erhältlich sind.
Es wäre deshalb sinnvoll, ein Verfahren zum Synthetisieren von Oligonukleotiden zu entwickeln, die so aufgebaut sind, dass sie an Gene hybridisieren, die für die bioaktive Verbindung kodierende Gene, Antibiotika und sekundäre Metabolite kodieren. Die vorliegende Erfindung erfüllt diese Bedürfnisse und bietet auch noch weitere Vorteile.
ZUSAMMENFASSUNG DER ERFINDUNG
Gemäß der vorliegenden Erfindung wird ein Verfahren zum gezielten Klonieren und Anreichern von Genen und Genclustern zur Verfügung gestellt. Dies wird durch direktes Klonieren des Ziel-Gens aus der Quell-DNA mittels eines aus mehreren neuen vorgestellten Verfahren erreicht, zum Beispiel durch Herstellen von von einer Matrize stammenden Primern mit Zieloligonukleotiden, Zugeben dieser von einer Matrize stammenden Primern zu einer DNA Probe und Durchführen der PCR zur Replikation der Gene, auf die die von der Matrize stammenden Primer gerichtet sind. Die Verfahren sehen das degenerative („degenerate) Klonieren der ganzen Familie von verwandten Ziel-Genen aus einer gemischten DNA Probe vor. Diese Sammlung von verwandten Genen wird dann dazu verwendet, um größere, das Ziel-Gen enthaltende Fragmente aus der Probe affinitätszureinigen und zu klonieren, die zugehörige Gene des biosynthetischen Pathways darstellen. Das Ergebnis ist eine mit einem Ziel-Gen/Pathway angereicherte genomische Bibliothek. Die durch dieses Verfahren zur Verfügung gestellten Gene und die in Verbindung mit diesem Verfahren verwendeten Proben werden auch bereitgestellt. Sie sind auch für das Hybridisierungs-Screening von klonalen Bibliotheken sowie Kultursammlungen nützlich.
BESCHREIBUNG DER ZEICHNUNGEN
Weitere Vorteile der vorliegenden Erfindung sind leicht ersichtlich, da diese unter Bezugnahme auf die folgende ausführliche Beschreibung besser verständlich werden, wenn diese zusammen mit den beigefügten Zeichnungen betrachtet wird:
1 ist ein Foto, das ein Gel der Ergebnisse der verschachtelten bzw. gestaffelten PCR („nested PCR) mit einem degenerierten bzw. degenerativen (Primer)-Paar („degenerate pair") zum Klonieren der DHFR2 Gensonde aus Meeressediment DNA zeigt; die Spuren 10–15 sind die Produkte aus der ersten PCR unter Verwendung der Primer DHFR2-1 und DHFR2-4; die Spuren 3–8 sind die Produkte aus der zweiten PCR unter Verwendung der Produkte aus der ersten PCR als Matrize und der Primer DHFR2-2 und DHFR2-3; die Spur 9 enthält Größenmarker; die Reaktionsbedingungen waren wie im Text näher erläutert; die erwartete Produktgröße beträgt etwa 120 bp, wie in den Spuren 8 und 4 zu sehen ist;
2A, B und C veranschaulichen die Strategie zum Erzeugen von matrizenspezifischen Primern und deren Verwendung bei der spezifischen Klonierung von unbekannten flankierenden Sequenzen gegen einen einzelnen bekannten Primer, wobei Details im Text erörtert werden;
3 zeigt die PCR Amplifikation des Teils des Amp Resistenzgens von pBR325 als Matrize unter Verwendung von BcgI abgeleiteten Primern und dem sequenzspezifischen pPstCW Primer, wobei das Reaktionsgemisch mit BamHI (50 ng) verdautes pBR325 als Matrize, 32-mer BcgI Primer von pBR325 (gelgereinigt 12 pmol) und/oder 32-mer sequenzspezifischen Primer pPstCW (40 pmol) enthält; BcgI Primer wurden fünf Minuten bei 100°C denaturiert und sofort auf Eis heruntergekühlt; für die PCR wurde das Programm AF08 verwendet (T1 = 96°C, t = 30 Sekunden; T2 56°C, t = 1 Minute; T3 = 72°C, t = 10 Sekunden, die Reaktionen werden in 34 Zyklen durchgeführt); Spuren: 1. Gemisch aus BcgI Oligonukleotid mit Matrize; 2. Gemisch aus BcgI Oligonukleotiden plus sequenzspezifischem pPstCW Primer mit Matrize; 3. pPstCW Primer mit Matrize aber ohne BcgI Primer; 4. pPstCW Primer plus BcgI Primergemisch ohne Matrize; und 5. pBR325 (1 μg) verdaut mit BcgI Restriktionsendonuklease;
4 zeigt die gereinigte einzelsträngige DNA Form aus Phagen aufgetrennt auf einem 0,8 % Agarosegel (Ethidiumbromid gefärbt); Spur 1. SS DNA M13mp18 (1 μg); 2. SS DNA von M13mp18 BcgI Bibliothek von E. coli HB101 (1 μg); 3. SS DNA von M13mp18 BcgI Bibliothek von S. clavuligerus (1 μg); und 4. DNA Marker lambda DNA verdaut mit HindIII (1 μg)(Promega, WI);
5 zeigt eine 0,8 % Agarosegelanalyse von biotinylierten Polymeraseelongationsprodukten (BEPEP); Bild: A mit Ethidiumbromid gefärbtes Gel. B Streptavidin-Phosphatase-Assay aus Southern Blotting. PCR und Polymeraseelongationsreaktion (PER), durchgeführt in 20 μl Reaktionsformat, enthielten 30 pmol biotinylierte Primer und 100 ng für PCR oder 1 μg für PER DNA Matrize entweder CsCI gereinigte DNA aus E. coli HB101 oder DNA aus S. clavuligerus; zur Verbesserung der Elongation wurden die Reaktionen mit 5u TaKaRa LA DNA Polymerase gemäß den Vorschriften des Herstellers durchgeführt (TaKaRa, Japan); die Primer wurden mit Photobiotin (Vector, CA) gemäß dem Handbuch markiert; Spuren: 1. PCR von HB101 DNA, Primer AA und AB (sequenzspezifische Primer für PEPase Gen von E. coli), 2. PCR von S. clavuligerus DNA mit den Primern ACVS 010 und 011 (ACVS 04-011 sind sequenzspezifische Primer für das ACVS Gen von S. clavuligerus); 3. Negativkontroll-PCR Primer AA und AB ohne Matrize; 4. biotinylierte DNA Marker lambda verdaut mit HindIII (0,5 μg); 5. Negativkontroll-PCR Primer ACVS 010 und 011 ohne Matrize; 6. BPEP mit AA Primer und DNA HB101; 7. BPEP mit AB Primer und DNA HB101; 8. BPEP mit ACVS 04 Primer und DNA S. clavuligerus; 9. BPEP mit ACVS05 und DNA S. clavuligerus, 10. BPEP mit ACVS08 und DNA S. clavuligerus; 11. BPEP mit ACVS 09 und DNA S. clavuligerus; 12 BPEP mit ACVS 010 und DNA S. clavuligerus; und 13. BPEP mit ACVS 011 und DNA S. clavuligerus;
6 zeigt den Blot eines Streptavidin-Phosphatase-Assays der Bindung der biotinylierten mit Polymerase elongierten Produkten (BPEP) an Avidin D Kügelchen (Vector Labs, CA); Spuren 1. BPEP mit Primern AA und AB von DNA E. coli HB101 von 2. BPEP mit Primern ACVS 04-011 von S. clavuligerus DNA. Bild: A BPEP vor der Adsorption an Kügelchen, B BPEP Fraktion nicht an Kügelchen gebunden, C BPEP Fraktion inkubiert bei 65°C in TEST Puffer; 50 μl (25 ng/μl) Avidinkügelchen, zweimal mit drei Volumen TEST Puffer äquilibriert und mit 100 μl BPEP gemischt und 2 Stunden bei 37°C inkubiert; dann wurden die Kügelchen dreimal mit drei Volumen TEST Puffer gewaschen und 2 μl auf Streptavidin-Phosphatase Dot-Blotting-Assay analysiert;
7 zeigt ein Foto einer Agarosegelanalyse von gebundenen und ungebundenen Fraktionen von SS DNA von M13mp18 BcgI Bibliotheken; Spur: 1.,7. DNA Marker lambda HindIII (1 μg); 2. M13mp18 originale BcgI Bibliothek von E. coli HB101 (10 μg); 3. ungebundene Fraktion der HB101 BcgI Bibliothek bei 37°C; 4. gebundene Fraktion der BcgI HB101 Bibliothek bei 37°C; 5. ungebundene Fraktion der BcgI HB101 Bibliothek bei 65°C; 6. gebundene Fraktion der BcgI HB101 Bibliothek bei 65°C; 8. M13mp18 originale BcgI Bibliothek von S. clavuligerus (10 μg); 9. ungebundene Fraktion der BcgI S. clavuligerus Bibliothek bei 37°C; 10. gebundene Fraktion der BcgI S. clavuligerus Bibliothek bei 37°C; 11. ungebundene Fraktion der BcgI S. clavuligerus Bibliothek bei 65°C; 12. gebundene Fraktion der BcgI S. clavuligerus Bibliothek bei 65°C, 10 μl (1 μg/μl) der M13 mp18 SS DNA Bibliothek gemischt mit 50 μl Avidin D-BPEP (biotinyliertes polymeraseelongiertes Produkt) in 100 μl TEST Puffer und über Nacht bei 55°C inkubiert; die Temperatur wurde dann für 10 Minuten auf 37°C gesenkt und 100 μl ungebundene Fraktion wurde gesammelt; die Kügelchen wurden dreimal mit drei Volumen TEST Puffer fünf Minuten lang gewaschen, gebundene Fraktion wurde mit 100 μl Wasser durch Kochen bei 100°C für fünf Minuten eluiert; alle Fraktionen wurden mit Ethanol präzipitiert und in 30 μl Wasser gelöst; 10 μl wurde mittels Agarosegelelektrophorese analysiert und 3 μl wurde in Nova Blue E. coli Zellen (Novagene, WI) elektrotransformiert;
8 ist ein Foto eines Agarosegels, das zur Analyse der PCR Amplifikation von S. clavuligerus DNA mit sequenzspezifischen ACVS und eingefangenen („captured") BcgI Primern verwendet wird; die PCR Reaktionen werden in 20 μl Format mit 100 ng S. clavuligerus genomischer DNA als Matrize und 30 pmol Primern durchgeführt; Spur: 1. ACVS 04 plus 011; 2. ACVS 09 plus 011; 3. ACVS 08 plus 010; 4. ACVS 010 plus 011; 5. DNA Marker lambda HindIII; 6. ACVS 04 plus 04w3bcg; 7. ACVS 04 plus 04w6bcg; 8. ACVS 04 plus 04w9bcg; 9. ACVS 04 plus 04w10bcg; 10. ACVS04 plus 04w13bcg; 11. ACVS09 plus 04w3bcg; 12. ACVS09 plus 04w6bcg; 13. ACVS09 plus 04 w9bcg; 14 ACVS09 plus 04w10bcg; und 15. ACVS09 plus 04w13bcg;
9 ist ein Foto eines Agarosegels, das die PCR Amplifikationsprodukte unter Verwendung von Octamerprimern zeigt, die mittels der k-Tuple Strategie berechnet sind, wie im Text beschrieben; die verwendete Matrize ist HB101 genomische DNA und ansonsten Standardbedingungen; Spuren 1, 1', 18' enthalten Größenmarker; 2–9 oct03 as alleinigen Primer mit variierenden Pufferzusammmensetzungen (Spuren 10–18 sind leer); 2'-9' Standardprimer für das Phosphoenolpyruvat-Gen als Kontrolle; 10'–18' oct01 als alleinigen Primer mit demselben variierenden Puffer wie in den Spuren 2–9. Die Produkte haben die erwartete Größe für eine willkürliche PCR („random PCR")(0,2–3 kb);
10 ist ein Foto eines Agarosegels, das die PCR Amplifikationsprodukte von 9 vergleicht; Spur: 1. Marker; 2. oct01; 3. oct03; die Reaktionen wurden unter optimierten Bedingungen durchgeführt, wie aus der Analyse der in der 9 gezeigten Reaktionen bewertet;
11 ist ein Foto eines Agarosegels, das die PCR Produkte unter Verwendung von k-Tuple erzeugten Primern paarweise mit für das acvs Gen spezifischen Primern zeigt; die genomische DNA aus S. clavuligerus wurde als Matrize unter ansonsten standardgemäßen Zyklisierungsbedingungen und Temperaturgradient verwendet (jede Primerpaar PCR wurde bei 27°C, 34°C und 42°C durchgeführt, und zwar von links nach rechts über das Gel); Spur: 1 Größenmarker; 2–4 ACVS05 und oct01; 5-7 ACVS05 und oct02; 8-10 ACVS07 und oct01; 11-13 ACVS07 und oct02; die Kontrollen bestätigten, dass die Amplifikation sich aus dem paarweisen Priming von spezifischen und Oktamer-Primern ergab und nicht aus dem alleinigen Priming durch einen der Primer allein;
12 ist ein Foto einer Hybridisierungsblotanalyse eines Streptavidin-Phosphatase-Assays von unterschiedlichen Fraktionen von biotinylierten PCR Sonden während der Reinigung auf Avidin DLA Kügelchen; Bild: A) ursprüngliches Gemisch aus PCR Sonden 2 μl (50 ng/μl); B) ungebundene Fraktion von nicht biotinylierten PCR Sonden 2μl (50 ng/μl); C) Biotin eluierte Fraktionen von biotinylierten PCR Sonden 2 μl (10 ng/μl); Spur: 1. Bio IPNS 05+06 PCR Produkt; 2. Bio StsC03+04 PCR Produkt; 200 μl Avidin DIA Kügelchen wurden zur Reinigung verwendet (Kapazität 25 ng/μl);
13 ist ein Foto, das eine 1 % Agarosegelelektrophoreseanalyse von Avidin DIA gereinigten biotinylierten PCR Sonden zeigt; Spur: 1. Bio IPNS 05+06 5 μl (10 ng/μl); 2. Bio StsC 03+04 5 μl (10 ng/μl); Bild: A) mit Ethidiumbromid gefärbtes Gel; B) Streptavidin-Phosphatase Assay vom Southern Blotting des Gels;
14 ist ein Foto der Ergebnisse des Screenings von pFD666 und pSCOS1 S. griseus genomischen Bibliotheken, angereichert für Aminoglycosid-Gene, mit alk-gerichteten markierten StsC03+04 Sonden; Bild: A) ursprüngliche Bibliothek (insgesamt 500 Kolonien auf der Platte); B) mittels StsC und recA eingefangene Bibliothek nach der Elektrotransformation (insgesamt 250 Kolonien auf der Platte); C) Bibliothek, die von mit StsC und recA eingefangenen chromosomalen DNA Fragmenten stammt, die in den pSCOS1 Cosmid Vektor kloniert wurden (insgesamt 2000 Kolonien auf der Platte); die Ergebnisse zeigen eine über 100-fache Anreicherung für das spezifische Gen im Vergleich zur erwarteten Zahl von positiven Klonen in der nicht angereicherten Bibliothek;
15 ist ein Foto von mehreren Dot-Blots von positiven Klonen aus Bibliotheken, die für das acvs Gen (linkes Bild) und strB1 (rechtes Bild) angereichert sind, und zwar entsprechend den beta-Laktam bzw. aminoglycosidbiosynthetischen Clustern; genomische Bibliotheken wurden aus S. clavuligerus (acvs) und S. griseus (strB1) erstellt; DNA von positiven Klonen wurde häufig mit mehreren zusätzlichen Gensonden hybridisiert, die mit ihren jeweiligen Clustern verbunden waren (Tabelle II), was das Klonieren von intakten Clustern und ganzen Pathways zeigt;
16 ist ein Foto eines Agarosegels, das in der PCR Analyse von mehreren, für den Aminoglycosidcluster angereicherten Klonen (14) verwendet wurde; Spur 1 bis 30: 1. PCR unter Verwendung von E. coli Zellen mit unterschiedlichen Plasmiden als Matrize; Spur 1' bis 30': 2. PCR unter Verwendung von den 1. PCR Produkten als Matrize; 1: MW Marker (100 bp Leiter); 2 bis 8: 1. PCR unter Verwendung der StrD Primer; 9 bis 15: 1. PCR unter Verwendung von StsA Primern; 16: MW Marker (100 bp Leiter); 17 bis 23: 1. PCR unter Verwendung von StrB1 Primern; 24 bis 30: 1. PCR unter Verwendung von StsC Primern; 1': MW Marker (100 bp Leiter); 2' bis 8': 2. PCR unter Verwendung von StrD Primern; 9' bis 15': 2. PCR unter Verwendung von StsA Primern; 16': MW Marker (100 bp Leiter); 17' bis 23': 2. PCR unter Verwendung von StrB1 Primern; 24' bis 30': 2. PCR unter Verwendung von StsC Primern, jeder Satz von sieben Spuren mit demselben Primer folgt demselben Reihenfolgenmuster: (1) keine Matrize; (2) PDF666 als Matrize; (3) B1-1 als Matrize; (4) B3-1 als Matrize; (5) B20-2 als Matrize; (6) B20-4 als Matrize; (7) B16str5 als Matrize; diese Ergebnisse bestätigen die Retention und das stabile Klonieren des Clusters in vielen Klonen und bestätigen die Hybridisierungsergebnisse, die das Vorhandensein dieser Gene anzeigen; außerdem wird auch die Nützlichkeit von vielen in der Tabelle I aufgeführten Oligos, die in doppelt gestaffelter PCR verwendet werden, wie hier beschrieben, gezeigt;
17 ist ein Foto von antibiotischen Selektionsplatten, die die heterologe Expression der Aminoglycosidresistenz von S. griseus in E. coli zeigt; linkes Bild: Gradientenplatten von 0 (unten) bis 25 (oben) μg/ml Streptomycin; die linke Seite jeder Platte enthält den Ausstrich einer einzelnen positiven Kolonie, die an die strB1 Gensonde hybridisiert hat; die rechte Seite jeder Platte enthält den E. coli Wirt, der mit kein Insert enthaltendem Cosmid transformiert ist; rechtes Bild: Platten enthalten dieselben Klone wie im linken Bild; die Platten enthalten 0, 5, 15, 25 μg/ml Streptomycin, und zwar im Uhrzeigersinn von der oberen linken Platte; und
18 zeigt ein noch anderes Beispiel der Hybridisierungssondierung von genomischen Bibliotheken unter Verwendung von mehreren Gensonden; SFT4 ist eine Bibliothek, die von einem trimethoprimresistenten Meerwasserisolat erstellt ist, sie trägt das DHFR2 Gen und zeigt antibakterielle Aktivität gegen S. aureus in standardmäßigen antibiotischen Challenge-Assays.
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
Im Allgemeinen stellt die vorliegende Erfindung ein Verfahren und Sonden zur Verwendung bei der gezielten Klonierung und Anreicherung von Genen und Genclustern aus einer ansonsten gemischten und sehr vielfältigen DNA Population zur Verfügung. Die Verfahren stellen die degenerative Klonierung der ganzen Familie von verwandten Zielgenen aus einer gemischten DNA Probe zur Verfügung. Diese Sammlung von verwandten Genen wird dann zum Affinitätsreinigen und Klonieren von größere Zielgene enthaltenden Fragmenten aus der Probe verwendet, die zugehörige biosynthetische Pathway-Gene darstellen. Das Ergebnis ist eine mit Ziel-Gen/Pathway angereicherte, genomische Bibliothek. Weiterhin werden die durch dieses Verfahren zur Verfügung gestellten Gene und die in Verbindung mit diesem Verfahren verwendeten Sonden bereitgestellt. Diese sind auch für das Hybridisierungsscreening von klonalen Bibliotheken sowie Kultursammlungen nützlich.
Genomik und Bioinformatik können verwendet werden, um spezielle Gene und DNA Sequenzen zu identifizieren, die mit der Biosynthese von spezifischen strukturellen Verbindungsklassen korrelieren, einschließlich vielen sekundären Metaboliten. Dies wird oft entweder durch einen Vergleich der Nukleotidgensequenzen von bekannten verwandten Genen oder der Proteinsequenzen der Genprodukte durch mehrere Sequenzgruppierungen („sequence alignment") durchgeführt. Konstante oder konservierte Regionen in verwandten Sequenzen werden für die Proteinfunktion für wichtig gehalten und werden auch in unentdeckten Genen der verwandten Klasse konserviert. Die Klonierung der gesamten Population von Zielgenen, die für eine spezielle Funktion kodieren, ermöglicht, dass die zugehörigen, geclusterten biosynthetischen Pathways auch auf sehr spezifische und gezielte Weise kloniert werden (siehe nachstehend). Darüber hinaus ermöglicht die Verwendung von degenerativer PCR Klonierung die Klonierung sowohl von nahe als auch entfernt verwandten Genen in einer speziellen Zielklasse und erlaubt anschließend die Klonierung und das Einfangen der ganzen genetischen und chemischen Vielfalt für die interessierende Zielverbindungsklasse.
Die degenerativ-gestaffelte bzw. degeneriert-verschachtelte Temperaturgradienten PCR wird zur erfolgreichen Klonierung der Mehrheit oder sogar der ganzen Population von verwandten Genen aus einem Gemisch aus vielen Genomen und ansonsten nicht verwandter DNA, wie beispielsweise der Gesamt-DNA, die aus einer Bodenprobe oder einer anderen Umweltquelle isoliert wurde, verwendet. Gestaffelte Sätze von degenerativen PCR Primern sind für eine Vielzahl von Zielgenen entwickelt worden (siehe TABELLE I).
Es wurden mehrere Oligonukleotid PCR Primer und Hybridisierungssonden entwickelt und dann synthetisiert, um DNA Sequenzen aus einer Vielzahl von Quellen als Ziel zu haben, die für eine bioaktive Verbindung kodierende Gene oder Resistenz-Gene potentiell enthalten. Das Design jedes Oligos wurde auf der Grundlage der Gruppierung von Sequenzen der interessierenden Gen- und/oder Proteinfamilie durchgeführt, die öffentlich verfügbar sind (d.h. durch GenBank). Mehrere Sequenzen wurden verwendet, falls verfügbar. In einigen Fällen war nur eine einzelne einzigartige Sequenz verfügbar, die zur Berechnung der Oligosequenzen verwendet wurde. Die meisten Oligos wurden als degenerative gestaffelte Paare („degenerate nested pairs") konstruiert, um ihre Kapazität für die Klonierung und Entdeckung sowohl von eng als auch entfernt verwandten neuen Sequenzen zu maximieren, die gleichermaßen für neuartige Proteine und enzymatische Produkte kodieren, wie beispielsweise sekundäre Metabolite, die als Wirkstoff-Leitverbindung zum Screening nützlich sind.
Das allgemeine Verfahren, das zum Klonieren von Ziel-Genen mittels degenerativer gestaffelter Temperaturgradienten PCR benutzt wird, verwendet die folgenden zwei Schritte. Zuerst wird ein Temperaturgradient für die 1. PCR mit einem Temperaturbereich von 41–60°C eingerichtet. Erreicht wird dies mittels Pufferarten mit einem pH von 8,3–9,2, MgCl₂ (1,5–3,5 mM), KCl (25 & 75 mM)(Stratagene PCR Optimierungskit). Ein Volumensbereich zwischen 10–30 μl pro Reaktion wird in ein 0,2 ml Gefäß für Zyklen zwischen 30–35 platziert. Dies wird 10-fach verdünnt und die 1. PCR Produkte werden als Matrizen für eine 2. PCR Reaktion verwendet. Die 2. PCR findet bei 52°C statt und die anderen Bedingungen sind dieselben wie die der 1. PCR. Es wird ein Gel des anschließenden Durchlaufs und der erwarteten Produktgröße geschnitten. DNA wird aus dem Gel mit einem Gelextraktionskit (Qiagen) extrahiert. Das PCR Produkt wird in einen pT7Blue-3 Vektor (Novagen) gemäß den Vorschriften des Herstellers kloniert. Klone, die das Ziel PCR Produkt enthalten, werden mittels PCR and/oder Dot-Blot-Hybridisierung gescreent. Das Plasmid wird dann gereinigt. Die automatisierte Sequenzierung erfolgt mit einem ThermoSequenase Cy5.5 Terminator Cycle Sequenzierungskit (Amersham) und 50–250 fmol Matrize mit M13 Vorwärts- oder M13 Rückwärtsprimern (jeweils 2 pmol).
Die neue Sequenz wird gruppiert bzw. ausgerichtet („aligned") und mit Konsensuszielgenen verglichen, um den Grad der Einzigartigkeit zu bestätigen, indem eine BLAST Suche und Sequenzanalyse durchgeführt wird.
In allen Fällen verbessert die Verwendung dieser degenerativen Primer auf die folgende Weise die Amplifikation signifikant und reduziert die Zahl der nicht verwandten falsch geprimerten Produkte. Dies ist ein Problem, wenn es ansonsten erwünscht ist, bei der Entdeckung von neuen Genen PCR Produkte direkt zu sequenzieren. Die meisten falsch geprimerten Produkte können durch Durchführen einer degenerativen, begrenzt degenerativen, gestaffelten PCR (DLDN-PCR) ausgeschaltet werden. Die erste PCR kann stark degenerativ sein, was bei der potentiellen Entdeckung von entfernt verwandten Genen hilft. Allerdings führt dies auch zu mehr nicht verwandten Amplifizierungsprodukten. Das Ergebnis lässt sich deutlich auf einem Agarosegel der PCR Reaktion ablesen, wo zu sehen ist, dass die erwartete Produktbande ziemlich diffus ist, und es existieren Produkte von unerwarteter Größe (1, Spuren 14, 15). Die Analyse dieser Bande auf einem 10 % Acrylamidgel zeigt das Vorhandensein von mehreren Banden, die jeweils leicht in ihrer Größe, und wahrscheinlich der Sequenz variieren. Allerdings führt das Durchführen einer zweiten PCR mit der gelgereinigten Produktbande oder dem ersten PCR Reaktionsgemisch als Matrize und einem gestaffelten Satz von weniger degenerativen Primern zu einer Amplifikation von nur spezifischen Matrizenzielen (1, Spuren 4, 8). In diesem Fall ist ein 150 bp Produkt klar gelöst und für die Reinigung und Sequenzierung empfänglich. Dies liegt daran, dass die Chancen für ein nicht verwandtes fehlgeprimtes („misprimed") Produkt, das auch eine andere fehlgeprimte Stelle enthält (zusätzlich zu der ersten, die in der ersten PCR fehlgeprimt war) sehr vage sind. Dies wurde durch Klonieren und Sequenzieren der PCR Produkte aus einer einzigen, wenn auch diffusen DHFR2 Bande von etwa 150 bp bestätigt. Obwohl alle klonierten Sequenzen die Primerstellen enthielten, enthielt ein viel kleinerer Prozentsatz irgendeine verwandte DHFR2 Sequenz, die durch die Primerstellen gebunden war. Daher führt eine zweite PCR nur zu einer Amplifikation der wirklich verwandten Moleküle aus der Produktpopulation. Das Klonieren und Sequenzieren der Produkte aus dieser zweiten PCR zeigt diesen "Filter"-Effekt. Das Ergebnis ist eine zuverlässige Strategie zum Erzeugen von degenerativen PCR Produkten, die für die direkte Sequenzierung empfänglich sind. Allerdings führt, wenn die Zahl der spezifischen Produkte hoch ist, wie das manchmal für relativ übliche Amplikons bei Umweltproben der Fall ist, die Klonierung der PCR Produkte zu einer großen Zahl von Klonen mit spezifischem Produkt für die Sequenzierung.
Mittels der oben beschriebenen Primer (Tabelle I) und DLDN-PCR wurden mehrere einzigartige Gene von Meer- und Bodenmikrobengenomen entdeckt und sequenziert, die mit einer großen Vielzahl von biosynthetischen Pathways und strukturellen Verbindungsklassen verbunden waren, einschließlich Antimetaboliten, beta-Laktamen, Polyketiden, anderen Antibiotika, Taxanen und anderen.
Ein Beispiel für dieses Verfahren umfasst eine SC16RA01 Sonde, die mittels der „universellen" 16S RNA PCR Primer erzeugt wurde, um ein 600 bp DNA Produkt von S. clavuligerus zu amplifizieren. Diese Sonde ist für die Koloniehybridisierungssondierung auf Streptomycetes und anderen verwandten Genomen mit hohem GC Gehalt nützlich.
Zusätzlich wird diese Sonde bei der PCR Amplifikation von ähnlicher genomischer DNA aus einer heterogenen Population verwendet.
Die sich ergebenden Gensonden können entweder für die Entdeckung von einzelnen Genen oder ganzen Clustern benachbarter Gene verwendet werden, die an der Gesamtsynthese von interessierenden Verbindungen beteiligt sind, zum Beispiel biosynthetischen Pathways sekundärer Metabolite, deren Produkte sehr nützliche Bibliotheken für ein Antibiotika-Screening und ein Screening anderer therapeutischer Verbindungen umfassen. Dies ist seit dem erst kürzlich auftauchenden Bild des Clusterns von sekundären Metabolit-Gen-Pathways auf dem Bakterien- und Pilzchromosom besonders vielversprechend.
Die folgende Anpassung der vorliegenden Erfindung beschreibt ein Verfahren zur Erzeugung und Verwendung von hoch spezifischen PCR Primern, die von der Matrize selbst stammen. Allerdings braucht ihre Sequenz nicht priori bekannt zu sein. Diese Anpassung nutzt auch einige einzigartige und neue Eigenschaften von Restriktionsendonukleasen unter Verwendung von BcgI als Beispiel (2).
BcgI ist eine neue Restriktionsendonuklease vom Typ II, die ursprünglich aus Bacillus coagulans isoliert wurde und nun im Handel erhältlich ist. Die Erkennungssequenz für BcgI ist nachfolgend gezeigt und besteht aus einer spezifischen 6 Basenpaarstelle der DNA Sequenz. Allerdings spaltet das Enzym außerhalb dieser Erkennungsstelle und erzeugt ein 32 bp Restriktionsfragment:
5'-/(N)₁₀CGA(N)₆TGC(N)₁₂/-3'
3'-/(N)₁₂GCT(N)₆ACG(N)₁₀/-5'
Jedes Restriktionsfragment ist statistisch einzigartig hinsichtlich der Sequenz und kann als spezifischer Oligonukleotidprimer verwendet werden. Die Häufigkeit des Auftretens der Erkennungsstelle ist dieselbe wie für eine willkürliche Sechs-Basen-Sequenz oder etwa einmal alle 4.000 Nukleotide (d.h. 1/4⁶). Allerdings ist die Einzigartigkeit des Fragments außerordentlich, weil sie 34 Nukleotide enthält und einem zufälligen Auftreten von einmal in 2,9 × 10²⁰ Basen entspricht. Die zufällige Sequenzanalyse hat die Einzigartigkeit dieser Restriktionsfragmente bestätigt und dass sie nicht nur ein häufig auftretendes Repeat sind. Dies liefert die Basis für diese Fragmente, die als sehr spezifische PCR Primer und Hybridisierungssonden dienen, wobei jedes Fragment hochspezifisch für seine eigene Erkennungssequenz ist. Durch Verdau eines ganzen Genoms, ganzen oder teilweisen Chromosomen oder eines Gemischs aus vielen Genomen können sehr spezifische Primer mit Primingstellen erzeugt werden, die etwa 4.000 bp entlang der Matrizen DNA entfernt sind, was ideal für die PCR Amplifikation und Klonierung ist.
Die Bibliothek dieser einzigartigen Oligonukleotide, die von der stammspezifischen genomischen DNA oder einer gemischten Population der Umwelt-DNA erzeugt worden war, kann als Primersatz für die PCR und in Kombination mit genspezifischen Primern verwendet werden, kann zur Amplifikation und Klonierung von Nachbarregionen von spezifische Gene umgebender DNA verwendet werden. Daher kann dieses Verfahren auch zur Klonierung von langen DNA Segmenten benachbart zu einer spezifischen Zielstelle verwendet werden, einschließlich den vollständigen bakteriellen Operons, oder biosynthetischen Pathway-Gen-Clustern von jedem Organismus. Allgemeiner gesagt kann diese Anpassung der vorliegenden Erfindung selektiv und sehr wirksam (d.h. mit hoher Selektivität) aus einem DNA Gemisch die Regionen amplifizieren und klonieren, die jedes spezifische Ziel flankiert, ohne vorhergehende Kenntnis der zu klonierenden Sequenz.
Die einfachste Anwendung dieser Anpassung der vorliegenden Erfindung ist die Verwendung des ganzen Satzes von von der BcgI Matrize stammenden Oligonukleotidprimern in einer PCR, die auch ein zielspezifisches Oligonukleotid enthält. Ein Modellsystem ist mit pBR325 entwickelt worden. Dann wurde das Verfahren der vorliegenden Erfindung verwendet, um ein 300 bp Fragment des Ampicillinresistenzgens zu amplifizieren unter Verwendung eines spezifischen Primers und eines willkürlichen Gemischs der von der Matrize stammenden Primern aus einem BcgI Verdau des pBR325 Plasmids, das drei BcgI Spaltstellen enthält (3). Es wurde auch ermittelt, dass dieses Verfahren sowohl mit linearer als auch kreisförmiger Matrize unter Anwendung von ansonsten herkömmlichen PCR Bedingungen wirksam war.
Ein Beispiel für eine umfangreichere und spezifischere Anwendung dieser Anpassung der vorliegenden Erfindung beinhaltet die Identifikation und Isolierung vom ganzen BcgI Restriktionsverdau des einzelnen Oligonukleotids, das die Primingstelle ganz proximal zu einem spezifischen Oligonukieotid auf der zu amplifizierenden und klonierenden Matrize enthält. Die folgenden Schritte beschreiben das Verfahren der vorliegenden Erfindung:

1. DNA Isolation und Reinigung von bakteriellen Stämmen oder ganzer Umwelt DNA aus Quellen, wie beispielsweise Öl, Wasser usw. mittels bekannter Verfahren, wie beispielsweise Guanidinthiocyanat, CTAB, Cäsiumchloridgradient oder ihre Kombination und/oder Modifikation;
2. Verdau von isolierter DNA mit BcgI Endonuklease (NEB, Protokoll) und präparative Reinigung von BcgI 34-mer Oligonukleotiden mittels 15 % PAGE oder 2 % Agarosegel in Kombination mit dem QIAEX II Reinigungssystem (Qiagen, CA) oder einem ähnlichen Reinigungssystem.
3. Konstruktion einer 32-mer BcgI Oligonukleotid DNA Bibliothek im M13 Phagen oder jedem anderen Phagemidvektor, der keine BcgI Stelle enthält. Der Vektor wird zuerst mit SmaI, EcoRV oder einer anderen ein glattes Ende erzeugenden, einzigartigen Restriktionsendonuklease verdaut, gefolgt von einer Phosphatase (CIP) Behandlung. Die gereinigten 32-mer BcgI Oligonukleotide werden mit Klenow Fragment von DNA Polymerase I oder T4 DNA Polymerase in Verbindung mit Polynukleotidkinase bei Fehlen von irgendeinem dNTP aber bei Vorhandensein von ATP behandelt, um 3' vorstehende Enden umzuwandeln, die durch BcgI Restriktionsendonuklease an glatte, zur Klonierung geeignete Enden erzeugt werden. Die BcgI Restriktionsfragmente sind jetzt 32 bp. Äquimolare Konzentrationen des Vektors und der 32-mer Oligonukleotide mit glattem Ende werden mittels T4 DNA Ligase ligiert, wonach eine Transformation in jeden herkömmlichen spezifischen Stamm von E. coli (JM101, TG1 oder ER2267) durch chemische Transformation oder Elektroporation mittels herkömmlicher Protokolle erfolgt;
4. Die Phagenbibliothek wird von den Agarplatten im Anschluss an die Transformation gewaschen und einzelsträngige DNA wird durch Standardverfahren gereinigt (4).
5. Der spezifische Primer (spezifische Sonde für das interessierende Gen) wird mit Biotin entweder am 5'-Ende oder willkürlich mittels eines Biotinmarkierungssystems (Vector Labs) oder eines anderen Markierungssystems (z.B. Fluoreszein) markiert.
6. Eine einzelsträngige markierte Kopie der zu klonierenden Sequenz wird wie folgt erzeugt. Das Annealing und die Elongation des markierten, genspezifischen Primers mit genomischer DNA Matrize erzeugt eine einzelsträngige, biotinylierte Kopie der interessierenden DNA, einschließlich der Sequenz stromabwärts zur bekannten Region und diese flankierend, die die Annealingstelle der genspezifischen Sonde enthält (5). Die biotinylierte Kopie der DNA wird durch Absorption auf einer Avidin oder Streptavidin enthaltenden Matrix, wie beispielsweise Avidex (Vector Labs, CA) oder einer anderen Affinitätsmatrix isoliert (6);
7. Einzelsträngige Oligonukleotid DNA von der Phagenbibliothek (Schritt 4) wird dann mit einzelsträngiger biotinylierter DNA unter geeigneten Bedingungen hybridisiert. Die ganze nicht spezifische Phasen DNA wird dann ausgewaschen und nur Phasen DNA, die komplementäre Sequenzen enthält, hybridisiert an die biotinylierte DNA. Ein anschließendes Kochverfahren setzt die einzelsträngige Phasen DNA frei, die dann über Retransformation in E. coli amplifiziert und in vivo amplifiziert werden kann (7).
8. Die Phagenbibliothek kann zur Erzeugung von zweiten Primern entweder mit der PCR der Polylinkerregion oder durch BcgI Verdau verwendet werden; ein Wiederholen der Schritte 5–7 führt zu einem gestaffelten Satz von PCR Primern, die zur Amplifikation eines ganzen biosynthetischen Pathways verwendet werden können;
9. Die Phagenbibliothek wird zur Erzeugung von zweiten Primern für die PCR verwendet. Von den vielen Weisen, auf die dies erreicht werden kann, wurden zwei Beispiele beschrieben. Erstens wurde die 32 bp Region des Inserts direkt sequenziert und diese Sequenz wurde für die Oligonukleotidsynthese verwendet. Als Beispiel führte dies zu mehreren Primern, einschließlich GGGTCCGGCAGACCGTTCGCGGGCCGGAC, GAGCGGACCGCACCGCGATCGGAACAACCT, TCTCCGGGGCAGCGCGGTCGCGGAACGT.

Eine BLAST Suche bestätigte die Beziehung zu dem Genus Streptomyces, wie erwartet. Zweitens wurde die Polylinkerregion, die das 32 bp Insert enthielt (gewünschter PCR Klonierungsprimer), durch PCR mittels der M13 universellen und M13 Rückwärtsprimern amplifiziert, wodurch ein 184 bp PCR Produkt erzeugt wurde. Das 32 bp BcgI Fragment wird mit einzigen EcoRI und BamHI Restriktionsendonukleasestellen flankiert und die Restriktion mit diesen Enzymen wurde verwendet, um ein 52 bp Fragment zu erzeugen, das anschließend in einen Satz von gestaffelten einzelsträngigen Oligonukleotiden durch Behandlung mit ExoIII Nuklease gemäß Standardbedingungen umgewandelt wurde. Jedes Oligonukleotid in diesem gestaffelten Satz hat dasselbe 5'-Ende, aber ein anderes Deletionsniveau am 3'-Ende. Daher kann es zur PCR Klonierung als zweiter Primer gegen einen spezifischen Zielprimer verwendet werden. Dieser Ansatz kann verwendet werden, um mehrere Gene mit ganzer Länge, Operone und ganze biosynthetische Pathways zu klonieren, wie im nächsten Schritt gezeigt wird.

10. Dieses Verfahren wurde verwendet, um eine Region zu klonieren, die eine spezifische Primingstelle im acvs Gen von S. clavuligerus flankiert. Die Kombination des ersten Primers (genspezifisch) und der sekundären Primer in einer PCR führt zur Erzeugung von Sequenzen, die die genspezifische Primer-Annealingstelle flankieren (8). Zusätzliche Sequenzen können anschließend kloniert und zur Expression von Proteinen, die interessierende sekundäre Metabolite erzeugen (zum Beispiel Antibiotika), in einem Operon kombiniert werden.

Eine noch andere Anpassung der vorliegenden Erfindung beschreibt ein Verfahren zur Erzeugung und Verwendung von hochspezifischen PCR Primern mit häufig auftretenden Primingstellen über einen breiten Genombereich. Diese Primer sind neu und sehr nützlich zum Klonieren von Sequenzen, die eine Zielsequenz ohne vorherige Kenntnisse über die zu klonierende Sequenz flankieren. Dieser Primersatz ist kollektiv als universelle Primerbibliothek nützlich, wobei die Spezifität auf den bei dieser Herstellung verwendeten Kriterien beruht.
Diese Anpassung der vorliegenden Erfindung beruht auf der Analyse und Interpretation von DNA Sequenzen von einer Vielzahl von Gattungen, wobei nach relativ langen und häufig wiederholten Sequenzen über einen großen Genombereich gesucht wird.
Als Beispiel wurde eine genomische Analyse von bakteriellen DNA Protein kodierenden Regionen durchgeführt und anschließend wurde ein Satz von 21 universellen Primeroktameroligonukleotiden auf der Grundlage einer sehr großen Häufigkeit von wiederholenden 8 Basensequenzen konstruiert. Darüber hinaus wurden die PCR Bedingungen mittels verschiedener Thermopolymerasen optimiert, einschließlich dem Stoffel Polymerasefragment und zeigen die Fähigkeit dieser „universellen Primer", gegen spezifische Zielprimer zu primen. Eine 10 Basen universelle Oligonukleotidprimerbibliothek wurde auch konstruiert, und die Sequenzanalysedaten zeigen, dass ein Oligonukleotidsatz von praktisch jeder Länge konstruiert werden kann. Allerdings nimmt die Häufigkeit des Auftretens mit steigender Oligonukleotidlänge ab. Jedoch machen lange Amplifikations-PCR- Verfahren selbst dieses hochspezifische aber weniger häufig bindende Oligonukleotid durchaus nützlich.

Als Beispiel wurden Oktamer- und Dekameroligonukleotidbibliotheken dadurch erzeugt, dass eine k-Tuple Suche und Analyse mittels einer eigenen Gendatenbank durchgeführt wurde. Diese Datenbank bestand aus 15 Gattungen, die 34 bakterielle und 4 fungale Spezien darstellten, und 38 Protein kodierende Gene. Die in dieser Datenbank enthaltenen Spezies wurden in einer gewichteten Art auf der Grundlage der bekannten/festgestellten Häufigkeit und Wichtigkeit der sekundären Metabolitenproduktion dargestellt. Von den fast 65.000 berechneten Oktameren waren nur eine Teilmenge von ungefähr 200, oder etwa 0,3 %, häufig in allen oder den meisten Genen vorhanden, die in der Datenbank enthalten waren, und daher für die universelle PCR Klonierung nützlich. Zum Beispiel tritt das Oktamer OS-OCT-003 mit der Sequenz CTCGCCGA 30-mal auf und mindestens einmal in fast jeder Spezies. Dies entspricht einer bestimmten durchschnittlichen Häufigkeit von einmal alle 1.625 Nukleotide, während die willkürliche Häufigkeit für eine Acht-Basen-Sequenz nur einmal alle 65.000 Nukleotide ist. Ähnliche Berechnungen auf der Basis von k = 10 führten zu einer kleineren Zahl von gleich häufigen 10-Basen-Sequenzen, die auch für PCR Primer nützlich sind. Ein Beispiel für 25 Oktamere und 12 Dekamere, die erzeugt und erfolgreich zur Klonierung verwendet wurden, sind in den Tabellen II und III gezeigt. Tabelle II Bakterielle CDS Oktamere mit großer Häufigkeit

Name	Sequenz, 5' –3	Häufigkeit
OS-OCT-001	GTCGGCGA	30
OS-OCT-002	CCAGATCG	21
OS-OCT-003	CTCGCCGA	23
OS-OCT-004	CGACATCG	18
OS-OCT-005	GCCGATCA	17
OS-OCT-006	GCCACCGA	15
OS-OCT-007	GATGCCGA	17
OS-OCT-008	CGGCGAAG	19
OS-OCT-009	CGGCGAAC	19
OS-OCT-010	GGCGATCA	15
OS-OCT-011	GCCGAGGA	17
OS-OCT-012	CGCCGACA	17
OS-OCT-013	ATCGCCGA	13
OS-OCT-014	GGCGAACC	13
OS-OCT-015	GCCGACCA	14
OS-OCT-016	GCCAAGGA	15
OS-OCT-017	CGGCAACG	16
OS-OCT-018	GGCTGGAC	13
OS-OCT-019	GCAGCACC	14
OS-OCT-020	CCAGCCAG	16
OS-OCT-21	CGCCGCCG	39
OS-OCT-22	CGGCGACC	34
OS-OCT-23	CCGCCGCC	33
OS-OCT-24	CGCGGCCG	31
OS-OCT-25	GTCGGCGA	30

Tabelle III Bakterielle CDS Dekamere mit großer Häufigkeit

Name	Sequenz, 5'– 3'	Häufigkeit
OS-DEC-001	CAGCTCGGCG	8
OS-DEC-002	GCCGGTGAGC	7
OS-DEC-003	CCGGGTCGAG	7
OS-DEC-004	GGCGCCGCCC	6
OS-DEC-005	GGCGCCGCCC	6
OS-DEC-006	CGAGGTCGAG	6
OS-DEC-007	CGAGCAGGCC	6
OS-DEC-008	CGACGCGGGC	6
OS-DEC-009	CCTGGCCGCG	6
OS-DEC-010	CCTGCGCGGC	6
OS-DEC-011	ACGGCCGCGG	6
OS-DEC-012	CGAGGACGTC	5

Die Spezifität dieser Oktamere und Dekamere zu den bakterielles Protein kodierenden Sequenzen wurde durch Häufigkeitsanalyse in Säugetier-DNA bestätigt. Die Häufigkeit in der humanen DNA für jedes Oktamer lag mindestens 10-fach niedriger als in bakterieller DNA, was als ein Kriterium zur Auswahl der Oktamere und Dekamere vom ganzen erzeugten Satz verwendet wurde. Außerdem zeigte eine randomisierte Suche gegenüber bekannten Konsensussequenzen bei den meisten erzeugten Oligonukleotiden keine Gegenstücke. Dies bestätigt, dass diese Oligonukleotide tatsächlich neu, einzigartig und für die spezifische universelle Klonierung von in einem Gemisch vorhandener bakterieller DNA sind. Weiter wurde sowohl das Vorhandensein als auch die große Häufigkeit von mehreren dieser Oktameren in mehreren gewünschten Klonierungssequenzen bestätigt (z.B. S. clavuligerus ipns Gen).
Mit diesem Verfahren ist eine PCR mit dem Oktamersatz klar unter Verwendung von E. coli HB101 genomischer DNA (gDNA) als Matrize erreicht worden (9 und 10). Bei Verwendung als einzelne Oligonukleotide in PCR Reaktionen wurden die Amplifikationsprodukte im Größenbereich von 0,2 bis 3 kb beobachtet, der mit dem von der kalkulierten Häufigkeit der Oktamere übereinstimmt. Dies zeigt die Nützlichkeit dieses Oktamersatzes zur Genotypisierung, und zwar zusätzlich zu der Klonierung über Amplifikation gegen einen spezifischen Primer. Ein ähnliches Ergebnis wird mit S. clavuligerus gDNA, die als Matrize verwendet wird, gezeigt. Außerdem wurde die Fähigkeit zur Verwendung dieser Oktamere als paarweise PCR Primer durch Amplifikation eines Produkts mittels ACVS-04, einem eigenen degenerativen Primer für das pcb A Gen, gezeigt (11).
Die vorliegende Erfindung unterscheidet sich vom zufälligen Priming und willkürlichen Priming auf die folgende Weise. Zufälliges Priming ist nicht für jede Art von DNA spezifisch. Umgekehrt sind zufällige Primer allgemein reichspezifisch im Gegensatz zur RAPD (zufällig amplifiziertes polymorphes DNA Verfahren), das ein DNA Polymorphismus-Analyse-System auf der Grundlage der Amplifikation von zufälligen DNA Segmenten mit einzelnen Primern der willkürlichen Nukleotidsequenz ist. Stattdessen verwendet die vorliegende Erfindung Primer, die speziell aus der sorgfältigen Analyse von DNA Datenbanken entwickelt wurden und die sich ergebenden Oligonukleotide sind für Genome universell, die in der Datenbank enthalten sind. Zum Beispiel passte bei einem Verfahren für die RAPD PCR Differenzierung der Streptomyces Art keine der zwölf 10-meren Oligonukleotide zur Sequenz der über 65.000 Oligonukleotide, die durch das Verfahren für die bakterielle DNA Amplifikation erzeugt wurden.
Die Verwendung der vorliegenden Erfindung hat auch einen klaren Vorteil, wenn die gewünschte Zielsequenz von der DNA einer Mischquelle stammt, zum Beispiel der gesamten gereinigten DNA aus dem Boden. Diese Population von Gesamt-DNA enthält bakterielle sowie fungale, pflanzliche DNA und potentiell einen Wirt von vielen anderen verunreinigenden DNAs, was es schwierig macht, spezifisch ein Produkt aus einer einzelnen Gruppe der DNA Bestandteile zu amplifizieren, wie beispielsweise der eines gewünschten bakteriellen Gens. Allerdings ermöglicht ein universeller Primersatz, der wie in dieser Erfindung beschrieben konstruiert ist, das universelle Priming einer spezifischen Teilmenge der gesamten DNA Population, die in diesem Beispiel nur bakterielle DNA ist. Zum Beispiel kann ein spezifisches bakterielles Gen aus einem Gemisch von Bakterien- und Säugetier-DNA mittels eines einzelnen genspezifischen Primers in Verbindung mit einer universellen Oligonukleotidbibliothek amplifiziert werden, die, wie in der vorliegenden Erfindung beschrieben, konstruiert ist.
Ein weiteres Beispiel für die Nützlichkeit der vorliegenden Erfindung wird dadurch gezeigt, dass sie gegen einen spezifischen Primer amplifiziert wird, um die Region der gDNA zu klonieren, die die spezifische Primer-Annealingstelle flankiert. Streptomyces clavuligerus gDNA wurde als Matrize mit spezifischen ACVS, IPNS und anderen spezifischen Primern verwendet, um das Verfahren mit hohem GC enthaltender DNA zu zeigen.
Die kombinierten Ergebnisse aus allen in der vorliegenden Erfindung beschriebenen Verfahren zum direkten Klonieren von einzigartigen Zielgenen aus Meer- und Bodenmikrobengenomen ist in der Tabelle IV aufgelistet. Zusammenfassend enthält diese Sammlung 52 neue Gene mit Homologien mit dem Prototyp-Gen oder der Konsensus-Sequenz im Bereich von 35 bis 90 %. Dies umfasst insgesamt 10 Zielgenklassen, wobei jedes Gen in einer Klasse durch Sequenzierung bestätigt wird (siehe Tabelle IV).
Andere Anpassungen dieser Erfindung betreffen die Optimierung und Verfeinerung der Umwelt-DNA-Isolation und -Reinigung; die PCR Bedingungen und Additive einschließlich DMSO, Formamid und anderen, die Verwendung von Substitutionen neutraler Basen und in die Primer eingearbeiteten Schwänzen bzw. Enden (wie beispielsweise d-azaGtP anstelle von dGTP und Inosin-Schwänze von 2–6 Basen) und spezielle Temperaturcyclisierungsprotokolle; die Konstruktion und Verwendung von degenerativen Primern auf der Basis von kalkulierten universellen Primern, einschließlich die Verwendung von Inosin in Primern, um die Länge und Annealingtemperatur zu erhöhen; und die Konstruktion und Verwendung von markierten Primern, wie beispielsweise Biotinylierung.
Klonierte Zielgene, die die biosynthetischen Pathways darstellen, oder im Allgemeinen, jede flankierende Sequenz können aus einem Gemisch unterschiedlicher DNA, wie beispielsweise Umwelt-DNA oder der Gesamt-DNA einer genomischen Bibliothek, affinitätsgereinigt werden. Dies umfasst sowohl zirkuläre als auch lineare DNA. Anschließend wird das ganze eingefangene Fragment, das das Ziel-Gen/Pathway enthielt, kloniert und in einer Vielzahl von Expressions/Klonierwirtsorganismen verbreitet und auf der Grundlage der Verbindungsklasse des ausgewählten Sonden-Gens auf Bioaktivität hin untersucht. Das Verfahren beruht auf der RecA vermittelten homologen Rekombination und Affinitätschromatographie.
Im Allgemeinen besteht das Verfahren aus den folgenden Schritten: i) Biotinylierung und Affinitätsreinigung des klonierten Sonden-Gens; ii) Reaktion der biotinylierten Sonde mit unterschiedlichen, gemischte DNA enthaltenden Sequenzen, die zur Sonde komplementär sind; iii) Einfangen der Hybridsonde: komplementäre Fragmente auf einem Avidinträger; iv) Elution der eingefangenen Fragmente; v) und molekulare und/oder biologische Klonierung von Fragmenten und Verbreitung in einem geeigneten Wirt, wie beispielsweise E. coli oder S. lividans.
Andere Verwendungen der neuen klonierten Gene umfassen das Hybridisierungsscreening wie reichlich durch die in dieser Offenbarung präsentierten Daten veranschaulicht. Zum Beispiel sind alle Sonden/Primer mit Biotin markiert worden und erfolgreich zur chemilumineszenten Entdeckung der neuen Zielgenen aus Southern Blots von Umwelt-DNA und genomischen Klonen verwendet worden. Anschließende Klonierung und Sequenzierung dieser Zielgene wurde verwendet, um zu bestätigen, dass jede Sonde spezifisch an das beabsichtigte Ziel gebunden hatte. Daher sind diese Sonden sehr nützlich (spezifisch und empfindlich) für die Entdeckung und Isolation von neuen Zielgenen, verwandten Gen-Clustern und biosynthetischen Pathways.
Die Verwendung der DHFR2 Oligos ist besonders viel versprechend für die Entdeckung von neuen Folatantimetaboliten und ihrer kodierenden Gene und Genprodukte (biosynthetische Enzyme). Dieser Ansatz ist die einzige bekannte Quelle für die DHFR2 Gene, von denen die Oligos als TMP resistente klinische Isolate erzeugt wurden. TMP ist ein synthetisiertes Antibiotikum und daher ist eine Suche nach einem natürlichen Erzeuger unter Verwendung von genetischen Determinanten für die klinische Resistenz ziemlich neu (?). Das DHFR2 Oligo zielt auf eine einzigartige Form des DHFR Proteins ab, das keinen Bezug zu der chromosomalen oder anderen mutanten Formen hat, die TMP klinische Resistenz verleihen. Daher sind der Ursprung dieses Gens und Proteins nicht bestimmt worden. DHFR2 kann von einem TMP-artigen biosynthetischen Pathway stammen, wobei dem Erzeuger Eigenresistenz verliehen wird. Diesem Modell folgend sollte das DHFR2 Gen im gesamten TMP-artigen Pathway geclustert sein. Daher stellt die Detektion des DHFR2 Gens auch den ganzen Pathway innerhalb den direkt das Gen flankierenden Bereichen bereit. Die Ergebnisse zeigen klar die Nützlichkeit des Verfahrens der vorliegenden Erfindung und zeigen das Vorhandensein und den möglichen Ursprung dieses einzigartigen Gens in mehreren Umweltbakterienisolaten, wie sowohl durch Koloniehybridisierungssondierung, PCR als auch anschließende Sequenzanalyse der Gene bewertet.
ACVS04 (degenerativ) und ACVS05 Primer wurden dazu verwendet, um ein etwa 500 Basenpaarprodukt aus S. clavuligerus genomischer DNA mittels PCR zu klonieren und zu sequenzieren. Diese PCR war so aufgebaut, dass 400 bp von bekannter S. clavuligerus ACVS und 100 bp von neuer Sequenz dieses Gens erzeugt wurde. Diese Strategie ermöglicht es, die Genauigkeit der Sequenz durch Vergleich mit einer bekannten Sequenz zu bewerten sowie eine neue Sequenz zu erzeugen. Diese Bestätigung ermöglicht die routinemäßige Verwendung der Primer zur Erzeugung einer neuen Sequenz direkt aus den degenerativen PCR Produkten, ein viel schnellerer Ansatz als herkömmlich verwendet.
DHFR2 wird zur erfolgreichen Entdeckung und Sequenzierung von mehreren neuen DHFR Genen verwendet. Diese Gene verleihen Resistenz gegenüber TMP und anderen Folat-Antimetaboliten in WT sowie klinischen Isolaten. Außerdem erzeugen viele der WT Stämme neue Folat-Antimetaboliten.
Die obige Diskussion stellt eine faktische Basis für die Verwendung der Verfahren und Sonden der vorliegenden Erfindung zur Verfügung. Die mit der vorliegenden Erfindung verwendeten Verfahren und die Nützlichkeit der vorliegenden Erfindung werden durch die folgenden nicht beschränkenden Beispiele und beigefügten Figuren veranschaulicht.
BEISPIELE
ALLGEMEINE VERFAHREN:
Allgemeine Verfahren der Molekularbiologie:
Standardmäßige Molekularbiologieverfahren, die auf dem Fachgebiet bekannt und nicht speziell beschrieben sind, wurden generell wie in Sambrook u.a., Molecular Cloning: A Laborstory Manual, Cold Spring Harbor Laborstory Press, New York (1989), und in Ausubel u.a., Current Protocols in Molecular Biology, John Wiley und Söhne, Baltimore, Maryland (1989) und in Perbal, A Practical Guide to Molecular Cloning, John Wiley & Sons, New York (1988), und in Watson u.a., Recombinant DNA, Scientific American Books, New York und in Birren u.a. (Hrsg.) Genome Analysis: A Laborstory Manual Series, Bd. 1–4, Cold Spring Harbor Laborstory Press, New York (1998) und der Methode, wie sie in den US-Patenten 4,666,828 ; 4,683,202 ; 4,801,531 ; 5,192,659 und 5,272,057 beschrieben und hier durch Bezugnahme aufgenommen, ausgeführt. Die Polymerasekettenreaktion (PCR) wurde generell wie in PCR Protocols: A Guide To Methods And Applications, Academic Press, San Diego, CA (1990) durchgeführt. In situ PCR (in der Zelle) in Kombination mit Durchflusszytometrie kann zur Detektion von Zellen, die spezifische DNA und mRNA Sequenzen enthalten, verwendet werden (Testoni u.a., 1996, Blood 87:3822).
Rekombinante Proteinreinigung

Marshak u.a. „Strategies for Protein Purification and Characterization. A laboratory course manual." CSHL Press, 1996.

BEISPIEL 1:
1. Herstellung von biotinylierten sequenzspezifischen Sonden.
40 μl (100 pmol/μl) DNA Primer StsC03, StsC04, IPNS05, IPNS06 wurden mit S-S Photobiotin (Vector Inc., CA) gemäß den Vorschriften des Herstellers markiert. Diese Primer wurden zur Amplifikation der stsC und ipns Gene von S. griseus bzw. S. clavuligerus entwickelt. Nach der n-Butanolkonzentration und EtOH Präzipitation wurden die Primer in 200 μl Wasser (20 pmol/μl) aufgelöst. Die PCR Reaktionen wurden von pT7 blue 3 (Novagene) Plasmiden, enthaltend die zuvor klonierten Sondensequenzen pT7ststC (stsC von S. griseus) und pT7ipns (ipns von S. clavuligerus) als Matrizen durchgeführt.
Die Reaktionsgemische enthielten: 2 μl Primer 1 (20 pmol/μl)(StsC03 oder IPNS05) 2 μl Primer2 (20 pmol/μl)(StSC04 oder IPNS 06), 2 μl Matrizen DNA (10–100 ng/μl)(pT7blue3/StsC/S.gr oder pT7blue/IPNS/S.cl), 2 μl Puffer, 2 μl dNTP Mix (2 mM), 10 μl Wasser und 0,2 μl (0,2 u) Taql. Die Zyklisierung wurde wie folgt durchgeführt: fünf Minuten bei 95°C, 30 Sekunden bei 98°C, 30 Sekunden 52°C, eine Minute 70°C, 34 Wiederholungen. Schließlich wurde die Reaktion auf 70°C für 10 Minuten erwärmt und anschließend bis zur Durchführung einer Produktanalyse bei 4°C gehalten.
10 μg des PCR-Mischprodukts wurde auf Avidin DIA Kügelchen (Vector) gereinigt, um biotinylierte und nicht biotinylierte Sonden zu trennen. Die Ausbeute der biotinylierten Sonde war 4–5 % (0,4–0,5 μg, 12 und 13). Die biotinylierte Fraktion der Sonde wurde zum Einfangen mittels RecA verwendet und die nicht biotinylierte Sonde wurde zum alk-gerichteten Markieren (Amersham) im Hybridisierungsscreening verwendet.
2. Einfangen von spezifische Zielgen enthaltenden Cosmiden aus der pFD666/S.gr/Bibliothek mittels RecA.
5 μl (0,1 μg) der biotinylierten Sonde wurde durch Inkubation für 10 Minuten bei 99°C denaturiert, gemischt mit 50 μl RecA Puffer (25 mM TrisAc, pH 7,5, 10 mM MgOAc, 2 mM CoCl₂, 1 mM ATP, 2 mM ATPγS, 5 μl (2 μg/ul) RecA (NEB). Das Gemisch wurde dann bei 37°C 30 Minuten lang inkubiert. 2,5 μl (2 μg/ul) der CsCl gereinigten Cosmid DNA wurden dann zugesetzt und für eine weitere Stunde bei 37°C inkubiert. 5 μl (50 ng/μl) von mit HindIII verdauter lambda DNA wurde dann dem Gemisch zugegeben, um überschüssiges RecA zu entfernen, für 10 Minuten bei 37°C inkubiert und anschließend 2 μg/μl Proteinase K und SDS 0,2 % zugegeben. Der enzymatische Verdau wurde 30 Minuten lang bei 37°C durchgeführt und dann wurde die Reaktion durch Zugabe von PMSF (100 mM) bis zu einer Endkonzentration von 3 mM gestoppt.
Die eingefangene DNA wurde auf Avidin DIA Kügelchen (20 μl) getrennt, die gemäß den Vorschriften des Herstellers hergestellt wurden. Im letzten Schritt wurde die eingefangene DNA mit 100–200 μl (0,1 M NaOH, 1 mM EDTA) EtOH präzipitiert und in 20 μl Wasser gelöst. Die DNA wurde in E. coli XL1 (Stratagene) elektrotransformiert. Positive Klone wurden durch Koloniehybridisierung mit alk-gerichteten StsC Sonden festgestellt (14). Die DNA von positiven Klonen wurde gereinigt und mittels Dot-Blot, Southern Hybridisierung, PCR und bakteriellem Wachstum auf Platten von LB Agar mit Streptomycin (20 μg/μl) verifiziert.
3. Direkte Klonierung von mittels RecA eingefangenen DNA Fragmenten von S. griseus chromosomaler DNA.
Das Einfangen mittels RecA wurde, wie oben beschrieben, durchgeführt, aber anstelle der Cosmid DNA wurde 5 μl (1 μg/μl) chromosomale DNA von S. griseus, die mit MboI/Sau3Al und CIP verdaut war, verwendet. Nach dem Einfangen mittels RecA und Binden an die Avidin DLA Kügelchen, wurde die DNA mit 200 μl 2,5 mM Biotin eluiert und direkt in den pSCOS1 Cosmidvektor (Stratagene) ligiert. Nach dem Verpacken in lambda Extrakte wurden Klone auf LB Agar mit Amp (50 μg/ml) und Km (25 μg/ml) plattiert. Positive Klone wurden mittels Koloniehybridisierung mit alk-gerichteten StsC Sonden festgestellt (14). DNA von positiven Klonen wurde gereinigt und mittels Dot-Blot, Southern Hybridisierung, PCR und bakteriellem Wachstum auf Platten von LB Agar mit Streptomycin (20 μg/μl) verifiziert. Positive Klone enthalten am häufigsten verwandte Pathway-Gene, wie durch zusätzliche Hybridisierung mit verwandten Gensonden, wie beispielsweise strD, strB und stsC (15) und PCR (16), bestätigt. Außerdem wird die heterologe Expression dieser Gene oft beobachtet, was durch Antibiotika-Resistenz (17) und HPLC chromatographische Profilierung von Zellextrakten und Fermentationsbrühen beurteilt wird, welches weiter die Nützlichkeit dieser Erfindung zum Expressionsklonierungsscreening zeigt.
Die Ergebnisse aus beiden Beispielen zeigen deutlich die Vorteile der gezielten Klonierung durch Bereitstellen von stark angereicherten Bibliotheken von spezifischen Genen und zugehörigen Sequenzen, einschließlich den biosynthetischen Pathways. Die mehrere hundertfache Anreicherung von Bibliotheken für spezifische Gene und verwandte biosynthetische Pathways ist mittels der Verwendung der vorliegenden Erfindung gezeigt worden (14, 18).
In der vorliegenden Anmeldung wird auf verschiedene Veröffentlichungen, einschließlich US-Patenten, durch Autor und Jahr und Patentnummer Bezug genommen. Die vollständige Anführung der Veröffentlichungen ist nachfolgend angegeben, um den Stand der Technik, zu dem die vorliegende Erfindung gehört, vollständiger zu beschreiben.
Die Erfindung wird veranschaulichend beschrieben und es ist davon auszugehen, dass die verwendete Terminologie beschreibend und nicht einschränkend sein soll.
Offensichtlich sind angesichts der obigen Lehren viele Modifikationen und Variationen der vorliegenden Erfindung möglich. Es ist daher davon auszugehen, dass im Umfang der beschriebenen Erfindung die Erfindung anders als speziell beschrieben, aber im Umfang der Ansprüche, ausgeführt werden kann.

Claims

Verfahren zum Klonieren einer ganzen Familie von Genen aus einer gemischten DNA Probe, durch: Erzeugen von mindestens einem Primer für eine als Ziel ausgewählte Gensequenz; Zugeben des Primers zu einer DNA Probe; Durchführen einer degenerierten, verschachtelten PCR zur Replikation der als Ziel ausgewählten Gensequenz und zur Erzeugung einer Genmatrize; Zugeben der Genmatrize zur DNA Probe zur Erleichterung einer stabilen Hybridisierung mit ähnlichen Sequenzen; und Isolieren einer ganzen Familie von Genen oder eines Gens mit Genclustern durch eine Reinigung, die aus der Gruppe bestehend aus Gelreinigung und Affinitätsreinigung ausgewählt ist.
Verfahren nach Anspruch 1, wobei der Erzeugungsschritt weiter das Erzeugen eines Primers mittels k-Tuple, Matrizenableitung und degenerierter PCR aufweist.
Verfahren nach Anspruch 1, wobei der Durchführungsschritt weiter den Schritt des Markierens der replizierten Genmatrize mit einem Affinitäts-Tag aufweist.
Verfahren zum Isolieren von kodierenden Genen oder Gen-Clustern für mindestens ein Polypeptid, das Trimethoprim erzeugt, durch direktes Isolieren und anschließendes Klonieren von mindestens einem kodierenden Gen oder Gen-Clustern, das bzw. die mindestens ein Trimethoprim erzeugendes Polypeptid kodieren, wobei der Isolierungsschritt die folgenden Schritte aufweist: Erzeugen von mindestens einem Primer für eine als Ziel ausgewählte Gensequenz mittels eines Verfahrens, das aus der Gruppe bestehend aus k-Tuple, Matrizenableitung und degenerativer PCR ausgewählt ist; Zugeben des Primers zu einer DNA Probe; Durchführen einer degenerierten, verschachtelten PCR zur Replikation der als Ziel ausgewählten Gensequenz und zur Erzeugung einer Genmatrize; Zugeben der Genmatrize zur DNA Probe zur Erleichterung einer stabilen Hybridisierung mit ähnlichen Sequenzen; und Isolieren einer ganzen Familie von Genen oder eines Gens mit Genclustern, die für Trimethoprim kodieren, durch eine Reinigung, die aus der Gruppe bestehend aus Gelreinigung und Affinitätsreinigung ausgewählt ist.
Verfahren nach Anspruch 4, wobei der Erzeugungsschritt weiter das Erzeugen eines Primers umfasst, der Zieloligonukleotide enthält, die für mindestens einen Abschnitt von DHFR2 kodieren.
Verfahren zum direkten Isolieren von als Ziel ausgewählten Genen oder Gen-Clustern durch: Erzeugen von mindestens einem Primer für eine als Ziel ausgewählte Gensequenz; Zugeben des Primers zu einer DNA Probe; Durchführen einer degenerierten, verschachtelten PCR zur Replikation der als Ziel ausgewählten Gensequenz und zur Erzeugung einer Genmatrize; Zugeben der Genmatrize zur DNA Probe zur Erleichterung einer stabilen Hybridisierung mit ähnlichen Sequenzen; und Isolieren einer ganzen Familie eines Gens mit Genclustern durch eine Reinigung, die aus der Gruppe bestehend aus Gelreinigung und Affinitätsreinigung ausgewählt ist.