-
1. GEBIET DER ERFINDUNG
-
Die
vorliegende Erfindung betrifft im Allgemeinen Verfahren und Materialien
zur Verwendung bei der Genklonierung. Insbesondere betrifft die
vorliegende Erfindung Gen-Sonden/Primer zur Verwendung beim Ermitteln
und Charakterisieren von eine bioaktive Verbindung kodierenden Genen
und Genclustern.
-
2. BESCHREIBUNG DES ZUGEHÖRIGEN STANDES
DER TECHNIK
-
Die
fundamentalen Herausforderungen beim Entwickeln bzw. Entdecken von
Arzneimitteln bzw. Wirkstoffen bestehen darin, eine Leitverbindung
mit gewünschter
Wirksamkeit zu bestimmen und die Leitverbindung so zu optimieren,
dass sie Kriterien, die zur Weiterentwicklung des Wirkstoffs notwendig
sind, erfüllt.
Ein üblicher
Ansatz für
das Entwickeln von Wirkstoffen umfasst das Präsentieren von Makromolekülen, die
mit dem Hervorrufen einer Krankheit (Krankheitsziele) in Zusammenhang
stehen, in Bioassays, in denen potentielle Wirkstoffkandidaten auf
therapeutische Wirksamkeit hin untersucht werden. Solche Moleküle können Rezeptoren,
Enzyme oder Transkriptionsfaktoren sein.
-
Ein
weiterer Ansatz beinhaltet das Präsentieren von ganzen Zellen
oder Organismen, die für
den Verursacher der Krankheit typisch sind. Solche Wirkstoffe umfassen
Bakterien und Tumorzelllinien.
-
Üblicherweise
gibt es zwei Quellen für
potentielle Wirkstoffkandidaten: Sammlungen von natürlichen Produkten
und synthetischen Chemikalien. Die Bestimmung von Leitverbindungen
wird durch Random Screening von solchen Sammlungen, die einen möglichst
breiten Bereich von strukturellen Arten umfassen, erreicht. Die
neuere Entwicklung von synthetischen kombinatorischen chemischen
Bibliotheken wird die Zahl und Vielfalt von zum Screening verfügbaren Verbindungen
weiter erhöhen.
Allerdings ist die Vielfältigkeit
in einer synthetischen chemischen Bibliothek auf die menschliche
Vorstellungskraft und Synthesefertigkeiten beschränkt.
-
Das „Random
Screening" von natürlichen
Produkten aus Quellen, wie beispielsweise Bodenbakterien, Pilzen,
wirbellosen Tieren und Pflanzen, hat zur Entdeckung von vielen wichtigen
Wirkstoffen geführt
(Franco u.a. 1991, Critical Rev Biotechnol 11:193-276; Goodfellow
u.a. 1989, in „Microbial
Products; New Approaches", Cambridge
University Press, Seite 343-383; Berdy 1974, Adv Appl Microbiol
18:309-406; Suffness u.a. 1988, in Biomedical Importance of Marine
Organisms, D.G. Fautin, California Academy of Sciences, Seite 151-157). Über 10.000
dieser Naturprodukte sind biologisch wirksam und mindestens 100
davon werden gegenwärtig verwendet
und decken das ganze therapeutische Spektrum ab, einschließlich Antibiotika,
Krebsmittel und Herz-Kreislauf-Mittel und auch als Agrochemikalien.
Der Erfolg dieses Ansatzes zum Entdecken von Wirkstoffen hängt stark
davon ab, wie viele Verbindungen in ein Screeningprogramm gelangen
und wie wirksam das Screening durchgeführt werden kann. Daher haben
für diesen
Zweck indikationsspezifische Verbindungsbibliotheken enorme Vorteile.
-
Typischerweise
durchsuchen Pharmafirmen Verbindungssammlungen, die hunderttausende
von natürlichen
und synthetischen Verbindungen enthalten. Allerdings hat sich das
Verhältnis
von neuen zu zuvor entdeckten Verbindungen im Lauf der Zeit verringert.
Bei Screenings nach Krebsmitteln beispielsweise können die
meisten mikrobiellen Spezies, die biologisch aktiv sind, Verbindungen
ergeben, die bereits beschrieben sind. Dies liegt teilweise an den
Schwierigkeiten, beständig
und in ausreichender Weise neue Naturproduktproben zu finden, zu
reproduzieren und bereitzustellen. Da biologische Vielfalt stark
von der zugrunde liegenden molekularen Vielfalt abhängt, gibt
es eine unzureichende biologische Vielfalt bei den Organismen, die
gegenwärtig
für das „Random
Screening" ausgewählt werden,
was die Möglichkeit
zur Isolierung von neuen Verbindungen reduziert.
-
Neue
Bioaktivität
wird beständig
in verschiedenen natürlichen
Quellen gefunden. Siehe beispielsweise Cragg u.a. 1994 (in „Ethnobotany
and the search for new drugs" Wiley,
Chichester, Seite 178-196). Wenige dieser Quellen sind systematisch
und gründlich
auf neue Wirkstoff-Leitverbindungen
hin erforscht worden. Zum Beispiel ist geschätzt worden, dass nur 5000 Pflanzenarten
gründlich
auf eine mögliche
medizinische Verwendung hin untersucht wurden. Dies ist ein kleiner
Teil der insgesamt schätzungsweise
250.000 bis 3.000.000 Arten, von denen die meisten in den Tropen
wachsen (Abelson 1990, Science 247:513). Darüber hinaus ist von den schätzungsweise
Millionen Arten von Meeresmikroorganismen nur eine kleine Zahl beschrieben.
Es gibt tatsächlich
eine enorme Artenvielfalt, die als Quellen für Leitverbindungen nicht erschlossen werden.
Herkömmliche
Verfahren zum Entdecken von Verbindungen aus diesen Quellen ist
eine Voraussetzung für
die erfolgreiche Laborkultur der mikrobiellen Flora, ein Verfahren,
das nur ungefähr
1 % Wirksamkeit zeigt. Deshalb kann die große Mehrzahl von Mikroorganismen
aus der Umwelt nicht in einem Labor wachsen gelassen werden und
daher können
alle potentiellen bioaktiven Verbindungen, die sie erzeugen, nicht
untersucht werden.
-
Bodenmikroorganismen,
Pilze, wirbellose Tiere und Pflanzen werden historisch als Quellen
für natürliche Produkte
verwendet. Allerdings gibt es abgesehen von mehreren gut untersuchten
Organismengruppen, wie beispielsweise den Aktinomyzeten, die für das Wirkstoff-Screening
und die kommerzielle Produktion entwickelt wurden, noch immer Probleme
bei der Reproduzierbarkeit und Herstellung. Zum Beispiel ist das
Antitumormittel TAXOLTM ein Bestandteil
der Rinde von voll entwickelten pazifischen Eiben und seine Bereitstellung
als klinisches Mittel hat Bedenken im Hinblick auf den Schaden für das lokale ökologische
System hervorgerufen. Taxol enthält
11 chirale Zentren mit 2048 möglichen
diastereoisomeren Formen, so dass die de novo Synthese im kommerziellen
Umfang unwahrscheinlich erscheint (Phillipson, 1994, Trans Royal
Sco Trop Med Hyg 88 Supp 1:17-19).
-
Wirbellose
Meerestiere stellen eine viel versprechende Quelle für neue Verbindungen
dar, aber es bestehen größere Schwächen bezüglich der
Technologie zum Durchführen
von Wirkstoff-Screenings und einer Bereitstellung im großen Umfang.
Zum Beispiel können
wirbellose Meerestiere schwer zu sammeln sein und viele weisen saisonal
bedingte Schwankungen im Hinblick auf den natürlichen Produktgehalt auf.
-
Meeresmikroorganismen
sind eine viel versprechende Quelle für neue Verbindungen, aber es
bestehen auch größere Schwächen bezüglich der
Technologie zum Durchführen
von Wirkstoff-Screenings und einer industriellen Fermentation mit
Meeresmikroorganismen. Zum Beispiel sind Meeresmikroorganismen schwer zu
sammeln, zu etablieren und in der Kultur zu halten, und viele haben
spezielle Nahrungsanforderungen. Eine zuverlässige Zufuhr von nicht verschmutztem
Meerwasser ist für
die Fermentation im Allgemeinen wichtig. Schätzungsweise überleben
mindestens 99 % der Meeresbakterienarten nicht auf Labormedien.
Weiter ist eine verfügbare
kommerzielle Fermentationsausrüstung
für die Verwendung
unter Salzbedingungen oder unter hohem Druck nicht optimal.
-
Bestimmte
Verbindungen treten in der Natur nur auf, wenn bestimmte Organismen
miteinander und mit der Umgebung in Wechselwirkung treten. Pathogene
können
die Pflanzen-Genexpression ändern
und die Synthese von Verbindungen, wie beispielsweise Phytoalexinen,
einleiten, die es der Pflanze ermöglichen, einem Angriff zu widerstehen.
Zum Beispiel erhöht
die wilde Tabakpflanze Nicotiana sylvestris ihre Alkaloidsynthese,
wenn sie von den Larven von Manduca sexta angegriffen wird. In ähnlicher
Weise können
Pilze auf Phytoalexine durch Entgiftung oder Verhinderung von deren
Ansammlung reagieren. Solche Metabolite gehen durch herkömmliche
Screenings mit hohem Durchsatz ("High-throughput
screenings"), die
einen Pilz nicht zusammen mit seinem Pflanzenwirt bewerten, verloren.
Ein drastisches Beispiel für
den Einfluss der natürlichen Umgebung
auf einen Organismus lässt
sich am Pfeilgiftfrosch sehen. Während
eine letale Dosis des Natriumkanalagonistalkaloids Batrachotoxin
durch Reiben mit einer Pfeilspitze über den Drüsenrücken eines in der Wildnis lebenden
Tiers gewonnen werden konnte, konnte Batrachotoxin in der zweiten
Generation von im Terrarium aufgezogenen Fröschen nicht festgestellt werden
(Daly, 1995, Proc. Natl. Acad. Sci. 92:9-13). Wenn nur die herkömmlichen
Screeningverfahren für
Wirkstoffe angewendet werden, können
potentiell wertvolle Moleküle
wie diese nie entdeckt werden. Außerdem können mikrobielle Symbionten
von Pflanzen und Wirbeltieren manchmal unabhängig voneinander ursprünglich entdeckte,
bioaktive Verbindungen von der Wirtspflanze biosynthetisieren. Tatsächlich erzeugt
in vielen Fällen
(z.B. Taxanen) die Symbiontenpopulation einen viel größeren Bereich
an verwandten Verbindungen. Es wird davon ausgegangen, dass als
Ergebnis eines horizontalen Gentransfers ähnliche biosynthetische Pathways
sowohl beim Wirt als auch beim Symbiont bestehen. Daher stellen
Symbionten-Mikroorganismen eine praktisch unberührte Quelle für neue Naturprodukte
dar, aber nur, wenn neue Verfahren zur Verfügung gestellt werden, die die
Begrenzungen der herkömmlichen
Verfahren bei der Fermentation/Kultivierung und Entdeckung von Verbindungen
aus Umweltmikroorganismen überwinden
können.
-
Darüber hinaus
wird eine Leitverbindung, die durch „Random Screening" entdeckt wurde,
kaum zu einem Arzneimittel, da ihre Potenz, Selektivität, Bioverfügbarkeit
oder Stabilität
vielleicht nicht angemessen sein wird. Typischerweise ist eine bestimmte
Menge an Leitverbindung notwendig, um sie strukturell zu modifizieren und
so ihre anfängliche
Wirksamkeit zu verbessern. Allerdings sind die gängigen Verfahren für die Synthese und
Entwicklung von Leitverbindungen aus natürlichen Quellen, insbesondere
Pflanzen, relativ ineffizient. Es gibt erhebliche Hindernisse in
Verbindung mit verschiedenen Stufen bei der Wirkstoffentwicklung,
wie beispielsweise das Sammeln, das Wachstum eines Wirkstoff erzeugenden
Organismus, die Replikation, Stammverbesserung, Medienverbesserung
und Produktionssteigerung. Diese Probleme verzögern den klinischen Test von
neuen Verbindungen und beeinträchtigen
die Ökonomie
der Verwendung dieser neuen Quellen von Wirkstoff-Leitverbindungen.
-
Gegenwärtig werden
die oben erwähnten
Meeres-, Botanik- und Tierquellen von Naturprodukten zu wenig verwendet.
Derzeit verfügbare
Verfahren zum Erzeugen und Screening von Leitverbindungen können nicht
wirksam auf diese zu wenig erforschten Quellen angewendet werden.
Anders als einige Bodenbakterien und Pilze sind diese Wirkstoff
erzeugenden Organismen nicht ohne weiteres industriellen Fermentationsverfahren
zugänglich.
Gleichzeitig wird der Druck zum Auffinden von neuen Quellen für Wirkstoffe
durch neue hochwirksame Screening-Verfahren mit hohem Durchsatz
intensiviert. Es besteht daher ein allgemeiner Bedarf nach Verfahren
zum Nutzbarmachen der genetischen Ressourcen und chemischen Vielfalt
dieser noch nicht erschlossenen Verbindungsquellen, um neue Wirkstoffe
zu entdecken. Die Entdeckung durch mikrobielle Symbionten bietet
eine Möglichkeit,
wenn Verfahren entwickelt werden können, die die der herkömmlichen Entdeckung
aus Umweltmikroorganismen inhärenten
Begrenzungen überwinden.
-
Die
neuesten Wirkstoffentwicklungsprogramme haben sich auf Mechanismen-basierte
Wirkstoff-Screenings verlagert. Wenn einmal ein molekulares Ziel
identifiziert ist (z. B. ein Hormonrezeptor, der an der Regulation
der Krankheit beteiligt ist), werden Assays entwickelt, um therapeutische
Agenzien zu identifizieren und/oder zu synthetisieren, die auf der
molekularen Ebene mit dem Ziel in Wechselwirkung stehen.
-
Genexpressionsbibliotheken
werden verwendet, um die Zielmoleküle zu identifizieren, zu erforschen und
zu erzeugen. Expressionsklonieren ist ein übliches Verfahren geworden,
mit dem man das ein einzelnes Protein kodierendes Zielgen ohne Kenntnis
der physikalischen Eigenschaften des Proteins erhalten kann.
-
Viele
Proteine, die durch Screening von Genexpressionsbibliotheken identifiziert
werden, die aus den Geweben von Menschen und Säugetieren erstellt werden,
sind potentielle Krankheitsziele, z.B. Rezeptoren (Simonsen u.a.
1994, Trends Pharmacol Sci 15:437-441; Nakayama u.a. 1992, Curr
Opin Biotechnol 3:497-505; Aruffo, 1991, Curr Opin Biotechnol, 2:735-741)
und signalübertragende
Proteine. Siehe Seed u.a., 1987, Proc. Natl. Acad Sci 84:3365-3369;
Yamasaki u.a., 1988, Science 241:825-828; und Lin u.a., 1992, Cell 68:775-785, (Typ III TGF-β Rezeptor)
als Beispiele für
Proteine, die durch funktionelles Expressionsklonieren in Säugetierzellen
identifiziert werden.
-
Sobald
ein Krankheitsziel identifiziert wurde, werden das Proteinziel oder
die genmodifizierten Wirtszellen, die das Proteinziel exprimieren,
in biologischen Assays zum Screening nach Leitverbindungen verwendet
(Luyten u.a. 1993, Trends Biotechnol 11:247-54). Daher wird im Projekt
der Wirkstoffentdeckung die Verwendung von Genexpressionsbibliotheken
weitgehend auf die Identifikation und Produktion von potentiellen Krankheitszielen
auf Proteinebene beschränkt.
Nur in den Fällen,
in denen der Wirkstoff ein Protein oder kleines Peptid, z. B. Antikörper, ist,
werden Expressionsbibliotheken hergestellt, um Moleküle mit der
gewünschten
biologischen Aktivität
zu erzeugen und nach ihnen zu screenen (Huse u.a., 1991, Ciba Foundation
Symp 159:91-102).
-
Allerdings
gibt es andere Anwendungen von Genexpressionsbibliotheken, die für die Wirkstoffentdeckung
relevant sind. Genbibliotheken von Mikroorganismen sind zum Identifizieren
von Genen hergestellt worden, die an den biosynthetischen Wegen
bzw. Pathways beteiligt sind, die arzneilich wirksame Metabolite
und spezielle Chemikalien erzeugen. Diese Pathways erfordern mehrere
Proteine (insbesondere Enzyme), die zu einer größeren Komplexität als die
einzelnen, als Wirkstoffziele verwendeten Proteine führen. Zum
Beispiel wurden Gene, die die Pathways von bakteriellen Polyketidsynthasen
(PKSs) kodieren, durch Screening von Genbibliotheken des Organismus
identifiziert (Malpartida u.a. 1984, Nature 309:462; Donadio u.a.
1991, Science 252:675-679). PKSs katalysieren mehrere Schritte der
Biosynthese von Polyketiden, eine wichtige Klasse von therapeutischen
Verbindungen, und steuern die strukturelle Vielfalt der erzeugten
Polyketide. Es wurde ein Wirt-Vektor-System in Streptomyces entwickelt,
das eine gerichtete Mutation and Expression von klonierten PKS Genen
ermöglicht
(McDaniel u.a. 1993, Science 262:1546-1550; Kao u.a. 1994, Science 265:509-512).
Dieses spezifische Wirts-Vektor-System
wird verwendet, um wirksamere Wege zur Herstellung von Polyketiden
zu entwickeln und um vernünftig
neue Polyketide zu entwickeln (Khosla u.a.,
WO 95/08548 ).
-
Ein
weiteres Beispiel ist die Herstellung des Textilfarbstoffs Indigo
durch Fermentation in einem E. coli Wirt. Zwei Operone, die die
den Multienzym-Biosynthese-Pathway kodierenden Gene enthalten, wurden
gentechnisch manipuliert, um die Herstellung von Indigo durch den
fremden E. coli Wirt zu verbessern (Ensley u.a. 1983, Science 222:167-169;
Murdock u.a. 1993, Bio/Technology 11:381-386). Herkömmliche
Gesamtstudien zur heterologen Expression von Genen, die einen metabolischen
Weg kodieren, beinhalten das Klonieren, die Sequenzanalyse, das „Designen" von Mutationen und
die Neuanordnung von bestimmten Genen, die Proteine kodieren, die
bekanntermaßen
an den zuvor bezeichneten metabolischen Pathways beteiligt sind.
-
WO 95/04150 A offenbart
die Entwicklung von zwei Primern, die der S. avermitilis DNA zugegeben werden,
um ein PCR Produkt zu erhalten.
-
WO 92/7078 A offenbart
die Amplifikation von L. mesenteroides pUC9 Plasmiden mittels PCR
unter Verwendung von Oligonukleotiden, um Fragmente von genomischer
DNA aus L. mesenteroides zu isolieren.
-
WO 97/33988 A offenbart
neue Mutantenformen von humaner Dihydrofolatreduktase (DHFR).
-
WO 94/24277 A offenbart
einen DNA Vektor, der eine DNA umfasst, die eine mutante, antifolatresistente
Dihydrofolatreduktase kodiert, die an einer Stelle in den Vektor
eingeführt
wird, deren Vorhandensein für die
Replikation des Vektors nicht wesentlich ist.
-
WO 99/10539 A offenbart
ein Verfahren zum Identifizieren von Klonen mit einer interessanten
spezifischen Wirkung, umfassend (a) das Erzeugen von einer oder
mehreren Expressionsbibliotheken, die von Nukleinsäuren stammen,
die aus der Umgebung bzw. Umwelt direkt isoliert wurden; und (b)
Screening der Bibliotheken mittels einer DNA Sonde, die an einen
Liganden gebunden sind, wobei die Sonde mindestens einem Teil der
kodierenden Sequenz einer DNA für
eine bekannte Bioaktivität
umfasst.
-
WO 98/17811 A offenbart
eine mobilisierbare kombinatorische Genexpressionsbibliothek, umfassend einen
Pool von Expressionskonstrukten, die jeweils einen Shuttle-Vektor
(SV) umfassen, der in der Lage ist, in unterschiedlichen Arten von
Stämmen
einer Wirtszelle zu replizieren, wobei SV ein cDNA- oder ein genomisches
DNA-Fragment enthält,
das von Arten der Spenderorganismen stammt, wobei das cDNA- oder
das genomische DNA-Fragment funktionsfähig mit mindestens einer regulatorischen
Region verbunden ist, die die Expression von Genen erzielt, die
durch das cDNA- oder das genomische DNA-Fragment in einem geeigneten Wirtsorganismus
kodiert wird.
-
WO 96/40968 A offenbart
ein Verfahren zur Herstellung einer kombinatorischen Polyketidbibliothek (CPL),
umfassend: (a) das Bereitstellen einer Population von Vektoren,
wobei die Vektoren eine willkürliche Auswahl
von Polyketidsynthase (PKS) Genen, Modulen, aktiven Stellen oder
Teilen und mindestens eine funktionsfähig mit den Genen verbundene
Steuersequenz umfassen; (b) das Transformieren einer Population
von Wirtszellen mit der Population von Vektoren, und (c) das Kultivieren
der Population von Wirtszellen unter Bedingungen, unter denen die
Gene im Gencluster transkribiert und translatiert werden können, wodurch
eine kombinatorische Polyketid-Bibliothek erzeugt wird.
-
WO 96/34112 A offenbart
ein neues Wirkstoffabgabesystem („drug delivery system") zum Erzeugen und
Screening auf molekulare Vielfalt hin.
-
Im
Hinblick auf zahlreiche Vorteile beim Verständnis der Krankheitsmechanismen
und der Identifikation von Wirkstoffzielen, gibt es einen steigenden
Bedarf an innovativen Strategien und Verfahren, um Leitverbindungen
schnell zu identifizieren und sie der klinischen Testung zuzuführen.
-
Die
Geschwindigkeit und Verfügbarkeit
der automatisierten Nukleinsäuresynthese
hat in der biologischen Forschung zu schnellen technologischen Fortschritten
geführt.
Zum Beispiel hat es die Verfügbarkeit von
synthetischen Primern zur Sequenzierung den Forschern erlaubt, ihre
Zeit und Arbeit, die die Sequenzierung einer bestimmten Nukleinsäure umfasst,
um etwa 60 % zu reduzieren. Ein weiteres Verfahren, das durch synthetische
Oligonukleotide erleichtert wird, ist die Polymerasekettenreaktion
(PCR). Diese Technik, die die exponentielle Amplifikation von Sequenzen
zwischen zwei synthetischen Primern beinhaltet, bietet beispiellose
Detektionsebenen und erlaubt eine genetische Manipulation der amplifizierten
Sequenz. Weiter ermöglicht die
Verfügbarkeit
von synthetischen Primern eine Vielzahl von genetischen Manipulationen,
die mit relativ einfachen Verfahren durchzuführen sind, einschließlich die
ortsgerichtete Mutagenese und die Maßanfertigung von genetischen
Vektoren.
-
Zu
klonierende Sequenzen werden auch routinemäßig mit synthetischen Oligonukleotiden
modifiziert. Die Modifikationen entweder des Vektors oder der Insertsequenz
können
von der Zugabe einer einfachen Sequenz, die eine Restriktionsenzymstelle
kodieren, bis zu komplizierteren Systemen reichen, die das Modifizieren
des Translationsprodukts der klonierten Sequenz mit einem bestimmten
Peptid oder einer Auswahl von Peptidsequenzen beinhalten. Daher
haben diese technologischen Vorteile in Verbindung mit synthetischen
Oligonukleotiden Forschern viele Möglichkeiten gegeben, um vielfältige biologische
Phänomene
ausführlicher und
schneller sowie genauer zu untersuchen.
-
Die
Oligonukleotidsynthese schreitet über die lineare Kopplung von
einzelnen Monomeren in einer Stufenreaktion voran. Die Reaktionen
werden generell auf einem Festphasenträger durch anfängliche
Kopplung des 3' Endes
des ersten Monomers an den Träger
durchgeführt.
Das zweite Monomer wird dem 5' Ende des
ersten Monomers in einer Kondensationsreaktion zugegeben, um ein
an den festen Träger
gekoppeltes Dinukleotid zu erhalten. Am Ende jeder Kopplungsreaktion
werden die Nebenprodukte und nicht reagierte freie Monomere weggewaschen,
so dass das Ausgangsmaterial für
die nächste
Runde der Synthese das reine an den Träger angelagerte Oligonukleotid
ist. Bei diesem Reaktionssystem stellt die stufenweise Zugabe von
einzelnen Monomeren zu einem einzelnen wachsenden Ende eines Oligonukleotids
eine präzise
Synthese der gewünschten
Sequenz sicher. Außerdem
werden nicht gewünschte
Nebenreaktionen ausgeschaltet, wie beispielsweise die Kondensation
von zwei Oligonukleotiden, was zu hohen Produktausbeuten führt.
-
In
einigen Fällen
ist es gewünscht,
dass synthetische Oligonukleotide willkürliche Nukleotidsequenzen aufweisen.
Dieses Ergebnis kann durch Zugabe von gleichen Mengen an allen vier
Nukleotiden in den Monomerkopplungsreaktionen erzielt werden, was
zur willkürlichen
Einarbeitung von allen Nukleotiden führt und eine Oligonukleotidpopulation
mit willkürlichen
Sequenzen erzeugt. Da alle möglichen
Kombinationen an Nukleotidsequenzen in der Population repräsentiert
werden, sind auch alle möglichen
Kodontriplets repräsentiert. Wenn
es das Ziel ist, ausschließlich
willkürliche
Peptidprodukte zu erzeugen, hat dieser Ansatz eine ernste Limitierung,
weil die willkürlichen
synthetisierten Kodons die Aminosäuren beeinflussen, die während der
Translation der DNA durch die Zelle in die Polypeptide eingearbeitet
werden.
-
Die
Beeinflussung wird durch die Redundanz des genetischen Codes verursacht.
Es gibt vier Nukleotidmonomere, was zu 64 möglichen Tripletkodons führt. Da
nur 20 Aminosäuren
zu spezifizieren sind, werden viele der Aminosäuren durch mehrere Kodons kodiert.
Daher kodiert eine Oligonukleotidpopulation, die durch sequentielle
Addition von Monomeren aus einer willkürlichen Population synthetisiert
wird, keine Peptide, deren Aminosäuresequenz alle möglichen
Kombinationen der 20 unterschiedlichen Aminosäuren in gleichen Verhältnissen
repräsentiert.
Das heißt,
dass die Häufigkeit
der Aminosäuren,
die in Polypeptide eingearbeitet werden, zu den Aminosäuren hin
beeinflusst wird, die durch mehrere Kodons spezifiziert sind.
-
Um
die Aminosäurebeeinflussung
aufgrund der Redundanz des genetischen Codes zu mindern, können die
Oligonukleotide aus Nukleotidtriplets synthetisiert werden. Hier
wird ein Triplet, das für
jede der 20 Aminosäuren
kodiert, aus einzelnen Monomeren kodiert. Sobald sie einmal synthetisiert
sind, werden die Triplets anstelle von einzelnen Monomeren in den
Kopplungsreaktionen verwendet. Durch Mischen von gleichen Triplet-Mengen
kann die Oligonukleotidsynthese mit zufälligen Kodons erreicht werden.
Allerdings übersteigen
die Kosten der Synthese von solchen Triplets bei weitem die der
Synthese von einzelnen Monomeren, weil Triplets nicht im Handel
erhältlich
sind.
-
Es
wäre deshalb
sinnvoll, ein Verfahren zum Synthetisieren von Oligonukleotiden
zu entwickeln, die so aufgebaut sind, dass sie an Gene hybridisieren,
die für
die bioaktive Verbindung kodierende Gene, Antibiotika und sekundäre Metabolite
kodieren. Die vorliegende Erfindung erfüllt diese Bedürfnisse
und bietet auch noch weitere Vorteile.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Gemäß der vorliegenden
Erfindung wird ein Verfahren zum gezielten Klonieren und Anreichern
von Genen und Genclustern zur Verfügung gestellt. Dies wird durch
direktes Klonieren des Ziel-Gens aus der Quell-DNA mittels eines
aus mehreren neuen vorgestellten Verfahren erreicht, zum Beispiel
durch Herstellen von von einer Matrize stammenden Primern mit Zieloligonukleotiden,
Zugeben dieser von einer Matrize stammenden Primern zu einer DNA
Probe und Durchführen
der PCR zur Replikation der Gene, auf die die von der Matrize stammenden
Primer gerichtet sind. Die Verfahren sehen das degenerative („degenerate)
Klonieren der ganzen Familie von verwandten Ziel-Genen aus einer
gemischten DNA Probe vor. Diese Sammlung von verwandten Genen wird
dann dazu verwendet, um größere, das
Ziel-Gen enthaltende Fragmente aus der Probe affinitätszureinigen
und zu klonieren, die zugehörige
Gene des biosynthetischen Pathways darstellen. Das Ergebnis ist
eine mit einem Ziel-Gen/Pathway angereicherte genomische Bibliothek.
Die durch dieses Verfahren zur Verfügung gestellten Gene und die
in Verbindung mit diesem Verfahren verwendeten Proben werden auch bereitgestellt.
Sie sind auch für
das Hybridisierungs-Screening von klonalen Bibliotheken sowie Kultursammlungen
nützlich.
-
BESCHREIBUNG DER ZEICHNUNGEN
-
Weitere
Vorteile der vorliegenden Erfindung sind leicht ersichtlich, da
diese unter Bezugnahme auf die folgende ausführliche Beschreibung besser
verständlich
werden, wenn diese zusammen mit den beigefügten Zeichnungen betrachtet
wird:
-
1 ist
ein Foto, das ein Gel der Ergebnisse der verschachtelten bzw. gestaffelten
PCR („nested PCR)
mit einem degenerierten bzw. degenerativen (Primer)-Paar („degenerate
pair") zum Klonieren
der DHFR2 Gensonde aus Meeressediment DNA zeigt; die Spuren 10–15 sind
die Produkte aus der ersten PCR unter Verwendung der Primer DHFR2-1
und DHFR2-4; die Spuren 3–8
sind die Produkte aus der zweiten PCR unter Verwendung der Produkte
aus der ersten PCR als Matrize und der Primer DHFR2-2 und DHFR2-3;
die Spur 9 enthält
Größenmarker;
die Reaktionsbedingungen waren wie im Text näher erläutert; die erwartete Produktgröße beträgt etwa
120 bp, wie in den Spuren 8 und 4 zu sehen ist;
-
2A,
B und C veranschaulichen die Strategie zum Erzeugen von matrizenspezifischen
Primern und deren Verwendung bei der spezifischen Klonierung von
unbekannten flankierenden Sequenzen gegen einen einzelnen bekannten
Primer, wobei Details im Text erörtert
werden;
-
3 zeigt die PCR Amplifikation des Teils
des Amp Resistenzgens von pBR325 als Matrize unter Verwendung von
BcgI abgeleiteten Primern und dem sequenzspezifischen pPstCW Primer,
wobei das Reaktionsgemisch mit BamHI (50 ng) verdautes pBR325 als
Matrize, 32-mer BcgI Primer von pBR325 (gelgereinigt 12 pmol) und/oder
32-mer sequenzspezifischen
Primer pPstCW (40 pmol) enthält;
BcgI Primer wurden fünf Minuten
bei 100°C
denaturiert und sofort auf Eis heruntergekühlt; für die PCR wurde das Programm
AF08 verwendet (T1 = 96°C,
t = 30 Sekunden; T2 56°C,
t = 1 Minute; T3 = 72°C,
t = 10 Sekunden, die Reaktionen werden in 34 Zyklen durchgeführt); Spuren:
1. Gemisch aus BcgI Oligonukleotid mit Matrize; 2. Gemisch aus BcgI Oligonukleotiden
plus sequenzspezifischem pPstCW Primer mit Matrize; 3. pPstCW Primer
mit Matrize aber ohne BcgI Primer; 4. pPstCW Primer plus BcgI Primergemisch
ohne Matrize; und 5. pBR325 (1 μg)
verdaut mit BcgI Restriktionsendonuklease;
-
4 zeigt
die gereinigte einzelsträngige
DNA Form aus Phagen aufgetrennt auf einem 0,8 % Agarosegel (Ethidiumbromid
gefärbt);
Spur 1. SS DNA M13mp18 (1 μg);
2. SS DNA von M13mp18 BcgI Bibliothek von E. coli HB101 (1 μg); 3. SS
DNA von M13mp18 BcgI Bibliothek von S. clavuligerus (1 μg); und 4.
DNA Marker lambda DNA verdaut mit HindIII (1 μg)(Promega, WI);
-
5 zeigt eine 0,8 % Agarosegelanalyse von
biotinylierten Polymeraseelongationsprodukten (BEPEP); Bild: A mit
Ethidiumbromid gefärbtes
Gel. B Streptavidin-Phosphatase-Assay aus Southern Blotting. PCR
und Polymeraseelongationsreaktion (PER), durchgeführt in 20 μl Reaktionsformat,
enthielten 30 pmol biotinylierte Primer und 100 ng für PCR oder
1 μg für PER DNA
Matrize entweder CsCI gereinigte DNA aus E. coli HB101 oder DNA
aus S. clavuligerus; zur Verbesserung der Elongation wurden die
Reaktionen mit 5u TaKaRa LA DNA Polymerase gemäß den Vorschriften des Herstellers
durchgeführt
(TaKaRa, Japan); die Primer wurden mit Photobiotin (Vector, CA)
gemäß dem Handbuch
markiert; Spuren: 1. PCR von HB101 DNA, Primer AA und AB (sequenzspezifische
Primer für
PEPase Gen von E. coli), 2. PCR von S. clavuligerus DNA mit den Primern
ACVS 010 und 011 (ACVS 04-011 sind sequenzspezifische Primer für das ACVS
Gen von S. clavuligerus); 3. Negativkontroll-PCR Primer AA und AB
ohne Matrize; 4. biotinylierte DNA Marker lambda verdaut mit HindIII
(0,5 μg);
5. Negativkontroll-PCR Primer ACVS 010 und 011 ohne Matrize; 6.
BPEP mit AA Primer und DNA HB101; 7. BPEP mit AB Primer und DNA
HB101; 8. BPEP mit ACVS 04 Primer und DNA S. clavuligerus; 9. BPEP
mit ACVS05 und DNA S. clavuligerus, 10. BPEP mit ACVS08 und DNA
S. clavuligerus; 11. BPEP mit ACVS 09 und DNA S. clavuligerus; 12
BPEP mit ACVS 010 und DNA S. clavuligerus; und 13. BPEP mit ACVS
011 und DNA S. clavuligerus;
-
6 zeigt
den Blot eines Streptavidin-Phosphatase-Assays der Bindung der biotinylierten
mit Polymerase elongierten Produkten (BPEP) an Avidin D Kügelchen
(Vector Labs, CA); Spuren 1. BPEP mit Primern AA und AB von DNA
E. coli HB101 von 2. BPEP mit Primern ACVS 04-011 von S. clavuligerus
DNA. Bild: A BPEP vor der Adsorption an Kügelchen, B BPEP Fraktion nicht
an Kügelchen
gebunden, C BPEP Fraktion inkubiert bei 65°C in TEST Puffer; 50 μl (25 ng/μl) Avidinkügelchen,
zweimal mit drei Volumen TEST Puffer äquilibriert und mit 100 μl BPEP gemischt
und 2 Stunden bei 37°C
inkubiert; dann wurden die Kügelchen
dreimal mit drei Volumen TEST Puffer gewaschen und 2 μl auf Streptavidin-Phosphatase
Dot-Blotting-Assay
analysiert;
-
7 zeigt
ein Foto einer Agarosegelanalyse von gebundenen und ungebundenen
Fraktionen von SS DNA von M13mp18 BcgI Bibliotheken; Spur: 1.,7.
DNA Marker lambda HindIII (1 μg);
2. M13mp18 originale BcgI Bibliothek von E. coli HB101 (10 μg); 3. ungebundene
Fraktion der HB101 BcgI Bibliothek bei 37°C; 4. gebundene Fraktion der
BcgI HB101 Bibliothek bei 37°C;
5. ungebundene Fraktion der BcgI HB101 Bibliothek bei 65°C; 6. gebundene
Fraktion der BcgI HB101 Bibliothek bei 65°C; 8. M13mp18 originale BcgI
Bibliothek von S. clavuligerus (10 μg); 9. ungebundene Fraktion
der BcgI S. clavuligerus Bibliothek bei 37°C; 10. gebundene Fraktion der
BcgI S. clavuligerus Bibliothek bei 37°C; 11. ungebundene Fraktion
der BcgI S. clavuligerus Bibliothek bei 65°C; 12. gebundene Fraktion der
BcgI S. clavuligerus Bibliothek bei 65°C, 10 μl (1 μg/μl) der M13 mp18 SS DNA Bibliothek
gemischt mit 50 μl
Avidin D-BPEP (biotinyliertes polymeraseelongiertes Produkt) in
100 μl TEST
Puffer und über
Nacht bei 55°C
inkubiert; die Temperatur wurde dann für 10 Minuten auf 37°C gesenkt
und 100 μl
ungebundene Fraktion wurde gesammelt; die Kügelchen wurden dreimal mit
drei Volumen TEST Puffer fünf
Minuten lang gewaschen, gebundene Fraktion wurde mit 100 μl Wasser
durch Kochen bei 100°C
für fünf Minuten
eluiert; alle Fraktionen wurden mit Ethanol präzipitiert und in 30 μl Wasser
gelöst; 10 μl wurde mittels
Agarosegelelektrophorese analysiert und 3 μl wurde in Nova Blue E. coli
Zellen (Novagene, WI) elektrotransformiert;
-
8 ist
ein Foto eines Agarosegels, das zur Analyse der PCR Amplifikation
von S. clavuligerus DNA mit sequenzspezifischen ACVS und eingefangenen
(„captured") BcgI Primern verwendet
wird; die PCR Reaktionen werden in 20 μl Format mit 100 ng S. clavuligerus
genomischer DNA als Matrize und 30 pmol Primern durchgeführt; Spur:
1. ACVS 04 plus 011; 2. ACVS 09 plus 011; 3. ACVS 08 plus 010; 4.
ACVS 010 plus 011; 5. DNA Marker lambda HindIII; 6. ACVS 04 plus
04w3bcg; 7. ACVS 04 plus 04w6bcg; 8. ACVS 04 plus 04w9bcg; 9. ACVS
04 plus 04w10bcg; 10. ACVS04 plus 04w13bcg; 11. ACVS09 plus 04w3bcg;
12. ACVS09 plus 04w6bcg; 13. ACVS09 plus 04 w9bcg; 14 ACVS09 plus
04w10bcg; und 15. ACVS09 plus 04w13bcg;
-
9 ist
ein Foto eines Agarosegels, das die PCR Amplifikationsprodukte unter
Verwendung von Octamerprimern zeigt, die mittels der k-Tuple Strategie
berechnet sind, wie im Text beschrieben; die verwendete Matrize
ist HB101 genomische DNA und ansonsten Standardbedingungen; Spuren
1, 1', 18' enthalten Größenmarker;
2–9 oct03
as alleinigen Primer mit variierenden Pufferzusammmensetzungen (Spuren
10–18
sind leer); 2'-9' Standardprimer für das Phosphoenolpyruvat-Gen
als Kontrolle; 10'–18' oct01 als alleinigen
Primer mit demselben variierenden Puffer wie in den Spuren 2–9. Die
Produkte haben die erwartete Größe für eine willkürliche PCR
(„random
PCR")(0,2–3 kb);
-
10 ist
ein Foto eines Agarosegels, das die PCR Amplifikationsprodukte von 9 vergleicht; Spur:
1. Marker; 2. oct01; 3. oct03; die Reaktionen wurden unter optimierten
Bedingungen durchgeführt,
wie aus der Analyse der in der 9 gezeigten
Reaktionen bewertet;
-
11 ist
ein Foto eines Agarosegels, das die PCR Produkte unter Verwendung
von k-Tuple erzeugten Primern paarweise mit für das acvs Gen spezifischen
Primern zeigt; die genomische DNA aus S. clavuligerus wurde als
Matrize unter ansonsten standardgemäßen Zyklisierungsbedingungen
und Temperaturgradient verwendet (jede Primerpaar PCR wurde bei
27°C, 34°C und 42°C durchgeführt, und
zwar von links nach rechts über
das Gel); Spur: 1 Größenmarker;
2–4 ACVS05
und oct01; 5-7 ACVS05 und oct02; 8-10 ACVS07 und oct01; 11-13 ACVS07
und oct02; die Kontrollen bestätigten,
dass die Amplifikation sich aus dem paarweisen Priming von spezifischen
und Oktamer-Primern ergab und nicht aus dem alleinigen Priming durch
einen der Primer allein;
-
12 ist
ein Foto einer Hybridisierungsblotanalyse eines Streptavidin-Phosphatase-Assays
von unterschiedlichen Fraktionen von biotinylierten PCR Sonden während der
Reinigung auf Avidin DLA Kügelchen; Bild:
A) ursprüngliches
Gemisch aus PCR Sonden 2 μl
(50 ng/μl);
B) ungebundene Fraktion von nicht biotinylierten PCR Sonden 2μl (50 ng/μl); C) Biotin
eluierte Fraktionen von biotinylierten PCR Sonden 2 μl (10 ng/μl); Spur:
1. Bio IPNS 05+06 PCR Produkt; 2. Bio StsC03+04 PCR Produkt; 200 μl Avidin
DIA Kügelchen
wurden zur Reinigung verwendet (Kapazität 25 ng/μl);
-
13 ist ein Foto, das eine 1 % Agarosegelelektrophoreseanalyse
von Avidin DIA gereinigten biotinylierten PCR Sonden zeigt; Spur:
1. Bio IPNS 05+06 5 μl
(10 ng/μl);
2. Bio StsC 03+04 5 μl
(10 ng/μl);
Bild: A) mit Ethidiumbromid gefärbtes
Gel; B) Streptavidin-Phosphatase
Assay vom Southern Blotting des Gels;
-
14 ist ein Foto der Ergebnisse des Screenings
von pFD666 und pSCOS1 S. griseus genomischen Bibliotheken, angereichert
für Aminoglycosid-Gene,
mit alk-gerichteten markierten StsC03+04 Sonden; Bild: A) ursprüngliche
Bibliothek (insgesamt 500 Kolonien auf der Platte); B) mittels StsC
und recA eingefangene Bibliothek nach der Elektrotransformation
(insgesamt 250 Kolonien auf der Platte); C) Bibliothek, die von
mit StsC und recA eingefangenen chromosomalen DNA Fragmenten stammt,
die in den pSCOS1 Cosmid Vektor kloniert wurden (insgesamt 2000
Kolonien auf der Platte); die Ergebnisse zeigen eine über 100-fache
Anreicherung für
das spezifische Gen im Vergleich zur erwarteten Zahl von positiven
Klonen in der nicht angereicherten Bibliothek;
-
15 ist
ein Foto von mehreren Dot-Blots von positiven Klonen aus Bibliotheken,
die für
das acvs Gen (linkes Bild) und strB1 (rechtes Bild) angereichert
sind, und zwar entsprechend den beta-Laktam bzw. aminoglycosidbiosynthetischen
Clustern; genomische Bibliotheken wurden aus S. clavuligerus (acvs)
und S. griseus (strB1) erstellt; DNA von positiven Klonen wurde
häufig
mit mehreren zusätzlichen
Gensonden hybridisiert, die mit ihren jeweiligen Clustern verbunden waren
(Tabelle II), was das Klonieren von intakten Clustern und ganzen
Pathways zeigt;
-
16 ist
ein Foto eines Agarosegels, das in der PCR Analyse von mehreren,
für den
Aminoglycosidcluster angereicherten Klonen (14)
verwendet wurde; Spur 1 bis 30: 1. PCR unter Verwendung von E. coli Zellen
mit unterschiedlichen Plasmiden als Matrize; Spur 1' bis 30': 2. PCR unter Verwendung
von den 1. PCR Produkten als Matrize; 1: MW Marker (100 bp Leiter);
2 bis 8: 1. PCR unter Verwendung der StrD Primer; 9 bis 15: 1. PCR
unter Verwendung von StsA Primern; 16: MW Marker (100 bp Leiter);
17 bis 23: 1. PCR unter Verwendung von StrB1 Primern; 24 bis 30:
1. PCR unter Verwendung von StsC Primern; 1': MW Marker (100 bp Leiter); 2' bis 8': 2. PCR unter Verwendung
von StrD Primern; 9' bis
15': 2. PCR unter
Verwendung von StsA Primern; 16':
MW Marker (100 bp Leiter); 17' bis
23': 2. PCR unter
Verwendung von StrB1 Primern; 24' bis
30': 2. PCR unter
Verwendung von StsC Primern, jeder Satz von sieben Spuren mit demselben
Primer folgt demselben Reihenfolgenmuster: (1) keine Matrize; (2)
PDF666 als Matrize; (3) B1-1 als Matrize; (4) B3-1 als Matrize;
(5) B20-2 als Matrize; (6) B20-4 als Matrize; (7) B16str5 als Matrize;
diese Ergebnisse bestätigen
die Retention und das stabile Klonieren des Clusters in vielen Klonen
und bestätigen
die Hybridisierungsergebnisse, die das Vorhandensein dieser Gene
anzeigen; außerdem
wird auch die Nützlichkeit
von vielen in der Tabelle I aufgeführten Oligos, die in doppelt
gestaffelter PCR verwendet werden, wie hier beschrieben, gezeigt;
-
17 ist
ein Foto von antibiotischen Selektionsplatten, die die heterologe
Expression der Aminoglycosidresistenz von S. griseus in E. coli
zeigt; linkes Bild: Gradientenplatten von 0 (unten) bis 25 (oben) μg/ml Streptomycin;
die linke Seite jeder Platte enthält den Ausstrich einer einzelnen
positiven Kolonie, die an die strB1 Gensonde hybridisiert hat; die
rechte Seite jeder Platte enthält
den E. coli Wirt, der mit kein Insert enthaltendem Cosmid transformiert
ist; rechtes Bild: Platten enthalten dieselben Klone wie im linken
Bild; die Platten enthalten 0, 5, 15, 25 μg/ml Streptomycin, und zwar
im Uhrzeigersinn von der oberen linken Platte; und
-
18 zeigt
ein noch anderes Beispiel der Hybridisierungssondierung von genomischen
Bibliotheken unter Verwendung von mehreren Gensonden; SFT4 ist eine
Bibliothek, die von einem trimethoprimresistenten Meerwasserisolat
erstellt ist, sie trägt
das DHFR2 Gen und zeigt antibakterielle Aktivität gegen S. aureus in standardmäßigen antibiotischen
Challenge-Assays.
-
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
-
Im
Allgemeinen stellt die vorliegende Erfindung ein Verfahren und Sonden
zur Verwendung bei der gezielten Klonierung und Anreicherung von
Genen und Genclustern aus einer ansonsten gemischten und sehr vielfältigen DNA
Population zur Verfügung.
Die Verfahren stellen die degenerative Klonierung der ganzen Familie
von verwandten Zielgenen aus einer gemischten DNA Probe zur Verfügung. Diese
Sammlung von verwandten Genen wird dann zum Affinitätsreinigen
und Klonieren von größere Zielgene
enthaltenden Fragmenten aus der Probe verwendet, die zugehörige biosynthetische
Pathway-Gene darstellen. Das Ergebnis ist eine mit Ziel-Gen/Pathway
angereicherte, genomische Bibliothek. Weiterhin werden die durch
dieses Verfahren zur Verfügung
gestellten Gene und die in Verbindung mit diesem Verfahren verwendeten
Sonden bereitgestellt. Diese sind auch für das Hybridisierungsscreening
von klonalen Bibliotheken sowie Kultursammlungen nützlich.
-
Genomik
und Bioinformatik können
verwendet werden, um spezielle Gene und DNA Sequenzen zu identifizieren,
die mit der Biosynthese von spezifischen strukturellen Verbindungsklassen
korrelieren, einschließlich
vielen sekundären
Metaboliten. Dies wird oft entweder durch einen Vergleich der Nukleotidgensequenzen
von bekannten verwandten Genen oder der Proteinsequenzen der Genprodukte
durch mehrere Sequenzgruppierungen („sequence alignment") durchgeführt. Konstante
oder konservierte Regionen in verwandten Sequenzen werden für die Proteinfunktion
für wichtig
gehalten und werden auch in unentdeckten Genen der verwandten Klasse
konserviert. Die Klonierung der gesamten Population von Zielgenen,
die für
eine spezielle Funktion kodieren, ermöglicht, dass die zugehörigen, geclusterten
biosynthetischen Pathways auch auf sehr spezifische und gezielte
Weise kloniert werden (siehe nachstehend). Darüber hinaus ermöglicht die
Verwendung von degenerativer PCR Klonierung die Klonierung sowohl
von nahe als auch entfernt verwandten Genen in einer speziellen
Zielklasse und erlaubt anschließend
die Klonierung und das Einfangen der ganzen genetischen und chemischen
Vielfalt für
die interessierende Zielverbindungsklasse.
-
Die
degenerativ-gestaffelte bzw. degeneriert-verschachtelte Temperaturgradienten
PCR wird zur erfolgreichen Klonierung der Mehrheit oder sogar der
ganzen Population von verwandten Genen aus einem Gemisch aus vielen
Genomen und ansonsten nicht verwandter DNA, wie beispielsweise der
Gesamt-DNA, die aus einer Bodenprobe oder einer anderen Umweltquelle
isoliert wurde, verwendet. Gestaffelte Sätze von degenerativen PCR Primern
sind für
eine Vielzahl von Zielgenen entwickelt worden (siehe TABELLE I).
-
Es
wurden mehrere Oligonukleotid PCR Primer und Hybridisierungssonden
entwickelt und dann synthetisiert, um DNA Sequenzen aus einer Vielzahl
von Quellen als Ziel zu haben, die für eine bioaktive Verbindung
kodierende Gene oder Resistenz-Gene potentiell enthalten. Das Design
jedes Oligos wurde auf der Grundlage der Gruppierung von Sequenzen
der interessierenden Gen- und/oder Proteinfamilie durchgeführt, die öffentlich
verfügbar
sind (d.h. durch GenBank). Mehrere Sequenzen wurden verwendet, falls
verfügbar.
In einigen Fällen
war nur eine einzelne einzigartige Sequenz verfügbar, die zur Berechnung der
Oligosequenzen verwendet wurde. Die meisten Oligos wurden als degenerative
gestaffelte Paare („degenerate
nested pairs") konstruiert,
um ihre Kapazität
für die
Klonierung und Entdeckung sowohl von eng als auch entfernt verwandten neuen
Sequenzen zu maximieren, die gleichermaßen für neuartige Proteine und enzymatische
Produkte kodieren, wie beispielsweise sekundäre Metabolite, die als Wirkstoff-Leitverbindung
zum Screening nützlich
sind.
-
Das
allgemeine Verfahren, das zum Klonieren von Ziel-Genen mittels degenerativer
gestaffelter Temperaturgradienten PCR benutzt wird, verwendet die
folgenden zwei Schritte. Zuerst wird ein Temperaturgradient für die 1.
PCR mit einem Temperaturbereich von 41–60°C eingerichtet. Erreicht wird
dies mittels Pufferarten mit einem pH von 8,3–9,2, MgCl2 (1,5–3,5 mM),
KCl (25 & 75
mM)(Stratagene PCR Optimierungskit). Ein Volumensbereich zwischen
10–30 μl pro Reaktion
wird in ein 0,2 ml Gefäß für Zyklen
zwischen 30–35
platziert. Dies wird 10-fach verdünnt und die 1. PCR Produkte
werden als Matrizen für
eine 2. PCR Reaktion verwendet. Die 2. PCR findet bei 52°C statt und
die anderen Bedingungen sind dieselben wie die der 1. PCR. Es wird
ein Gel des anschließenden
Durchlaufs und der erwarteten Produktgröße geschnitten. DNA wird aus
dem Gel mit einem Gelextraktionskit (Qiagen) extrahiert. Das PCR
Produkt wird in einen pT7Blue-3 Vektor (Novagen) gemäß den Vorschriften
des Herstellers kloniert. Klone, die das Ziel PCR Produkt enthalten,
werden mittels PCR and/oder Dot-Blot-Hybridisierung gescreent. Das
Plasmid wird dann gereinigt. Die automatisierte Sequenzierung erfolgt
mit einem ThermoSequenase Cy5.5 Terminator Cycle Sequenzierungskit
(Amersham) und 50–250 fmol
Matrize mit M13 Vorwärts-
oder M13 Rückwärtsprimern
(jeweils 2 pmol).
-
Die
neue Sequenz wird gruppiert bzw. ausgerichtet („aligned") und mit Konsensuszielgenen verglichen,
um den Grad der Einzigartigkeit zu bestätigen, indem eine BLAST Suche
und Sequenzanalyse durchgeführt
wird.
-
In
allen Fällen
verbessert die Verwendung dieser degenerativen Primer auf die folgende
Weise die Amplifikation signifikant und reduziert die Zahl der nicht
verwandten falsch geprimerten Produkte. Dies ist ein Problem, wenn
es ansonsten erwünscht
ist, bei der Entdeckung von neuen Genen PCR Produkte direkt zu sequenzieren.
Die meisten falsch geprimerten Produkte können durch Durchführen einer
degenerativen, begrenzt degenerativen, gestaffelten PCR (DLDN-PCR)
ausgeschaltet werden. Die erste PCR kann stark degenerativ sein,
was bei der potentiellen Entdeckung von entfernt verwandten Genen
hilft. Allerdings führt
dies auch zu mehr nicht verwandten Amplifizierungsprodukten. Das
Ergebnis lässt
sich deutlich auf einem Agarosegel der PCR Reaktion ablesen, wo
zu sehen ist, dass die erwartete Produktbande ziemlich diffus ist,
und es existieren Produkte von unerwarteter Größe (1, Spuren
14, 15). Die Analyse dieser Bande auf einem 10 % Acrylamidgel zeigt
das Vorhandensein von mehreren Banden, die jeweils leicht in ihrer
Größe, und
wahrscheinlich der Sequenz variieren. Allerdings führt das
Durchführen
einer zweiten PCR mit der gelgereinigten Produktbande oder dem ersten
PCR Reaktionsgemisch als Matrize und einem gestaffelten Satz von
weniger degenerativen Primern zu einer Amplifikation von nur spezifischen
Matrizenzielen (1, Spuren 4, 8). In diesem Fall
ist ein 150 bp Produkt klar gelöst
und für
die Reinigung und Sequenzierung empfänglich. Dies liegt daran, dass
die Chancen für
ein nicht verwandtes fehlgeprimtes („misprimed") Produkt, das auch eine andere fehlgeprimte
Stelle enthält
(zusätzlich
zu der ersten, die in der ersten PCR fehlgeprimt war) sehr vage
sind. Dies wurde durch Klonieren und Sequenzieren der PCR Produkte
aus einer einzigen, wenn auch diffusen DHFR2 Bande von etwa 150
bp bestätigt.
Obwohl alle klonierten Sequenzen die Primerstellen enthielten, enthielt
ein viel kleinerer Prozentsatz irgendeine verwandte DHFR2 Sequenz,
die durch die Primerstellen gebunden war. Daher führt eine
zweite PCR nur zu einer Amplifikation der wirklich verwandten Moleküle aus der
Produktpopulation. Das Klonieren und Sequenzieren der Produkte aus
dieser zweiten PCR zeigt diesen "Filter"-Effekt. Das Ergebnis
ist eine zuverlässige
Strategie zum Erzeugen von degenerativen PCR Produkten, die für die direkte
Sequenzierung empfänglich
sind. Allerdings führt,
wenn die Zahl der spezifischen Produkte hoch ist, wie das manchmal
für relativ übliche Amplikons
bei Umweltproben der Fall ist, die Klonierung der PCR Produkte zu
einer großen
Zahl von Klonen mit spezifischem Produkt für die Sequenzierung.
-
Mittels
der oben beschriebenen Primer (Tabelle I) und DLDN-PCR wurden mehrere
einzigartige Gene von Meer- und Bodenmikrobengenomen entdeckt und
sequenziert, die mit einer großen
Vielzahl von biosynthetischen Pathways und strukturellen Verbindungsklassen
verbunden waren, einschließlich
Antimetaboliten, beta-Laktamen, Polyketiden, anderen Antibiotika,
Taxanen und anderen.
-
Ein
Beispiel für
dieses Verfahren umfasst eine SC16RA01 Sonde, die mittels der „universellen" 16S RNA PCR Primer
erzeugt wurde, um ein 600 bp DNA Produkt von S. clavuligerus zu
amplifizieren. Diese Sonde ist für
die Koloniehybridisierungssondierung auf Streptomycetes und anderen
verwandten Genomen mit hohem GC Gehalt nützlich.
-
Zusätzlich wird
diese Sonde bei der PCR Amplifikation von ähnlicher genomischer DNA aus
einer heterogenen Population verwendet.
-
Die
sich ergebenden Gensonden können
entweder für
die Entdeckung von einzelnen Genen oder ganzen Clustern benachbarter
Gene verwendet werden, die an der Gesamtsynthese von interessierenden
Verbindungen beteiligt sind, zum Beispiel biosynthetischen Pathways
sekundärer
Metabolite, deren Produkte sehr nützliche Bibliotheken für ein Antibiotika-Screening
und ein Screening anderer therapeutischer Verbindungen umfassen.
Dies ist seit dem erst kürzlich
auftauchenden Bild des Clusterns von sekundären Metabolit-Gen-Pathways
auf dem Bakterien- und Pilzchromosom besonders vielversprechend.
-
Die
folgende Anpassung der vorliegenden Erfindung beschreibt ein Verfahren
zur Erzeugung und Verwendung von hoch spezifischen PCR Primern,
die von der Matrize selbst stammen. Allerdings braucht ihre Sequenz
nicht priori bekannt zu sein. Diese Anpassung nutzt auch einige
einzigartige und neue Eigenschaften von Restriktionsendonukleasen
unter Verwendung von BcgI als Beispiel (2).
-
BcgI
ist eine neue Restriktionsendonuklease vom Typ II, die ursprünglich aus
Bacillus coagulans isoliert wurde und nun im Handel erhältlich ist.
Die Erkennungssequenz für
BcgI ist nachfolgend gezeigt und besteht aus einer spezifischen
6 Basenpaarstelle der DNA Sequenz. Allerdings spaltet das Enzym
außerhalb
dieser Erkennungsstelle und erzeugt ein 32 bp Restriktionsfragment:
5'-/(N)10CGA(N)6TGC(N)12/-3'
3'-/(N)12GCT(N)6ACG(N)10/-5'
-
Jedes
Restriktionsfragment ist statistisch einzigartig hinsichtlich der
Sequenz und kann als spezifischer Oligonukleotidprimer verwendet
werden. Die Häufigkeit
des Auftretens der Erkennungsstelle ist dieselbe wie für eine willkürliche Sechs-Basen-Sequenz
oder etwa einmal alle 4.000 Nukleotide (d.h. 1/46).
Allerdings ist die Einzigartigkeit des Fragments außerordentlich,
weil sie 34 Nukleotide enthält
und einem zufälligen
Auftreten von einmal in 2,9 × 1020 Basen entspricht. Die zufällige Sequenzanalyse
hat die Einzigartigkeit dieser Restriktionsfragmente bestätigt und
dass sie nicht nur ein häufig
auftretendes Repeat sind. Dies liefert die Basis für diese
Fragmente, die als sehr spezifische PCR Primer und Hybridisierungssonden
dienen, wobei jedes Fragment hochspezifisch für seine eigene Erkennungssequenz
ist. Durch Verdau eines ganzen Genoms, ganzen oder teilweisen Chromosomen
oder eines Gemischs aus vielen Genomen können sehr spezifische Primer mit
Primingstellen erzeugt werden, die etwa 4.000 bp entlang der Matrizen
DNA entfernt sind, was ideal für
die PCR Amplifikation und Klonierung ist.
-
Die
Bibliothek dieser einzigartigen Oligonukleotide, die von der stammspezifischen
genomischen DNA oder einer gemischten Population der Umwelt-DNA
erzeugt worden war, kann als Primersatz für die PCR und in Kombination
mit genspezifischen Primern verwendet werden, kann zur Amplifikation
und Klonierung von Nachbarregionen von spezifische Gene umgebender
DNA verwendet werden. Daher kann dieses Verfahren auch zur Klonierung
von langen DNA Segmenten benachbart zu einer spezifischen Zielstelle
verwendet werden, einschließlich
den vollständigen
bakteriellen Operons, oder biosynthetischen Pathway-Gen-Clustern
von jedem Organismus. Allgemeiner gesagt kann diese Anpassung der
vorliegenden Erfindung selektiv und sehr wirksam (d.h. mit hoher
Selektivität)
aus einem DNA Gemisch die Regionen amplifizieren und klonieren,
die jedes spezifische Ziel flankiert, ohne vorhergehende Kenntnis
der zu klonierenden Sequenz.
-
Die
einfachste Anwendung dieser Anpassung der vorliegenden Erfindung
ist die Verwendung des ganzen Satzes von von der BcgI Matrize stammenden
Oligonukleotidprimern in einer PCR, die auch ein zielspezifisches
Oligonukleotid enthält.
Ein Modellsystem ist mit pBR325 entwickelt worden. Dann wurde das
Verfahren der vorliegenden Erfindung verwendet, um ein 300 bp Fragment
des Ampicillinresistenzgens zu amplifizieren unter Verwendung eines
spezifischen Primers und eines willkürlichen Gemischs der von der
Matrize stammenden Primern aus einem BcgI Verdau des pBR325 Plasmids,
das drei BcgI Spaltstellen enthält
(3). Es wurde auch ermittelt, dass
dieses Verfahren sowohl mit linearer als auch kreisförmiger Matrize
unter Anwendung von ansonsten herkömmlichen PCR Bedingungen wirksam
war.
-
Ein
Beispiel für
eine umfangreichere und spezifischere Anwendung dieser Anpassung
der vorliegenden Erfindung beinhaltet die Identifikation und Isolierung
vom ganzen BcgI Restriktionsverdau des einzelnen Oligonukleotids,
das die Primingstelle ganz proximal zu einem spezifischen Oligonukieotid
auf der zu amplifizierenden und klonierenden Matrize enthält. Die
folgenden Schritte beschreiben das Verfahren der vorliegenden Erfindung:
- 1. DNA Isolation und Reinigung von bakteriellen
Stämmen
oder ganzer Umwelt DNA aus Quellen, wie beispielsweise Öl, Wasser
usw. mittels bekannter Verfahren, wie beispielsweise Guanidinthiocyanat,
CTAB, Cäsiumchloridgradient
oder ihre Kombination und/oder Modifikation;
- 2. Verdau von isolierter DNA mit BcgI Endonuklease (NEB, Protokoll)
und präparative
Reinigung von BcgI 34-mer Oligonukleotiden mittels 15 % PAGE oder
2 % Agarosegel in Kombination mit dem QIAEX II Reinigungssystem
(Qiagen, CA) oder einem ähnlichen
Reinigungssystem.
- 3. Konstruktion einer 32-mer BcgI Oligonukleotid DNA Bibliothek
im M13 Phagen oder jedem anderen Phagemidvektor, der keine BcgI
Stelle enthält.
Der Vektor wird zuerst mit SmaI, EcoRV oder einer anderen ein glattes
Ende erzeugenden, einzigartigen Restriktionsendonuklease verdaut,
gefolgt von einer Phosphatase (CIP) Behandlung. Die gereinigten
32-mer BcgI Oligonukleotide werden mit Klenow Fragment von DNA Polymerase
I oder T4 DNA Polymerase in Verbindung mit Polynukleotidkinase bei
Fehlen von irgendeinem dNTP aber bei Vorhandensein von ATP behandelt,
um 3' vorstehende
Enden umzuwandeln, die durch BcgI Restriktionsendonuklease an glatte,
zur Klonierung geeignete Enden erzeugt werden. Die BcgI Restriktionsfragmente
sind jetzt 32 bp. Äquimolare
Konzentrationen des Vektors und der 32-mer Oligonukleotide mit glattem
Ende werden mittels T4 DNA Ligase ligiert, wonach eine Transformation
in jeden herkömmlichen
spezifischen Stamm von E. coli (JM101, TG1 oder ER2267) durch chemische
Transformation oder Elektroporation mittels herkömmlicher Protokolle erfolgt;
- 4. Die Phagenbibliothek wird von den Agarplatten im Anschluss
an die Transformation gewaschen und einzelsträngige DNA wird durch Standardverfahren
gereinigt (4).
- 5. Der spezifische Primer (spezifische Sonde für das interessierende
Gen) wird mit Biotin entweder am 5'-Ende oder willkürlich mittels eines Biotinmarkierungssystems
(Vector Labs) oder eines anderen Markierungssystems (z.B. Fluoreszein)
markiert.
- 6. Eine einzelsträngige
markierte Kopie der zu klonierenden Sequenz wird wie folgt erzeugt.
Das Annealing und die Elongation des markierten, genspezifischen
Primers mit genomischer DNA Matrize erzeugt eine einzelsträngige, biotinylierte
Kopie der interessierenden DNA, einschließlich der Sequenz stromabwärts zur bekannten
Region und diese flankierend, die die Annealingstelle der genspezifischen
Sonde enthält (5). Die biotinylierte Kopie der DNA wird
durch Absorption auf einer Avidin oder Streptavidin enthaltenden
Matrix, wie beispielsweise Avidex (Vector Labs, CA) oder einer anderen
Affinitätsmatrix
isoliert (6);
- 7. Einzelsträngige
Oligonukleotid DNA von der Phagenbibliothek (Schritt 4) wird dann
mit einzelsträngiger biotinylierter
DNA unter geeigneten Bedingungen hybridisiert. Die ganze nicht spezifische
Phasen DNA wird dann ausgewaschen und nur Phasen DNA, die komplementäre Sequenzen
enthält,
hybridisiert an die biotinylierte DNA. Ein anschließendes Kochverfahren
setzt die einzelsträngige
Phasen DNA frei, die dann über
Retransformation in E. coli amplifiziert und in vivo amplifiziert
werden kann (7).
- 8. Die Phagenbibliothek kann zur Erzeugung von zweiten Primern
entweder mit der PCR der Polylinkerregion oder durch BcgI Verdau
verwendet werden; ein Wiederholen der Schritte 5–7 führt zu einem gestaffelten Satz
von PCR Primern, die zur Amplifikation eines ganzen biosynthetischen
Pathways verwendet werden können;
- 9. Die Phagenbibliothek wird zur Erzeugung von zweiten Primern
für die
PCR verwendet. Von den vielen Weisen, auf die dies erreicht werden
kann, wurden zwei Beispiele beschrieben. Erstens wurde die 32 bp Region
des Inserts direkt sequenziert und diese Sequenz wurde für die Oligonukleotidsynthese
verwendet. Als Beispiel führte
dies zu mehreren Primern, einschließlich
GGGTCCGGCAGACCGTTCGCGGGCCGGAC,
GAGCGGACCGCACCGCGATCGGAACAACCT,
TCTCCGGGGCAGCGCGGTCGCGGAACGT.
-
Eine
BLAST Suche bestätigte
die Beziehung zu dem Genus Streptomyces, wie erwartet. Zweitens wurde
die Polylinkerregion, die das 32 bp Insert enthielt (gewünschter
PCR Klonierungsprimer), durch PCR mittels der M13 universellen und
M13 Rückwärtsprimern
amplifiziert, wodurch ein 184 bp PCR Produkt erzeugt wurde. Das
32 bp BcgI Fragment wird mit einzigen EcoRI und BamHI Restriktionsendonukleasestellen
flankiert und die Restriktion mit diesen Enzymen wurde verwendet,
um ein 52 bp Fragment zu erzeugen, das anschließend in einen Satz von gestaffelten
einzelsträngigen
Oligonukleotiden durch Behandlung mit ExoIII Nuklease gemäß Standardbedingungen
umgewandelt wurde. Jedes Oligonukleotid in diesem gestaffelten Satz
hat dasselbe 5'-Ende,
aber ein anderes Deletionsniveau am 3'-Ende. Daher kann es zur PCR Klonierung
als zweiter Primer gegen einen spezifischen Zielprimer verwendet
werden. Dieser Ansatz kann verwendet werden, um mehrere Gene mit
ganzer Länge,
Operone und ganze biosynthetische Pathways zu klonieren, wie im
nächsten Schritt
gezeigt wird.
- 10. Dieses Verfahren wurde verwendet,
um eine Region zu klonieren, die eine spezifische Primingstelle
im acvs Gen von S. clavuligerus flankiert. Die Kombination des ersten
Primers (genspezifisch) und der sekundären Primer in einer PCR führt zur
Erzeugung von Sequenzen, die die genspezifische Primer-Annealingstelle flankieren
(8). Zusätzliche
Sequenzen können anschließend kloniert
und zur Expression von Proteinen, die interessierende sekundäre Metabolite
erzeugen (zum Beispiel Antibiotika), in einem Operon kombiniert
werden.
-
Eine
noch andere Anpassung der vorliegenden Erfindung beschreibt ein
Verfahren zur Erzeugung und Verwendung von hochspezifischen PCR
Primern mit häufig
auftretenden Primingstellen über
einen breiten Genombereich. Diese Primer sind neu und sehr nützlich zum
Klonieren von Sequenzen, die eine Zielsequenz ohne vorherige Kenntnisse über die
zu klonierende Sequenz flankieren. Dieser Primersatz ist kollektiv
als universelle Primerbibliothek nützlich, wobei die Spezifität auf den
bei dieser Herstellung verwendeten Kriterien beruht.
-
Diese
Anpassung der vorliegenden Erfindung beruht auf der Analyse und
Interpretation von DNA Sequenzen von einer Vielzahl von Gattungen,
wobei nach relativ langen und häufig
wiederholten Sequenzen über einen
großen
Genombereich gesucht wird.
-
Als
Beispiel wurde eine genomische Analyse von bakteriellen DNA Protein
kodierenden Regionen durchgeführt
und anschließend
wurde ein Satz von 21 universellen Primeroktameroligonukleotiden
auf der Grundlage einer sehr großen Häufigkeit von wiederholenden
8 Basensequenzen konstruiert. Darüber hinaus wurden die PCR Bedingungen
mittels verschiedener Thermopolymerasen optimiert, einschließlich dem
Stoffel Polymerasefragment und zeigen die Fähigkeit dieser „universellen
Primer", gegen spezifische
Zielprimer zu primen. Eine 10 Basen universelle Oligonukleotidprimerbibliothek
wurde auch konstruiert, und die Sequenzanalysedaten zeigen, dass
ein Oligonukleotidsatz von praktisch jeder Länge konstruiert werden kann.
Allerdings nimmt die Häufigkeit
des Auftretens mit steigender Oligonukleotidlänge ab. Jedoch machen lange
Amplifikations-PCR- Verfahren
selbst dieses hochspezifische aber weniger häufig bindende Oligonukleotid
durchaus nützlich.
-
Als
Beispiel wurden Oktamer- und Dekameroligonukleotidbibliotheken dadurch
erzeugt, dass eine k-Tuple Suche und Analyse mittels einer eigenen
Gendatenbank durchgeführt
wurde. Diese Datenbank bestand aus 15 Gattungen, die 34 bakterielle
und 4 fungale Spezien darstellten, und 38 Protein kodierende Gene. Die
in dieser Datenbank enthaltenen Spezies wurden in einer gewichteten
Art auf der Grundlage der bekannten/festgestellten Häufigkeit
und Wichtigkeit der sekundären
Metabolitenproduktion dargestellt. Von den fast 65.000 berechneten
Oktameren waren nur eine Teilmenge von ungefähr 200, oder etwa 0,3 %, häufig in
allen oder den meisten Genen vorhanden, die in der Datenbank enthalten
waren, und daher für
die universelle PCR Klonierung nützlich.
Zum Beispiel tritt das Oktamer OS-OCT-003 mit der Sequenz CTCGCCGA
30-mal auf und mindestens einmal in fast jeder Spezies. Dies entspricht
einer bestimmten durchschnittlichen Häufigkeit von einmal alle 1.625
Nukleotide, während
die willkürliche
Häufigkeit
für eine
Acht-Basen-Sequenz nur einmal alle 65.000 Nukleotide ist. Ähnliche
Berechnungen auf der Basis von k = 10 führten zu einer kleineren Zahl
von gleich häufigen
10-Basen-Sequenzen,
die auch für
PCR Primer nützlich
sind. Ein Beispiel für
25 Oktamere und 12 Dekamere, die erzeugt und erfolgreich zur Klonierung
verwendet wurden, sind in den Tabellen II und III gezeigt. Tabelle II Bakterielle CDS Oktamere mit großer Häufigkeit
Name | Sequenz,
5' –3 | Häufigkeit |
OS-OCT-001 | GTCGGCGA | 30 |
OS-OCT-002 | CCAGATCG | 21 |
OS-OCT-003 | CTCGCCGA | 23 |
OS-OCT-004 | CGACATCG | 18 |
OS-OCT-005 | GCCGATCA | 17 |
OS-OCT-006 | GCCACCGA | 15 |
OS-OCT-007 | GATGCCGA | 17 |
OS-OCT-008 | CGGCGAAG | 19 |
OS-OCT-009 | CGGCGAAC | 19 |
OS-OCT-010 | GGCGATCA | 15 |
OS-OCT-011 | GCCGAGGA | 17 |
OS-OCT-012 | CGCCGACA | 17 |
OS-OCT-013 | ATCGCCGA | 13 |
OS-OCT-014 | GGCGAACC | 13 |
OS-OCT-015 | GCCGACCA | 14 |
OS-OCT-016 | GCCAAGGA | 15 |
OS-OCT-017 | CGGCAACG | 16 |
OS-OCT-018 | GGCTGGAC | 13 |
OS-OCT-019 | GCAGCACC | 14 |
OS-OCT-020 | CCAGCCAG | 16 |
OS-OCT-21 | CGCCGCCG | 39 |
OS-OCT-22 | CGGCGACC | 34 |
OS-OCT-23 | CCGCCGCC | 33 |
OS-OCT-24 | CGCGGCCG | 31 |
OS-OCT-25 | GTCGGCGA | 30 |
Tabelle III Bakterielle CDS Dekamere mit großer Häufigkeit
Name | Sequenz,
5'– 3' | Häufigkeit |
OS-DEC-001 | CAGCTCGGCG | 8 |
OS-DEC-002 | GCCGGTGAGC | 7 |
OS-DEC-003 | CCGGGTCGAG | 7 |
OS-DEC-004 | GGCGCCGCCC | 6 |
OS-DEC-005 | GGCGCCGCCC | 6 |
OS-DEC-006 | CGAGGTCGAG | 6 |
OS-DEC-007 | CGAGCAGGCC | 6 |
OS-DEC-008 | CGACGCGGGC | 6 |
OS-DEC-009 | CCTGGCCGCG | 6 |
OS-DEC-010 | CCTGCGCGGC | 6 |
OS-DEC-011 | ACGGCCGCGG | 6 |
OS-DEC-012 | CGAGGACGTC | 5 |
-
Die
Spezifität
dieser Oktamere und Dekamere zu den bakterielles Protein kodierenden
Sequenzen wurde durch Häufigkeitsanalyse
in Säugetier-DNA
bestätigt.
Die Häufigkeit
in der humanen DNA für
jedes Oktamer lag mindestens 10-fach niedriger als in bakterieller
DNA, was als ein Kriterium zur Auswahl der Oktamere und Dekamere
vom ganzen erzeugten Satz verwendet wurde. Außerdem zeigte eine randomisierte
Suche gegenüber
bekannten Konsensussequenzen bei den meisten erzeugten Oligonukleotiden
keine Gegenstücke. Dies
bestätigt,
dass diese Oligonukleotide tatsächlich
neu, einzigartig und für
die spezifische universelle Klonierung von in einem Gemisch vorhandener
bakterieller DNA sind. Weiter wurde sowohl das Vorhandensein als
auch die große
Häufigkeit
von mehreren dieser Oktameren in mehreren gewünschten Klonierungssequenzen
bestätigt
(z.B. S. clavuligerus ipns Gen).
-
Mit
diesem Verfahren ist eine PCR mit dem Oktamersatz klar unter Verwendung
von E. coli HB101 genomischer DNA (gDNA) als Matrize erreicht worden
(9 und 10). Bei Verwendung als einzelne
Oligonukleotide in PCR Reaktionen wurden die Amplifikationsprodukte
im Größenbereich
von 0,2 bis 3 kb beobachtet, der mit dem von der kalkulierten Häufigkeit
der Oktamere übereinstimmt.
Dies zeigt die Nützlichkeit
dieses Oktamersatzes zur Genotypisierung, und zwar zusätzlich zu
der Klonierung über
Amplifikation gegen einen spezifischen Primer. Ein ähnliches
Ergebnis wird mit S. clavuligerus gDNA, die als Matrize verwendet
wird, gezeigt. Außerdem
wurde die Fähigkeit
zur Verwendung dieser Oktamere als paarweise PCR Primer durch Amplifikation
eines Produkts mittels ACVS-04, einem eigenen degenerativen Primer
für das
pcb A Gen, gezeigt (11).
-
Die
vorliegende Erfindung unterscheidet sich vom zufälligen Priming und willkürlichen
Priming auf die folgende Weise. Zufälliges Priming ist nicht für jede Art
von DNA spezifisch. Umgekehrt sind zufällige Primer allgemein reichspezifisch
im Gegensatz zur RAPD (zufällig
amplifiziertes polymorphes DNA Verfahren), das ein DNA Polymorphismus-Analyse-System
auf der Grundlage der Amplifikation von zufälligen DNA Segmenten mit einzelnen
Primern der willkürlichen
Nukleotidsequenz ist. Stattdessen verwendet die vorliegende Erfindung
Primer, die speziell aus der sorgfältigen Analyse von DNA Datenbanken
entwickelt wurden und die sich ergebenden Oligonukleotide sind für Genome
universell, die in der Datenbank enthalten sind. Zum Beispiel passte
bei einem Verfahren für
die RAPD PCR Differenzierung der Streptomyces Art keine der zwölf 10-meren Oligonukleotide
zur Sequenz der über
65.000 Oligonukleotide, die durch das Verfahren für die bakterielle
DNA Amplifikation erzeugt wurden.
-
Die
Verwendung der vorliegenden Erfindung hat auch einen klaren Vorteil,
wenn die gewünschte
Zielsequenz von der DNA einer Mischquelle stammt, zum Beispiel der
gesamten gereinigten DNA aus dem Boden. Diese Population von Gesamt-DNA
enthält
bakterielle sowie fungale, pflanzliche DNA und potentiell einen
Wirt von vielen anderen verunreinigenden DNAs, was es schwierig
macht, spezifisch ein Produkt aus einer einzelnen Gruppe der DNA
Bestandteile zu amplifizieren, wie beispielsweise der eines gewünschten
bakteriellen Gens. Allerdings ermöglicht ein universeller Primersatz,
der wie in dieser Erfindung beschrieben konstruiert ist, das universelle
Priming einer spezifischen Teilmenge der gesamten DNA Population,
die in diesem Beispiel nur bakterielle DNA ist. Zum Beispiel kann
ein spezifisches bakterielles Gen aus einem Gemisch von Bakterien-
und Säugetier-DNA
mittels eines einzelnen genspezifischen Primers in Verbindung mit
einer universellen Oligonukleotidbibliothek amplifiziert werden,
die, wie in der vorliegenden Erfindung beschrieben, konstruiert
ist.
-
Ein
weiteres Beispiel für
die Nützlichkeit
der vorliegenden Erfindung wird dadurch gezeigt, dass sie gegen
einen spezifischen Primer amplifiziert wird, um die Region der gDNA
zu klonieren, die die spezifische Primer-Annealingstelle flankiert.
Streptomyces clavuligerus gDNA wurde als Matrize mit spezifischen
ACVS, IPNS und anderen spezifischen Primern verwendet, um das Verfahren
mit hohem GC enthaltender DNA zu zeigen.
-
Die
kombinierten Ergebnisse aus allen in der vorliegenden Erfindung
beschriebenen Verfahren zum direkten Klonieren von einzigartigen
Zielgenen aus Meer- und Bodenmikrobengenomen ist in der Tabelle
IV aufgelistet. Zusammenfassend enthält diese Sammlung 52 neue Gene
mit Homologien mit dem Prototyp-Gen oder der Konsensus-Sequenz im
Bereich von 35 bis 90 %. Dies umfasst insgesamt 10 Zielgenklassen,
wobei jedes Gen in einer Klasse durch Sequenzierung bestätigt wird
(siehe Tabelle IV).
-
Andere
Anpassungen dieser Erfindung betreffen die Optimierung und Verfeinerung
der Umwelt-DNA-Isolation und -Reinigung; die PCR Bedingungen und
Additive einschließlich
DMSO, Formamid und anderen, die Verwendung von Substitutionen neutraler
Basen und in die Primer eingearbeiteten Schwänzen bzw. Enden (wie beispielsweise
d-azaGtP anstelle von dGTP und Inosin-Schwänze von 2–6 Basen) und spezielle Temperaturcyclisierungsprotokolle;
die Konstruktion und Verwendung von degenerativen Primern auf der Basis
von kalkulierten universellen Primern, einschließlich die Verwendung von Inosin
in Primern, um die Länge
und Annealingtemperatur zu erhöhen;
und die Konstruktion und Verwendung von markierten Primern, wie beispielsweise
Biotinylierung.
-
Klonierte
Zielgene, die die biosynthetischen Pathways darstellen, oder im
Allgemeinen, jede flankierende Sequenz können aus einem Gemisch unterschiedlicher
DNA, wie beispielsweise Umwelt-DNA oder der Gesamt-DNA einer genomischen
Bibliothek, affinitätsgereinigt
werden. Dies umfasst sowohl zirkuläre als auch lineare DNA. Anschließend wird
das ganze eingefangene Fragment, das das Ziel-Gen/Pathway enthielt, kloniert und in
einer Vielzahl von Expressions/Klonierwirtsorganismen verbreitet
und auf der Grundlage der Verbindungsklasse des ausgewählten Sonden-Gens
auf Bioaktivität
hin untersucht. Das Verfahren beruht auf der RecA vermittelten homologen
Rekombination und Affinitätschromatographie.
-
Im
Allgemeinen besteht das Verfahren aus den folgenden Schritten: i)
Biotinylierung und Affinitätsreinigung
des klonierten Sonden-Gens; ii) Reaktion der biotinylierten Sonde
mit unterschiedlichen, gemischte DNA enthaltenden Sequenzen, die
zur Sonde komplementär
sind; iii) Einfangen der Hybridsonde: komplementäre Fragmente auf einem Avidinträger; iv)
Elution der eingefangenen Fragmente; v) und molekulare und/oder biologische
Klonierung von Fragmenten und Verbreitung in einem geeigneten Wirt,
wie beispielsweise E. coli oder S. lividans.
-
Andere
Verwendungen der neuen klonierten Gene umfassen das Hybridisierungsscreening
wie reichlich durch die in dieser Offenbarung präsentierten Daten veranschaulicht.
Zum Beispiel sind alle Sonden/Primer mit Biotin markiert worden
und erfolgreich zur chemilumineszenten Entdeckung der neuen Zielgenen
aus Southern Blots von Umwelt-DNA und genomischen Klonen verwendet
worden. Anschließende
Klonierung und Sequenzierung dieser Zielgene wurde verwendet, um
zu bestätigen,
dass jede Sonde spezifisch an das beabsichtigte Ziel gebunden hatte.
Daher sind diese Sonden sehr nützlich
(spezifisch und empfindlich) für
die Entdeckung und Isolation von neuen Zielgenen, verwandten Gen-Clustern
und biosynthetischen Pathways.
-
Die
Verwendung der DHFR2 Oligos ist besonders viel versprechend für die Entdeckung
von neuen Folatantimetaboliten und ihrer kodierenden Gene und Genprodukte
(biosynthetische Enzyme). Dieser Ansatz ist die einzige bekannte
Quelle für
die DHFR2 Gene, von denen die Oligos als TMP resistente klinische
Isolate erzeugt wurden. TMP ist ein synthetisiertes Antibiotikum
und daher ist eine Suche nach einem natürlichen Erzeuger unter Verwendung
von genetischen Determinanten für
die klinische Resistenz ziemlich neu (?). Das DHFR2 Oligo zielt
auf eine einzigartige Form des DHFR Proteins ab, das keinen Bezug
zu der chromosomalen oder anderen mutanten Formen hat, die TMP klinische
Resistenz verleihen. Daher sind der Ursprung dieses Gens und Proteins
nicht bestimmt worden. DHFR2 kann von einem TMP-artigen biosynthetischen
Pathway stammen, wobei dem Erzeuger Eigenresistenz verliehen wird.
Diesem Modell folgend sollte das DHFR2 Gen im gesamten TMP-artigen
Pathway geclustert sein. Daher stellt die Detektion des DHFR2 Gens
auch den ganzen Pathway innerhalb den direkt das Gen flankierenden
Bereichen bereit. Die Ergebnisse zeigen klar die Nützlichkeit
des Verfahrens der vorliegenden Erfindung und zeigen das Vorhandensein
und den möglichen
Ursprung dieses einzigartigen Gens in mehreren Umweltbakterienisolaten,
wie sowohl durch Koloniehybridisierungssondierung, PCR als auch
anschließende
Sequenzanalyse der Gene bewertet.
-
ACVS04
(degenerativ) und ACVS05 Primer wurden dazu verwendet, um ein etwa
500 Basenpaarprodukt aus S. clavuligerus genomischer DNA mittels
PCR zu klonieren und zu sequenzieren. Diese PCR war so aufgebaut,
dass 400 bp von bekannter S. clavuligerus ACVS und 100 bp von neuer
Sequenz dieses Gens erzeugt wurde. Diese Strategie ermöglicht es,
die Genauigkeit der Sequenz durch Vergleich mit einer bekannten Sequenz
zu bewerten sowie eine neue Sequenz zu erzeugen. Diese Bestätigung ermöglicht die
routinemäßige Verwendung
der Primer zur Erzeugung einer neuen Sequenz direkt aus den degenerativen
PCR Produkten, ein viel schnellerer Ansatz als herkömmlich verwendet.
-
DHFR2
wird zur erfolgreichen Entdeckung und Sequenzierung von mehreren
neuen DHFR Genen verwendet. Diese Gene verleihen Resistenz gegenüber TMP
und anderen Folat-Antimetaboliten in WT sowie klinischen Isolaten.
Außerdem
erzeugen viele der WT Stämme
neue Folat-Antimetaboliten.
-
Die
obige Diskussion stellt eine faktische Basis für die Verwendung der Verfahren
und Sonden der vorliegenden Erfindung zur Verfügung. Die mit der vorliegenden
Erfindung verwendeten Verfahren und die Nützlichkeit der vorliegenden
Erfindung werden durch die folgenden nicht beschränkenden
Beispiele und beigefügten
Figuren veranschaulicht.
-
BEISPIELE
-
ALLGEMEINE VERFAHREN:
-
Allgemeine Verfahren der Molekularbiologie:
-
Standardmäßige Molekularbiologieverfahren,
die auf dem Fachgebiet bekannt und nicht speziell beschrieben sind,
wurden generell wie in Sambrook u.a., Molecular Cloning: A Laborstory
Manual, Cold Spring Harbor Laborstory Press, New York (1989), und
in Ausubel u.a., Current Protocols in Molecular Biology, John Wiley
und Söhne,
Baltimore, Maryland (1989) und in Perbal, A Practical Guide to Molecular
Cloning, John Wiley & Sons,
New York (1988), und in Watson u.a., Recombinant DNA, Scientific
American Books, New York und in Birren u.a. (Hrsg.) Genome Analysis:
A Laborstory Manual Series, Bd. 1–4, Cold Spring Harbor Laborstory
Press, New York (1998) und der Methode, wie sie in den
US-Patenten 4,666,828 ;
4,683,202 ;
4,801,531 ;
5,192,659 und
5,272,057 beschrieben und hier durch
Bezugnahme aufgenommen, ausgeführt.
Die Polymerasekettenreaktion (PCR) wurde generell wie in PCR Protocols:
A Guide To Methods And Applications, Academic Press, San Diego,
CA (1990) durchgeführt.
In situ PCR (in der Zelle) in Kombination mit Durchflusszytometrie kann
zur Detektion von Zellen, die spezifische DNA und mRNA Sequenzen
enthalten, verwendet werden (Testoni u.a., 1996, Blood 87:3822).
-
Rekombinante Proteinreinigung
-
- Marshak u.a. „Strategies
for Protein Purification and Characterization. A laboratory course
manual." CSHL Press,
1996.
-
BEISPIEL 1:
-
1. Herstellung von biotinylierten sequenzspezifischen
Sonden.
-
40 μl (100 pmol/μl) DNA Primer
StsC03, StsC04, IPNS05, IPNS06 wurden mit S-S Photobiotin (Vector Inc.,
CA) gemäß den Vorschriften
des Herstellers markiert. Diese Primer wurden zur Amplifikation
der stsC und ipns Gene von S. griseus bzw. S. clavuligerus entwickelt.
Nach der n-Butanolkonzentration und EtOH Präzipitation wurden die Primer
in 200 μl
Wasser (20 pmol/μl)
aufgelöst.
Die PCR Reaktionen wurden von pT7 blue 3 (Novagene) Plasmiden, enthaltend
die zuvor klonierten Sondensequenzen pT7ststC (stsC von S. griseus) und
pT7ipns (ipns von S. clavuligerus) als Matrizen durchgeführt.
-
Die
Reaktionsgemische enthielten: 2 μl
Primer 1 (20 pmol/μl)(StsC03
oder IPNS05) 2 μl
Primer2 (20 pmol/μl)(StSC04
oder IPNS 06), 2 μl
Matrizen DNA (10–100
ng/μl)(pT7blue3/StsC/S.gr
oder pT7blue/IPNS/S.cl), 2 μl
Puffer, 2 μl
dNTP Mix (2 mM), 10 μl
Wasser und 0,2 μl
(0,2 u) Taql. Die Zyklisierung wurde wie folgt durchgeführt: fünf Minuten
bei 95°C,
30 Sekunden bei 98°C,
30 Sekunden 52°C,
eine Minute 70°C,
34 Wiederholungen. Schließlich
wurde die Reaktion auf 70°C
für 10
Minuten erwärmt
und anschließend bis
zur Durchführung
einer Produktanalyse bei 4°C
gehalten.
-
10 μg des PCR-Mischprodukts
wurde auf Avidin DIA Kügelchen
(Vector) gereinigt, um biotinylierte und nicht biotinylierte Sonden
zu trennen. Die Ausbeute der biotinylierten Sonde war 4–5 % (0,4–0,5 μg, 12 und 13). Die biotinylierte Fraktion der Sonde
wurde zum Einfangen mittels RecA verwendet und die nicht biotinylierte
Sonde wurde zum alk-gerichteten Markieren (Amersham) im Hybridisierungsscreening
verwendet.
-
2. Einfangen von spezifische Zielgen enthaltenden
Cosmiden aus der pFD666/S.gr/Bibliothek mittels RecA.
-
5 μl (0,1 μg) der biotinylierten
Sonde wurde durch Inkubation für
10 Minuten bei 99°C
denaturiert, gemischt mit 50 μl
RecA Puffer (25 mM TrisAc, pH 7,5, 10 mM MgOAc, 2 mM CoCl2, 1 mM ATP, 2 mM ATPγS, 5 μl (2 μg/ul) RecA (NEB). Das Gemisch
wurde dann bei 37°C
30 Minuten lang inkubiert. 2,5 μl
(2 μg/ul)
der CsCl gereinigten Cosmid DNA wurden dann zugesetzt und für eine weitere
Stunde bei 37°C
inkubiert. 5 μl
(50 ng/μl) von
mit HindIII verdauter lambda DNA wurde dann dem Gemisch zugegeben,
um überschüssiges RecA
zu entfernen, für
10 Minuten bei 37°C
inkubiert und anschließend
2 μg/μl Proteinase
K und SDS 0,2 % zugegeben. Der enzymatische Verdau wurde 30 Minuten
lang bei 37°C
durchgeführt
und dann wurde die Reaktion durch Zugabe von PMSF (100 mM) bis zu
einer Endkonzentration von 3 mM gestoppt.
-
Die
eingefangene DNA wurde auf Avidin DIA Kügelchen (20 μl) getrennt,
die gemäß den Vorschriften des
Herstellers hergestellt wurden. Im letzten Schritt wurde die eingefangene
DNA mit 100–200 μl (0,1 M
NaOH, 1 mM EDTA) EtOH präzipitiert
und in 20 μl
Wasser gelöst.
Die DNA wurde in E. coli XL1 (Stratagene) elektrotransformiert.
Positive Klone wurden durch Koloniehybridisierung mit alk-gerichteten
StsC Sonden festgestellt (14). Die
DNA von positiven Klonen wurde gereinigt und mittels Dot-Blot, Southern
Hybridisierung, PCR und bakteriellem Wachstum auf Platten von LB
Agar mit Streptomycin (20 μg/μl) verifiziert.
-
3. Direkte Klonierung von mittels RecA
eingefangenen DNA Fragmenten von S. griseus chromosomaler DNA.
-
Das
Einfangen mittels RecA wurde, wie oben beschrieben, durchgeführt, aber
anstelle der Cosmid DNA wurde 5 μl
(1 μg/μl) chromosomale
DNA von S. griseus, die mit MboI/Sau3Al und CIP verdaut war, verwendet.
Nach dem Einfangen mittels RecA und Binden an die Avidin DLA Kügelchen,
wurde die DNA mit 200 μl
2,5 mM Biotin eluiert und direkt in den pSCOS1 Cosmidvektor (Stratagene)
ligiert. Nach dem Verpacken in lambda Extrakte wurden Klone auf
LB Agar mit Amp (50 μg/ml)
und Km (25 μg/ml)
plattiert. Positive Klone wurden mittels Koloniehybridisierung mit
alk-gerichteten StsC Sonden festgestellt (14).
DNA von positiven Klonen wurde gereinigt und mittels Dot-Blot, Southern
Hybridisierung, PCR und bakteriellem Wachstum auf Platten von LB
Agar mit Streptomycin (20 μg/μl) verifiziert.
Positive Klone enthalten am häufigsten
verwandte Pathway-Gene,
wie durch zusätzliche
Hybridisierung mit verwandten Gensonden, wie beispielsweise strD, strB
und stsC (15) und PCR (16),
bestätigt.
Außerdem
wird die heterologe Expression dieser Gene oft beobachtet, was durch
Antibiotika-Resistenz (17) und HPLC chromatographische
Profilierung von Zellextrakten und Fermentationsbrühen beurteilt
wird, welches weiter die Nützlichkeit
dieser Erfindung zum Expressionsklonierungsscreening zeigt.
-
Die
Ergebnisse aus beiden Beispielen zeigen deutlich die Vorteile der
gezielten Klonierung durch Bereitstellen von stark angereicherten
Bibliotheken von spezifischen Genen und zugehörigen Sequenzen, einschließlich den
biosynthetischen Pathways. Die mehrere hundertfache Anreicherung
von Bibliotheken für
spezifische Gene und verwandte biosynthetische Pathways ist mittels
der Verwendung der vorliegenden Erfindung gezeigt worden (14, 18).
-
In
der vorliegenden Anmeldung wird auf verschiedene Veröffentlichungen,
einschließlich
US-Patenten, durch Autor und Jahr und Patentnummer Bezug genommen.
Die vollständige
Anführung
der Veröffentlichungen
ist nachfolgend angegeben, um den Stand der Technik, zu dem die
vorliegende Erfindung gehört,
vollständiger
zu beschreiben.
-
Die
Erfindung wird veranschaulichend beschrieben und es ist davon auszugehen,
dass die verwendete Terminologie beschreibend und nicht einschränkend sein
soll.
-
Offensichtlich
sind angesichts der obigen Lehren viele Modifikationen und Variationen
der vorliegenden Erfindung möglich.
Es ist daher davon auszugehen, dass im Umfang der beschriebenen
Erfindung die Erfindung anders als speziell beschrieben, aber im
Umfang der Ansprüche,
ausgeführt
werden kann.