-
GEBIET DER
ERFINDUNG
-
Die
vorliegende Erfindung betrifft isolierte Nukleinsäuremoleküle, insbesondere
Regulatorsequenzen, besonderer Reispromoter und deren Verwendung
zur Kontrolle der Genexpression in vordefiniertem Weizengewebe,
wie beispielsweise Spelze, Deckspelze und/oder Vorspelze. Ein Verfahren
zur Isolierung dieser Regulatorsequenzen wird ebenfalls offenbart.
-
HINTERGRUND
DER ERFINDUNG
-
Fusarium-Kopfmehltau
von kleinen Körnern
(„Schorf"), der oft mit dem
Akronym „FHB" bezeichnet wird,
nimmt weltweit zu und ist ein enormes Problem bei der Erzeugung
und dem Ertrag von Weizen. Innerhalb der letzten dutzend Jahre sind
Ausbrüche
von FHB in den Mittlerenwesten- und Oststaaten in den USA sowie in
Zentral- und Ostkanada gewesen. Die am meisten ausgedehnte unlängst geschehene
Episode ist in der Frühlingskornregion
des oberen Mittlerenwestens gewesen, das auf dem Red River Valley
von Nord-Dakota, Minnesota und Manitoba zentriert ist. Hier sind
fünf aufeinander
folgende Jahre mit schwerer Krankheit gewesen. Die Verluste sind
groß gewesen,
und ein sich summierender Verlust hat vielen Farmern den Ruin gebracht.
-
Während einige
Spezies des Boden- und Schlagabraum-getragenen Pilzes Fusarium in
der Lage sind, FHB anzuspornen, sind die meisten der Schäden in den
unlängst
geschehenen Ausbrüchen
in den US und Kanada aufgrund von F. graminearum gewesen. Zusätzlich zu
Kornsaaten weist diese Spezies einen breiten Wirtsbereich unter
Gräsern
auf. Der Name Fusarium bedeutet tatsächlich „von den Gräsern". Diese Spezies war
wahrscheinlich im einheimischen Weidenland, lange bevor Weizen oder
Gerste in Nordamerika ankamen, vorhanden. F. graminearum ist ebenfalls
ein vorzüglicher
Besiedler von alternden Pflanzen; insbesondere von Getreidehalmen
bzw. Maistängeln.
F. graminearum ist in einer anderen Hinsicht einzigartig. Es ist
die einzige gewöhnliche
Fusarium-Spezies, die Weizen infiziert, der regelmäßig und
abundant seine Geschlechtsstufe (Giberella zeae) in Natur bildet.
Weil die Sporen, die durch diese Stufe erzeugt werden, gewaltsam
in die Luft geschossen werden, erhöhen sie außerordentlich die Fähigkeit
des Pilzes, sich von einem besiedelten Saatrest zu verstreuen, wo
sich die Fruchtkörper
(perithecia) dieser Stufe bilden.
-
F.
graminearum weist einen komplexen Lebenszyklus auf, der sich leichter
vorstellen lässt,
wenn er in zwei Teile geteilt wird: einen pathogenen Zyklus und
einen ,verborgenen' Zyklus
von saprophytischer Besiedelung. Die Wirkung des pathogenen Zyklus
wird als FHB gesehen. Luftsporen landen auf Blütenköpfen während nassen Wetters, und FHB
ergibt sich. F. graminearum überlebt
auf dem Rest; insbesondere auf infizierten Köpfen und bildet in dem nächsten Frühling und
Sommer Sporen. In dem saprophytischen Zyklus besetzt Myzelium oberflächlich Getreidehalme
bzw. Maisstängel,
oft ohne eine Krankheit zu verursachen. Bei Alterung tritt eine
invasive Besiedelung auf, und F. graminearum nimmt von dem meisten
des Getreidehalm- bzw. Maisstängelrests
Besitz. Eine Minnesota-Studie hat festgestellt, dass über 80%
des Getreidehalm- bzw. Maisstängelrests
im Herbst von F. graminearum besetzt war und es über 60% im folgenden Frühling bedeckte.
Dieser besiedelte Rest stellt eine Stelle zur massiven Sporenbildung
während
der nächsten
Wachstumszeit bereit. Diese in der Luft befindlichen Sporen können eine
neue saprophytische Besiedelung beginnen, oder sie können pathogene
Zyklen einleiten, die zu FHB führen.
Der saprophytische Besiedelungszyklus ist der Motor, der den pathogenen
Teil des Zyklus antreibt.
-
Der
saprophytische Lebenszyklus von F. graminearum wird von Getreidehalm-
bzw. Maisstängelresten
angetrieben. Es gibt eine Anzahl an Beobachtungen, dass, wenn sich
eine Getreideerzeugung in eine früher kleine Kornfläche bewegt,
sich das Auftreten von F. graminearum und die Gefahr von FHB erhöhen. Vereinige
die Ausdehnung von Getreideflächen
in Weizen- und Gerstenland mit großen Erhöhungen in reduziertem Ackerbau,
und die Stufe wird für
große
Epidemien von FHB in kleinen Körnern
festgesetzt, wenn das Wetter auftritt, das die Krankheit begünstigt.
-
Folglich
kann die Fusarium-Kopfmehltau-Krankheit eine Anzahl an Getreidesaaten,
wie beispielsweise Weizen, Gerste, Reis, Roggen und Mais, beeinflussen.
Sie wird durch die phytopathogenen Pilze Fusarium graminearum, F.
moniliforme, F. culmorum, F. nivale und Microdochium nivale verursacht.
Feuchte Umfeldbedingungen während
der Anthese können
zu Fusarium-Epidemien und riesigen Verlusten bei Saateinkünften führen. Die
Krankheit reduziert nicht nur den Saatertrag und die Kornqualität, sondern
führt ebenfalls
zu einer fungalen Mycotoxin-Akkumulation
im Korn.
-
Kang
et al., (Mycol. Res. 104(9): 1083-1093, 200) offenbaren einen experimentellen
Beweis, dass eine Penetration von Wirtsgeweben durch Fusarium culmorum
auf den inneren Oberflächen
von Deckspelze, Spelze und Vorspelze so früh wie 36 Std. nach Impfung
auftrat, was demonstriert, dass Spelze, Deckspelze und/oder Vorspelze
die Schlüsseleintrittspunkte
zum Start des Infektionsprozesses durch Fusarium in Weizen ist.
-
Eines
der Ziele der Pflanzengenmanipulation ist, Pflanzen mit agronomisch
wichtigen Charakteristiken oder Merkmalen zu erzeugen. Jüngste Fortschritte
bei der Genmanipulation haben die notwendigen Werkzeuge zur Transformation
von Pflanzen zum Umfassen und Exprimieren von fremden Genen bereitgestellt
(Kahl et al., 1995, World Journal of Microbiology and Biotechnology
11:449-460). Besonders wünschenswerte
Merkmale oder Qualitäten
von Interesse für
eine Pflanzengenmanipulation werden Resistenz gegen Insekten, Pilzkrankheiten,
wie beispielsweise Fusarium-Kopfmehltau-Krankheit und andere Plagen
bzw. Schädlinge
und Krankheits-verursachende Mittel, Toleranz für Herbizide, verbesserte Ertragsstabilität oder Lagerfähigkeit,
umfeldbedingte Toleranzen und Nährstoffverbesserungen
einschließen,
sind aber nicht darauf beschränkt.
Die technologischen Fortschritte bei der Pflanzentransformation
oder -regeneration haben Forschern ermöglicht, Stücke von DNA, wie beispielsweise
ein Gen oder Gene aus einer heterologischen Quelle oder einer nativen Quelle,
die aber modifiziert ist, um unterschiedliche oder verbesserte Qualitäten aufzuweisen,
zu nehmen und die exogene DNA in das Genom der Pflanze einzubauen.
Das Gen oder die Gen(e) können
dann in der Pflanzenzelle exprimiert werden, um die zusätzliche(n)
Charakteristik(en) oder Merkmal(e) zu zeigen. In einem Ansatz kann
eine Expression eines neuen Gens, das normalerweise nicht in einer
besonderen Pflanze oder Pflanzengewebe exprimiert wird, einen gewünschten
phenotypischen Effekt verleihen. In einem anderen Ansatz kann eine
Transkription eines Gens oder eines Teils eines Gens in einer Antisense-Ausrichtung
einen wünschenswerten
Effekt durch Vorbeugung oder Inhibierung einer Expression eines
endogenen Gens erzeugen.
-
Isolierte
Pflanzen-Promoter sind zur Modifizierung von Pflanzen durch Genmanipulation
zum Aufweisen gewünschter
phenotypischer Charakteristiken nützlich. Um solch eine transgene
Pflanze zu erzeugen, wird ein Vektor, der eine heterologe Gensequenz
einschließt,
die den gewünschten
Phenotyp verleiht, wenn in der Pflanze exprimiert, in die Pflanzenzelle
eingeführt.
Der Vektor schließt
ebenfalls einen Pflanzen-Promoter, der mit der heterologen Gensequenz
operabel verbunden ist, oft einen Promoter ein, der normalerweise
nicht mit dem heterologen Gen assoziiert ist. Der Vektor wird dann
in eine Pflanzenzelle eingeführt,
um eine transformierte Pflanzenzelle zu erzeugen, und die transformierte
Pflanzenzelle wird in einer transgenen Pflanzenzelle regeneriert
bzw. neu gebildet. Der Promoter kontrolliert eine Expression der
eingeführten
DNA-Sequenz, mit der der Promoter operabel verbunden ist, und bewirkt
folglich die gewünschten
Charakteristiken, die durch die DNA-Sequenz verliehen werden.
-
Weil
der Promoter ein Regulatorelement ist, das eine wesentliche Rolle
bei der gesamten Expression eines Gens oder von Genen spielt, wird
es vorteilhaft sein, eine Vielfalt an Promotern zu haben, um eine
Genexpression zuzuschneiden, sodass ein Gen oder Gene effizient
zu der richtigen Zeit während
des Pflanzenwachstums und -entwicklung in dem optimalen Ort in der
Pflanze und in der Menge transkribiert wird, die notwendig ist,
um den gewünschten
Effekt zu erzeugen. In einem Fall, kann, zum Beispiel, eine konstitutive
Expression eines Genprodukts in einem Ort der Pflanze vorteilhaft,
aber weniger vorteilhaft in einem anderen Teil der Pflanze sein.
In anderen Fällen
kann es vorteilhaft sein, ein Genprodukt zu haben, das bei einer
bestimmten Entwicklungsstufe der Pflanze oder in Antwort auf bestimmte
umfeldbedingte oder chemische Stimulantien erzeugt wird. Die kommerzielle
Entwicklung von genetisch verbessertem Keimplasma ist ebenfalls
zu der Stufe der Einführung
von vielen Merkmalen in Saatpflanzen fortgeschritten, was oft als
ein Genstapelungszugang bezeichnet wird. In diesem Ansatz können viele
Gene, die unterschiedliche Charakteristiken von Interesse verleihen,
in eine Pflanze eingeführt
werden. Es ist wichtig, wenn viele Gene in eine Pflanze eingeführt werden, dass
jedes Gen zur optimalen Expression angepasst oder gesteuert wird
und dass die Regulatorelemente verschieden sind, um das Wirkungsvermögen einer
Gendämpfung
zu reduzieren, die durch Rekombination von homologen Sequenzen verursacht
werden kann. Im Lichte dieser und anderer Betrachtungen ist es klar,
dass eine optimale Kontrolle der Genexpression und eine Regulatorelementverschiedenheit
in der Pflanzenbiotechnologie wichtig sind.
-
Die
richtigen Regulatorsequenzen müssen
in dem richtigen Ort in Bezug auf die DNA-Sequenz von Interesse
für die
neu eingefügte
DNA vorhanden sein, die zu transkribieren und dadurch, wenn gewünscht, in ein
Protein in der Pflanzenzelle zu translatieren ist. Diese Regulatorsequenzen
schließen
einen Promoter, einen 5'-nichttranslatierten
Leiter und eine 3'-Polyadenylationssequenz
ein, sind aber nicht darauf beschränkt. Die Fähigkeit, die Gewebe, in die
solch fremde DNA zu transkribieren ist, und die Zeit während des
Pflanzenwachstums auszuwählen,
in der eine Transkription solch fremder DNA zu erhalten ist, ist
ebenfalls durch die Wahl von angemessenen Promotersequenzen möglich, die
die Transkription dieser Gene steuern.
-
Eine
Vielfalt von unterschiedlichen Typen oder Klassen von Promotern
können
zur Pflanzengenmanipulation verwendet werden. Promoter können auf
der Basis eines Bereichs von Gewebespezifizität klassifiziert werden. Zum
Beispiel sind Promoter, die als konstitutive Promoter bezeichnet
werden, in der Lage, operabel verbundene DNA-Sequenzen effizient
zu transkribieren und besagte DNA-Sequenzen in vielen Geweben zu exprimieren.
Gewebe-verbesserte bzw. -verstärkte
oder Gewebe-spezifische Promoter können stromaufwärts von
und operabel verbunden mit DNA-Sequenzen
gefunden werden, die normalerweise in höheren Pegeln in bestimmten
Pflanzengeweben oder spezifisch in bestimmten Pflanzengeweben transkribiert
werden. Andere Klassen von Promotern werden induzierbare Promoter,
die durch externe Stimilantien, wie beispielsweise chemische Mittel,
Entwicklungsstimulantien oder umfeldbedingte Stimulantien, ausgelöst werden,
einschließen, sind
aber nicht darauf beschränkt.
Die unterschiedlichen Typen von gewünschten Promotern können durch Isolierung
der Regulatorregionen von DNA-Sequenzen erhalten werden, die in
einer konstitutiven, Gewebe-verbesserten oder induzierbaren Weise
transkribiert und exprimiert werden.
-
Die
technologischen Fortschritte von Hochdurchsatz-Sequenzierung und
Bioinformatik haben zusätzliche
molekulare Werkzeuge für
eine Promoterentdeckung bereitgestellt. Besondere Zielpflanzenzellen,
-gewebe oder -organe bei einer spezifischen Entwicklungsstufe oder
unter besonderen chemischen, umfeldbedingten oder physiologischen
Bedingungen können
als Quellenmaterial zur Isolierung der mRNA und zum Aufbau von cDNA-Banken
verwendet werden. Die cDNA-Banken werden schnell sequenziert, und
die exprimierten Sequenzen können
elektronisch katalogisiert werden. Unter Verwendung von Sequenzanalysensoftware können Tausende
von Sequenzen in einer kurzen Zeitdauer analysiert werden, und Sequenzen
aus ausgewählten
cDNA-Banken können verglichen
werden. Die Kombination von Labor- und Computer-basierenden Subtraktionsverfahren
erlauben Forschern, c-DNA-Banken abzusuchen und zu vergleichen und
Sequenzen mit einem gewünschten
Expressionsprofil zu identifizieren. Zum Beispiel können Sequenzen,
die bevorzugt in einem Gewebe exprimiert werden, durch Vergleichen
einer cDNA-Bank von einem Gewebe mit cDNA-Banken von anderen Geweben
und elektronischer „Subtraktion" gewöhnlicher
Sequenzen zum Finden von Sequenzen identifiziert werden, die nur
in dem Zielgewebe von Interesse exprimiert werden. Die Gewebe-verbesserte
Sequenz kann dann als eine Sonde oder Primer verwendet werden, um
die entsprechende cDNA in voller Größe zu klonen. Eine genomische
Bank der Zielpflanze kann dann verwendet werden, um das entsprechende
Gen und die assoziierten Regulatorelemente zu isolieren, die die
Promotersequenzen einschließen,
aber nicht darauf beschränkt
sind.
-
Trotz
all der Technologie, die gegenwärtig
verfügbar
ist, sind keine monokotylen Regulatorsequenzen bekannt, die in der
Lage sind, eine Transkription einer operabel verbundenen Nukleinsäuresequenz
in monokotylem Deckspelzen-, Vorspelzen- oder Spelzengewebe zu regulieren.
Insbesondere sind ebenfalls unglücklicherweise
Weizen-Promoter unbekannt, die eine Expression eines Gens in der
Vorspelze, Spelze und/oder Deckspelze von Weizen antreiben könnten. Weil
die Vorspelze, Spelze und/oder Deckspelze die Schlüsseleintrittspunkte
sind, die für
den Fusarium-Angriff anfällig
sind, ist es hoch wünschenswert,
einen Zugriff aus spezifische Promoter zu haben, die, zum Beispiel,
eine Expression eines heterologen Gens antreiben können, das fähig ist,
einen Fusarium-Angriff und/oder eine verwandte Krankheit in diesen
spezifischen Geweben zu verhindern und/oder zu heilen.
-
Die
Datenbank EM_HTG [Online] EBI Hinxton, GB; AC/ID NO: AP004068, 17.
August 2001 (2001-08-17)
SASAKI ET AL.: ,Oryza sativa Nipponbare (GA3) genomic DNA, chromosome
2, BAC' offenbart einen
Reisgenomklon.
-
EP-A-0
913 469 (Japan Tobacco Inc.) offenbart einen Blüten-spezifischen Promoter,
der aus Mais isoliert wird, und dessen Verwendungen. Sie offenbart
weiterhin einen monokotylen (Reis-) Promoter mit bevorzugter Expression
in Deckspelzen- und Vorspelzengewebe.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Die
gegenwärtige
Erfindung offenbart eine Lösung
zu den vorstehenden Problemen mit der Bereitstellung einer neuen
chimären
monokotylen Regulatorsequenz, die SEQ ID NO:1 und einen Minimal-CaMV
oder Reisactin-Promoter umfasst, die in der Lage ist, eine Transkription
einer operabel verbundenen Nukleinsäuresequenz in monokotylem Deckspelzen-,
Vorspelzen- und/oder Spelzengewebe zu regulieren.
-
Um
diese neuen monokotylen Regulatorsequenzen zu isolieren, ist der
folgende erfinderische, nicht offensichtliche Prozess entwickelt
worden. Erstens sind Gewebe-spezifische EST's gefunden worden; zweitens sind spezifische
Homologe in anderen Spezies, z.B. Reis, ausfindig gemacht worden.
Anschließend
ist für
diese spezifischen Homologe, z.B. in Reis, bestimmt worden, dass
sie in der angemessenen Gewebe-spezifischen Weise exprimiert werden.
Unter Verwendung der genomischen DNA-Sequenz sind die Promoter von den
anderen Spezies, d.h. Reis oder Mais, geklont worden.
-
Detaillierter
wurde die Abundanz der 96 abundandesten EST-Cluster-Sequenzen in
einer Weizendeckspelzen-/-vorspelzen-cDNA-Bank in einem Bereich
von cDNA-Banken untersucht, die von verschiedenen Weizen- und Maisgeweben
hergestellt sind. 30 cDNA-Sequenzen, die eine hochgradig verbesserte
Abundanz bei Deckspelzen-, Vorspelzen- und Spelzengeweben über Blatt-,
Halm- bzw. Stängel-,
Embryo- bzw. Fruchtkeim-, Endosperm- und Wurzelgewebe zeigten, wurden
zur weiteren Analyse ausgewählt.
Diese Weizen-EST-Cluster-Sequenzen wurden verwendet, um z.B. Reis-cDNA-Homologe
zu identifizieren. Die Abundanz der Reis-cDNA-Homologe wurde mit
Reisblatt- und Rispen- (schließt
Deckspelze und Vorspelze ein) cDNA-Banken verglichen. Reis-cDNAs, die eine bevorzugte
Expression in der Rispe zeigten, wurden dann verwendet, um homologe
Reisgenom-cDNA-Klone zu identifizieren; die mutmaßlichen
Promotersequenzen sind identifiziert und geklont worden.
-
Die
Isolierung von heterologen Promotern durch eine homologe Intermediat-cDNA
weist zwei Hauptvorteile auf. Erstens eine Identifizierung von Promotern
mit einem konservierten Genexpressionsmuster quer durch Spezies
und zweitens eine zuversichtliche Identifizierung des korrekten
Genfamilienelements zur anschließenden Promoterisolierung.
-
DETAILLIERTE
BESCHREIBUNG DER ERFINDUNG
-
Die
vorliegende Erfindung umfasst folglich einen neuen chimären oder
hybriden monokotylen Promoter, der eine Nukleinsäure der SEQ ID NO: 1 umfasst,
die mit einem Minimal-CaMV oder Reisactin-Promoter kombiniert ist.
-
Die
vorliegende Erfindung umfasst ebenfalls DNA-Konstrukte, die die
offenbarten Sequenzen, wie in SEQ ID NO:1 gezeigt, und operabel
verbunden damit eine transkribierbare DNA-Sequenz und eine 3'-nichttranslatierte Region umfassen.
-
Die
vorliegende Erfindung schließt
ebenfalls irgendeine transgene Pflanzenzelle und Pflanzen ein, die das
hier vorstehende DNA-Konstrukt enthält bzw. enthalten.
-
Die
vorstehende Erfindung stellt ebenfalls ein Verfahren zur Verwendung
einer monokotylen Sequenz der SEQ ID NO:1 bereit, um eine Transkription
einer Nukleinsäuresequenz,
die damit operabel verbunden ist, in monokotylem Deckspelzen-, Vorspelzen-
und/oder Spelzengewebe zu regulieren, wobei der Promoter eine verbesserte
bzw. verstärkte
oder verminderte Expression der operabel verbundenen DNA-Sequenz
verleiht.
-
Die
vorliegende Erfindung stellt ebenfalls ein Verfahren zur Erzeugung
einer transgenen Pflanze durch Einführung eines DNA-Konstrukts
in eine Pflanzenzelle bereit, das umfasst: (i) einen Promoter, der
eine Nukleinsäure
umfasst, die eine Sequenz von SEQ ID NO: 1 umfasst, und operabel
verbunden mit dem Promoter (ii) eine transkribierbare DNA-Sequenz
und (iii) eine 3'-nichttranslatierte
Region.
-
Für Transformationszwecke
kann zusätzlich
eine angemessen ausgewählte
Markerkassette verwendet werden, um transformierte Pflanzen zu bilden
und zu erkennen. Nützliche
Marker sind hier nachstehend in dieser Anmeldung beispielhaft dargestellt.
-
Die
vorliegende Erfindung umfasst ebenfalls differenzierte Pflanzen,
Samen und Nachkommenschaft, die die vorstehend erwähnten transformierten
Pflanzenzellen umfassen. Die so erhaltenen Pflanzen zeigen eine
Gewebe-spezifische Expression von so genannten Reportergenen. Besagte
Promoter können
folglich in einem richtigen Konstrukt verwendet werden, um eine
Expression von Kontrollgenen gegen zum Beispiel Fusarium-Kopfmehltau-Krankheit
in dem rechten Gewebe zu ermöglichen.
Solch so erhaltene transformierte Pflanzen zeigen neue Eigenschaften
von agronomischer Bedeutung.
-
Die
vorangehenden und andere Aspekte der Erfindung werden aus der folgenden
detaillierten Beschreibung von verwendeten Definitionen und Verfahren
sowie begleitenden Zeichnungen klarer werden.
-
Definitionen
und Verfahren
-
Die
folgenden Definitionen und Verfahren werden bereitgestellt, um die
vorliegende Erfindung besser zu definieren und den Fachmann in der
Praxis der vorliegenden Erfindung zu leiten. Sofern nicht anderweitig angegeben,
sind Ausdrücke
entsprechend der herkömmlichen
Verwendung durch den Fachmann zu verstehen. Es wird die Standard-Ein-
und -Drei-Buchstaben-Nomenklatur für Aminosäurereste verwendet.
-
„Nukleinsäure(sequenz)" oder „Polynukleotid(sequenz)" bezieht sich auf
ein- oder doppelsträngige DNA
oder RNA mit genomischen oder synthetischen Ursprung, d.h. jeweils
ein Polymer von Deoxyribonukleotid- oder Ribonukleotid-Basen, die
von dem 5'- (stromaufwärts gelegenen)
Ende zu dem 3'-
(stromabwärts gelegenen)
Ende gelesen werden. Die Nukleinsäure kann den Sense- oder komplementären (Antisense-) Strang
darstellen.
-
„Nativ" bezieht sich auf
eine natürlich
auftretende („Wild-Typ") Nukleinsäuresequenz.
-
„Heterologe" Sequenz bezieht
sich auf eine Sequenz, die von einer fremden Quelle oder Spezies
herrührt
oder, wenn von der gleichen Quelle, von ihrer ursprünglichen
Form modifiziert ist.
-
Eine „isolierte" Nukleinsäuresequenz
ist im Wesentlichen von anderen Nukleinsäuresequenzen, mit denen die
Nukleinsäure
normalerweise in der Zelle des Organismus assoziiert ist, in dem
die Nukleinsäure
natürlich
auftritt, d.h. anderer chromosomaler oder extrachromosomaler DNA,
getrennt oder weg gereinigt. Der Ausdruck umschließt Nukleinsäuren, die
biochemisch gereinigt sind, sodass kontaminierende Nukleinsäuren und
andere Zellkomponenten im Wesentlichen entfernt sind. Der Ausdruck
umschließt
ebenfalls rekombinante Nukleinsäuren
und chemisch synthetisierte Nukleinsäuren.
-
Der
Ausdruck „im
Wesentlichen gereinigt",
wie hierin verwendet, bezieht sich auf ein Molekül, das von im Wesentlichen
allen anderen Molekülen
getrennt ist, die normalerweise mit ihm in seinem nativen Zustand assoziiert
sind. Bevorzugter ist ein im Wesentlichen gereinigtes Molekül die überwiegende
Spezies, die in einem Präparat
vorhanden ist. Ein im Wesentlichen gereinigtes Molekül kann mehr
als 60% frei, bevorzugt 70% frei, bevorzugter 90% frei von den anderen
Molekülen
(ausschließlich
von Lösungsmittel)
sein, die in der natürlichen
Mischung vorhanden sind. Es wird nicht beabsichtigt, dass der Ausdruck „im Wesentlichen
gereinigt" Moleküle umschließt, die
in ihrem nativen Zustand vorhanden sind.
-
Eine
erste Nukleinsäurensequenz
zeigt eine „wesentliche
Identität" zu einer Referenznukleinsäuresequenz,
wenn, wenn (mit angemessenen Nukleotidinsertionen oder -deletionen,
die insgesamt weniger als 20 Prozent der Referenzsequenz über das
Vergleichsfenster betragen) mit der anderen Nukleinsäure (oder
ihrem komplementären
Strang) optimal ausgerichtet, es mindestens etwa 75% Nukleotidsequenzidentität, bevorzugt mindestens
etwa 80% Identität,
bevorzugter mindestens etwa 85% Identität, und am meisten bevorzugt
mindestens etwa 90% Identität, über ein
Vergleichsfenster von mindestens 20 Nukleotidpositionen, bevorzugt
mindestens 50 Nukleotidpositionen, bevorzugter mindestens 100 Nukleotidpositionen,
und am meisten bevorzugt über
die gesamte Länge
der ersten Nukleinsäure,
gibt. Eine optimale Ausrichtung von Sequenzen zur Ausrichtung eines
Vergleichsfensters kann durch den lokalen Homologiealgorithmus von
Smith und Waterman (Adv. Appl. Math. 2:482, 1981), durch den Homologieausrichtungsalgorithmus
von Needleman und Wunsch (J. Mol. Biol. 48:443, 1970); durch das
Verfahren zur Suche auf Ähnlichkeit
von Pearson und Lipman (Proc. Natl. Acad. Sci. USA 85:2444, 1988);
bevorzugt durch computerisierte Implementationen dieser Algorithmen
(GAP, BESTFIT, FASTA und TFASTA) in dem Wisconsin Genetics Software
Package Release 7.0 (Genetics Computer Group, 575 Science Dr., Madison,
WI) ausgeführt
werden. Die Referenznukleinsäure
kann ein Molekül
in voller Größe oder
ein Teil eines längeren
Moleküls
sein. Alternativ weisen zwei Nukleinsäuren eine erhebliche Identität auf, wenn
eine mit der anderen unter stringenten Bedingungen hybridisiert,
wie nachstehend definiert.
-
Eine
erste Nukleinsäuresequenz
ist mit einer zweiten Nukleinsäuresequenz „operabel
verbunden", wenn
die Sequenzen so angeordnet sind, dass die erste Nukleinsäuresequenz
die Funktion der zweiten Nukleinsäuresequenz beeinflusst. Bevorzugt
sind die zwei Sequenzen Teil eines einzigen zusammenhängenden Nukleinsäuremoleküls und sind
bevorzugter benachbart. Zum Beispiel ist ein Promoter mit einem
Gen operabel verbunden, wenn der Promoter eine Transkription des
Gens in einer Zelle reguliert oder vermittelt.
-
Eine „rekombinante" Nukleinsäure wird
durch eine künstliche
Kombination von zwei andernfalls getrennten Segmenten einer Sequenz,
z.B., durch chemische Synthese oder durch die Manipulation von isolierten
Segmenten von Nukleinsäuren
durch Genmanipulationstechniken, hergestellt. Techniken zur Nukleinsäurenmanipulation
sind wohl bekannt (siehe, z.B., Molecular Cloning: A Laboratory
Manual, 2nd ed., vol.1-3, ed. Sambrook et al., Cold Spring Harbor
Laboratory Press, Cold Spring Harbor, NY, 1989, Sambrook et al.,
1989; Current Protocols in Molecular Biology, ed. Ausubel, et al.,
Greene Publishing und Wiley-Interscience, New York, 1992, mit periodischen
Aktualisierungen, Ausubel et al., 1992; und PCR Protocols: A Guide
to Methods and Applications, Academic Press: San Diego, Innis et
al., 1990). Verfahren zur chemischen Synthese von Nukleinsäuren werden,
zum Beispiel, in Beaucage und Carruthers (Tetra. Letts. 22:1859-1862,
1981) und Matteucci et al. (J. Am. Chem. Soc. 103:3185, 1981) diskutiert.
Eine chemische Synthese von Nukleinsäuren kann, zum Beispiel, auf
kommerziellen automatisierten Oligonukleotid-Synthesevorrichtungen durchgeführt werden.
-
Eine „synthetische
Nukleinsäuresequenz" kann für eine verbesserte
Expression in besonderen Wirtszellen und für die Zwecke der Klonierung
in angemessenen Vektoren entworfen und chemisch synthetisiert werden.
Synthetische DNAs, die entworfen werden, um eine Expression in einem
besonderen Wirt zu verbessern, sollten deshalb das Muster des Kodongebrauchs
in der Wirtszelle widerspiegeln. Computerprogramme sind für diese
Zwecke verfügbar,
die die „BestFit"- oder „Gap"-Programme des Sequence Analysis Software Package,
Genetics Computer Group, Inc. (University of Wisconsin Biotechnology
Center, Madison, WI 53711) einschließen, aber nicht darauf beschränkt sind.
-
Eine „Amplifikation" von Nukleinsäuren oder
eine „Nukleinsäurenreproduktion" bezieht sich auf
die Erzeugung von zusätzlichen
Kopien einer Nukleinsäuresequenz
und wird unter Verwendung von Polymerasekettenreaktion- (PCR-) Technologien
ausgeführt.
Eine Vielfalt an Amplifikationsverfahren sind im Stand der Technik
bekannt und sind unter anderem in U.S. Patent Nrn. 4,683,195 und
4,683,202 und von Innis et al. (PCR Protocols: A Guide to Methods
and Applications, Academic Press, San Diego, 1990) beschrieben.
Bei PCR bezieht sich ein Primer auf ein kurzes Oligonukleotid einer
definierten Sequenz, die an ein DNA-Templat angetempert wird, um
die Polymerasekettenreaktion auszulösen.
-
„Transformiert", „transfiziert" oder „transgen" bezieht sich auf
eine Zelle, ein Gewebe, ein Organ oder einen Organismus, in die
bzw. das bzw. den eine fremde Nukleinsäure, wie beispielsweise ein
rekombinanter Vektor, eingeführt
worden ist. Bevorzugt wird die eingeführte Nukleinsäure in die
genomische DNA der Aufnahmezelle, des Aufnahmegewebes, des Aufnahmeorgans
oder des Aufnahmeorganismus derart integriert, dass die eingeführte Nukleinsäure durch
anschließende
Nachkommenschaft vererbt wird. Eine „transgene" oder „transformierte" Zelle oder Organismus
schließen
ebenfalls eine Nachkommenschaft der Zelle oder des Organismus und
eine Nachkommenschaft ein, die von einem Züchtungsprogramm erzeugt wird,
das solch eine „transgene" Pflanze als ein
Elternteil in einer Kreuzung einsetzt und einen veränderten
Phenotyp zeigt, der sich aus der Gegenwart eines rekombinanten Konstrukts
oder Vektors ergibt.
-
Der
Ausdruck „Gen" bezieht sich auf
chromosomale DNA, Plasmid-DNA, cDNA, synthetische DNA oder andere
DNA, die ein Peptid, ein Polypeptid, Protein oder RNA-Molekül und Regionen
kodiert, die die Kodierungssequenz flankieren, die in die Regulierung
der Expression involviert sind. Einige Gene können in mRNA transkribiert
werden und in Polypetide translatiert werden (Strukturgene); andere
Gene können
in RNA (z.B., rRNA, tRNA) transkribiert werden; und andere Typen
von Genen funktionieren als Regulatoren der Expression (Regulatorgene).
-
„Expression" eines Gens bezieht
sich auf die Transkription eines Gens, um die entsprechende mRNA zu
erzeugen, und die Translation dieser mRNA, um das entsprechende
Genprodukt, d.h. ein Peptid, Polypeptid oder Protein, zu erzeugen.
Die Genexpression wird durch Regulatorelemente, einschließlich 5'-Regulatorelemente,
wie beispielsweise Promoter, kontrolliert oder angepasst.
-
„Genetische
Komponente" bezieht
sich auf irgendeine Nukleinsäuresequenz
oder irgendein genetisches Element, die bzw. das ebenfalls eine
Komponente oder ein Teil eines Expressionsvektors sein kann. Beispiele
genetischer Komponenten schließen
Promoterregionen, 5'-nichttranslatierte
Leiter bzw. Leader, Introns, Gene, 3'-nichttranslatierte Regionen und andere
Regulatorsequenzen oder Sequenzen, die die Transkription oder Translation
von einer oder mehreren Nukleinsäuresequenzen
beeinflussen, ein, sind aber nicht darauf beschränkt.
-
Die
Ausdrücke „rekombinantes
DNA-Konstrukt", „rekombinanter
Vektor", „Expressionsvektor" oder „Expressionskassette" beziehen sich auf
irgendein Mittel, wie beispielsweise ein Plasmid, Cosmid, Virus,
BAC (bacterial artifical chromosome), autonom replizierende Sequenz,
Phage oder lineare oder kreisförmige
einsträngige
oder doppelsträngige
DNA- oder RNA-Nukleotidsequenz, das sich von irgendeiner Quelle
ableitet, das in der Lage zur genomischen Integration oder autonomen
Replikation ist, das ein DNA-Molekül umfasst, in dem eine oder
mehrere DNA-Sequenzen in einer funktional operablen Weise verbunden
worden sind.
-
„Komplementär" bezieht sich auf
die natürliche
Assoziation von Nukleinsäuresequenzen
durch Basenpaarung (A-G-T-Paare mit der komplementären Sequenz
A-C-T). Komplementarität
zwischen zwei einsträngigen
Molekülen
kann teilweise, wenn nur einige der Nukleinsäurenpaare komplementär sind,
oder vollständig sein,
wenn alle Basenpaare komplementär
sind. Der Komplentaritätsgrad
beeinflusst die Effizienz und Stärke der
Hybridizierungs- und Amplifikationsreaktionen.
-
„Homologie" bezieht sich auf
den Pegel an Ähnlichkeit
zwischen Nukleinsäure-
oder Aminosäuresequenzen
in Hinsicht auf jeweils eine prozentuale Nukleotid- oder Aminosäurenpositionsidentität, d.h.
Sequenzähnlichkeit
oder Identität.
Homologie bezieht sich ebenfalls auf das Konzept ähnlicher
funktionaler Eigenschaften unter unterschiedlichen Nukleinsäuren oder
Proteinen.
-
„ESTs" oder Exprimierte
Sequenz-Tags sind kurze Sequenzen von zufällig ausgewählten Klonen von einer cDNA-
(oder komplementären
DNA-) Bank, die Vertreter der cDNA-Inserts dieser zufällig ausgewählten Klone
sind (McCombie et al., Nature Genetics, 1:124, 1992; Kurata et al.,
Nature Genetics, 8: 365, 1994; Okubo et al., Nature Genetics, 2:
173, 1992).
-
Der
Ausdruck „elektronisches
Northern" bezieht
sich auf eine Computer-basierende Sequenzanalyse, die erlaubt, dass
Sequenzen von vielen cDNA-Banken auf Basis von Parametern elektronisch
verglichen werden, die der Forscher identifiziert, einschließlich von
Abundanz in EST-Populationen in vielen cDNA-Banken oder beschränkt auf
EST-Sätze
von einer oder Kombinationen von Banken.
-
„Subsetting" bezieht sich auf
ein Verfahren zum Vergleichen von Nukleinsäuresequenzen von unterschiedlichen
oder vielen Quellen, die verwendet werden können, um das Expressionsprofil
der Nukleinsäuresequenzen
abzuschätzen,
das die Gentranskriptionsaktivität
und Messagestabilität
in einem besonderen Gewebe bei einer besonderen Zeit oder unter
besonderen Bedingungen widerspiegelt.
-
„Promoter" bezieht sich auf
eine Nukleinsäuresequenz,
die stromaufwärts
oder 5' zu einem
Translationsstartkode eines offenen Leserahmens (oder einer Protein-kodierender
Region) eines Gens angeordnet ist und die in die Erkennung und Bindung
von RNA Polymerase II und anderen Proteinen (trans-tätige Transkriptionsfaktoren)
involviert wird, um eine Transkription auszulösen. Ein „Pflanzen-Promoter" ist ein nativer
oder nicht nativer Promoter, der in Pflanzenzellen funktional ist.
Konstitutive Promoter sind in den meisten oder allen Geweben einer
Pflanze überall
in der Pflanzenentwicklung funktional. Gewebe-, Organ- oder Zell-spezifische Promoter
werden jeweils nur oder überwiegend
in einem besonderen Gewebe, Organ oder Zelltyp exprimiert. Eher
als „spezifisch" in einem gegebenen
Gewebe, Organ oder Zelltyp exprimiert zu werden, kann der Promoter
eine „verbesserte" bzw. „verstärkte" Expression, d.h.
einen höheren
Expressionspegel, in einem Teil (z.B., Zelltyp, Gewebe oder Organ)
der Pflanze im Vergleich zu anderen Teilen der Pflanze anzeigen.
Temporär
regulierte Promoter sind nur oder überwiegend während bestimmten
Zeitdauern der Pflanzenentwicklung oder bei bestimmten Tageszeiten
funktional, wie in dem Fall von Genen, die, zum Beispiel, mit dem
Tagesrhythmus assoziiert sind. Induzierbare Promoter exprimieren
selektiv eine operabel verbundene DNA-Sequenz in Antwort auf die
Gegenwart eines endogenen oder exogenen Stimulus, zum Beispiel durch
chemische Verbindungen (chemische Induktoren) oder in Antwort auf
umfeldbedingte, hormonale, chemische oder Entwicklungs-Signale.
Induzierbare oder regulierte Promoter schließen, zum Beispiel, Promoter
ein, die durch Licht, Wärme, Beanspruchung, Überschwemmung
oder Dürre,
Phytohormone, Verletzung oder Chemikalien, wie beispielsweise Ethanol,
Jasmonat, Salicylsäure,
Safener, Plagen bzw. Schädlinge
oder Pathogene reguliert werden.
-
Irgendein
Pflanzen-Promoter kann als eine 5'-Regulatorsequenz zur Anpassung der
Expression eines besonderen Gens oder von Genen verwendet werden.
Ein bevorzugter Promoter wird ein Pflanzen-Promoter sein, der RNA Polymerase II
erkennt oder bindet. Solche Pflanzen-RNA-Polymerase Typ II- Promotoren, wie jene
von anderen höheren
Eukaryoten, weisen komplexe Strukturen auf und beinhalten einige
verschiedene Elemente. Ein solches Element ist die TATA-Box oder
Goldberg-Hogness-Box,
die für
eine korrekte Expression von eukaryotischen Genen in vitro und eine
genaue, effiziente Initiation von Transkription in vivo erforderlich ist.
Die TATA-Box ist typischerweise bei ungefähr -25 bis -35 positioniert,
das heißt,
bei 25 bis 35 Basenpaaren (bp) stromaufwärts (5') der Transkriptionsinitiationsstelle
oder Kappen- bzw. Cap-Seite, die als Position +1 definiert ist (Breathnach
und Chambon, Ann. Rev. Biochem. 50:349-383, 1981; Messing et al.,
In: Genetic Engineering of Plants, Kosuge et al., eds., S. 211-227,
1983). Ein anderes übliches
Element, die CCAAT-Box, ist zwischen -70 und -100 bp angeordnet.
In Pflanzen kann die CCAAT-Box eine unterschiedliche Übereinstimmungssequenz
aufweisen als die funktional analoge Sequenz von Säugetier-Promotern
(das Pflanzenanalogon ist die „AGGA-Box" genannt worden,
um sie von ihrem Tiergegenpart zu unterscheiden; Messing et al.,
In: Genetic Enineering of Plants, Kosuge et al., eds., S. 211-227,
1983). Zudem schließen
virtuell alle Promoter zusätzlich
stromaufwärts
Aktivierungssequenzen oder -verstärker ein (Benoist und Chambon,
Nature 290: 304-310, 1981; Gruss et al., Proc. Natl. Acad. Sci.
USA 78: 943-947, 1981; und Khoury und Gruss, Cell 27:313-314, 1983),
die sich von um -100 bp bis zu -1000 bp oder mehr stromaufwärts der
Transkriptionsinitiationsstelle erstrecken. Es sind ebenfalls Verstärker 3' zu der Transkriptionsstartstelle
gefunden worden.
-
Wenn
mit heterologen DNA-Sequenzen fusioniert, verursachen solche Promoter
typischerweise, dass die fusionierte Sequenz, in einer Weise transkribiert
wird, die zu der der Gensequenz ähnlich
ist, mit der der Promoter normalerweise assoziiert ist. Promoterfragmente,
die Regulatorsequenzen einschließen, können zugegeben werden (zum
Beispiel, fusioniert mit dem 5'-Ende
von oder eingefügt
in einem aktiven Promoter mit seinen eigenen teilweisen oder vollständigen Regulatorsequenzen
(Fluhr et al., Science 232:1106-1112, 1986; Ellis et al., EMBO J.
6:11-16, 1987; Strittmatter und Chua, Proc. Nat. Acad. Sci. USA
84:8986-8990, 1987; Poulson und Chua, Mol. Gen. Genet. 214:16-23, 1988; Comai et
al., Plant Mol. Biol. 15:373-381, 1991). Alternativ können heterologe
Regulatorsequenzen zu der stromaufwärts gelegenen 5'-Region eines inaktiven,
gestutzten Promoters, z.B., eines Promoters, der nur die Kern TATA
und manchmal die CCAAT-Elemente einschließt, zugegeben werden (Fluhr
et al., Science 232:1106-1112, 1986; Strittmatter und Chua, Proc.
Nat. Acad. Sci. USA 84:8986-8990; Ayran et al., Mol. Gen. Genet.
225:65-71, 1991).
-
Pflanzen-Promoter
können
Promoter einschließen,
die durch die Manipulation von bekannten Promotern zur Erzeugung
von synthetischen, chimären
oder hybriden Promotern erzeugt sind.
-
Chimäre Promoter
sind durch Zugeben einer heterologen Regulatorsequenz zu der stromaufwärts gelegenen
5'-Region eines
inaktiven, gestutzten Promoters entwickelt worden, d.h. eines Promoters,
der nur die Kern-TATA und optional die CCAAT-Elemente einschließt (Fluhr
et al., Science 232:1106-1112, 1986; Strittmatter und Chua, Proc.
Nat. Acad. Sci. USA 84:8986-8990; Ayran et al., Mol. Gen. Genet.
225:65-71, 1991).
-
Die
Promotersequenzen sind in der Lage, operabel verbundene DNA-Sequenzen
in spezifischen wohl definierten Weizengeweben, wie beispielsweise
Deckspelze, Vorspelze oder Spelze, zu transkribieren, und können deshalb
die Expression jener Gene in diesen Geweben selektiv regulieren.
-
Die
Promotersequenzen der vorliegenden Erfindung sind zur Regulierung
von Genexpression in Weizengeweben, wie beispielsweise Deckspelze,
Vorspelze oder Spelze, nützlich.
Für eine
Anzahl von agronomischen Merkmalen ist eine Transkription eines
Gens oder von Genen von Interesse in vielen Geweben wünschenswert,
um die gewünschte(n)
Charakteristik(en) zu verleihen. Die Verfügbarkeit von geeigneten Promotern,
die die Transkription von operabel verbundenen Genen in ausgewählten Zielgeweben
von Interesse regulieren, ist wichtig, weil es nicht wünschenswert
sein kann, eine Expression eines Gens in jedem Gewebe, sondern nur
in bestimmten Geweben zu haben. Konsequenterweise ist es wichtig
eine breite Vielfalt an Möglichkeiten
von 5'-Regulatorelementen
für irgendeine
Pflanzenbiotechnologiestrategie zu haben.
-
Das
Erscheinen von Gentechnik, das molekulare und Bioinformatik-Techniken
umfasst, hat zu schneller Sequenzierung und Analysen einer großen Anzahl
von DNA-Proben von einer riesigen Anzahl von Zielen geführt, einschließlich von
Pflanzenspezies von agronomischer Wichtigkeit, aber nicht darauf
beschränkt.
Um die Nukleinsäuresequenzen
der vorliegenden Erfindung aus einer Datenbank oder Sammlung von
cDNA-Sequenzen zu identifizieren, involviert der erste Schritt das
Konstruieren von cDNA-Banken von spezifischen Pflanzengewebezielen
von Interesse. Kurz gesagt, die cDNA-Banken werden zuerst von diesen
Geweben konstruiert, die bei einer besonderen Entwicklungsstufe
oder unter besonderen umfeldbedingten Bedingungen geerntet werden.
Durch Identifizierung von unterschiedlich exprimierten Genen in
Pflanzengeweben bei unterschiedlichen Entwicklungsstufen oder unter
unterschiedlichen Bedingungen können
die entsprechenden Regulatorsequenzen dieser Gene identifiziert
und isoliert werden. Eine Transkriptabbildung ermöglicht die
Identifizierung von Gewebe-bevorzugten Sequenzen auf Basis von spezifischer
Abbildung von Nukleinsäuresequenzen
aus einer cDNA-Bank. Mit Transkriptabbildung, wie hierin verwendet,
ist eine Analyse gemeint, die die Abundanz an exprimierten Genen
in einer oder mehreren Banken vergleicht. Die Klone, die innerhalb
einer cDNA-Bank enthalten sind, werden sequenziert, und die Sequenzen
werden mit Sequenzen aus öffentlich
verfügbaren
Datenbanken verglichen. Computer-basierte Verfahren erlauben dem
Forscher Fragen bereitzustellen, die Sequenzen von vielen Banken
vergleichen. Der Prozess ermöglicht
eine schnelle Identifizierung von Klonen von Interesse im Vergleich
mit herkömmlichen
Hybridisierungssubtraktionsverfahren, die dem Fachmann bekannt sind.
-
Unter
Verwendung von herkömmlichen
Methodologien können
cDNA-Banken von der mRNA (Messenger-RNA) eines gegebenen Gewebes
oder Organismuses unter Verwendung von Poly dT Primern und reverser
Transkriptase konstruiert werden (Efstratiadis et al., Cell 7:279,
1976; Higuchi et al., Proc. Natl. Acad. Sci. U.S.A. 73:3146, 1976;
Maniatis et al., Cell 8:163, 1976; Land et al., Nucleic Acids Res.
9:2251, 1981; Okayama et al., Mol. Cell. Biol. 2:161, 1982; Gubler
et al., Gene 25:263; 1983).
-
Mehrere
Verfahren können
eingesetzt werden, um cDNA-Konstrukte in voller Größe zu erhalten.
Zum Beispiel kann eine Terminal-Transferase verwendet werden, um
homopolymere Enden von dC-Resten zu den freien 3'-Hydroxylgruppen zuzufügen (Land
et al., Nucleic Acids Res. 9:2251, 1981). Dieses Ende kann dann durch
ein Poly dG Oligo hybridisiert werden, das für die Synthese eines zweiten
cDNA-Stranges in voller Größe als ein
Primer wirken kann. Okayama und Berg berichteten ein Verfahren zum
Erhalten von cDNA-Konstrukten in voller Größe (Mol. Cell Biol. 2:161,
1982). Dieses Verfahren ist durch Verwendung von synthetischen Primeradaptern
vereinfacht worden, die sowohl homopolymere Enden zum Primen der
Synthese des ersten und zweiten Stranges als auch Beschränkungsstellen
zum Klonen in Plasmiden (Coleclough et al., Gene 34:305, 1985) und
Bakteriophagenvektoren (Krawinkel et al., Nucleic Acids Res. 14:1913,
1986; Han et al., Nucleic Acids Res. 15:6304, 1987) aufweisen.
-
Diese
Strategien können
mit zusätzlichen
Strategien zur Isolierung von seltenen mRNA-Populationen verbunden
werden. Zum Beispiel enthält
eine typische Säugetierzelle
zwischen 10.000 und 30.000 unterschiedliche mRNA-Sequenzen (Davidson,
Gene Activity in Early Development, 2nd ed., Academic Press, New York,
1976). Die Anzahl an Klonen, die erforderlich ist, um eine gegebene
Wahrscheinlichkeit zu erreichen, dass eine mRNA mit niedrigerer
Abundanz in einer cDNA-Bank vorhanden sein wird, ist N = (ln(1-P))/(ln(1-1/n)),
wobei N die erforderliche Anzahl an Klonen ist, P die gewünschte Wahrscheinlichkeit
ist, und 1/n das Bruchverhältnis
der gesamten mRNA ist, die durch eine einzige seltene mRNA dargestellt
wird (Sambrook et al., 1989).
-
Ein
Verfahren zur Anreicherung von Präparaten aus mRNA für Sequenzen
von Interesse ist, durch Größe zu fraktionieren.
Ein solches Verfahren ist, durch Elektrophorese durch ein Agarosegel
zu fraktionieren (Pennica et al., Nature 301:214, 1983). Ein anderes
Verfahren setzt eine Sucrosegradientenzentrifugation in der Gegenwart
eines Mittels, wie beispielsweise Methylquecksilberhydroxid, ein,
das eine sekundäre
Struktur in RNA denaturiert (Schweinfest et al., Proc. Natl. Acad.
Sci. U.S.A. 79:4997-5000, 1982).
-
ESTs
können
durch eine Anzahl von Verfahren sequenziert werden. Zwei grundlegende
Verfahren können
zur DNA-Sequenzierung verwendet werden, das Kettenterminationsverfahren
(Sanger et al., Proc. Natl. Acad. Sci. U.S.A. 74:5463, 1977) und
das Verfahren durch chemischen Abbau (Maxam und Gilbert, Proc. Nat.
Acad. Sci. U.S.A. 74:560, 1977). Eine Automatisierung und Fortschritte
in der Technologie, wie beispielsweise die Ersetzung von Radioisotopen
durch Sequenzierung auf Fluoreszenzbasis, haben die Anstrengungen
reduziert, die zur Sequenzierung von DNA erforderlich sind (Craxton,
Methods, 2: 20, 1991; Ju et al., Proc. Natl. Acad. Sci. U.S.A. 92:
4347, 1995; Tabor und Richardson, Proc. Natl. Acad. Sci. U.S.A.
92: 6339, 1995). Automatisierte Sequenziervorrichtungen sind von
einer Anzahl von Herstellern, einschließlich von Pharmacia Biotech,
Inc., Piscataway, New Jersey (Pharmacia ALF); LI-COR, Inc., Lincoln,
Nebraska (LI-COR 4,000); und Millipore, Bedford, Massachusetts (Millipore
BaseStation) erhältlich.
-
Es
ist festgestellt worden, dass ESTs, die länger als 150 bp sind, für Ähnlichkeitssuchen
und Mapping nützlich
sind (Adams et al., Science 252:1651, 1991). EST-Sequenzen liegen
normalerweise im Bereich von 150-450 Basen. Das ist die Länge der
Sequenzinformation, die routinemäßig und
zuverlässig
unter Verwendung von Einzellaufsequenzdaten erzeugt wird. Typischerweise
werden nur Einzellaufsequenzdaten von der cDNA-Bank erhalten (Adams
et al., Science 252:1651, 1991). Eine automatisierte Einzellaufsequenzierung führt typischerweise
zu einem 2-3 %-igen Fehler oder Basiszweideutigkeitsrate (Boguski
et al., Nature Genetics, 4: 332, 1993).
-
EST-Datenbanken
wurden konstruiert oder teilweise konstruiert von, zum Beispiel,
C. elegans (McCombrie et al., Nature Genetics 1:124, 1992); humaner
Leberzelllinie HepG2 (Okubo et al., Nature Genetics 2:173, 1992);
humaner Gehirn-RNA (Adams et al., Science 252:1651, 1991; Adams
et al., Nature 355:632, 1992); Arabidopsis, (Newman et al., Plant
Physiol. 106:1241, 1994); und Reis (Kurata et al., Nature Genetics 8:365,
1994). Die vorliegende Erfindung verwendet ESTs aus einer Anzahl
von cDNA-Banken, die aus Weizengeweben, bevorzugt aus Spelze, Deckspelze
oder Vorspelze, hergestellt sind, als ein Werkzeug zur Identifizierung
von Genen, die in diesen Zielgeweben exprimiert werden, das dann
die Isolierung von 5'-Regulatorsequenzen,
wie beispielsweise Promoter, erleichtert, die die Gene regulieren.
Zudem sind ebenfalls EST-Banken aus Blütengeweben von Reis erforderlich,
um eine Identifizierung des Gen-spezifischen Homologs vor der Promoterisolierung
zu unterstützen,
sowie EST-Banken aus anderen Geweben sind als Hintergrund-Banken erforderlich.
-
Die
ESTs, die aus der Sequenzierung eines Bereichs von cDNA-Banken erzeugt
werden, werden in einer Computerdatenbank gespeichert und diese „rohen" ESTs werden in Gruppen
von zusammenhängenden ESTs,
d.h. ESTs, die von homologen mRNA-Transkripten herrühren, in
einem Prozess sortiert, der als Clustern bekannt ist.
-
Ein „Cluster" ist eine Gruppe
von Sequenzen, die eine Identität
von mindestens 90% über
irgendein Fenster von 100 Basenpaaren teilen. Durch Ausrichtung
der Elemente eines Clusters und Berechnung der Übereinstimmung kann eine einzige
repräsentative
Sequenz für
den Cluster abgeleitet werden.
-
Computer-basierte
Sequenzanalysen können
verwendet werden, um unterschiedlich exprimierte Sequenzen zu identifizieren,
einschließlich
jener Sequenzen, aber nicht darauf beschränkt, die in einem Gewebe im
Vergleich zu anderem Gewebe exprimiert werden. Zum Beispiel kann
ein unterschiedlicher Satz an Sequenzen aus cDNA gefunden werden,
der aus Wurzelgewebe gegen Blattgewebe isoliert wird. Dementsprechend können Sequenzen
aus cDNA-Banken verglichen werden, die aus Pflanzen erzeugt werden,
die unter unterschiedlichen umfeldbedingten oder physiologischen
Bedingungen gewachsen sind. Wenn die bevorzugten Sequenzen einmal
aus der cDNA-Bank von Interesse identifiziert sind, können die
genomischen Klone aus einer genomischen Bank isoliert werden, die
aus Pflanzengewebe erzeugt wird, und entsprechende Regulatorsequenzen,
einschließlich
5'-Regulatorsequenzen,
aber nicht darauf beschränkt,
können
identifiziert und isoliert werden.
-
In
einer bevorzugten Ausführungsform
werden Sequenzen exprimierter Sequenz-Tags (EST) aus einer Vielfalt
von cDNA-Banken in einer Sequenzdatenbank katalogisiert. Diese Datenbank
wird verwendet, um Promoterziele von einem besonderen Gewebe von
Interesse zu identifizieren. Die Auswahl an exprimierten Sequenz-Tags
zur anschließenden
Promoterisolierung spiegelt das Vorhandensein von einer oder mehreren Sequenzen
unter den repräsentativen
ESTs aus einem zufälligen
Sampling einer individuellen cDNA-Bank oder einer Sammlung von cDNA-Banken
wieder.
-
Zum
Beispiel wird die Identifizierung von Regulatorsequenzen, die die
Expression von Transkripten im Gewebe von Interesse richten, durch
Identifizierung von ESTs, die in Geweben von Interesse, wie beispielsweise
Deckspelze, Vorspelze oder Spelze, gefunden werden, und abwesend
oder in geringer Abundanz in anderen cDNA-Banken in der Datenbank
durchgeführt.
Die identifizierten EST-Führungen
werden dann verwendet, um die operabel verbundenen Regulatorsequenzen
aus genomischen DNA-Sequenzen dementsprechend zu identifizieren.
-
Mit
Abundanz, wie hierin verwendet, ist die Anzahl an Malen eines Klons
oder Clusters aus Klonen gemeint, die er in einer Bank erscheint.
Die Sequenzen, die verstärkt
oder in hoher Menge in einem spezifischen Gewebe oder Organ sind,
die ein Zielexpressionsprofil darstellen, werden in dieser Weise
identifiziert, und Primer können
aus den identifizierten EST-Sequenzen entworfen werden. Ein Zugang
auf PCR-Basis kann verwendet werden, um Flankenregionen aus einer
genomischen Bank der Zielpflanze von Interesse zu vergrößern. Eine
Anzahl an Verfahren ist dem Fachmann bekannt, um unbekannte DNA-Sequenzen
zu amplifizieren, die zu einer Kernregion einer bekannten Sequenz
benachbart sind. Verfahren schließen inverse PCR (IPCR), Vektorette-PCR,
Y-förmige
PCR und Genomwanderungs-Ansätze
ein, sind aber nicht darauf beschränkt.
-
In
einer bevorzugten Ausführungsform
wird eine genomische DNA, die an einen Adapter gebunden ist, einer
primären
Runde von PCR-Amplifikation mit einem Gen-spezifischen Primer und
einem Primer unterworfen, der an die Adaptersequenz antempert. Als
nächstes
wird das PCR-Produkt als das Templat für eine eingenistete Runde an
PCR-Amplifikation mit einem zweiten Gen-spezifischen Primer und
einem zweiten Adapter verwendet. Die sich ergebenden Fragmente von
der eingenisteten PCR-Reaktion werden dann isoliert, gereinigt und
in einem angemessenen Vektor subgeklont. Die Fragmente werden sequenziert,
und die Translationsstartstellen können identifiziert werden,
wenn das EST aus einer gestutzten cDNA abgeleitet wird. Die Fragmente
können
in Pflanzenexpressionsvektoren als Transkriptions- oder Translationsfusionen
mit einem Reportergen, wie beispielsweise β-Glucuronidase (GUS) geklont
werden. Die Konstrukte können
in Durchgangsanalysen getestet werden, und anschließend werden
die 5'-Regulatorregionen
mit anderen Genen und Regulatorsequenzen von Interesse in einem
geeigneten Pflanzentransformationsvektor operabel verbunden, und
die transformierten Pflanzen werden auf die Expression des (der)
Gens (Gene) von Interesse durch eine Anzahl an Verfahren analysiert,
die dem Fachmann bekannt sind.
-
Irgendeine
Pflanze kann für
die Identifizierung von Genen und Regulatorsequenzen ausgewählt werden.
Beispiele geeigneter Pflanzenziele für die Isolierung von Genen
und Regulatorsequenzen werden Akadie, Luzerne, Apfel, Aprikose,
Arabidopsis, Artischocke, Rucola, Spargel, Avocado, Banane, Gerste,
Bohnen, Mangold, Brombeere, Blaubeere, Brokkoli, Rosenkohl, Kohl,
Raps, Kantalupe, Karotte, Maniok, Rizinussamen, Blumenkohl, Sellerie,
Kirsche, Chicoree, Koriander, Zitronengewächs, Clementine, Klee, Kokosnuss,
Kaffee, Getreide, Baumwolle, Gurke, Douglasie, Aubergine, Endivie,
Winterendivie, Eukalyptus, Fenchel, Feigen, Knoblauch, Flaschenkürbis, Weintraube,
Grapefruit, Honigtau, Jicama, Kiwi, Salat, Lauch, Zitrone, Lilie,
Limone, Loblolly-Kiefer,
Leinsamen, Mango, Melone, Pilz, Nektarine, Nuss, Hafer, Palmenöl, Rapssamenöl, Okra, Olive,
Zwiebel, Orange, eine Zierpflanze, Plame, Papaya, Petersilie, Pastinake,
Erbse, Pfeffer, Persimone, Kiefer, Ananas, Wegerich, Pflaume, Granatapfel,
Pappel, Kartoffel, Gartenkürbis,
Quitte, Radiatakiefer, Radicchio, Rettich, Rapssamen, Himbeere,
Reis, Roggen, Hirse, Gelbkiefer, Sojabohne, Spinat, Kürbis, Erdbeere, Zuckerrübe, Zuckerrohr,
Sonneblume, Süßkartoffel,
Amberbaum, Mandarine, Tee, Tabak, Tomate, Triticale, Torfgräser, Rübe, einen
Wein, Wassermelone, Weizen, Yams und Zucchini einschließen, sind
aber nicht darauf beschränkt.
Besonders bevorzugte Pflanzenziele werden Getreide, Baumwolle, Reis,
Roggen, Gerste, Hirse, Hafer, Sojabohne und Weizen, am meisten bevorzugt
Weizen, einschließen.
-
Irgendein
Verfahren, das einen Differenzierungsvergleich zwischen unterschiedlichen
Typen oder Klassen von Sequenzen erlaubt, kann verwendet werden,
um Gene oder Regulatorsequenzen von Interesse zu isolieren. Zum
Beispiel kann in einem Differenzierungsscreeningzugang eine cDNA-Bank
von mRNA, die aus einem besonderen Gewebe isoliert wird, in einem
Bakteriophagenwirt unter Verwendung eines kommerziell erhältlichen
Klonierungs-Kits erzeugt werden. Die Placques werden auf Platten
gesprüht,
die Lawns eines Bakterienwirts, wie beispielsweise E. coli, enthalten,
um Bakteriophagenplacques zu erzeugen. Etwa 105 bis 106 Placques können auf DNA-bindende Membranen
gehoben werden. Dublikat-Membranen werden unter Verwendung von Sonden
untersucht, die aus mRNA von dem Ziel- und Nicht-Ziel- oder Hintergrundgewebe erzeugt
werden. Diese Sonden werden gelabelt, um eine Detektion nach Hybridisierung
und Entwicklung zu erleichtern. Placques, die zu Zielgewebe-abgeleiteten
Sonden, aber nicht zu Nicht-Zielgewebe-abgeleiteten Sonden hybridisieren, die
ein gewünschtes
Differenzierungsexpressionsmuster zeigen, können zur weiteren Analyse ausgewählt werden.
Genomische DNA-Banken können
ebenfalls von einer gewählten
Spezies durch Teilverdauung mit einem Restriktionsenzym und Größenauswählenden
Fragmenten innerhalb eines besonderen Größenbereichs erzeugt werden.
Die genomische DNA kann in einem geeigneten Vektor geklont, der
einen Bakteriophagen einschließt,
aber nicht darauf beschränkt
ist, und unter Verwendung eines geeigneten Vektors, wie beispielsweise ein
Bakteriophage, unter Verwendung eines geeigneten Klonierungs-Kits
aus irgendeiner Anzahl von Verkäufern
erzeugt werden (siehe zum Beispiel Stratagene, La Jolla CA oder
Gibco BRL, Gaithersburg, MD).
-
Differenzierende
Hybridisierungstechniken, wie beschrieben, sind dem Fachmann wohl
bekannt und können
verwendet werden, um eine gewünschte
Klasse von Sequenzen zu isolieren. Mit Klassen von Sequenzen, wie
hierin verwendet, sind Sequenzen gemeint, die auf Basis eines üblichen
Identifizierers gruppiert werden können, einschließlich Sequenzen,
die aus einer üblichen
Zielpflanze, einer üblichen
Bank oder eines üblichen
Pflanzengewebetyps isoliert werden, aber nicht darauf beschränkt. In
einer bevorzugten Ausführungsform
werden Sequenzen von Interesse auf Basis von Sequenzanalysen und
Abfragen einer Sammlung von diversen cDNA-Sequenzen aus Banken von
unterschiedlichen Gewebetypen identifiziert. Das offenbarte Verfahren
stellt ein Beispiel eines Differenzierungsscreeningzugangs auf Basis
von elektronischen Sequenzanalysen von Pflanzen-ESTs bereit, die
von diversen cDNA-Banken abgeleitet sind.
-
Eine
Anzahl von Verfahren, die verwendet werden, um eine Genexpression
abzuschätzen,
basieren auf Messung des mRNA-Pegels in einem Organ, einem Gewebe
oder einer Zellprobe. Typische Verfahren schließen RNA-Blots, Ribonuklease-Schutz-Assays
und RT-PCR ein, aber sind nicht darauf beschränkt. In einer anderen bevorzugten
Ausführungsform
wird ein Hochdurchsatz-Verfahren verwendet, wodurch Regulatorsequenzen
aus einem Transkript-Profilierungs-Zugang identifiziert werden.
Die Entwicklung von cDNA-Mikroarray-Technologie ermöglicht die
systematische Überwachung
von Genexpressionsprofilen für
Tausende von Genen (Schena et al., Science, 270:467, 1995). Diese
DNA-Chip-basierende Technologie ordnet Tausende von cDNA-Sequenzen
auf einer Trägeroberfläche. Diese
Arrays werden gleichzeitig mit vielen gelabelten cDNA-Sonden hybridisiert,
die aus RNA-Proben von unterschiedlichen Zell- oder Gewebentypen
hergestellt werden, was eine direkte Vergleichsanalyse der Expression
erlaubt. Diese Technologie wurde zuerst durch Analysieren von 48
Arabidopsis-Genen zur differenzierten Expression in Wurzeln und
Schösslingen
gezeigt (Schena et al, Science, 270:467, 1995). Früher wurden
die Expressionsprofile von über
1400 Genen unter Verwendung von cDNA-Mikroarrays untersucht (Ryan
et al, The Plant Journal 15:821, 1998). Mikroarrays stellen ein
quantitatives und reproduzierbares Verfahren mit hohem Durchsatz
zur Analyse einer Genexpression und Charakterisierung einer Genfunktion
bereit. Der Transkript-Profilierungs-Zugang
unter Verwendung von Mikroarrays stellt folglich ein anderes wertvolles
Werkzeug für
die Isolierung von Regulatorsequenzen, wie beispielsweise Promoter,
bereit, die mit diesen Genen assoziiert sind.
-
Die
vorliegende Erfindung verwendet Hochdurchsatz-Sequenzanalysen, um
die Grundlage einer schnellen, Computer-basierenden Identifizierung
von Sequenzen von Interesse zu bilden. Die Fachleute kennen die
Mittel, die für
eine Sequenzanalyse verfügbar
sind. Sequenzvergleiche können
durch Bestimmung der Ähnlichkeit
der Test- oder Abfragesequenz mit Sequenzen in öffentlich zugänglichen
oder gesetzlich geschützten
Datenbanken („Ähnlichkeitsanalyse") oder durch Suchen auf
bestimmte Motive („intrinsische
Sequenzanalyse")
(z.B., cis Elemente) durchgeführt
werden (Coulson, Trends in Biotechnology, 12:76, 1994; Birren et
al., Genome Analysis, 1:543, 1997).
-
Die
Nuklotidsequenz, die in SEQ ID NO: 1 bereitgestellt ist, kann in
einer Vielfalt an Medien „bereitgestellt" werden, um eine
Verwendung zu erleichtern. Solch ein Medium kann ebenfalls einen
Untersatz bzw. Subset davon in einer Form bereitstellen, die dem
Fachmann erlaubt, die Sequenzen zu untersuchen.
-
In
einer Anwendung dieser Ausführungsform
kann eine Nukleotidsequenz der vorliegenden Erfindung auf Computer-lesbaren
Medien aufgezeichnet werden. Wie hierin verwendet, beziehen sich „Computer-lesbare
Medien" auf irgendein
Medium, das direkt von einem Computer gelesen und auf das direkt
von einem Computer zugegriffen werden kann. Solche Medien schließen ein,
sind aber nicht darauf beschränkt:
magnetische Speichermedien, wie beispielsweise Floppy-Disks, Festplatte,
Speichermedium und Magnetband; optische Speichermedien, wie beispielsweise
CD-ROM; elektrische Speichermedien, wie beispielsweise RAM und ROM;
und Hybride dieser Kategorien, wie beispielsweise magnetische/optische
Speichermedien. Einem Fachmann kann sofort klar sein, wie irgendeines
der gegenwärtig
bekannten Computer-lesbaren Medien verwendet werden kann, um ein
Erzeugnis zu bilden, das ein Computer-lesbares Medium umfasst, auf
dem eine Nukleotidsequenz der vorliegenden Erfindung aufgezeichnet
ist.
-
Durch
Bereitstellung von einer oder mehreren Nukleotidsequenzen der vorliegenden
Erfindung kann der Fachmann routinemäßig auf die Sequenzinformation
für eine
Vielfalt von Zwecken zugreifen. Computersoftware ist öffentlich
zugänglich,
das erlaubt dem Fachmann auf eine Sequenzinformation zuzugreifen,
die in einem Computer-lesbaren Medium bereitgestellt ist. Beispiele
von öffentlichen
Datenbanken werden die DNA-Datenbank von Japan (DDBJ) (http://www.ddbj.nig.ac.jp/);
Genbank (http://www.ncbi.nlm.nih.gov/web/Genbank/Index.html); und
die European Molecular Biology Laboratory Nucleic Acid Sequence
Database (EMBL) (http://www.ebi.ac.uk/ebi_docs/embl_db.html) oder
Versionen davon einschließen, aber
sind nicht darauf beschränkt.
Eine Anzahl von unterschiedlichen Suchalgorithmen sind entwickelt
worden, einschließlich
der Reihe von Programmen, die als BLAST-Programme bezeichnet werden,
aber nicht darauf beschränkt.
Es gibt fünf
Implementierungen von BLAST, drei, die für Nukleotidsequenzabfragen
entworfen sind (BLASTN, BLASTX und TBLASTX), und zwei, die für Proteinsequenzabfragen
entworfen sind (BLASTP und TBLASTN) (Coulson, Trends in Biotechnology,
12:76-80, 1994; Birren et al., Genome Analysis, 1:543, 1997).
-
BLASTN
nimmt eine Nukleotidsequenz (die Abfragesequenz) und ihr reverses
Komplement und sucht sie gegen eine Nukleotidsequenzdatenbank. BLASTN
wurde zur schnellen, nicht maximalen Sensitivität entworfen und kann nicht
entfernt verwandte Kodierungssequenzen finden. BLASTX nimmt eine
Nukleotidsequenz, translatiert sie in drei Vorwärtsleserahmen und drei reverse
Komplementleserahmen und vergleicht dann die sechs Translationen
gegen eine Proteinsequenzdatenbank. BLASTX ist zur sensitiven Analyse
von vorlaufigen (Single-pass) Sequenzdaten nützlich und ist zu Sequenzfehlern
tolerant (Gish und States, Nature Genetics, 3: 266-272 (1993)). BLASTN
und BLASTX können
gemeinsam zur Analyse von EST-Daten verwendet werden (Coulson, Trends
in Biotechnology, 12: 76-80 (1994); Birren, et al., Genome Analysis,
1: 543-559 (1997)).
-
Wenn
eine kodierende Nukleotidsequenz gegeben ist, und das Protein kodiert
sie, wird es oft bevorzugt, das Protein als die Abfragesequenz zur
Durchsuchung einer Datenbank aufgrund der stark erhöhten Sensitivität zur Detektierung
von feineren Beziehungen zu verwenden. Dies liegt an dem größeren Alphabet von
Proteinen (20 Aminosäuren)
im Vergleich mit dem Alphabet von Nukleinsäuresequenzen (4 Basen), wo
es viel leichter ist, einen Treffer zufällig zu erhalten. Zudem wird
mit Nukleotidausrichtungen nur ein Treffer (positiver Punkt) oder
ein Negativtreffer (negativer Punkt) erhalten, aber mit Proteinen
kann das Vorhandensein von konservierenden Aminosäurensubstitutionen
in Betracht gezogen werden. Hier kann ein Negativtreffer einen positiven
Punkt bringen, wenn der nicht-identische Rest physikalische/chemische
Eigenschaften aufweist, die zu dem einen ähnlich sind, den er ersetzt.
Verschiedene Punktematrizen werden verwendet, um die Substitutionspunkte
von allen möglichen
Aminosäurepaaren
zu liefern. Ein allgemeines Zweckpunktesystem ist die BLOSUM62-Matrix
(Henikoff und Henikoff, Proteins, 17: 49-61 (1993), die gegenwärtig die
Grundeinstellungswahl für
BLAST Programme ist. BLOSUM62 ist auf Ausrichtungen von moderat
auseinandergehenden Sequenzen zugeschnitten und kann nicht die besten
Ergebnisse unter allen Bedingungen bringen. Altschul, J. Mol. Biol.
36: 290-300 (1993) verwendet eine Kombination von drei Matrizen,
um alle Möglichkeiten
abzudecken. Dies kann die Sensitivität, aber mit einem Aufwand von
langsameren Suchen, verbessern. In der Praxis wird oft eine einzige
BLOSUM62-Matrix verwendet, aber andere (PAM40 und PAM250) können versucht
werden, wenn eine zusätzliche
Analyse notwendig ist. Niedrige PAM-Matrizen sind auf eine Detektion
von sehr starken, aber lokalisierten Sequenzähnlichkeitn gerichtet, während hohe
PAM-Matrizen auf eine Detektion von langen, aber schwachen Ausrichtungen
zwischen sehr entfernt verwandten Sequenzen gerichtet sind.
-
Es
sind Homologe in anderen Organismen erhältlich, die zur Vergleichssequenzanalyse
verwendet werden können.
Viele Ausrichtungen werden durchgeführt, um Ähnlichkeiten und Unterschiede
in einer Gruppe von verwandten Sequenzen zu untersuchen. CLUSTAL
W ist ein erhältliches
Package für
viele Sequenzausrichtungen, das progressive viele Sequenzausrichtungen
auf Basis eines Verfahrens von Feng und Doolittle, J. Mol. Evol.
25: 351-360 (1987) durchführt.
Jedes Paar von Sequenzen wird ausgerichtet, und der Abstand zwischen
jedem Paar wird berechnet; von dieser Abstandsmatrix wird ein Leitbaum
berechnet, und alle der Sequenzen werden progressiv auf Basis dieses
Baums ausgerichtet. Ein Merkmal dieses Programms ist seine Sensitivität auf den
Effekt von Lücken
bei der Ausrichtung; Lückenbüßer werden
variiert, um die Insertion von Lücken
in mögliche
Schleifenregionen anstelle in der Mitte von strukturierten Regionen
zu fördern.
Benutzer können
Lückenbüßer spezifizieren,
zwischen einer Anzahl von Punktematrizen wählen oder ihre eigene Punktematrix
für sowohl
die paarweisen Ausrichtungen als auch die mehrfachen Ausrichtungen
zu liefern. CLUSTAL W für
UNIX und VMS Systeme ist erhältlich
bei: ftp.ebi.ac.uk. Ein anderes Programm ist MACAW (Schuler et al.,
Poteins, Struct. Func. Genet, 9:180-190 (1991), sowohl Macintosh
als auch Microsoft Windows Versionen sind erhältlich. MACAW verwendet eine
graphische Schnittstelle, stellt eine Wahl von mehreren Ausrichtungsalgorithmen
bereit und ist durch anonyme ftp erhältlich bei: ncbi.nlm.nig.gov
(directory/pub/macaw).
-
Irgendein
Programm, das zur Motivsuche entworfen ist, weist ebenfalls Nützlichkeit
in der vorliegenden Erfindung auf. Sequenzanalysenprogramme, die
zur Motivsuche entworfen sind, können
zur Identifizierung von cis Elementen verwendet werden. Bevorzugte
Computerprogramme werden MEME, SIGNAL SCAN und GENESCAN einschließen, sind
aber nicht darauf beschränkt.
MEME ist ein Programm, das konservierte Motive (entweder Nukleinsäure oder
Peptid) in einer Gruppe von unausgerichteten Sequenzen identifiziert. MEME
sichert diese Motive als einen Satz von Profilen. Diese Profile
können
verwendet werden, um eine Datenbank von Sequenzen zu durchsuchen.
Ein MEME-Algorithmus (Version 2.2) kann in Version 10.0 des GCG-Package
gefunden werden; MEME (Bailey und Elkan, Machine Learning, 21(1-2):51-80,
1995 und der Ort der Webseite ist http://www.sdsc.edu/MEME/meme/website/COPYRIGHT.html.
SIGNALSCAN ist ein Programm, das bekannte Motive in den Testsequenzen
unter Verwendung einer Information von anderen Motivdatenbanken
identifiziert (Prestridge, CABIOS 7, 203-206, 1991). Eine Information über SIGNALSCAN
Version 4.0 ist auf der folgenden Webseite erhältlich: http://biosci.cbs.umn.edu/software/sigscan.html.
Die ftp-Seite für SIGNALSCAN
ist ftp://biosci.cbs.umn.edu/software/sigscan.html. Datenbanken,
die mit SIGNALSCAN verwendet werden, schließen PLACE (http://www.dna.affrc.go.ip/htdocs/PLACE;
Higo et al., Nucleic Acids Research 27(1):297-300, 1999) und TRANSFAC
(Heinemeye, X. et al., Nucleic Acid Research 27(1):318-322) ein,
das auf der folgenden Webseite gefunden werden kann: http://transfac.gbf.de/.
GENESCAN ist ein anderes geeignetes Programm zur Motivsuche (Burge
und Karlin, J. Mol. Biol. 268, 78-94, 1997), und eine Information über Version
1.0 ist auf der folgenden Webseite erhältlich: http://gnomic.stanford.edu/GENESCANW.html. Wie
hierin verwendet, bezieht sich „ein Zielstrukturmotiv" oder „Zielmotiv" auf irgendeine rational
ausgewählte Sequenz
oder Kombination von Sequenzen, in der die Sequenzen) auf Basis
einer dreidimensionalen Konfiguration gewählt wird (werden), die bei
der Faltung des Zielmotivs gebildet wird. Es gibt eine Vielfalt
von Zielmotiven, die dem Fachmann bekannt sind. Proteinzielmotive
schließen
enzymatische aktive Stellen und Signalsequenzen ein, sind aber nicht
darauf beschränkt.
Bevorzugte Zielmotive der vorliegenden Erfindung werden Promotersequenzen,
cis Elemente, Haarnadelstrukturen und andere Expressionselemente,
wie beispielsweise Proteinbindungssequenzen, einschließen, sind
aber nicht darauf beschränkt.
-
Wie
hierin verwendet, bezieht sich „Suchmittel" auf ein oder mehrere
Programme, die auf dem Computer-basierten System implementiert werden,
um eine Zielsequenz oder ein Zielstrukturmotiv mit der Sequenzinformation
zu vergleichen, die innerhalb des Datenspeichermittels gespeichert
ist.
-
Suchmittel
werden verwendet, um Fragmente oder Regionen der Sequenzen der vorhegenden
Erfindung zu identifizieren, die eine besondere Zielsequenz oder
Zielmotiv treffen. Viele Sequenzen können ebenfalls verglichen werden,
um übliche
Regionen oder Motive zu identifizieren, die für spezifische Funktionen verantwortlich
sein können.
Zum Beispiel können
cis Elemente oder Sequenzdomänen,
die ein spezifisches Expressionsprofil verleihen, identifiziert
werden, wenn viele Promoterregionen von ähnlichen Klassen von Promotern
durch bestimmte Softwarepackages ausgerichtet und analysiert werden.
-
Die
vorliegende Erfindung stellt weiterhin Systeme bereit, insbesondere
Computer-basierte Systeme, die die Sequenzinformation enthalten,
die hierin beschrieben ist. Wie hierin verwendet, bezieht sich ein „Computer-basiertes
System" auf Festplattenmittel,
Softwaremittel und Datenspeichermittel, die verwendet werden, um
die Nukleotidsequenzinformation der vorliegenden Erfindung zu analysieren.
Das minimale Festplattenmittel des Computer-basierten Systems der
vorliegenden Erfindung umfasst eine Zentraleinheit (CPU), Eingabemittel,
Ausgabemittel und Datenspeichermittel. Der Fachmann kann erkennen,
dass irgendeines der erhältlichen
Computer-basierten Systeme zur Verwendung in der vorliegenden Erfindung
geeignet ist.
-
In
einer bevorzugten Ausführungsform
werden die Flankensequenzen, die die 5'-Regulatorelemente der vorliegenden
Erfindung enthalten, unter Verwendung eines Genom-Wanderungs-Zugangs
(Universal GenomeWalkerTM-Kit, CLONTECH
Laboratories, Inc., Palo Alto, CA) isoliert. Kurz gesagt, die gereinigte
genomische DNA wird einer Restriktionsenzymverdauung unterworfen,
die genomischen DNA-Fragmente mit Enden erzeugt, die mit GenomeWalkerTM-Adaptern verbunden werden. GenomeWalkerTM-Primer werden zusammen mit Gen-spezifischen
Primern in zwei aufeinanderfolgenden PCR-Reaktionen (primäre und eingenistete PCR-Reaktionen)
verwendet, um PCR-Produkte zu erzeugen, die die 5'-Regulatorsequenzen
enthalten, die anschließend
geklont und sequenziert werden.
-
Zusätzlich zu
ihrer Verwendung zur Modulation der Genexpression weisen die Promotersequenzen der
vorliegenden Erfindung ebenfalls Nützlichkeit als Sonden oder
Primer in Nukleinsäurehybridisierungsexperimenten
auf. Die Nukleinsäuresonden
und -primer der vorliegenden Erfindung können unter stringenten Bedingungen
zu einer Ziel-DNA-Sequenz hybridisieren. Der Ausdruck „stringente
Hybridisierungsbedingungen" wird
als Bedingungen definiert, unter denen eine Sonde oder ein Primer
mit einer Zielsequenz(en) und nicht mit Nicht-Zielsequenzen spezifisch
hybridisiert, wie empirisch bestimmt werden kann. Der Ausdruck „stringente
Bedingungen" wird
funktional im Hinblick auf die Hybridisierung einer Nukleinsäuresonde
mit einer Zielnukleinsäure
(d.h. mit einer besonderen Nukleinsäuresequenz von Interesse) durch
die spezifische Hybridisierungsprozedur definiert (siehe zum Beispiel
Sambrook et al., 1989, bei 9.52-9.55 und 9.47-9.52, 9.56-9.58; Kanehisa, Nucl. Acids
Res. 12:203-213, 1984; Wetmur und Davidson, J. Mol. Biol. 31:349-370,
1968). Angemessene Stringenzbedingungen, die eine DNA-Hybridisierung
fördern,
sind, zum Beispiel, 6,0 × Natriumchlorid/Natriumcitrat
(SSC) bei etwa 45°C,
gefolgt von einer Waschung mit 2,0 × SCC bei 50°C, und sie
sind dem Fachmann bekannt oder können
in Laborhandbüchern,
einschließlich
Current Protocols in Molecular Biology, John Wiley & Sons, N. Y.,
1989, 6.3.1-6.3.6, aber nicht darauf beschränkt, gefunden werden. Zum Beispiel kann
die Salzkonzentration in dem Waschschritt von einer niedrigen Stringenz
von etwa 2,0 × SCC
bei 50°C bis
zu einer hohen Stringenz von etwa 0,2 × SCC bei 50°C ausgewählt werden.
Zudem kann die Temperatur in dem Waschschritt von niedrigen Stringenz-Bedingungen
bei Raumtemperatur, etwa 22°C,
zu hohen Stringenz-Bedingungen
bei etwa 65°C
erhöht
werden. Sowohl Temperatur als auch Salz können variiert werden, oder
entweder die Temperatur oder die Salzkonzentration können konstant
gehalten werden, während
die andere Variable geändert
wird. Zum Beispiel kann eine Hybridisierung unter Verwendung von
DNA- oder RNA-Sonden oder -Primern bei 65°C in 6 × SCC, 0,5% SDS, 5 × Denhardt's, 100 μg/ml unspezifischer
DNA (z.B., beultraschallte Lachssperma-DNA) mit Waschung bei 0,5 × SCC, 0,5%
SDS bei 65°C
für hohe
Stringenz durchgeführt
werden.
-
Es
wird erwogen, dass Hybridisierungsbedingungen niedrigerer Stringenz,
wie beispielsweise niedrigere Hybridisierungs- und/oder Waschtemperaturen
verwendet werden können,
um verwandte Sequenzen mit einem niedrigeren Grad an Sequenzähnlichkeit
zu identifizieren, wenn eine Spezifität der Bindung der Sonde oder
des Primers mit Zielsequenzen(en) erhalten wird. Dementsprechend
können
die Nukleotidsequenzen der vorliegenden Erfindung für ihre Fähigkeit
verwendet werden, Duplexmoleküle
mit komplementären
Strecken von DNA-Fragmenten selektiv zu bilden. Eine Detektion von
DNA-Segmenten durch Hybridisierung ist dem Fachmann wohl bekannt.
Folglich wird man in Abhängigkeit
von der sich vorgestellten Anwendung wünschen, variierende Hybridisierungsbedingungen
einzusetzen, um variierende Grade an Selektivität einer Sonde in Richtung zu
einer Zielsequenz zu erreichen, und das Verfahren der Wahl wird
von den gewünschten
Ergebnissen abhängen.
-
Die
Nukleinsäuresequenz
in SEQ ID NO: 1 ist in der Lage, mit anderen Nukleinsäuresequenzen
unter angemessen ausgewählten
Stringenzbedingungen zu hybridisieren. Wie hierin verwendet, wird
gesagt, dass zwei Nukleinsäuremoleküle in der
Lage sind, miteinander spezifisch zu hybridisieren, wenn die zwei
Moleküle in
der Lage sind, eine anti-parallele, doppelsträngige Nukleinsäurestruktur
zu bilden. Es wird gesagt, dass ein Nukleinsäuremolekül, das „Komplement" eines anderen Nukleinsäuremoleküls ist,
wenn sie Komplementarität zeigen.
Wie hierin verwendet, wird gesagt, dass Moleküle „vollständige Komplementarität" zeigen, wenn jedes Nukleotid
eines der Moleküle
mit einem Nukleotid des anderen komplementär ist. Es wird gesagt, dass
zwei Moleküle „minimal
komplementär" sind, wenn sie miteinander
mit ausreichender Stabilität
hybridisieren können,
um ihnen zu erlauben, miteinander unter zum Mindesten herkömmlichen
Bedingungen „niedriger
Stringenz" angetempert
zu bleiben. Genauso wird gesagt, dass die Moleküle „komplementär" sind, wenn sie miteinander
mit ausreichender Stabilität
hybridisieren können,
um ihnen zu erlauben, miteinander unter herkömmlichen Bedingungen „hoher
Stringenz" angetempert
zu bleiben. Herkömmliche
Stringenzbedingungen werden von Sambrook et al. (Molecular Cloning,
A Laboratory Manual, 2nd Ed., Cold Spring
Harbor Press, Cold Spring Harbor, New York, 1989) und von Haymes
et al. (Nucleic Acid Hybridization, A Practical Approach, IRL Press; Washington,
DC, 1985) beschrieben.
-
In
einer bevorzugten Ausführungsform
kann die Nukleinsäuresequenz
SEQ ID NO: 1 in Hybridisierungsassays von anderen Pflanzengeweben
verwendet werden, um nahe verwandte oder homologe Gene und assoziierte
Regulatorsequenzen zu identifizieren. Diese schließen Southern
oder Northern Hybridisierungsassays auf irgendeinem Substrat, einschließlich, aber
nicht beschränkt
auf ein angemessen erzeugtes Pflanzengewebe, Cellulose, Nylon oder
Kombinationsfilter, Chip oder Glasobjektträger, ein, sind aber nicht darauf beschränkt. Solche
Methodologien sind im Fachgebiet wohl bekannt und sind in einem
Kit oder Präparat
erhältlich,
die von kommerziellen Verkäufern
geliefert werden können.
-
Natürlich können Nukleinsäurefragmente
ebenfalls durch andere Techniken, wie beispielsweise durch direkte
Synthetisierung des Fragments durch chemische Mittel, erhalten werden,
wie es gewöhnlich
durch Verwendung einer automatisierten Oligonukleotidsynthesevorrichtung
praktiziert wird. Fragmente können
ebenfalls durch Anwendung von Nukleinsäurereproduktionstechnologie,
wie beispielsweise PCRTM- (Polymerasekettenreaktion-)
Technologie oder durch rekombinante DNA-Techniken erhalten werden, die dem Fachmann der
Molekularbiologie im Allgemeinen bekannt sind. Im Hinblick auf die
Amplifikation einer Zielnukleinsäuresequenz
(z.B., durch PCR) unter Verwendung einer besonderen Amplifikation
des Primerpaars beziehen sich „stringente
PCR-Bedingungen" auf Bedingungen,
die dem Primerpaar erlauben, nur mit der Zielnukleinsäuresequenz
zu hybridisieren, an die ein Primer mit der entsprechenden Wildtyp-Sequenz
(oder ihrem Komplement) binden wird und bevorzugt um ein einzigartiges
Amplifikationsprodukt zu erzeugen.
-
Die
Nukleinsäuresequenzen
der vorliegenden Erfindung können
ebenfalls als Sonden und Primer verwendet werden. Nukleinsäuresonden
und -primer können
auf Basis einer nativen Gensequenz erzeugt werden. Eine „Sonde" ist eine isolierte
Nukleinsäure,
an die ein herkömmlich
detektierbares Label oder Reportermolekül, z.B., ein radioaktives Isotop,
Ligand, chemiluminiszentes Mittel oder Enzym, angehängt ist. „Primer" sind isolierte Nukleinsäuren, die
mit einem komplementären
Ziel-DNA-Strang
durch Nukleinsäurehybridisierung
angetempert werden, um ein Hybrid zwischen dem Primer und dem Ziel-DNA-Strang
zu bilden, dann entlang des Ziel-DNA-Strangs durch eine Polymerase,
z. B., eine DNA-Polymerase, erstreckt werden. Primerpaare können zur
Amplifikation einer Nukleinsäuresequenz,
z. B., durch die Polymerasekettenreaktion (PCR) oder andere herkömmliche
Nukleinsäureamplifikationsverfahren
verwendet werden.
-
Sonden
und Primer hybridisieren spezifisch mit einer Ziel-DNA- oder -RNA-Sequenz
unter Hybridisierungsbedingungen hoher Stringenz und hybridisieren
spezifisch mit einer nativen Zielsequenz von anderen Spezies unter
Bedingungen niedriger Stringenz. Bevorzugt weisen Sonden und Primer
gemäß der vorliegenden
Erfindung vollständige
Sequenzähnlichkeit
mit der nativen Sequenz auf, obwohl Sonden, die sich von der nativen
Sequenz unterscheiden und die die Fähigkeit zur Hybridisierung
mit nativen Zielsequenzen beibehalten, durch herkömmliche
Verfahren entworfen werden können.
Verfahren zur Erzeugung und Verwendung von Sonden und Primern sind
beschrieben (siehe Sambrook et al., 1989; Ausubel et al., 1992 und
Innis et al., 1990). PCR-Primerpaare können von einer bekannten Sequenz
abgeleitet werden, zum Beispiel, durch Verwendung von Computerprogrammen,
die für
diesen Zweck beabsichtigt sind, wie beispielsweise Primer (Version
0.5, © 1991,
Whitehead Institute for Biochemical Research, Cambridge, MA).
-
Native
oder synthetische Nukleinsäuren
gemäß der vorliegenden
Erfindung können
in rekombinante Nukleinsäure-Konstrukte,
typischerweise DNA-Konstrukte, eingebaut werden, die zur Einführung in
und Replikation in eine Wirtszelle in der Lage sind. In einer bevorzugten
Ausführungsform
wird die Nukleotidsequenz der vorliegenden Erfindung, wie in SEQ
ID NO: 1 gezeigt, in eine Expressionsvektorkassette eingebaut, die die
Promoterregionen der vorliegenden Erfindung einschließt, die
mit einer genetischen Komponente, wie beispielsweise einem selektierbaren,
screenbaren oder markierbaren Markergen, operabel verbunden ist.
Die offenbarte Nukleinsäuresequenz
der vorliegenden Erfindung ist bevorzugt mit einer genetischen Komponente, wie
beispielsweise einer Nukleinsäure,
operabel verbunden, die eine wünschenswerte
Charakteristik verleiht, die mit der Pflanzenmorphologie, Physiologie,
Wachstum und Entwicklung, Ertrag, Nährstoffverbesserung, Krankheit,
wie beispielsweise Fusarium-Kopfmehltau-Krankheit oder Plagen- bzw. Schädlingsresistenz,
umfeldbedingter oder chemischer Toleranz assoziiert ist. Diese genetischen
Komponenten, wie beispielsweise Markergene oder agronomische Gene
von Interesse können
bei der Identifizierung einer transformierten Pflanzenzelle oder
Pflanze oder einer Erzeugung eines Produkts von agronomischer Nützlichkeit
funktionieren.
-
In
einer bevorzugten Ausführungsform
erzeugt eine genetische Komponente ein Produkt, das als eine Selektionsvorrichtung
dient und in einem regenerierbaren Pflanzengewebe funktioniert,
um eine Verbindung zu erzeugen, die dem Pflanzengewebe Resistenz
zu einer andernfalls toxischen Verbindung verleihen wird. Gene von
Interesse zur Verwendung als ein selektierbarer, screenbarer oder
markierbarer Marker werden GUS (Kodierungssequenz für beta-Glucuronidase),
GFP (Kodierungssequenz für
Grünfluoreszenzprotein), LUX
(Kodierungsgen für
Luciferase), Markergene für
Antibiotika-Resistenz oder Herbizidtoleranzgene einschließen, sind
aber nicht darauf beschränkt.
Beispiele von Transposons und assoziierten Antibiotikaresistenzgenen
schließen
die Transposons Tns (bla), Tn5 (nptII), Tn7 (dhfr), Penicilline,
Kanamycin (und Neomycin, G418, Bleomycin); Methotrexat (und Trimethoprim);
Chloramphenicol; und Tetracycline ein.
-
Charakteristiken,
die für
selektierbare Marker in Pflanzen nützlich sind, sind in einem
Bericht über
die Verwendung von Mikroorganismen (Advisory Commitee on Novel Foods
and Processes, July 1994) umrissen worden. Diese umfassen stringente
Selektion mit minimaler Anzahl an nicht transformierten Geweben,
große Anzahl
an unabhängigen
Transformationsereignissen mit keiner signifikanten Störung bei
der Regeneration, Anwendung auf eine große Anzahl an Spezies und Verfügbarkeit
eines Assays, um die Gewebe auf Vorhandensein des Markers zu markieren.
-
Eine
Anzahl an selektierbaren Markergenen ist in dem Fachgebiet bekannt,
und einige Antibiotikaresistenzmarker erfüllen diese Kriterien, einschließlich jener,
die gegen Kanamycin (nptII), Hygromycin B (aph IV) und Gentamycin
(aac3 und aac4) resistent sind. Nützliche dominante selektierbare
Markergene schließen Gene
ein, die Antibiotikaresistenzgene (z. B., Resistenz gegen Hygromycin,
Kanamycin, Bleomycin, G418, Streptomycin oder Spectinomycin); und
Herbizidresistenzgene (z. B., Phosphinothricinacetyltransferase)
kodieren. Eine nützliche
Strategie zur Selektion von Transformanten für eine Herbizidresistenz wird,
z. B., in Vasil (Cell Culture and Somatic Cell Genetics of Plants,
Vols. I-III, Laboratory Procedures and Their Applications Academic
Press, New York, 1984) beschrieben. Besonders bevorzugte selektierbare
Markergene zur Verwendung in der vorliegenden Erfindung werden Gene
einschließen,
die Resistenz gegen Verbindungen, wie beispielsweise Antibiotika
wie Kanamycin und Herbizide wie Glyphosat, verleihen (Della-Cioppa
et al., Bio/Technology 5(6), 1987; U. S. Patent 5,463,175; U. S.
Patent 5,633,435). Andere Selektionsvorrichtungen können ebenfalls
ausgeführt
werden und werden immer noch innerhalb des Schutzumfangs der vorliegenden
Erfindung fallen.
-
Für die Praxis
der vorliegenden Erfindung werden herkömmliche Zusammensetzungen und
Verfahren zur Erzeugung und Verwendung von Vektoren und Wirtszellen
eingesetzt, wie, unter anderem, in Sambrook et al., 1989, diskutiert.
In einer bevorzugten Ausführungsform
ist die Wirtszelle eine Pflanzenzelle. Eine Anzahl an Vektoren,
die zu der stabilen Transfektion von Pflanzenzellen oder zu der
Schaffung von transgenen Pflanzen geeignet sind, sind in, z. B.,
Pouwels et al. (Cloning Vectors: A Laboratory Manual, 1985, supp.
1987); Weissbach und Weissbach (Methods for Plant Molecular Biology,
Academic Press, 1989); Gelvin et al. (Plant Molecular Biology Manual,
Kluwer Academic Publishers, 1990); und Croy (Plant Molecular Biology
LabFax, BIOS Scientific Publishers, 1993) beschrieben worden. Pflanzenexpressionsvektoren
können,
zum Beispiel, ein oder mehrere geklonte Pflanzengene unter der Transkriptionskontrolle
von 5'- und 3'-Regulatorsequenzen einschließen. Sie
können
ebenfalls einen selektierbaren Marker einschließen, wie beschrieben, um Wirtszellen zu
selektieren, die den Expressionsvektor enthalten. Solche Pflanzenexpressionsvektoren
enthalten ebenfalls eine Promoterregulatorregion (z. B., eine Regulatorregion,
die induzibel oder konstitutiv kontrolliert, umfeldbedingt oder
Entwicklungs-reguliert ist, oder Zell- oder Gewebe-spezifische Expression),
eine Transkriptionsinitiationsstartstelle, eine Ribosom-Bindungsstelle,
ein RNA-Verarbeitungssignal,
eine Transkriptionsterminationsstelle und ein Polyadenylationssignal.
Andere Sequenzen aus bakteriellem Ursprung sind ebenfalls enthalten,
um dem Vektor zu erlauben, in einem bakteriellen Wirt geklont zu
werden. Der Vektor wird ebenfalls typischerweise einen breiten prokaryotischen
Wirtsbereichsreplikationsurspung haben. In einer besonders bevorzugten
Ausführungsform
ist die Wirtszelle eine Pflanzenzelle, und der Pflanzenexpressionsvektor
umfasst eine Promoterregion, wie in SEQ ID NO: 1 offenbart, eine
operabel verbundene transkribierbare Sequenz und eine Transkriptionsterminationssequenz.
Andere Regulatorsequenzen, die sich als genetische Komponenten in
einem Expressionsvektor vorgestellt sind, schließen eine nicht translatierte
Leitsequenz ein, die mit dem Promoter gekoppelt werden kann, sind
aber nicht darauf beschränkt.
Pflanzenexpressionsvektoren können
ebenfalls zusätzliche
Sequenzen umfassen, die Restriktionsenzymstellen, die für Klonierungszwecke
nützlich
sind, einschließen,
aber nicht darauf beschränkt
sind.
-
Eine
Anzahl an Promotern weisen Nützlichkeit
zur Pflanzengenexpression irgendeines Gens von Interesse auf, das
selektierbare Marker, markierbare Marker, Gene für Plagen- bzw. Schädlingstoleranz,
Krankheitstoleranz, Nährstoffverbesserungen
und irgendein anderes Gen, das ein gewünschtes Merkmal oder Charakteristik
verleiht, einschließt,
aber nicht darauf beschränkt
ist. Beispiele konstitutiver Promoter, die zur Pflanzengenexpression
nützlich
sind, schließen
den Blumenkohl-Mosaik-Virus- bzw. Cauliflower Mosaic Virus (CaMV)
35S Promoter, der eine konstitutive Expression mit hohem Pegel in
den meisten Pflanzengeweben verleiht (siehe, z. B., Odel et al.,
Nature 313:810, 1985), einschließlich von Monokotyledonen (siehe,
z. B., Dekeyser et al., Plant Cell 2:591, 1990; Terada und Shimamoto,
Mol. Gen. Genet. 220:389, 1990); den Nopalin-Synthase-Promoter (An et al.,
Plant Physiol. 88:547, 1988); den Octopin-Synthase-Promoter (Fromm
et al., Plant Cell 1:977, 1989); und den Braunwurz-Mosaik-Virus-
bzw. Figwort Mosaic Virus- (FMV) Promoter, wie in U.S. Patent Nr.
5,378,619 beschrieben, ein, sind aber nicht darauf beschränkt.
-
Eine
Vielfalt an Pflanzengenpromotern, die in Antwort auf umfeldbedingte,
hormonale, chemische und/oder Entwicklungs-Signalen reguliert werden,
können
zur Expression eines operabel verbundenen Gens in Pflanzenzellen
verwendet werden, einschließlich
von Promotern, die durch (1) Wärme
(Callis et al., Plant Physiol. 88:965, 1988), (2) Licht (z. B.,
Erbsen-rbcS-3A-Promoter, Kuhlemeier et al., Plant Cell 1:471, 1989; Mais-rbcS-Promoter,
Schaffner und Sheen, Plant Cell 3:997, 1991; oder Chlorophyll-a/b-Bindungsprotein-Promoter,
Simpson et al., EMBO J. 4:2723, 1985), (3) Hormone, wie beispielsweise
Abscissäure
(Marcotte et al., Plant Cell 1:969, 1989), (4) Verletzung (z. B.,
wunI, Siebertz et al., Plant Cell 1:961, 1989); oder (5) Chemikalien,
wie beispielsweise Methyljasmonat, Salicylsäure, oder Safener reguliert
werden. Es kann ebenfalls vorteilhaft sein, (6) Organ-spezifische
Promoter (z. B., Roshal et al., EMBO J. 6:1155, 1987; Schernthaner
et al., EMBO J. 7:1249, 1988; Bustos et al., Plant Cell 1:839, 1989)
einzusetzen.
-
Pflanzenexpressionsvektoren
können
RNA-Verarbeitungssignale, z. B., Introns einschließen, die stromaufwärts oder
stromabwärts
einer Polypeptid-kodierenden Sequenz in dem Transgen positioniert
sein können.
Zudem können
die Expressionsvektoren zusätzliche
Regulatorsequenzen von der 3'-nichttranslatierten
Region von Pflanzengenen einschließen (Thornburg et al., Proc.
Natl. Acad. Sci. USA 84:744, 1987; An et al., Plant Cell 1:115,
1989), z. B., eine 3'-Terminatorregion,
um die mRNA-Stabilität der mRNA
zu erhöhen,
wie beispielsweise die PI-II-Terminatorregion von Kartoffel- oder
Octopin- oder Nopalin-Synthase-3'-Terminatorregionen.
Fünf-endständige nichttranslatierte
Regionen einer mRNA können
eine wichtige Rolle bei der Translationsinitiation spielen und können ebenfalls
eine genetische Komponente in einem Pflanzenexpressionsvektor sein.
Zum Beispiel ist gezeigt worden, dass nichttranslatierte 5'-Leitsequenzen, die
von Wärmeschockproteinen
abgeleitet sind, eine Genexpression in Pflanzen verstärken (siehe,
zum Beispiel U. S. 5,362,865). Diese zusätzlichen stromaufwärts oder
stromabwärts
gelegenen Regulatorsequenzen können
von einer Quelle abgeleitet werden, die nativ oder heterolog in
Bezug auf andere Elemente ist, die auf dem Expressionsvektor vorhanden
sind.
-
Die
Promotersequenz der vorliegenden Erfindung wird verwendet, um die
Genexpression in monokotylen Pflanzenzellen, insbesondere in Getreidepflanzen
und sogar noch besonderer in definierten Weizenzellen, zu kontrollieren.
Die offenbarten Promotersequenzen sind genetische Komponenten, die
Teil von Vektoren sind, die zur Pflanzentransformation verwendet
werden. Die Promotersequenz der vorliegenden Erfindung kann mit
irgendeinem geeigneten Pflanzentransformationsplasmid oder Vektor
verwendet werden, der einen selektierbaren oder screenbaren Marker
und assoziierte Regulatorelemente, wie beschrieben, zusammen mit einer
oder mehreren Nukleinsäuren
enthält,
die in einer Weise exprimiert werden, die ausreichend ist, um ein besonderes
wünschenswertes
Merkmal zu verleihen. Beispiele von geeigneten Strukturgenen von
agronomischem Interesse, die sich von der vorliegenden Erfindung
vorgestellt sind, werden ein oder mehrere Gene zur Insektentoleranz,
wie beispielsweise ein Gen, das ein B.t Endotoxin kodiert, Plagen- bzw. Schädlingstoleranz, wie
beispielsweise Gene zur Pilzkrankheitskontrolle, insbesondere zur
Fusarium-Kopfmehltau-Krankheitskontrolle, Herbizidtoleranz, wie
beispielsweise Gene, die Glyphosattoleranz verleihen, und Gene zu
Qualitätsverbesserungen,
wie beispielsweise Ertrag, Physiologie, Düngemittel, Wachstum, Entwicklung,
Morphologie oder Pflanzenprodukt(e) einschließen, sind aber nicht darauf
beschränkt.
-
Die
Promotersequenzen der vorliegenden Erfindung können in Weizengewebe verwendet
werden, um eine Genexpression, die in die Ertragsverbesserung involviert
ist, anti-fungale und anti-mikrobielle Befälle, z. B. Fusarium, Microdochium,
Stagnospora und Blumeria, zu kontrollieren. Die Promotersequenzen
gemäß der vorliegenden
Erfindung können
zur Kontrolle der Expression jener Gene verwendet werden, die gegen
insektizide Schädigung
auf Korn aktiv sind, die normalerweise zur Keimung vor der Ernte
führt,
weil Feuchtigkeit in das durch das Insekt beschädigte Korn eindringt. Zudem
können
die Promotersequenzen der vorliegenden Erfindung zur Kontrolle der
Expression von jenen Genen verwendet werden, die einen starken Einfluss
auf Pflanzenbelastung, z. B., Wärme-
oder Wasserbelastung, aufweisen.
-
Alternativ
können
die DNA-Kodierungssequenzen diese Phenotypen durch Kodierung eines
nichttranslatierbaren RNA-Moleküls
bewirken, das die gezielte Inhibierung der Expression eines endogenen
Gens, zum Beispiel durch Antisense- oder Counterdrückungs-vermittelte
Mechanismen verursacht (siehe, zum Beispiel, Bird et al., Biotech.
Gen. Engin. Rev. 9:207, 1991). Die RNA kann ebenfalls ein katalytisches
RNA-Molekül
(z. B., ein Ribozym) sein, das entwickelt wird, um ein gewünschtes
endogenes mRNA-Produkt zu spalten (siehe zum Beispiel, Gibson und
Shillitoe, Mol. Biotech. 7:125, 1997). Folglich ist irgendein Gen,
das ein Protein oder eine mRNA erzeugt, das bzw. die einen Phenotyp
oder eine Morphologieänderung
von Interesse exprimiert, für
die Praxis der vorliegenden Erfindung nützlich.
-
Zusätzlich zu
Regulatorelementen oder -sequenzen, die stromaufwärts (5') oder innerhalb
einer DNA-Sequenz
angeordnet sind, gibt es stromabwärts gelegene (3') Sequenzen, die
die Genexpression beeinflussen, und folglich bezieht sich der Ausdruck
Regulatorsequenz, wie hierin verwendet, auf irgendeine Nukleotidsequenz,
die stromaufwärts,
innerhalb oder stromabwärts
zu einer DNA-Sequenz angeordnet ist, die die Expression eines Genprodukts
in Verbindung mit der Proteinsynthesevorrichtung der Zelle kontrolliert,
vermittelt oder beeinflusst.
-
Die
Promotersequenzen der vorliegenden Erfindung können, zum Beispiel, zur Expression
in anderen Pflanzensystemen modifiziert werden. In einem anderen
Zugang können
neue Hybridpromoter durch eine Anzahl an Verfahren entworfen oder
entwickelt werden. Viele Promoter enthalten stromaufwärts gelegene
Sequenzen, die die Stringenz und/oder Spezifizität des Promoters aktivieren,
verbessern oder definieren (Atchinson, Ann. Rev. Cell Biol. 4:127,
1988). T-DNA-Gene, zum Beispiel, enthalten „TATA"-Boxen, die die Stelle der Transkriptionsinitiation
definieren, und andere stromaufwärts
gelegene Elemente, die stromaufwärts
der Transkrisptionsinitiationsstelle angeordnet sind, passen Transkriptionspegel
an (Gelvin, In: Transgenic Plants, Kung und Us, eds, San Diego:
Academic Press, S. 49-87, 1988). Chimäre Promoter kombinierten ein
Trimer des Octopin-Synthase- (ocs) Aktivators mit dem Mannopin-Synthase-
(mas) Aktivator plus Promoter und berichteten eine Erhöhung bei
der Expression eines Reportergens (Min Ni et al., The Plant Journal
7:661, 1995). Die stromaufwärts
gelegenen Regulatorsequenzen der vorliegenden Erfindung können für die Konstruktion solcher
chimären
oder hybriden Promotern verwendet werden. Verfahren zur Konstruktion
verschiedener Promoter der vorliegenden Erfindung schließen eine
Kombinierung von Kontrollelementen unterschiedlicher Promoter oder
eine Duplizierung von Abschnitten oder Regionen eines Promoters
ein, sind aber nicht darauf beschränkt (siehe zum Beispiel U.
S. Patent 5,110,732 und U. S. Patent 5,097,025). Die Fachleute sind
mit den Standardquellenmaterialien vertraut, die spezifische Bedingungen
und Prozeduren für
die Konstruktion, Manipulation und Isolation von Makromolekülen (z.
B., DNA-Molekülen,
Plasmiden usw.), Erzeugung von rekombinanten Organismen und das
Screening und die Isolation von Genen beschreiben (siehe zum Beispiel
Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring
Harbor Press, 1989; Maliga et al., Methods in Plant Molecular Biology,
Cold Spring Harbor Press, 1995; Birren et al., Genome Analysis:
volume 1, Analyzing DNA, (1997), volume 2, Detecting Genes, (1998),
volume 3, Cloning Systems, (1999), volume 4, Mapping Genomes, (1999),
Cold Spring Harbor, New York).
-
Die
Promotersequenzen der vorliegenden Erfindung können in einen Expressionsvektor
eingebaut werden, der screenbare oder markierbare Marker, wie beschrieben,
verwendet und in Durchgangsanalysen getestet werden, die eine Indikation
der Genexpression in stabilen Pflanzensystemen bereitstellen. Verfahren zum
Testen der Genexpression in Durchgangsassays sind dem Fachmann bekannt. Über eine
Durchgangsexpression von Markergenen ist unter Verwendung einer
Vielfalt von Pflanzen, Geweben und DNA-Zuführsystemen berichtet worden.
Zum Beispiel können
Typen von Durchgangsanalysen direkte Genzuführung durch Elektroporation
oder Partikelbombardement von Geweben in irgendeinem Durchgangspflanzenassay
unter Verwendung irgendeiner Pflanzenspezies von Interesse einschließen, sind
aber nicht darauf beschränkt.
Solche Durchgangssysteme werden Protoplasten aus Suspensionskulturen
in Weizen (Zhou et al., Plant Cell Reports 12:612.1993), Elektroporation
von Blattprotoplasten von Weizen (Sethi et al., J. Crop Sci. 52:
152, 1983); Elektroporation von Protoplasten, die aus Getreidegewebe
hergestellt sind (Sheen, The Plant Cell 3: 225, 1991) oder Partikelbombardement
von spezifischen Geweben von Interesse einschließen, sind aber nicht darauf
beschränkt.
Die vorliegende Erfindung umfasst die Verwendung von irgendeinem
Durchgangsexpressionssystem, um Regulatorsequenzen zu bewerten,
die mit selektierten Reportergenen, Markergenen oder agronomischen
Genen von Interesse operabel verbunden sind. Beispiele von Pflanzengeweben,
die sich vorgestellten sind, in Durchgängen durch ein angemessenes
Zuführsystem
getestet zu werden, werden Blattbasisgewebe, Schwielen, Keimblätter, Wurzeln,
Endosperm, Fruchtkeime bzw. Embryos, Blütengewebe, Pollen und epidermales
Gewebe einschließen,
sind aber nicht darauf beschränkt.
-
Irgendein
markierbarer oder screenbarer Marker kann in einem Durchgangsassay
verwendet werden. Bevorzugte Markergene für Durchgangsanalysen der Promoter
oder 5'-Regulatorsequenzen
der vorliegenden Erfindung schließen ein GUS-Gen oder ein GFP-Gen
ein. Die Expressionsvektoren, die die 5'-Regulatorsequenzen enthalten, die mit
einem Markergen operabel verbunden sind, werden zu den Geweben zugeführt, und
die Gewebe werden durch einen angemessenen Mechanismus in Abhängigkeit
des Markers analysiert. Die quantitativen oder qualitativen Analysen
werden als ein Werkzeug verwendet, um das potenzielle Expressionsprofil
der 5'-Regulatorsequenzen
zu bewerten, wenn sie mit Genen von agronomischen Interesse in stabilen
Pflanzen operabel verbunden sind. Schließlich werden die 5'-Regulatorsequenzen
der vorliegenden Erfindung in geeignete Pflanzentransformationsexpressionsvektoren
direkt eingebaut, die die 5'-Regulatorsequenzen
umfassen, die mit einer transkribierbaren DNA-Sequenz von Interesse
operabel verbunden sind, in Pflanzen transformiert, und die stabil
transformierten Pflanzen und deren Nachkommenschaft werden auf das gewünschte Expressionsprofil
analysiert, das durch die 5'-Regulatorsequenzen
verliehen wird.
-
Die
Fachleute kennen die Vektoren, die zur Pflanzentransformation geeignet
sind. Geeignete Vektoren werden unschädlich gemachte Ti-Plasmide
für Agrobacterium-vermittelte
Verfahren einschließen,
sind aber nicht darauf beschränkt.
Diese Vektoren können
einen Resistenzmarker, 1-2 T-DNA-Grenzen
und Replikationsursprünge
für E.
coli und Agrobacterium zusammen mit einem oder mehreren Genen von
Interesse und assoziierten Regulatorregionen enthalten. Die Fachleute
wissen, dass für
Agrobacterium-vermittelte Zugänge eine
Anzahl von Bakterienstämmen
und Verfahren verfügbar
sind. Solche Bakterienstämme
werden Agrobacterium-Bakterienstämme
C58, LBA4404, EHA101 und EHA105 einschließen, sind aber nicht darauf
beschränkt.
Besonders bevorzugte Bakterienstämme
sind Agrobacterium tumefaciens-Bakterienstämme. Andere DNA-Zuführsysteme
zur Pflanzentransformation sind den Fachleuten ebenfalls bekannt
und schließen
Partikelbombardement von ausgewählten
Pflanzengeweben ein, sind aber nicht darauf beschränkt.
-
Beispielhafte
Nukleinsäuren,
die durch die Verfahren eingeführt
werden können,
die von der vorliegenden Erfindung umfasst sind, schließen, zum
Beispiel, DNA-Sequenzen oder Gene von anderen Spezies oder sogar
Gene oder Sequenzen ein, die ursprünglich aus oder in der gleichen
Spezies vorhanden sind, aber in Empfängerzellen durch Gentechnikverfahren
eher als durch die klassische Reproduktion oder Züchttechniken eingeführt werden.
Der Ausdruck exogen ist jedoch ebenfalls beabsichtigt, um sich auf
Gene zu beziehen, die normalerweise in der Zelle, die transformiert
wird, nicht vorhanden oder vielleicht einfach nicht in der Form, Struktur
usw. vorhanden sind, wie festgestellt wird, dass in dem transformierenden
DNA-Segment oder Gen oder Genen, die normalerweise vorhanden sind,
von denen man immer noch wünscht,
dass sie z. B., über-exprimiert
haben. Der Ausdruck „exogenes" oder alternativ „heterologes" Gen oder DNA ist
folglich beabsichtigt, sich auf irgendein Gen oder DNA-Segment zu
beziehen, das in eine Empfängerzelle
eingeführt
wird, egal, ob ein ähnliches
Gen bereits in solch einer Zelle vorhanden sein kann. Der Typ an
DNA, der in der exogenen DNA enthalten ist, kann DNA, die bereits
in der Pflanzenzelle vorhanden ist, DNA von einer anderen Pflanze,
DNA aus einem unterschiedlichen Organismus oder eine DNA einschließen, die
extern erzeugt wird, wie beispielsweise eine DNA-Sequenz, die eine
Antisense-Message bzw. Nachricht eines Gens enthält, oder eine DNA-Sequenz,
die eine synthetische oder modifizierte Version eines Gens kodiert.
-
Die
Pflanzentransformationsvektoren, die die Promotersequenzen der vorliegenden
Erfindung enthalten, können
in Pflanzen durch irgendein Pflanzentransformationsverfahren eingeführt werden.
Einige Verfahren sind zur Einführung
von DNA-Sequenzen in Pflanzenzellen verfügbar und sind in dem Fachgebiet
wohl bekannt. Geeignete Verfahren schließen bakterielle Infektion,
binäre
bakterielle künstliche
Chromosomvektoren, direkte Zuführung
von DNA (z. B. durch PEG-vermittelte Transformation, Dürre-/Inhibierungs-vermittelte DNA-Aufnahme,
Elektroporation, Schüttlung
mit Siliziumcarbidfasern) und Beschleunigung von DNA-beschichteten
Partikeln (ein Überblick
wird gegeben in Potrykus, Ann. Rev. Plant. Physiol. Plant Mol. Biol.,
42: 205, 1991) ein, sind aber nicht darauf beschränkt.
-
Verfahren
zur spezifischen Transformation von Dikotyledonen verwenden hauptsächlich Agrobacterium
tumefaciens. Zum Beispiel schließen berichtete transgene Pflanzen
Baumwolle (U. S. Patent Nr. 5,004,863; U.S. Patent Nr. 5,159,135;
U. S. Patent Nr. 5,518,908, WO 97/43430), Sojabohne/U. S. Patent
Nr. 5,569,834; U. S. Patent Nr. 5,416,011; McCabe et al., Bio/Technology,
6:923, 1988; Christou et al., Plant Physiol., 87:671, 1988); Brassica
(U. S. Patent Nr. 5,463,174) und Erdnuss (Cheng et al., Plant Cell
Rep., 15:653, 1996) ein, sind aber nicht darauf beschränkt.
-
Ähnliche
Verfahren wurden bei der Transformation von Monokotyledonen berichtet.
Eine Transformation und Pflanzenregeneration unter Verwendung dieser
Verfahren wurden für
eine Anzahl an Saaten beschrieben, die Spargel (Asparagus officinalis;
Bytebier et al., Proc. Natl. Acad. Sci. U.S.A., 84: 5345, 1987);
Gerste (Hordeum vulgarae; Wan und Lemaux, Plant Physiol, 104; 37,
1994); Mais (Zea mays; Rhodes et al., Science, 240:204, 1988; Gordon-Kamm
et al., Plant Cell, 2: 603, 1990; Fromm et al., Bio/Technology,
8: 833, 1990; Koziel et al., Bio/Technology, 11:194, 1993); Hafer
(Avena sativa; Somers et al., Bio/Technology, 10: 1589, 1992); Knaulgras
(Dactylis glomerata; Horn et al., Plant Cell Rep., 7: 469, 1988);
Reis (Oryza sativa, einschließlich Indica-
und Japonica-Varietäten, Toriyama
et al., Bio/Technology, 6: 10, 1988; Zhang et al., Plant Cell Rep., 7:379,
1988; Luo und Wu, Plant Mol. Biol. Rep., 6: 165, 1988; Zhang und
Wu, Theor. Appl. Genet., 76: 835, 1988; Christou et al., Bio/Technology,
9: 957, 1991); Hirse (Sorghum bicolor; Casas et al., Proc. Natl.
Acad. Sci. U.S.A., 90: 11212, 1993); Zuckerrohr (Saccharum spp.;
Bower und Birch, Plant J., 2: 409, 1992); hoher Schwingel (Festuca
arundinacea; Wang et al., Bio/Technology, 10:691, 1992), Torfgras
(Agrostis palustris; Zhong et al., Plant Cell Rep., 13: 1, 1993);
Weizen (Triticum aestivum; Vasil et al., Bio/Technology, 10: 667, 1992;
Weeks et al., Plant Physiol., 102: 1077, 1993; Becker et al., Plant,
J. 5: 299, 1994) und Alfalfa (Massoud et al., Transgen. Res., 5:
313, 1996) einschließen,
aber nicht darauf beschränkt
sind. Es ist dem Fachmann klar, dass eine Anzahl an Transformationstechnologien
verwendet und zur Erzeugung von stabilen transgenen Pflanzen aus
irgendeiner Anzahl von Zielsaaten von Interesse modifiziert werden
können.
-
Die
transformierten Pflanzen werden auf das Vorhandensein der Gene von
Interesse und den Expressionspegel und/oder -profil analysiert,
der bzw. das durch die Promotersequenzen der vorliegenden Erfindung verliehen
wird. Die Fachleute kennen die zahlreichen Verfahren, die für die Analyse
von transformierten Pflanzen verfügbar sind. Eine Vielfalt an
Verfahren wird verwendet, um die Genexpression zu bewerten und zu
bestimmen, ob das (die) eingeführte(n)
Gen(e) integriert wird (werden), korrekt funktioniert und wie erwartet
vererbt wird (werden). Für
die vorliegende Erfindung können
die Promoter durch Bestimmung der Expressionspegel von Genen bewertet
werden, mit dem die Promoter operabel verbunden sind. Eine vorläufige Bewertung der
Promoterfunktion kann durch ein Durchgangsassayverfahren unter Verwendung
von Reportergenen bestimmt werden, aber eine definitivere Promoterbewertung
kann von der Analyse von stabilen Pflanzen bestimmt werden. Verfahren
zur Pflanzenanalyse schließen
Southern Blots oder Northern Blots, PCR-basierende Zugänge, biochemische
Analysen, Phenotyp-Screeningverfahren, Feldbewertungen und immunodiagnostische
Assays ein, sind aber nicht darauf beschränkt.
-
Die
Verfahren der vorliegenden Erfindung, die Erzeugung einer cDNA-Bank,
Erzeugung einer genomischen Bank, Sequenzierung, Sequenzanalysen,
PCR-Technologien, Vektorkonstruktion, Durchgangsassays und Pflanzentransformationsverfahren
einschließen,
aber nicht darauf beschränkt
sind, sind den Fachleuten wohl bekannt und werden unter Verwendung
von Standardtechniken oder deren Modifikationen durchgeführt.
-
Die
folgenden Beispiele sind enthalten, um bevorzugte Ausführungsformen
der vorliegenden Erfindung zu zeigen.
-
BEISPIELE
-
Beispiel 1 – Pflanzenmaterial,
RNA-Isolierung und cDNA-Konstruktion
-
Ein
Gewebe für
die Konstruktion der Deckspelzen-/Vorspelzen-Bank (LIB3399) wird
wie folgt gesammelt. Eine Triticum aestivum- (var. Bobwhite bzw.
Wachtel) Saat wird gekeimt und in einer Wachstumskammer (Feuchtigkeit – 65%, Temperatur-/Lichtzyklus – 16 Std.
Licht [18°C]/8
Std. Dunkelheit [16°C],
Lichtstärke – 43 kLux)
wachsen gelassen. Eine Gewebeernte wird nach ungefähr 8 Wochen
Wachstum als die Pflanzen die Stufe 65 von der BBCH Wachstumsskala
(die gemeinschaftlich mit Deutschen Landwirtschaftsinstituten entwickelt
worden ist) erreichten, wenn 50% Staubbeutel extrudiert werden,
durchgeführt.
Das Deckspelzen- und Vorspelzengewebe wird entfernt und sofort in
flüssigen
Stickstoff mit anschließender
Lagerung bei –80°C gelegt.
-
Die
gesamte RNA wird von dem Deckspelzen- und Vorspelzengewebe unter
Verwendung von Trizol (Gibco BRL, Life Technologies, Gaithersburg,
Maryland U.S.A.) gereinigt, wie im Wesentlichen von dem Hersteller
empfohlen. Poly A+ RNA (mRNA) wird unter Verwendung von magnetischen
Olio dT Perlen gereinigt, wie von dem Hersteller empfohlen (Dynabeads,
Dynal Corporation, Lake Success, New York U.S.A.).
-
Eine
Konstruktion von Pflanzen-cDNA-Banken ist in dem Fachgebiet wohl
bekannt, und eine Anzahl von Klonierungsstrategien ist vorhanden.
Eine Anzahl von cDNA-Bankkonstruktions-Kits ist kommerziell erhältlich.
Das SuperscriptTM-Plasmid-System für die cDNA-Synthese
und Plasmid Cloning (Gibco BRL, Life Technologies, Gaitherburg,
Maryland U.S.A.) wurden verwendet, den Bedingungen folgend, die
von dem Hersteller vorgeschlagen sind. cDNA wird synthetisiert,
unter Verwendung einer Sephacryl-Säule (500-2000 bp inklusive)
Größen-selektiert
und direkt in pSPORT1 (GibcoBRL, Life Technologies, Gaitherburg,
Maryland U.S.A.) geklont.
-
Die
cDNA-Banken werden auf LB Agar plattiert, das die angemessenen Antibiotika
zur Selektion enthält,
und bei 37°C über eine
ausreichende Zeit inkubiert, um das Wachstum von individuellen Kolonien
zu erlauben. Einzelne Kolonien werden in individuelle Vertiefungen
von Mikrotiterplatten mit 96 Vertiefungen platziert, die LB Flüssigkeit,
einschließlich
der selektiven Antikörper,
enthalten. Die Platten werden über
Nacht bei ungefähr
37°C mit
leichtem Schütteln
inkubiert, um das Wachstum der Kulturen zu fördern. Plasmid-DNA wird aus
jedem Klon unter Verwendung von Qiaprep-Plasmid-Isolierungs-Kits unter Verwendung der
Bedingungen isoliert, die von dem Hersteller empfohlen werden (Quiagen
Inc., Santa Clara, California U.S.A.).
-
Die
Templat-Plasmid-DNA-Klone werden durch Initiation von dem 5'-Ende jedes cDNA-Klons
sequenziert, die sich ergebenden Sequenzen werden als exprimierte
Sequenz-Tags (ESTs) bezeichnet. Die Templat-Plasmid-DNA-Klone werden
dann sequenziert. Die cDNAs werden unter Verwendung eines kommerziell
erhältlichen
Sequenzierungs-Kits, wie beispielsweise ABI PRISM dRhodamine Terminator
Cycle Sequencing Ready Reaction Kit mit AmpliTaq® DNA
Polymerase, unter den Bedingungen sequenziert, die von dem Hersteller
(PE Applied Biosystems, Foster City, CA) empfohlen werden.
-
Eine
Anzahl an Sequenzierungstechniken ist in dem Fachgebiet bekannt,
einschließlich
Fluoreszenz-basierter
Sequenzierungsmethodologien. Diese Verfahren weisen die Detektion-,
Automatisierungs- und Instrumentationsfähigkeit
auf, die für
die Analyse großer
Umfänge
an Sequenzdaten notwendig sind. Gegenwärtig erlaubt die 377 DNA-Sequenzierungsvorrichtung
(Perkin-Elmer Corp., Applied Biosystems Div., Foster City, CA) die
schnellste Elektrophorese und Datensammlung. Mit diesen Typen an
automatisierten Systemen werden fluoreszente Farbstoff-gelabelte
Sequenzreaktionsprodukte detektiert, und Daten werden direkt in
den Computer eingegeben, der ein Chromatogramm erzeugt, das anschließend unter
Verwendung der entsprechenden Softwareprogramme gesehen, gespeichert
und analysiert wird. Diese Verfahren sind den Fachleuten bekannt
und sind beschrieben, und ein Überblick
ist gegeben worden (Birren et al., Genome Analysis: Analyzing DNA,
1, Cold Spring Harbor, New York).
-
Beispiel 2 – EST-Clustern
-
Die
ESTs, die aus Sequenzierung eines Bereichs von T. asetivum-cDNA-Banken
erzeugt sind, werden in einer Computerdatenbank gespeichert. Die
,rohen' ESTs werden
in Gruppen von zusammenhängenden ESTs,
d.h., ESTs, die ursprünglich
aus homologen mRNA-Transkripten sind, in einem Prozess sortiert,
der als Clustern bekannt ist.
-
Der
Clusterprozess besteht aus drei Hauptschritten:
- 1.
Die Banken werden auf Vektorkontamination und Sequenz schlechter
Qualität
gescreent.
- 2. Die Sequenzen werden miteinander verglichen. Jene Sequenzen,
die 90% Identität über einen
Bereich von 100 Basenpaaren aufweisen, werden erwogen, in dem gleichen „Behältnis" zu sein.
- 3. Alle der Sequenzen in jedem „Behältnis" werden ausgerichtet, was eine übereinstimmende
Sequenz erzeugt, die als eine EST-Cluster-Sequenz bekannt ist. Die
Sequenzen in einem „Behältnis", die sich nicht ausrichten,
werden zu einem neuen Behältnis
bewegt.
-
Die
Deckspelzen- und Vorspelzen-cDNA-Bank (LIB3399) umfasst 5856 Klone,
jedes von ihnen wird sequenziert, um einen EST zu erzeugen. Diese
ESTs werden dann mit anderen verfügbaren ESTs aus weiteren T.
aestivum-cDNA-Banken geclustert, um einen Satz an T. aestivum-EST-Clustersequenzen
zu erzeugen. Tabelle 1 (im Anhang) zeigt 40 der abundantesten EST-Clustersequenzen
in LIB3399. Die Abundanz ist als Zielzählung (Anzahl an ESTs aus LIB3399,
die den Cluster umfasst) und prozentuale Abundanz (Zielzählung als
ein Prozentsatz der Gesamtzahl an ESTs in LIB3399) ausgedrückt.
-
Beispiel 3 – Messung
der Abundanz an EST-Clustern unter Verwendung von BLAST
-
BLAST
(Basic Local Alignment Search Tool) ist ein Satz an Ähnlichkeitssuchprogrammen,
die entworfen sind, um DNA- und Proteinsequenz-Datenbanken abzufragen.
Die BLAST-Programme wurden für
Geschwindigkeit mit einem minimalen Verlust an Sensitivität zu entfernten
Sequenzbeziehungen entworfen. Die Markierungen, die in einer BLAST-Suche
zugeordnet werden, weisen eine wohl definierte statistische Interpretation
auf, was es einfacher macht, reale Treffer von zufälligen Hintergrund-Hits
zu unterscheiden. BLAST verwendet einen heuristischen Algorithmus,
der lokal im Gegensatz zu globalen Ausrichtungen sucht und deshalb in
der Lage ist, Beziehungen unter Sequenzen zu detektieren, die nur
isolierte Ähnlichkeitsregionen
teilen (Altschul et al. J. Mol. Biol. 215(3): 403-410).
-
Die
Anzahl an ESTs, die aus einer besonderen Bank stammen, die einen
besonderen EST-Cluster umfassen, stellt ein Maß der Abundanz des entsprechenden
mRNA-Transkripts in dem Gewebe bereit, das verwendet wird, um die
Bank herzustellen.
-
Die
96 abundantesten EST-Cluster aus LIB3399 wurden als Abfragesequenzen
verwendet, um einen Bereich aus cDNA-Banken (siehe Tabelle 2 im
Anhang) unter Verwendung des BLAST-Algorithmus zu suchen. Die Anzahl
an ,Hits' mit einem
E-Wert <= 1 × 10–7 und
einem Bitscore >=100
(unter Verwendung von Fehlerparametern mit Ausnahme der Schwellenausdehnung >=100) wurden für jede DNA-Bank
kollationiert, von der die Anzahl an ,Hits' in jedem Gewebetyp berechnet wurde
(siehe Tabelle 3 im Anhang).
-
Ausgewählte EST-Cluster
waren jene, in denen die Gesamtanzahl an Hits im Stängel bzw.
Halm, Blatt, Embryo, Endosperm und Wurzel <5 waren. Siebenunddreißig der
analysierten 96 EST-Cluster erfüllten
dieses Kriterium. Diese wurden weiterhin auf 30 EST Cluster durch
Auswählen
auf dem Kriterium einer sehr niedrigen Expression (<=1 Hit) im Stängel bzw.
Halm, Blatt, Embryo und Wurzel reduziert. Wenn jedoch irgendeine Staubbeutelexpression
offensichtlich war, wurde ein höherer
Pegel der Expression im Stängel,
Blatt, Embryo und Wurzel toleriert (<=5 Hits). Siehe Ablaufdiagramm (1 im
Anhang) zum Vergleich des Expressionsmusters von 3 EST-Clustern
(jeweils 3849_1, 17859_1 und 88_3) mit gewünschten Expressionsmustern
und andere 4 mit ungewünschten
Expressionsmustern.
-
Beispiel 4 – Identifizierung
von homologen Reis-cDNAs und Expressionsanalyse
-
Die
30 Weizen-EST-Cluster wurden dann als Abfragesequenzen gegen O.
sativa-Unigen-Datenbank (geclusterte und zusammengesetzte ganze
EST-Datensätze
von Reisspezies vom 21. Sept. 2000) verwendet (seq VersionCollection – Oryza_sativa_Unigene20000921),
letzte Aktualisierung: 19. Oktober 2000 11:55 AM), um homologe Reis-cDNAs
zu suchen. Reis-cDNA-Homologe wurden für 25 der 30 Weizen-EST-Cluster
gefunden (siehe Tabelle 5).
-
Die
25 homologen Reis-cDNA-Sequenzen wurden dann als Abfragesequenzen
gegen einen Bereich von EST-Datenbanken von O. sativa-Rispen und
Blatt/vegetativem Gewebe verwendet (siehe Tabelle 4 im Anhang).
Die Anzahl an Hits (E-Wert <=
1 × 10–7,
Bitscore >=100 und
Schwellenausdehnung >=100)
wurden für den
Gewebetyp kollatisiert, der einen Vergleich des Gewebetypexpressionsmusters
erlaubt.
-
Siehe
Tabelle 5 (im Anhang) zur Zusammenfassung der 30 Weizen-EST-Cluster,
die mit einem Reis-cDNA-Homolog
und einer genomischen DNA-Reis-Sequenz assoziiert sind.
-
Reis-cDNA:
109_1.R2011 (LP1 genannt) zeigte eine bevorzugte Expression in Reisrispen über Blattgewebe.
Eine stringentere Analyse der Abfrage-/Subjektsequenzausrichtung
deutete an, dass diese cDNA noch bevorzugt abundanter in den Rispen-Banken
war als durch die ursprünglichen
Suchbedingungen angedeutet (siehe Tabelle 6 im Anhang).
-
Beispiel 5 – Identifizierung
und Klonierung von mutmaßlichen
Promoterregionen
-
Die
25 identifizierten Reis-cDNA-Homologsequenzen wurden als Abfragesequenzen
gegen eine genomische O. sativa-DNA-Bank verwendet, um entsprechende
genomische DNA-Sequenzen zu identifizieren (siehe Zusammenfassung
in Tabelle 5).
-
Ein
BLASTX- (alle sechs Nukleotidleserahmen) Suche einer GenPeptPRT-Datenbank
(öffentlich
zugängliche
Proteinsequenz) wurde mit der Reis-Unigen-cDNA-LP1 ausgeführt. Beste
,Hits' sind nachstehend gezeigt,
cDNA/gDNA-Ausrichtungen folgen in Tabelle 6 im Anhang.
-
-
Die
Reis-cDNA-Sequenzen wurden mit ihrer entsprechenden genomischen
Reis-DNA-Sequenz ausgerichtet, die genomische Reissequenz wurde
in dem gleichen Rahmen wie der cDNA-Rahmen translatiert, der die
vorstehenden Hits hervorrief. Dies ermöglichte eine Deduktion der
Position der mutmaßlichen
,TATA'-Box und ATG-Translationsstartkodons
für die
Gensequenz (siehe 2). Ein weiterer Beweis für die Position
des Translationstartkodons wurde durch Vergleichen der aminoterminalen
Aminosäuresequenz
von anderen nah verwandten Proteinsequenzen gesammelt.
-
Eingenistete
Paare von Oligonukleotid-PCR-Primern wurden für die genomische Reis-DNA-Sequenz entworfen.
Ein ,äußeres' primäres Paar
wurde unter Verwendung von Primerentwurfcomputersoftware (PrimerSelect – DNAStar)
entworfen, um eine Region von ungefähr 1700 bp stromaufwärts des
mutmaßlichen Translationsstartkodons
auf 200 bp stromabwärts
des mutmaßlichen
Translationsstartkodons zu amplifizieren. Dieses Paar an Primern
wurde mit einem genomischen Reis-(Nipponbare)
DNA-Templat verwendet, um primäre
PCR-Produkte zu erzeugen.
-
Das
,innere' sekundäre Paar
an Primern wurde manuell entworfen. Der Vorwärtsprimer baute entweder eine
SalI-Stelle ein oder temperte an eine Region unmittelbar stromaufwärts einer
SalI-Stelle innerhalb des mutmaßlichen
Promoters ungefähr
1500 bp stromaufwärts
des mutmaßlichen
Translationsstartkodons an. Der reverse Primer wurde entworfen,
um an die Region des mutmaßlichen
ATG-Translationsstartkodons anzutempern, aber durch diese Ausführung das
ATG in dem amplifizierten Produkt durch eine einzige Basenpaarsubstitution
zu zerstören.
Eine NotI-Restriktionsstelle
war ebenfalls unmittelbar stromabwärts des zerstörten ATG-Kodons
enthalten. Das sekundäre
Paar an Primern wurde verwendet, um den mutmaßlichen Promoter unter Verwendung
des primären
PCR-Produkts als ein Templat mittels PCR zu amplifizieren.
-
Mit
diesem Verfahren wurden ungefähr
1500 bp jedes mutmaßlichen
Promoters, einschließlich
von Nukleotiden unmittelbar stromaufwärts des mutmaßlichen
ATG-Translationsstartkodons, amplifizert und in einen geeigneten
Klonierungsvekor unter Verwendung von SalI- und NotI-Restriktionsstellen
geklont.
-
Beispiel 6 – Promoteranalyse
in Pflanzen
-
Für eine stabile
Pflanzentransformation wird die 5'-Regulatorsequenz in einen Pflanzentransformationsvektor,
wie beispielsweise der gezeigte pMON-CAM1 (3), geklont.
Dies ist ein binärer
Doppelrand- (rechte und linke T-DNA-Ränder) Pflanzentransformationsvektor
und enthält
die folgenden genetischen Komponenten: RACT ist das erste Intron
von dem Reisactin-Gen; GUS ist die Kodierungsregion für das Reportergen β-Glucoronidase;
NOS ist das 3'-Terminationssignal
von dem Nopalin-Synthase-Gen; Spec/Strep ist die Kodierungsregion
für Spectinomycin-
und Streptomycin-Resistenz; ori-pUC und ori-V sind Replikationsursprünge; NPTII
ist die Kodierungsregion für
Kanamycin-Resistenz; HSP70 ist ein Intron vom Maiswärmeschockprotein
70 Gen, wie in U. S. Patent Nrn. 5,593,874 und 5,859,347 beschrieben;
und CaMV35S ist der Promoter für
die 35S RNA vom Cauliflower Mosaic Virus, der eine Duplikation der
-90 bis -300 Region enthält.
-
Der
Promoter wird mit dem GUS-Reportergen zusammen mit anderen Regulatorsequenzen
operabel verbunden, die nichttranslatierte Leiter und Terminatoren,
wie vorstehend beschrieben, einschließen, aber nicht darauf beschränkt sind,
und in eine Zielsaat von Interesse durch ein angemessenes Zuführsystem,
wie beispielsweise eine Agrobacterium-vermittelte Transformation
(siehe, zum Beispiel, U. S. Patent Nr. 5,569,834, U. S. Patent Nr.
5,416,011, U. S. Patent Nr. 5,631,152, U. S. Patent Nr. 5,159,135
und U. S. Patent Nr. 5,004,863) oder Partikelbombardementverfahren
(siehe, zum Beispiel, Patentanmeldungen WO 92/15675, WO 97/48814
und Europäische
Patentanmeldung 586,355 und U. S. Patent Nrn. 5,120,657, 5,503,998, 5,830,728
und 5,015,580) transformiert.
-
Eine
große
Anzahl an Transformations- und Regenerationssystemen und -verfahren
sind verfügbar und
dem Fachmann wohl bekannt. Die stabil transformierten Pflanzen und
Nachkommenschaft werden anschließend auf die Expression des
Gens in Geweben von Interesse durch irgendeine Anzahl an molekularen, immunodiagnostischen,
biochemischen und/oder Feldbewertungs-Verfahren analysiert, die
dem Fachmann bekannt sind.
-
Weizenpflanzen,
die mit verschiedenen Promoterreporter-Konstrukten transformiert
waren, wurden auf GUS-Aktivität
jeweils in der Spelze, Deckspelze, Vorspelze und dem Markierungsblatt
analysiert. Der erhaltenen Ergebnisse sind in Tabelle 7 gezeigt.
-
Tabelle
7. Vergleich der GUS-Aktivität
in Weizenpflanzen, die mit verschiedenen Promoterreporter-Konstrukten transformiert
waren.
-
ScBV – Promoter
aus Zuckerrohr-Badnavirus, der eine konstitutive Expression antreibt
(Tzafrir et. al. 1998 Plant. Mol. Biol. 38, 347). PER1 – Promoter
des Hordeum vulgare-Peroxiredoxingens, das im Embryo- und Aleuron-Gewebe
exprimiert wird (Stacy et. al. 1996 Plant. Mol. Biol. 31, 1205).
Für LP1:
siehe SEQ ID NO.1.
-
Gewebe
wurden aus zahlreichen Pflanzen für jedes Konstrukt präpariert
und histochemisch auf GUS-Aktivität gemäß dem Protokoll
von Jefferson (1987, Plant. Mol. Biol. Rep. 5, 387) individuell
gefärbt.
Die GUS-Aktivität
wurde durch Markierung der Intensität der Blaufärbung mit dem Auge und unter
Zuordnung der folgenden Werte bewertet:
– für undetektierbar, + für detektierbar
und ++ für
niedrig, +++ für
mittelmäßig und
++++ für
hoch.
-
-
-
-
-
-
-
-
-
-
SEQUENZ
1, wie in der Anmeldung beschrieben SEQ.
ID. NO.1
-
-
-