DE60218700T2

DE60218700T2 - Regulatorische sequenzen aus reis für die genexpression in definierten geweben von weizen

Info

Publication number: DE60218700T2
Application number: DE60218700T
Authority: DE
Inventors: Martin Urban; Rebecca Stratford; Kim Hammond-Kosack; Pierre Lecocq; Richard Kemp
Original assignee: Monsanto UK Ltd
Current assignee: Monsanto UK Ltd
Priority date: 2001-08-28
Filing date: 2002-08-23
Publication date: 2007-11-08
Anticipated expiration: 2022-08-24
Also published as: WO2003020937A3; ATE377085T1; DE60223293D1; EP1548117A1; US7541452B2; ATE356219T1; DE60218700D1; EP1421196B1; US20070130633A1; EP1548117B1; EP1288302A1; DE60223293T2; US20080271206A1; WO2003020937A2; EP1421196A2; US7375208B2

Description

GEBIET DER ERFINDUNG
Die vorliegende Erfindung betrifft isolierte Nukleinsäuremoleküle, insbesondere Regulatorsequenzen, besonderer Reispromoter und deren Verwendung zur Kontrolle der Genexpression in vordefiniertem Weizengewebe, wie beispielsweise Spelze, Deckspelze und/oder Vorspelze. Ein Verfahren zur Isolierung dieser Regulatorsequenzen wird ebenfalls offenbart.
HINTERGRUND DER ERFINDUNG
Fusarium-Kopfmehltau von kleinen Körnern („Schorf"), der oft mit dem Akronym „FHB" bezeichnet wird, nimmt weltweit zu und ist ein enormes Problem bei der Erzeugung und dem Ertrag von Weizen. Innerhalb der letzten dutzend Jahre sind Ausbrüche von FHB in den Mittlerenwesten- und Oststaaten in den USA sowie in Zentral- und Ostkanada gewesen. Die am meisten ausgedehnte unlängst geschehene Episode ist in der Frühlingskornregion des oberen Mittlerenwestens gewesen, das auf dem Red River Valley von Nord-Dakota, Minnesota und Manitoba zentriert ist. Hier sind fünf aufeinander folgende Jahre mit schwerer Krankheit gewesen. Die Verluste sind groß gewesen, und ein sich summierender Verlust hat vielen Farmern den Ruin gebracht.
Während einige Spezies des Boden- und Schlagabraum-getragenen Pilzes Fusarium in der Lage sind, FHB anzuspornen, sind die meisten der Schäden in den unlängst geschehenen Ausbrüchen in den US und Kanada aufgrund von F. graminearum gewesen. Zusätzlich zu Kornsaaten weist diese Spezies einen breiten Wirtsbereich unter Gräsern auf. Der Name Fusarium bedeutet tatsächlich „von den Gräsern". Diese Spezies war wahrscheinlich im einheimischen Weidenland, lange bevor Weizen oder Gerste in Nordamerika ankamen, vorhanden. F. graminearum ist ebenfalls ein vorzüglicher Besiedler von alternden Pflanzen; insbesondere von Getreidehalmen bzw. Maistängeln. F. graminearum ist in einer anderen Hinsicht einzigartig. Es ist die einzige gewöhnliche Fusarium-Spezies, die Weizen infiziert, der regelmäßig und abundant seine Geschlechtsstufe (Giberella zeae) in Natur bildet. Weil die Sporen, die durch diese Stufe erzeugt werden, gewaltsam in die Luft geschossen werden, erhöhen sie außerordentlich die Fähigkeit des Pilzes, sich von einem besiedelten Saatrest zu verstreuen, wo sich die Fruchtkörper (perithecia) dieser Stufe bilden.
F. graminearum weist einen komplexen Lebenszyklus auf, der sich leichter vorstellen lässt, wenn er in zwei Teile geteilt wird: einen pathogenen Zyklus und einen ,verborgenen' Zyklus von saprophytischer Besiedelung. Die Wirkung des pathogenen Zyklus wird als FHB gesehen. Luftsporen landen auf Blütenköpfen während nassen Wetters, und FHB ergibt sich. F. graminearum überlebt auf dem Rest; insbesondere auf infizierten Köpfen und bildet in dem nächsten Frühling und Sommer Sporen. In dem saprophytischen Zyklus besetzt Myzelium oberflächlich Getreidehalme bzw. Maisstängel, oft ohne eine Krankheit zu verursachen. Bei Alterung tritt eine invasive Besiedelung auf, und F. graminearum nimmt von dem meisten des Getreidehalm- bzw. Maisstängelrests Besitz. Eine Minnesota-Studie hat festgestellt, dass über 80% des Getreidehalm- bzw. Maisstängelrests im Herbst von F. graminearum besetzt war und es über 60% im folgenden Frühling bedeckte. Dieser besiedelte Rest stellt eine Stelle zur massiven Sporenbildung während der nächsten Wachstumszeit bereit. Diese in der Luft befindlichen Sporen können eine neue saprophytische Besiedelung beginnen, oder sie können pathogene Zyklen einleiten, die zu FHB führen. Der saprophytische Besiedelungszyklus ist der Motor, der den pathogenen Teil des Zyklus antreibt.
Der saprophytische Lebenszyklus von F. graminearum wird von Getreidehalm- bzw. Maisstängelresten angetrieben. Es gibt eine Anzahl an Beobachtungen, dass, wenn sich eine Getreideerzeugung in eine früher kleine Kornfläche bewegt, sich das Auftreten von F. graminearum und die Gefahr von FHB erhöhen. Vereinige die Ausdehnung von Getreideflächen in Weizen- und Gerstenland mit großen Erhöhungen in reduziertem Ackerbau, und die Stufe wird für große Epidemien von FHB in kleinen Körnern festgesetzt, wenn das Wetter auftritt, das die Krankheit begünstigt.
Folglich kann die Fusarium-Kopfmehltau-Krankheit eine Anzahl an Getreidesaaten, wie beispielsweise Weizen, Gerste, Reis, Roggen und Mais, beeinflussen. Sie wird durch die phytopathogenen Pilze Fusarium graminearum, F. moniliforme, F. culmorum, F. nivale und Microdochium nivale verursacht. Feuchte Umfeldbedingungen während der Anthese können zu Fusarium-Epidemien und riesigen Verlusten bei Saateinkünften führen. Die Krankheit reduziert nicht nur den Saatertrag und die Kornqualität, sondern führt ebenfalls zu einer fungalen Mycotoxin-Akkumulation im Korn.
Kang et al., (Mycol. Res. 104(9): 1083-1093, 200) offenbaren einen experimentellen Beweis, dass eine Penetration von Wirtsgeweben durch Fusarium culmorum auf den inneren Oberflächen von Deckspelze, Spelze und Vorspelze so früh wie 36 Std. nach Impfung auftrat, was demonstriert, dass Spelze, Deckspelze und/oder Vorspelze die Schlüsseleintrittspunkte zum Start des Infektionsprozesses durch Fusarium in Weizen ist.
Eines der Ziele der Pflanzengenmanipulation ist, Pflanzen mit agronomisch wichtigen Charakteristiken oder Merkmalen zu erzeugen. Jüngste Fortschritte bei der Genmanipulation haben die notwendigen Werkzeuge zur Transformation von Pflanzen zum Umfassen und Exprimieren von fremden Genen bereitgestellt (Kahl et al., 1995, World Journal of Microbiology and Biotechnology 11:449-460). Besonders wünschenswerte Merkmale oder Qualitäten von Interesse für eine Pflanzengenmanipulation werden Resistenz gegen Insekten, Pilzkrankheiten, wie beispielsweise Fusarium-Kopfmehltau-Krankheit und andere Plagen bzw. Schädlinge und Krankheits-verursachende Mittel, Toleranz für Herbizide, verbesserte Ertragsstabilität oder Lagerfähigkeit, umfeldbedingte Toleranzen und Nährstoffverbesserungen einschließen, sind aber nicht darauf beschränkt. Die technologischen Fortschritte bei der Pflanzentransformation oder -regeneration haben Forschern ermöglicht, Stücke von DNA, wie beispielsweise ein Gen oder Gene aus einer heterologischen Quelle oder einer nativen Quelle, die aber modifiziert ist, um unterschiedliche oder verbesserte Qualitäten aufzuweisen, zu nehmen und die exogene DNA in das Genom der Pflanze einzubauen. Das Gen oder die Gen(e) können dann in der Pflanzenzelle exprimiert werden, um die zusätzliche(n) Charakteristik(en) oder Merkmal(e) zu zeigen. In einem Ansatz kann eine Expression eines neuen Gens, das normalerweise nicht in einer besonderen Pflanze oder Pflanzengewebe exprimiert wird, einen gewünschten phenotypischen Effekt verleihen. In einem anderen Ansatz kann eine Transkription eines Gens oder eines Teils eines Gens in einer Antisense-Ausrichtung einen wünschenswerten Effekt durch Vorbeugung oder Inhibierung einer Expression eines endogenen Gens erzeugen.
Isolierte Pflanzen-Promoter sind zur Modifizierung von Pflanzen durch Genmanipulation zum Aufweisen gewünschter phenotypischer Charakteristiken nützlich. Um solch eine transgene Pflanze zu erzeugen, wird ein Vektor, der eine heterologe Gensequenz einschließt, die den gewünschten Phenotyp verleiht, wenn in der Pflanze exprimiert, in die Pflanzenzelle eingeführt. Der Vektor schließt ebenfalls einen Pflanzen-Promoter, der mit der heterologen Gensequenz operabel verbunden ist, oft einen Promoter ein, der normalerweise nicht mit dem heterologen Gen assoziiert ist. Der Vektor wird dann in eine Pflanzenzelle eingeführt, um eine transformierte Pflanzenzelle zu erzeugen, und die transformierte Pflanzenzelle wird in einer transgenen Pflanzenzelle regeneriert bzw. neu gebildet. Der Promoter kontrolliert eine Expression der eingeführten DNA-Sequenz, mit der der Promoter operabel verbunden ist, und bewirkt folglich die gewünschten Charakteristiken, die durch die DNA-Sequenz verliehen werden.
Weil der Promoter ein Regulatorelement ist, das eine wesentliche Rolle bei der gesamten Expression eines Gens oder von Genen spielt, wird es vorteilhaft sein, eine Vielfalt an Promotern zu haben, um eine Genexpression zuzuschneiden, sodass ein Gen oder Gene effizient zu der richtigen Zeit während des Pflanzenwachstums und -entwicklung in dem optimalen Ort in der Pflanze und in der Menge transkribiert wird, die notwendig ist, um den gewünschten Effekt zu erzeugen. In einem Fall, kann, zum Beispiel, eine konstitutive Expression eines Genprodukts in einem Ort der Pflanze vorteilhaft, aber weniger vorteilhaft in einem anderen Teil der Pflanze sein. In anderen Fällen kann es vorteilhaft sein, ein Genprodukt zu haben, das bei einer bestimmten Entwicklungsstufe der Pflanze oder in Antwort auf bestimmte umfeldbedingte oder chemische Stimulantien erzeugt wird. Die kommerzielle Entwicklung von genetisch verbessertem Keimplasma ist ebenfalls zu der Stufe der Einführung von vielen Merkmalen in Saatpflanzen fortgeschritten, was oft als ein Genstapelungszugang bezeichnet wird. In diesem Ansatz können viele Gene, die unterschiedliche Charakteristiken von Interesse verleihen, in eine Pflanze eingeführt werden. Es ist wichtig, wenn viele Gene in eine Pflanze eingeführt werden, dass jedes Gen zur optimalen Expression angepasst oder gesteuert wird und dass die Regulatorelemente verschieden sind, um das Wirkungsvermögen einer Gendämpfung zu reduzieren, die durch Rekombination von homologen Sequenzen verursacht werden kann. Im Lichte dieser und anderer Betrachtungen ist es klar, dass eine optimale Kontrolle der Genexpression und eine Regulatorelementverschiedenheit in der Pflanzenbiotechnologie wichtig sind.
Die richtigen Regulatorsequenzen müssen in dem richtigen Ort in Bezug auf die DNA-Sequenz von Interesse für die neu eingefügte DNA vorhanden sein, die zu transkribieren und dadurch, wenn gewünscht, in ein Protein in der Pflanzenzelle zu translatieren ist. Diese Regulatorsequenzen schließen einen Promoter, einen 5'-nichttranslatierten Leiter und eine 3'-Polyadenylationssequenz ein, sind aber nicht darauf beschränkt. Die Fähigkeit, die Gewebe, in die solch fremde DNA zu transkribieren ist, und die Zeit während des Pflanzenwachstums auszuwählen, in der eine Transkription solch fremder DNA zu erhalten ist, ist ebenfalls durch die Wahl von angemessenen Promotersequenzen möglich, die die Transkription dieser Gene steuern.
Eine Vielfalt von unterschiedlichen Typen oder Klassen von Promotern können zur Pflanzengenmanipulation verwendet werden. Promoter können auf der Basis eines Bereichs von Gewebespezifizität klassifiziert werden. Zum Beispiel sind Promoter, die als konstitutive Promoter bezeichnet werden, in der Lage, operabel verbundene DNA-Sequenzen effizient zu transkribieren und besagte DNA-Sequenzen in vielen Geweben zu exprimieren. Gewebe-verbesserte bzw. -verstärkte oder Gewebe-spezifische Promoter können stromaufwärts von und operabel verbunden mit DNA-Sequenzen gefunden werden, die normalerweise in höheren Pegeln in bestimmten Pflanzengeweben oder spezifisch in bestimmten Pflanzengeweben transkribiert werden. Andere Klassen von Promotern werden induzierbare Promoter, die durch externe Stimilantien, wie beispielsweise chemische Mittel, Entwicklungsstimulantien oder umfeldbedingte Stimulantien, ausgelöst werden, einschließen, sind aber nicht darauf beschränkt. Die unterschiedlichen Typen von gewünschten Promotern können durch Isolierung der Regulatorregionen von DNA-Sequenzen erhalten werden, die in einer konstitutiven, Gewebe-verbesserten oder induzierbaren Weise transkribiert und exprimiert werden.
Die technologischen Fortschritte von Hochdurchsatz-Sequenzierung und Bioinformatik haben zusätzliche molekulare Werkzeuge für eine Promoterentdeckung bereitgestellt. Besondere Zielpflanzenzellen, -gewebe oder -organe bei einer spezifischen Entwicklungsstufe oder unter besonderen chemischen, umfeldbedingten oder physiologischen Bedingungen können als Quellenmaterial zur Isolierung der mRNA und zum Aufbau von cDNA-Banken verwendet werden. Die cDNA-Banken werden schnell sequenziert, und die exprimierten Sequenzen können elektronisch katalogisiert werden. Unter Verwendung von Sequenzanalysensoftware können Tausende von Sequenzen in einer kurzen Zeitdauer analysiert werden, und Sequenzen aus ausgewählten cDNA-Banken können verglichen werden. Die Kombination von Labor- und Computer-basierenden Subtraktionsverfahren erlauben Forschern, c-DNA-Banken abzusuchen und zu vergleichen und Sequenzen mit einem gewünschten Expressionsprofil zu identifizieren. Zum Beispiel können Sequenzen, die bevorzugt in einem Gewebe exprimiert werden, durch Vergleichen einer cDNA-Bank von einem Gewebe mit cDNA-Banken von anderen Geweben und elektronischer „Subtraktion" gewöhnlicher Sequenzen zum Finden von Sequenzen identifiziert werden, die nur in dem Zielgewebe von Interesse exprimiert werden. Die Gewebe-verbesserte Sequenz kann dann als eine Sonde oder Primer verwendet werden, um die entsprechende cDNA in voller Größe zu klonen. Eine genomische Bank der Zielpflanze kann dann verwendet werden, um das entsprechende Gen und die assoziierten Regulatorelemente zu isolieren, die die Promotersequenzen einschließen, aber nicht darauf beschränkt sind.
Trotz all der Technologie, die gegenwärtig verfügbar ist, sind keine monokotylen Regulatorsequenzen bekannt, die in der Lage sind, eine Transkription einer operabel verbundenen Nukleinsäuresequenz in monokotylem Deckspelzen-, Vorspelzen- oder Spelzengewebe zu regulieren. Insbesondere sind ebenfalls unglücklicherweise Weizen-Promoter unbekannt, die eine Expression eines Gens in der Vorspelze, Spelze und/oder Deckspelze von Weizen antreiben könnten. Weil die Vorspelze, Spelze und/oder Deckspelze die Schlüsseleintrittspunkte sind, die für den Fusarium-Angriff anfällig sind, ist es hoch wünschenswert, einen Zugriff aus spezifische Promoter zu haben, die, zum Beispiel, eine Expression eines heterologen Gens antreiben können, das fähig ist, einen Fusarium-Angriff und/oder eine verwandte Krankheit in diesen spezifischen Geweben zu verhindern und/oder zu heilen.
Die Datenbank EM_HTG [Online] EBI Hinxton, GB; AC/ID NO: AP004068, 17. August 2001 (2001-08-17) SASAKI ET AL.: ,Oryza sativa Nipponbare (GA3) genomic DNA, chromosome 2, BAC' offenbart einen Reisgenomklon.
EP-A-0 913 469 (Japan Tobacco Inc.) offenbart einen Blüten-spezifischen Promoter, der aus Mais isoliert wird, und dessen Verwendungen. Sie offenbart weiterhin einen monokotylen (Reis-) Promoter mit bevorzugter Expression in Deckspelzen- und Vorspelzengewebe.
ZUSAMMENFASSUNG DER ERFINDUNG
Die gegenwärtige Erfindung offenbart eine Lösung zu den vorstehenden Problemen mit der Bereitstellung einer neuen chimären monokotylen Regulatorsequenz, die SEQ ID NO:1 und einen Minimal-CaMV oder Reisactin-Promoter umfasst, die in der Lage ist, eine Transkription einer operabel verbundenen Nukleinsäuresequenz in monokotylem Deckspelzen-, Vorspelzen- und/oder Spelzengewebe zu regulieren.
Um diese neuen monokotylen Regulatorsequenzen zu isolieren, ist der folgende erfinderische, nicht offensichtliche Prozess entwickelt worden. Erstens sind Gewebe-spezifische EST's gefunden worden; zweitens sind spezifische Homologe in anderen Spezies, z.B. Reis, ausfindig gemacht worden. Anschließend ist für diese spezifischen Homologe, z.B. in Reis, bestimmt worden, dass sie in der angemessenen Gewebe-spezifischen Weise exprimiert werden. Unter Verwendung der genomischen DNA-Sequenz sind die Promoter von den anderen Spezies, d.h. Reis oder Mais, geklont worden.
Detaillierter wurde die Abundanz der 96 abundandesten EST-Cluster-Sequenzen in einer Weizendeckspelzen-/-vorspelzen-cDNA-Bank in einem Bereich von cDNA-Banken untersucht, die von verschiedenen Weizen- und Maisgeweben hergestellt sind. 30 cDNA-Sequenzen, die eine hochgradig verbesserte Abundanz bei Deckspelzen-, Vorspelzen- und Spelzengeweben über Blatt-, Halm- bzw. Stängel-, Embryo- bzw. Fruchtkeim-, Endosperm- und Wurzelgewebe zeigten, wurden zur weiteren Analyse ausgewählt. Diese Weizen-EST-Cluster-Sequenzen wurden verwendet, um z.B. Reis-cDNA-Homologe zu identifizieren. Die Abundanz der Reis-cDNA-Homologe wurde mit Reisblatt- und Rispen- (schließt Deckspelze und Vorspelze ein) cDNA-Banken verglichen. Reis-cDNAs, die eine bevorzugte Expression in der Rispe zeigten, wurden dann verwendet, um homologe Reisgenom-cDNA-Klone zu identifizieren; die mutmaßlichen Promotersequenzen sind identifiziert und geklont worden.
Die Isolierung von heterologen Promotern durch eine homologe Intermediat-cDNA weist zwei Hauptvorteile auf. Erstens eine Identifizierung von Promotern mit einem konservierten Genexpressionsmuster quer durch Spezies und zweitens eine zuversichtliche Identifizierung des korrekten Genfamilienelements zur anschließenden Promoterisolierung.
DETAILLIERTE BESCHREIBUNG DER ERFINDUNG
Die vorliegende Erfindung umfasst folglich einen neuen chimären oder hybriden monokotylen Promoter, der eine Nukleinsäure der SEQ ID NO: 1 umfasst, die mit einem Minimal-CaMV oder Reisactin-Promoter kombiniert ist.
Die vorliegende Erfindung umfasst ebenfalls DNA-Konstrukte, die die offenbarten Sequenzen, wie in SEQ ID NO:1 gezeigt, und operabel verbunden damit eine transkribierbare DNA-Sequenz und eine 3'-nichttranslatierte Region umfassen.
Die vorliegende Erfindung schließt ebenfalls irgendeine transgene Pflanzenzelle und Pflanzen ein, die das hier vorstehende DNA-Konstrukt enthält bzw. enthalten.
Die vorstehende Erfindung stellt ebenfalls ein Verfahren zur Verwendung einer monokotylen Sequenz der SEQ ID NO:1 bereit, um eine Transkription einer Nukleinsäuresequenz, die damit operabel verbunden ist, in monokotylem Deckspelzen-, Vorspelzen- und/oder Spelzengewebe zu regulieren, wobei der Promoter eine verbesserte bzw. verstärkte oder verminderte Expression der operabel verbundenen DNA-Sequenz verleiht.
Die vorliegende Erfindung stellt ebenfalls ein Verfahren zur Erzeugung einer transgenen Pflanze durch Einführung eines DNA-Konstrukts in eine Pflanzenzelle bereit, das umfasst: (i) einen Promoter, der eine Nukleinsäure umfasst, die eine Sequenz von SEQ ID NO: 1 umfasst, und operabel verbunden mit dem Promoter (ii) eine transkribierbare DNA-Sequenz und (iii) eine 3'-nichttranslatierte Region.
Für Transformationszwecke kann zusätzlich eine angemessen ausgewählte Markerkassette verwendet werden, um transformierte Pflanzen zu bilden und zu erkennen. Nützliche Marker sind hier nachstehend in dieser Anmeldung beispielhaft dargestellt.
Die vorliegende Erfindung umfasst ebenfalls differenzierte Pflanzen, Samen und Nachkommenschaft, die die vorstehend erwähnten transformierten Pflanzenzellen umfassen. Die so erhaltenen Pflanzen zeigen eine Gewebe-spezifische Expression von so genannten Reportergenen. Besagte Promoter können folglich in einem richtigen Konstrukt verwendet werden, um eine Expression von Kontrollgenen gegen zum Beispiel Fusarium-Kopfmehltau-Krankheit in dem rechten Gewebe zu ermöglichen. Solch so erhaltene transformierte Pflanzen zeigen neue Eigenschaften von agronomischer Bedeutung.
Die vorangehenden und andere Aspekte der Erfindung werden aus der folgenden detaillierten Beschreibung von verwendeten Definitionen und Verfahren sowie begleitenden Zeichnungen klarer werden.
Definitionen und Verfahren
Die folgenden Definitionen und Verfahren werden bereitgestellt, um die vorliegende Erfindung besser zu definieren und den Fachmann in der Praxis der vorliegenden Erfindung zu leiten. Sofern nicht anderweitig angegeben, sind Ausdrücke entsprechend der herkömmlichen Verwendung durch den Fachmann zu verstehen. Es wird die Standard-Ein- und -Drei-Buchstaben-Nomenklatur für Aminosäurereste verwendet.
„Nukleinsäure(sequenz)" oder „Polynukleotid(sequenz)" bezieht sich auf ein- oder doppelsträngige DNA oder RNA mit genomischen oder synthetischen Ursprung, d.h. jeweils ein Polymer von Deoxyribonukleotid- oder Ribonukleotid-Basen, die von dem 5'- (stromaufwärts gelegenen) Ende zu dem 3'- (stromabwärts gelegenen) Ende gelesen werden. Die Nukleinsäure kann den Sense- oder komplementären (Antisense-) Strang darstellen.
„Nativ" bezieht sich auf eine natürlich auftretende („Wild-Typ") Nukleinsäuresequenz.
„Heterologe" Sequenz bezieht sich auf eine Sequenz, die von einer fremden Quelle oder Spezies herrührt oder, wenn von der gleichen Quelle, von ihrer ursprünglichen Form modifiziert ist.
Eine „isolierte" Nukleinsäuresequenz ist im Wesentlichen von anderen Nukleinsäuresequenzen, mit denen die Nukleinsäure normalerweise in der Zelle des Organismus assoziiert ist, in dem die Nukleinsäure natürlich auftritt, d.h. anderer chromosomaler oder extrachromosomaler DNA, getrennt oder weg gereinigt. Der Ausdruck umschließt Nukleinsäuren, die biochemisch gereinigt sind, sodass kontaminierende Nukleinsäuren und andere Zellkomponenten im Wesentlichen entfernt sind. Der Ausdruck umschließt ebenfalls rekombinante Nukleinsäuren und chemisch synthetisierte Nukleinsäuren.
Der Ausdruck „im Wesentlichen gereinigt", wie hierin verwendet, bezieht sich auf ein Molekül, das von im Wesentlichen allen anderen Molekülen getrennt ist, die normalerweise mit ihm in seinem nativen Zustand assoziiert sind. Bevorzugter ist ein im Wesentlichen gereinigtes Molekül die überwiegende Spezies, die in einem Präparat vorhanden ist. Ein im Wesentlichen gereinigtes Molekül kann mehr als 60% frei, bevorzugt 70% frei, bevorzugter 90% frei von den anderen Molekülen (ausschließlich von Lösungsmittel) sein, die in der natürlichen Mischung vorhanden sind. Es wird nicht beabsichtigt, dass der Ausdruck „im Wesentlichen gereinigt" Moleküle umschließt, die in ihrem nativen Zustand vorhanden sind.
Eine erste Nukleinsäurensequenz zeigt eine „wesentliche Identität" zu einer Referenznukleinsäuresequenz, wenn, wenn (mit angemessenen Nukleotidinsertionen oder -deletionen, die insgesamt weniger als 20 Prozent der Referenzsequenz über das Vergleichsfenster betragen) mit der anderen Nukleinsäure (oder ihrem komplementären Strang) optimal ausgerichtet, es mindestens etwa 75% Nukleotidsequenzidentität, bevorzugt mindestens etwa 80% Identität, bevorzugter mindestens etwa 85% Identität, und am meisten bevorzugt mindestens etwa 90% Identität, über ein Vergleichsfenster von mindestens 20 Nukleotidpositionen, bevorzugt mindestens 50 Nukleotidpositionen, bevorzugter mindestens 100 Nukleotidpositionen, und am meisten bevorzugt über die gesamte Länge der ersten Nukleinsäure, gibt. Eine optimale Ausrichtung von Sequenzen zur Ausrichtung eines Vergleichsfensters kann durch den lokalen Homologiealgorithmus von Smith und Waterman (Adv. Appl. Math. 2:482, 1981), durch den Homologieausrichtungsalgorithmus von Needleman und Wunsch (J. Mol. Biol. 48:443, 1970); durch das Verfahren zur Suche auf Ähnlichkeit von Pearson und Lipman (Proc. Natl. Acad. Sci. USA 85:2444, 1988); bevorzugt durch computerisierte Implementationen dieser Algorithmen (GAP, BESTFIT, FASTA und TFASTA) in dem Wisconsin Genetics Software Package Release 7.0 (Genetics Computer Group, 575 Science Dr., Madison, WI) ausgeführt werden. Die Referenznukleinsäure kann ein Molekül in voller Größe oder ein Teil eines längeren Moleküls sein. Alternativ weisen zwei Nukleinsäuren eine erhebliche Identität auf, wenn eine mit der anderen unter stringenten Bedingungen hybridisiert, wie nachstehend definiert.
Eine erste Nukleinsäuresequenz ist mit einer zweiten Nukleinsäuresequenz „operabel verbunden", wenn die Sequenzen so angeordnet sind, dass die erste Nukleinsäuresequenz die Funktion der zweiten Nukleinsäuresequenz beeinflusst. Bevorzugt sind die zwei Sequenzen Teil eines einzigen zusammenhängenden Nukleinsäuremoleküls und sind bevorzugter benachbart. Zum Beispiel ist ein Promoter mit einem Gen operabel verbunden, wenn der Promoter eine Transkription des Gens in einer Zelle reguliert oder vermittelt.
Eine „rekombinante" Nukleinsäure wird durch eine künstliche Kombination von zwei andernfalls getrennten Segmenten einer Sequenz, z.B., durch chemische Synthese oder durch die Manipulation von isolierten Segmenten von Nukleinsäuren durch Genmanipulationstechniken, hergestellt. Techniken zur Nukleinsäurenmanipulation sind wohl bekannt (siehe, z.B., Molecular Cloning: A Laboratory Manual, 2nd ed., vol.1-3, ed. Sambrook et al., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989, Sambrook et al., 1989; Current Protocols in Molecular Biology, ed. Ausubel, et al., Greene Publishing und Wiley-Interscience, New York, 1992, mit periodischen Aktualisierungen, Ausubel et al., 1992; und PCR Protocols: A Guide to Methods and Applications, Academic Press: San Diego, Innis et al., 1990). Verfahren zur chemischen Synthese von Nukleinsäuren werden, zum Beispiel, in Beaucage und Carruthers (Tetra. Letts. 22:1859-1862, 1981) und Matteucci et al. (J. Am. Chem. Soc. 103:3185, 1981) diskutiert. Eine chemische Synthese von Nukleinsäuren kann, zum Beispiel, auf kommerziellen automatisierten Oligonukleotid-Synthesevorrichtungen durchgeführt werden.
Eine „synthetische Nukleinsäuresequenz" kann für eine verbesserte Expression in besonderen Wirtszellen und für die Zwecke der Klonierung in angemessenen Vektoren entworfen und chemisch synthetisiert werden. Synthetische DNAs, die entworfen werden, um eine Expression in einem besonderen Wirt zu verbessern, sollten deshalb das Muster des Kodongebrauchs in der Wirtszelle widerspiegeln. Computerprogramme sind für diese Zwecke verfügbar, die die „BestFit"- oder „Gap"-Programme des Sequence Analysis Software Package, Genetics Computer Group, Inc. (University of Wisconsin Biotechnology Center, Madison, WI 53711) einschließen, aber nicht darauf beschränkt sind.
Eine „Amplifikation" von Nukleinsäuren oder eine „Nukleinsäurenreproduktion" bezieht sich auf die Erzeugung von zusätzlichen Kopien einer Nukleinsäuresequenz und wird unter Verwendung von Polymerasekettenreaktion- (PCR-) Technologien ausgeführt. Eine Vielfalt an Amplifikationsverfahren sind im Stand der Technik bekannt und sind unter anderem in U.S. Patent Nrn. 4,683,195 und 4,683,202 und von Innis et al. (PCR Protocols: A Guide to Methods and Applications, Academic Press, San Diego, 1990) beschrieben. Bei PCR bezieht sich ein Primer auf ein kurzes Oligonukleotid einer definierten Sequenz, die an ein DNA-Templat angetempert wird, um die Polymerasekettenreaktion auszulösen.
„Transformiert", „transfiziert" oder „transgen" bezieht sich auf eine Zelle, ein Gewebe, ein Organ oder einen Organismus, in die bzw. das bzw. den eine fremde Nukleinsäure, wie beispielsweise ein rekombinanter Vektor, eingeführt worden ist. Bevorzugt wird die eingeführte Nukleinsäure in die genomische DNA der Aufnahmezelle, des Aufnahmegewebes, des Aufnahmeorgans oder des Aufnahmeorganismus derart integriert, dass die eingeführte Nukleinsäure durch anschließende Nachkommenschaft vererbt wird. Eine „transgene" oder „transformierte" Zelle oder Organismus schließen ebenfalls eine Nachkommenschaft der Zelle oder des Organismus und eine Nachkommenschaft ein, die von einem Züchtungsprogramm erzeugt wird, das solch eine „transgene" Pflanze als ein Elternteil in einer Kreuzung einsetzt und einen veränderten Phenotyp zeigt, der sich aus der Gegenwart eines rekombinanten Konstrukts oder Vektors ergibt.
Der Ausdruck „Gen" bezieht sich auf chromosomale DNA, Plasmid-DNA, cDNA, synthetische DNA oder andere DNA, die ein Peptid, ein Polypeptid, Protein oder RNA-Molekül und Regionen kodiert, die die Kodierungssequenz flankieren, die in die Regulierung der Expression involviert sind. Einige Gene können in mRNA transkribiert werden und in Polypetide translatiert werden (Strukturgene); andere Gene können in RNA (z.B., rRNA, tRNA) transkribiert werden; und andere Typen von Genen funktionieren als Regulatoren der Expression (Regulatorgene).
„Expression" eines Gens bezieht sich auf die Transkription eines Gens, um die entsprechende mRNA zu erzeugen, und die Translation dieser mRNA, um das entsprechende Genprodukt, d.h. ein Peptid, Polypeptid oder Protein, zu erzeugen. Die Genexpression wird durch Regulatorelemente, einschließlich 5'-Regulatorelemente, wie beispielsweise Promoter, kontrolliert oder angepasst.
„Genetische Komponente" bezieht sich auf irgendeine Nukleinsäuresequenz oder irgendein genetisches Element, die bzw. das ebenfalls eine Komponente oder ein Teil eines Expressionsvektors sein kann. Beispiele genetischer Komponenten schließen Promoterregionen, 5'-nichttranslatierte Leiter bzw. Leader, Introns, Gene, 3'-nichttranslatierte Regionen und andere Regulatorsequenzen oder Sequenzen, die die Transkription oder Translation von einer oder mehreren Nukleinsäuresequenzen beeinflussen, ein, sind aber nicht darauf beschränkt.
Die Ausdrücke „rekombinantes DNA-Konstrukt", „rekombinanter Vektor", „Expressionsvektor" oder „Expressionskassette" beziehen sich auf irgendein Mittel, wie beispielsweise ein Plasmid, Cosmid, Virus, BAC (bacterial artifical chromosome), autonom replizierende Sequenz, Phage oder lineare oder kreisförmige einsträngige oder doppelsträngige DNA- oder RNA-Nukleotidsequenz, das sich von irgendeiner Quelle ableitet, das in der Lage zur genomischen Integration oder autonomen Replikation ist, das ein DNA-Molekül umfasst, in dem eine oder mehrere DNA-Sequenzen in einer funktional operablen Weise verbunden worden sind.
„Komplementär" bezieht sich auf die natürliche Assoziation von Nukleinsäuresequenzen durch Basenpaarung (A-G-T-Paare mit der komplementären Sequenz A-C-T). Komplementarität zwischen zwei einsträngigen Molekülen kann teilweise, wenn nur einige der Nukleinsäurenpaare komplementär sind, oder vollständig sein, wenn alle Basenpaare komplementär sind. Der Komplentaritätsgrad beeinflusst die Effizienz und Stärke der Hybridizierungs- und Amplifikationsreaktionen.
„Homologie" bezieht sich auf den Pegel an Ähnlichkeit zwischen Nukleinsäure- oder Aminosäuresequenzen in Hinsicht auf jeweils eine prozentuale Nukleotid- oder Aminosäurenpositionsidentität, d.h. Sequenzähnlichkeit oder Identität. Homologie bezieht sich ebenfalls auf das Konzept ähnlicher funktionaler Eigenschaften unter unterschiedlichen Nukleinsäuren oder Proteinen.
„ESTs" oder Exprimierte Sequenz-Tags sind kurze Sequenzen von zufällig ausgewählten Klonen von einer cDNA- (oder komplementären DNA-) Bank, die Vertreter der cDNA-Inserts dieser zufällig ausgewählten Klone sind (McCombie et al., Nature Genetics, 1:124, 1992; Kurata et al., Nature Genetics, 8: 365, 1994; Okubo et al., Nature Genetics, 2: 173, 1992).
Der Ausdruck „elektronisches Northern" bezieht sich auf eine Computer-basierende Sequenzanalyse, die erlaubt, dass Sequenzen von vielen cDNA-Banken auf Basis von Parametern elektronisch verglichen werden, die der Forscher identifiziert, einschließlich von Abundanz in EST-Populationen in vielen cDNA-Banken oder beschränkt auf EST-Sätze von einer oder Kombinationen von Banken.
„Subsetting" bezieht sich auf ein Verfahren zum Vergleichen von Nukleinsäuresequenzen von unterschiedlichen oder vielen Quellen, die verwendet werden können, um das Expressionsprofil der Nukleinsäuresequenzen abzuschätzen, das die Gentranskriptionsaktivität und Messagestabilität in einem besonderen Gewebe bei einer besonderen Zeit oder unter besonderen Bedingungen widerspiegelt.
„Promoter" bezieht sich auf eine Nukleinsäuresequenz, die stromaufwärts oder 5' zu einem Translationsstartkode eines offenen Leserahmens (oder einer Protein-kodierender Region) eines Gens angeordnet ist und die in die Erkennung und Bindung von RNA Polymerase II und anderen Proteinen (trans-tätige Transkriptionsfaktoren) involviert wird, um eine Transkription auszulösen. Ein „Pflanzen-Promoter" ist ein nativer oder nicht nativer Promoter, der in Pflanzenzellen funktional ist. Konstitutive Promoter sind in den meisten oder allen Geweben einer Pflanze überall in der Pflanzenentwicklung funktional. Gewebe-, Organ- oder Zell-spezifische Promoter werden jeweils nur oder überwiegend in einem besonderen Gewebe, Organ oder Zelltyp exprimiert. Eher als „spezifisch" in einem gegebenen Gewebe, Organ oder Zelltyp exprimiert zu werden, kann der Promoter eine „verbesserte" bzw. „verstärkte" Expression, d.h. einen höheren Expressionspegel, in einem Teil (z.B., Zelltyp, Gewebe oder Organ) der Pflanze im Vergleich zu anderen Teilen der Pflanze anzeigen. Temporär regulierte Promoter sind nur oder überwiegend während bestimmten Zeitdauern der Pflanzenentwicklung oder bei bestimmten Tageszeiten funktional, wie in dem Fall von Genen, die, zum Beispiel, mit dem Tagesrhythmus assoziiert sind. Induzierbare Promoter exprimieren selektiv eine operabel verbundene DNA-Sequenz in Antwort auf die Gegenwart eines endogenen oder exogenen Stimulus, zum Beispiel durch chemische Verbindungen (chemische Induktoren) oder in Antwort auf umfeldbedingte, hormonale, chemische oder Entwicklungs-Signale. Induzierbare oder regulierte Promoter schließen, zum Beispiel, Promoter ein, die durch Licht, Wärme, Beanspruchung, Überschwemmung oder Dürre, Phytohormone, Verletzung oder Chemikalien, wie beispielsweise Ethanol, Jasmonat, Salicylsäure, Safener, Plagen bzw. Schädlinge oder Pathogene reguliert werden.
Irgendein Pflanzen-Promoter kann als eine 5'-Regulatorsequenz zur Anpassung der Expression eines besonderen Gens oder von Genen verwendet werden. Ein bevorzugter Promoter wird ein Pflanzen-Promoter sein, der RNA Polymerase II erkennt oder bindet. Solche Pflanzen-RNA-Polymerase Typ II- Promotoren, wie jene von anderen höheren Eukaryoten, weisen komplexe Strukturen auf und beinhalten einige verschiedene Elemente. Ein solches Element ist die TATA-Box oder Goldberg-Hogness-Box, die für eine korrekte Expression von eukaryotischen Genen in vitro und eine genaue, effiziente Initiation von Transkription in vivo erforderlich ist. Die TATA-Box ist typischerweise bei ungefähr -25 bis -35 positioniert, das heißt, bei 25 bis 35 Basenpaaren (bp) stromaufwärts (5') der Transkriptionsinitiationsstelle oder Kappen- bzw. Cap-Seite, die als Position +1 definiert ist (Breathnach und Chambon, Ann. Rev. Biochem. 50:349-383, 1981; Messing et al., In: Genetic Engineering of Plants, Kosuge et al., eds., S. 211-227, 1983). Ein anderes übliches Element, die CCAAT-Box, ist zwischen -70 und -100 bp angeordnet. In Pflanzen kann die CCAAT-Box eine unterschiedliche Übereinstimmungssequenz aufweisen als die funktional analoge Sequenz von Säugetier-Promotern (das Pflanzenanalogon ist die „AGGA-Box" genannt worden, um sie von ihrem Tiergegenpart zu unterscheiden; Messing et al., In: Genetic Enineering of Plants, Kosuge et al., eds., S. 211-227, 1983). Zudem schließen virtuell alle Promoter zusätzlich stromaufwärts Aktivierungssequenzen oder -verstärker ein (Benoist und Chambon, Nature 290: 304-310, 1981; Gruss et al., Proc. Natl. Acad. Sci. USA 78: 943-947, 1981; und Khoury und Gruss, Cell 27:313-314, 1983), die sich von um -100 bp bis zu -1000 bp oder mehr stromaufwärts der Transkriptionsinitiationsstelle erstrecken. Es sind ebenfalls Verstärker 3' zu der Transkriptionsstartstelle gefunden worden.
Wenn mit heterologen DNA-Sequenzen fusioniert, verursachen solche Promoter typischerweise, dass die fusionierte Sequenz, in einer Weise transkribiert wird, die zu der der Gensequenz ähnlich ist, mit der der Promoter normalerweise assoziiert ist. Promoterfragmente, die Regulatorsequenzen einschließen, können zugegeben werden (zum Beispiel, fusioniert mit dem 5'-Ende von oder eingefügt in einem aktiven Promoter mit seinen eigenen teilweisen oder vollständigen Regulatorsequenzen (Fluhr et al., Science 232:1106-1112, 1986; Ellis et al., EMBO J. 6:11-16, 1987; Strittmatter und Chua, Proc. Nat. Acad. Sci. USA 84:8986-8990, 1987; Poulson und Chua, Mol. Gen. Genet. 214:16-23, 1988; Comai et al., Plant Mol. Biol. 15:373-381, 1991). Alternativ können heterologe Regulatorsequenzen zu der stromaufwärts gelegenen 5'-Region eines inaktiven, gestutzten Promoters, z.B., eines Promoters, der nur die Kern TATA und manchmal die CCAAT-Elemente einschließt, zugegeben werden (Fluhr et al., Science 232:1106-1112, 1986; Strittmatter und Chua, Proc. Nat. Acad. Sci. USA 84:8986-8990; Ayran et al., Mol. Gen. Genet. 225:65-71, 1991).
Pflanzen-Promoter können Promoter einschließen, die durch die Manipulation von bekannten Promotern zur Erzeugung von synthetischen, chimären oder hybriden Promotern erzeugt sind.
Chimäre Promoter sind durch Zugeben einer heterologen Regulatorsequenz zu der stromaufwärts gelegenen 5'-Region eines inaktiven, gestutzten Promoters entwickelt worden, d.h. eines Promoters, der nur die Kern-TATA und optional die CCAAT-Elemente einschließt (Fluhr et al., Science 232:1106-1112, 1986; Strittmatter und Chua, Proc. Nat. Acad. Sci. USA 84:8986-8990; Ayran et al., Mol. Gen. Genet. 225:65-71, 1991).
Die Promotersequenzen sind in der Lage, operabel verbundene DNA-Sequenzen in spezifischen wohl definierten Weizengeweben, wie beispielsweise Deckspelze, Vorspelze oder Spelze, zu transkribieren, und können deshalb die Expression jener Gene in diesen Geweben selektiv regulieren.
Die Promotersequenzen der vorliegenden Erfindung sind zur Regulierung von Genexpression in Weizengeweben, wie beispielsweise Deckspelze, Vorspelze oder Spelze, nützlich. Für eine Anzahl von agronomischen Merkmalen ist eine Transkription eines Gens oder von Genen von Interesse in vielen Geweben wünschenswert, um die gewünschte(n) Charakteristik(en) zu verleihen. Die Verfügbarkeit von geeigneten Promotern, die die Transkription von operabel verbundenen Genen in ausgewählten Zielgeweben von Interesse regulieren, ist wichtig, weil es nicht wünschenswert sein kann, eine Expression eines Gens in jedem Gewebe, sondern nur in bestimmten Geweben zu haben. Konsequenterweise ist es wichtig eine breite Vielfalt an Möglichkeiten von 5'-Regulatorelementen für irgendeine Pflanzenbiotechnologiestrategie zu haben.
Das Erscheinen von Gentechnik, das molekulare und Bioinformatik-Techniken umfasst, hat zu schneller Sequenzierung und Analysen einer großen Anzahl von DNA-Proben von einer riesigen Anzahl von Zielen geführt, einschließlich von Pflanzenspezies von agronomischer Wichtigkeit, aber nicht darauf beschränkt. Um die Nukleinsäuresequenzen der vorliegenden Erfindung aus einer Datenbank oder Sammlung von cDNA-Sequenzen zu identifizieren, involviert der erste Schritt das Konstruieren von cDNA-Banken von spezifischen Pflanzengewebezielen von Interesse. Kurz gesagt, die cDNA-Banken werden zuerst von diesen Geweben konstruiert, die bei einer besonderen Entwicklungsstufe oder unter besonderen umfeldbedingten Bedingungen geerntet werden. Durch Identifizierung von unterschiedlich exprimierten Genen in Pflanzengeweben bei unterschiedlichen Entwicklungsstufen oder unter unterschiedlichen Bedingungen können die entsprechenden Regulatorsequenzen dieser Gene identifiziert und isoliert werden. Eine Transkriptabbildung ermöglicht die Identifizierung von Gewebe-bevorzugten Sequenzen auf Basis von spezifischer Abbildung von Nukleinsäuresequenzen aus einer cDNA-Bank. Mit Transkriptabbildung, wie hierin verwendet, ist eine Analyse gemeint, die die Abundanz an exprimierten Genen in einer oder mehreren Banken vergleicht. Die Klone, die innerhalb einer cDNA-Bank enthalten sind, werden sequenziert, und die Sequenzen werden mit Sequenzen aus öffentlich verfügbaren Datenbanken verglichen. Computer-basierte Verfahren erlauben dem Forscher Fragen bereitzustellen, die Sequenzen von vielen Banken vergleichen. Der Prozess ermöglicht eine schnelle Identifizierung von Klonen von Interesse im Vergleich mit herkömmlichen Hybridisierungssubtraktionsverfahren, die dem Fachmann bekannt sind.
Unter Verwendung von herkömmlichen Methodologien können cDNA-Banken von der mRNA (Messenger-RNA) eines gegebenen Gewebes oder Organismuses unter Verwendung von Poly dT Primern und reverser Transkriptase konstruiert werden (Efstratiadis et al., Cell 7:279, 1976; Higuchi et al., Proc. Natl. Acad. Sci. U.S.A. 73:3146, 1976; Maniatis et al., Cell 8:163, 1976; Land et al., Nucleic Acids Res. 9:2251, 1981; Okayama et al., Mol. Cell. Biol. 2:161, 1982; Gubler et al., Gene 25:263; 1983).
Mehrere Verfahren können eingesetzt werden, um cDNA-Konstrukte in voller Größe zu erhalten. Zum Beispiel kann eine Terminal-Transferase verwendet werden, um homopolymere Enden von dC-Resten zu den freien 3'-Hydroxylgruppen zuzufügen (Land et al., Nucleic Acids Res. 9:2251, 1981). Dieses Ende kann dann durch ein Poly dG Oligo hybridisiert werden, das für die Synthese eines zweiten cDNA-Stranges in voller Größe als ein Primer wirken kann. Okayama und Berg berichteten ein Verfahren zum Erhalten von cDNA-Konstrukten in voller Größe (Mol. Cell Biol. 2:161, 1982). Dieses Verfahren ist durch Verwendung von synthetischen Primeradaptern vereinfacht worden, die sowohl homopolymere Enden zum Primen der Synthese des ersten und zweiten Stranges als auch Beschränkungsstellen zum Klonen in Plasmiden (Coleclough et al., Gene 34:305, 1985) und Bakteriophagenvektoren (Krawinkel et al., Nucleic Acids Res. 14:1913, 1986; Han et al., Nucleic Acids Res. 15:6304, 1987) aufweisen.
Diese Strategien können mit zusätzlichen Strategien zur Isolierung von seltenen mRNA-Populationen verbunden werden. Zum Beispiel enthält eine typische Säugetierzelle zwischen 10.000 und 30.000 unterschiedliche mRNA-Sequenzen (Davidson, Gene Activity in Early Development, 2nd ed., Academic Press, New York, 1976). Die Anzahl an Klonen, die erforderlich ist, um eine gegebene Wahrscheinlichkeit zu erreichen, dass eine mRNA mit niedrigerer Abundanz in einer cDNA-Bank vorhanden sein wird, ist N = (ln(1-P))/(ln(1-1/n)), wobei N die erforderliche Anzahl an Klonen ist, P die gewünschte Wahrscheinlichkeit ist, und 1/n das Bruchverhältnis der gesamten mRNA ist, die durch eine einzige seltene mRNA dargestellt wird (Sambrook et al., 1989).
Ein Verfahren zur Anreicherung von Präparaten aus mRNA für Sequenzen von Interesse ist, durch Größe zu fraktionieren. Ein solches Verfahren ist, durch Elektrophorese durch ein Agarosegel zu fraktionieren (Pennica et al., Nature 301:214, 1983). Ein anderes Verfahren setzt eine Sucrosegradientenzentrifugation in der Gegenwart eines Mittels, wie beispielsweise Methylquecksilberhydroxid, ein, das eine sekundäre Struktur in RNA denaturiert (Schweinfest et al., Proc. Natl. Acad. Sci. U.S.A. 79:4997-5000, 1982).
ESTs können durch eine Anzahl von Verfahren sequenziert werden. Zwei grundlegende Verfahren können zur DNA-Sequenzierung verwendet werden, das Kettenterminationsverfahren (Sanger et al., Proc. Natl. Acad. Sci. U.S.A. 74:5463, 1977) und das Verfahren durch chemischen Abbau (Maxam und Gilbert, Proc. Nat. Acad. Sci. U.S.A. 74:560, 1977). Eine Automatisierung und Fortschritte in der Technologie, wie beispielsweise die Ersetzung von Radioisotopen durch Sequenzierung auf Fluoreszenzbasis, haben die Anstrengungen reduziert, die zur Sequenzierung von DNA erforderlich sind (Craxton, Methods, 2: 20, 1991; Ju et al., Proc. Natl. Acad. Sci. U.S.A. 92: 4347, 1995; Tabor und Richardson, Proc. Natl. Acad. Sci. U.S.A. 92: 6339, 1995). Automatisierte Sequenziervorrichtungen sind von einer Anzahl von Herstellern, einschließlich von Pharmacia Biotech, Inc., Piscataway, New Jersey (Pharmacia ALF); LI-COR, Inc., Lincoln, Nebraska (LI-COR 4,000); und Millipore, Bedford, Massachusetts (Millipore BaseStation) erhältlich.
Es ist festgestellt worden, dass ESTs, die länger als 150 bp sind, für Ähnlichkeitssuchen und Mapping nützlich sind (Adams et al., Science 252:1651, 1991). EST-Sequenzen liegen normalerweise im Bereich von 150-450 Basen. Das ist die Länge der Sequenzinformation, die routinemäßig und zuverlässig unter Verwendung von Einzellaufsequenzdaten erzeugt wird. Typischerweise werden nur Einzellaufsequenzdaten von der cDNA-Bank erhalten (Adams et al., Science 252:1651, 1991). Eine automatisierte Einzellaufsequenzierung führt typischerweise zu einem 2-3 %-igen Fehler oder Basiszweideutigkeitsrate (Boguski et al., Nature Genetics, 4: 332, 1993).
EST-Datenbanken wurden konstruiert oder teilweise konstruiert von, zum Beispiel, C. elegans (McCombrie et al., Nature Genetics 1:124, 1992); humaner Leberzelllinie HepG2 (Okubo et al., Nature Genetics 2:173, 1992); humaner Gehirn-RNA (Adams et al., Science 252:1651, 1991; Adams et al., Nature 355:632, 1992); Arabidopsis, (Newman et al., Plant Physiol. 106:1241, 1994); und Reis (Kurata et al., Nature Genetics 8:365, 1994). Die vorliegende Erfindung verwendet ESTs aus einer Anzahl von cDNA-Banken, die aus Weizengeweben, bevorzugt aus Spelze, Deckspelze oder Vorspelze, hergestellt sind, als ein Werkzeug zur Identifizierung von Genen, die in diesen Zielgeweben exprimiert werden, das dann die Isolierung von 5'-Regulatorsequenzen, wie beispielsweise Promoter, erleichtert, die die Gene regulieren. Zudem sind ebenfalls EST-Banken aus Blütengeweben von Reis erforderlich, um eine Identifizierung des Gen-spezifischen Homologs vor der Promoterisolierung zu unterstützen, sowie EST-Banken aus anderen Geweben sind als Hintergrund-Banken erforderlich.
Die ESTs, die aus der Sequenzierung eines Bereichs von cDNA-Banken erzeugt werden, werden in einer Computerdatenbank gespeichert und diese „rohen" ESTs werden in Gruppen von zusammenhängenden ESTs, d.h. ESTs, die von homologen mRNA-Transkripten herrühren, in einem Prozess sortiert, der als Clustern bekannt ist.
Ein „Cluster" ist eine Gruppe von Sequenzen, die eine Identität von mindestens 90% über irgendein Fenster von 100 Basenpaaren teilen. Durch Ausrichtung der Elemente eines Clusters und Berechnung der Übereinstimmung kann eine einzige repräsentative Sequenz für den Cluster abgeleitet werden.
Computer-basierte Sequenzanalysen können verwendet werden, um unterschiedlich exprimierte Sequenzen zu identifizieren, einschließlich jener Sequenzen, aber nicht darauf beschränkt, die in einem Gewebe im Vergleich zu anderem Gewebe exprimiert werden. Zum Beispiel kann ein unterschiedlicher Satz an Sequenzen aus cDNA gefunden werden, der aus Wurzelgewebe gegen Blattgewebe isoliert wird. Dementsprechend können Sequenzen aus cDNA-Banken verglichen werden, die aus Pflanzen erzeugt werden, die unter unterschiedlichen umfeldbedingten oder physiologischen Bedingungen gewachsen sind. Wenn die bevorzugten Sequenzen einmal aus der cDNA-Bank von Interesse identifiziert sind, können die genomischen Klone aus einer genomischen Bank isoliert werden, die aus Pflanzengewebe erzeugt wird, und entsprechende Regulatorsequenzen, einschließlich 5'-Regulatorsequenzen, aber nicht darauf beschränkt, können identifiziert und isoliert werden.
In einer bevorzugten Ausführungsform werden Sequenzen exprimierter Sequenz-Tags (EST) aus einer Vielfalt von cDNA-Banken in einer Sequenzdatenbank katalogisiert. Diese Datenbank wird verwendet, um Promoterziele von einem besonderen Gewebe von Interesse zu identifizieren. Die Auswahl an exprimierten Sequenz-Tags zur anschließenden Promoterisolierung spiegelt das Vorhandensein von einer oder mehreren Sequenzen unter den repräsentativen ESTs aus einem zufälligen Sampling einer individuellen cDNA-Bank oder einer Sammlung von cDNA-Banken wieder.
Zum Beispiel wird die Identifizierung von Regulatorsequenzen, die die Expression von Transkripten im Gewebe von Interesse richten, durch Identifizierung von ESTs, die in Geweben von Interesse, wie beispielsweise Deckspelze, Vorspelze oder Spelze, gefunden werden, und abwesend oder in geringer Abundanz in anderen cDNA-Banken in der Datenbank durchgeführt. Die identifizierten EST-Führungen werden dann verwendet, um die operabel verbundenen Regulatorsequenzen aus genomischen DNA-Sequenzen dementsprechend zu identifizieren.
Mit Abundanz, wie hierin verwendet, ist die Anzahl an Malen eines Klons oder Clusters aus Klonen gemeint, die er in einer Bank erscheint. Die Sequenzen, die verstärkt oder in hoher Menge in einem spezifischen Gewebe oder Organ sind, die ein Zielexpressionsprofil darstellen, werden in dieser Weise identifiziert, und Primer können aus den identifizierten EST-Sequenzen entworfen werden. Ein Zugang auf PCR-Basis kann verwendet werden, um Flankenregionen aus einer genomischen Bank der Zielpflanze von Interesse zu vergrößern. Eine Anzahl an Verfahren ist dem Fachmann bekannt, um unbekannte DNA-Sequenzen zu amplifizieren, die zu einer Kernregion einer bekannten Sequenz benachbart sind. Verfahren schließen inverse PCR (IPCR), Vektorette-PCR, Y-förmige PCR und Genomwanderungs-Ansätze ein, sind aber nicht darauf beschränkt.
In einer bevorzugten Ausführungsform wird eine genomische DNA, die an einen Adapter gebunden ist, einer primären Runde von PCR-Amplifikation mit einem Gen-spezifischen Primer und einem Primer unterworfen, der an die Adaptersequenz antempert. Als nächstes wird das PCR-Produkt als das Templat für eine eingenistete Runde an PCR-Amplifikation mit einem zweiten Gen-spezifischen Primer und einem zweiten Adapter verwendet. Die sich ergebenden Fragmente von der eingenisteten PCR-Reaktion werden dann isoliert, gereinigt und in einem angemessenen Vektor subgeklont. Die Fragmente werden sequenziert, und die Translationsstartstellen können identifiziert werden, wenn das EST aus einer gestutzten cDNA abgeleitet wird. Die Fragmente können in Pflanzenexpressionsvektoren als Transkriptions- oder Translationsfusionen mit einem Reportergen, wie beispielsweise β-Glucuronidase (GUS) geklont werden. Die Konstrukte können in Durchgangsanalysen getestet werden, und anschließend werden die 5'-Regulatorregionen mit anderen Genen und Regulatorsequenzen von Interesse in einem geeigneten Pflanzentransformationsvektor operabel verbunden, und die transformierten Pflanzen werden auf die Expression des (der) Gens (Gene) von Interesse durch eine Anzahl an Verfahren analysiert, die dem Fachmann bekannt sind.
Irgendeine Pflanze kann für die Identifizierung von Genen und Regulatorsequenzen ausgewählt werden. Beispiele geeigneter Pflanzenziele für die Isolierung von Genen und Regulatorsequenzen werden Akadie, Luzerne, Apfel, Aprikose, Arabidopsis, Artischocke, Rucola, Spargel, Avocado, Banane, Gerste, Bohnen, Mangold, Brombeere, Blaubeere, Brokkoli, Rosenkohl, Kohl, Raps, Kantalupe, Karotte, Maniok, Rizinussamen, Blumenkohl, Sellerie, Kirsche, Chicoree, Koriander, Zitronengewächs, Clementine, Klee, Kokosnuss, Kaffee, Getreide, Baumwolle, Gurke, Douglasie, Aubergine, Endivie, Winterendivie, Eukalyptus, Fenchel, Feigen, Knoblauch, Flaschenkürbis, Weintraube, Grapefruit, Honigtau, Jicama, Kiwi, Salat, Lauch, Zitrone, Lilie, Limone, Loblolly-Kiefer, Leinsamen, Mango, Melone, Pilz, Nektarine, Nuss, Hafer, Palmenöl, Rapssamenöl, Okra, Olive, Zwiebel, Orange, eine Zierpflanze, Plame, Papaya, Petersilie, Pastinake, Erbse, Pfeffer, Persimone, Kiefer, Ananas, Wegerich, Pflaume, Granatapfel, Pappel, Kartoffel, Gartenkürbis, Quitte, Radiatakiefer, Radicchio, Rettich, Rapssamen, Himbeere, Reis, Roggen, Hirse, Gelbkiefer, Sojabohne, Spinat, Kürbis, Erdbeere, Zuckerrübe, Zuckerrohr, Sonneblume, Süßkartoffel, Amberbaum, Mandarine, Tee, Tabak, Tomate, Triticale, Torfgräser, Rübe, einen Wein, Wassermelone, Weizen, Yams und Zucchini einschließen, sind aber nicht darauf beschränkt. Besonders bevorzugte Pflanzenziele werden Getreide, Baumwolle, Reis, Roggen, Gerste, Hirse, Hafer, Sojabohne und Weizen, am meisten bevorzugt Weizen, einschließen.
Irgendein Verfahren, das einen Differenzierungsvergleich zwischen unterschiedlichen Typen oder Klassen von Sequenzen erlaubt, kann verwendet werden, um Gene oder Regulatorsequenzen von Interesse zu isolieren. Zum Beispiel kann in einem Differenzierungsscreeningzugang eine cDNA-Bank von mRNA, die aus einem besonderen Gewebe isoliert wird, in einem Bakteriophagenwirt unter Verwendung eines kommerziell erhältlichen Klonierungs-Kits erzeugt werden. Die Placques werden auf Platten gesprüht, die Lawns eines Bakterienwirts, wie beispielsweise E. coli, enthalten, um Bakteriophagenplacques zu erzeugen. Etwa 10⁵ bis 10⁶ Placques können auf DNA-bindende Membranen gehoben werden. Dublikat-Membranen werden unter Verwendung von Sonden untersucht, die aus mRNA von dem Ziel- und Nicht-Ziel- oder Hintergrundgewebe erzeugt werden. Diese Sonden werden gelabelt, um eine Detektion nach Hybridisierung und Entwicklung zu erleichtern. Placques, die zu Zielgewebe-abgeleiteten Sonden, aber nicht zu Nicht-Zielgewebe-abgeleiteten Sonden hybridisieren, die ein gewünschtes Differenzierungsexpressionsmuster zeigen, können zur weiteren Analyse ausgewählt werden. Genomische DNA-Banken können ebenfalls von einer gewählten Spezies durch Teilverdauung mit einem Restriktionsenzym und Größenauswählenden Fragmenten innerhalb eines besonderen Größenbereichs erzeugt werden. Die genomische DNA kann in einem geeigneten Vektor geklont, der einen Bakteriophagen einschließt, aber nicht darauf beschränkt ist, und unter Verwendung eines geeigneten Vektors, wie beispielsweise ein Bakteriophage, unter Verwendung eines geeigneten Klonierungs-Kits aus irgendeiner Anzahl von Verkäufern erzeugt werden (siehe zum Beispiel Stratagene, La Jolla CA oder Gibco BRL, Gaithersburg, MD).
Differenzierende Hybridisierungstechniken, wie beschrieben, sind dem Fachmann wohl bekannt und können verwendet werden, um eine gewünschte Klasse von Sequenzen zu isolieren. Mit Klassen von Sequenzen, wie hierin verwendet, sind Sequenzen gemeint, die auf Basis eines üblichen Identifizierers gruppiert werden können, einschließlich Sequenzen, die aus einer üblichen Zielpflanze, einer üblichen Bank oder eines üblichen Pflanzengewebetyps isoliert werden, aber nicht darauf beschränkt. In einer bevorzugten Ausführungsform werden Sequenzen von Interesse auf Basis von Sequenzanalysen und Abfragen einer Sammlung von diversen cDNA-Sequenzen aus Banken von unterschiedlichen Gewebetypen identifiziert. Das offenbarte Verfahren stellt ein Beispiel eines Differenzierungsscreeningzugangs auf Basis von elektronischen Sequenzanalysen von Pflanzen-ESTs bereit, die von diversen cDNA-Banken abgeleitet sind.
Eine Anzahl von Verfahren, die verwendet werden, um eine Genexpression abzuschätzen, basieren auf Messung des mRNA-Pegels in einem Organ, einem Gewebe oder einer Zellprobe. Typische Verfahren schließen RNA-Blots, Ribonuklease-Schutz-Assays und RT-PCR ein, aber sind nicht darauf beschränkt. In einer anderen bevorzugten Ausführungsform wird ein Hochdurchsatz-Verfahren verwendet, wodurch Regulatorsequenzen aus einem Transkript-Profilierungs-Zugang identifiziert werden. Die Entwicklung von cDNA-Mikroarray-Technologie ermöglicht die systematische Überwachung von Genexpressionsprofilen für Tausende von Genen (Schena et al., Science, 270:467, 1995). Diese DNA-Chip-basierende Technologie ordnet Tausende von cDNA-Sequenzen auf einer Trägeroberfläche. Diese Arrays werden gleichzeitig mit vielen gelabelten cDNA-Sonden hybridisiert, die aus RNA-Proben von unterschiedlichen Zell- oder Gewebentypen hergestellt werden, was eine direkte Vergleichsanalyse der Expression erlaubt. Diese Technologie wurde zuerst durch Analysieren von 48 Arabidopsis-Genen zur differenzierten Expression in Wurzeln und Schösslingen gezeigt (Schena et al, Science, 270:467, 1995). Früher wurden die Expressionsprofile von über 1400 Genen unter Verwendung von cDNA-Mikroarrays untersucht (Ryan et al, The Plant Journal 15:821, 1998). Mikroarrays stellen ein quantitatives und reproduzierbares Verfahren mit hohem Durchsatz zur Analyse einer Genexpression und Charakterisierung einer Genfunktion bereit. Der Transkript-Profilierungs-Zugang unter Verwendung von Mikroarrays stellt folglich ein anderes wertvolles Werkzeug für die Isolierung von Regulatorsequenzen, wie beispielsweise Promoter, bereit, die mit diesen Genen assoziiert sind.
Die vorliegende Erfindung verwendet Hochdurchsatz-Sequenzanalysen, um die Grundlage einer schnellen, Computer-basierenden Identifizierung von Sequenzen von Interesse zu bilden. Die Fachleute kennen die Mittel, die für eine Sequenzanalyse verfügbar sind. Sequenzvergleiche können durch Bestimmung der Ähnlichkeit der Test- oder Abfragesequenz mit Sequenzen in öffentlich zugänglichen oder gesetzlich geschützten Datenbanken („Ähnlichkeitsanalyse") oder durch Suchen auf bestimmte Motive („intrinsische Sequenzanalyse") (z.B., cis Elemente) durchgeführt werden (Coulson, Trends in Biotechnology, 12:76, 1994; Birren et al., Genome Analysis, 1:543, 1997).
Die Nuklotidsequenz, die in SEQ ID NO: 1 bereitgestellt ist, kann in einer Vielfalt an Medien „bereitgestellt" werden, um eine Verwendung zu erleichtern. Solch ein Medium kann ebenfalls einen Untersatz bzw. Subset davon in einer Form bereitstellen, die dem Fachmann erlaubt, die Sequenzen zu untersuchen.
In einer Anwendung dieser Ausführungsform kann eine Nukleotidsequenz der vorliegenden Erfindung auf Computer-lesbaren Medien aufgezeichnet werden. Wie hierin verwendet, beziehen sich „Computer-lesbare Medien" auf irgendein Medium, das direkt von einem Computer gelesen und auf das direkt von einem Computer zugegriffen werden kann. Solche Medien schließen ein, sind aber nicht darauf beschränkt: magnetische Speichermedien, wie beispielsweise Floppy-Disks, Festplatte, Speichermedium und Magnetband; optische Speichermedien, wie beispielsweise CD-ROM; elektrische Speichermedien, wie beispielsweise RAM und ROM; und Hybride dieser Kategorien, wie beispielsweise magnetische/optische Speichermedien. Einem Fachmann kann sofort klar sein, wie irgendeines der gegenwärtig bekannten Computer-lesbaren Medien verwendet werden kann, um ein Erzeugnis zu bilden, das ein Computer-lesbares Medium umfasst, auf dem eine Nukleotidsequenz der vorliegenden Erfindung aufgezeichnet ist.
Durch Bereitstellung von einer oder mehreren Nukleotidsequenzen der vorliegenden Erfindung kann der Fachmann routinemäßig auf die Sequenzinformation für eine Vielfalt von Zwecken zugreifen. Computersoftware ist öffentlich zugänglich, das erlaubt dem Fachmann auf eine Sequenzinformation zuzugreifen, die in einem Computer-lesbaren Medium bereitgestellt ist. Beispiele von öffentlichen Datenbanken werden die DNA-Datenbank von Japan (DDBJ) (http://www.ddbj.nig.ac.jp/); Genbank (http://www.ncbi.nlm.nih.gov/web/Genbank/Index.html); und die European Molecular Biology Laboratory Nucleic Acid Sequence Database (EMBL) (http://www.ebi.ac.uk/ebi_docs/embl_db.html) oder Versionen davon einschließen, aber sind nicht darauf beschränkt. Eine Anzahl von unterschiedlichen Suchalgorithmen sind entwickelt worden, einschließlich der Reihe von Programmen, die als BLAST-Programme bezeichnet werden, aber nicht darauf beschränkt. Es gibt fünf Implementierungen von BLAST, drei, die für Nukleotidsequenzabfragen entworfen sind (BLASTN, BLASTX und TBLASTX), und zwei, die für Proteinsequenzabfragen entworfen sind (BLASTP und TBLASTN) (Coulson, Trends in Biotechnology, 12:76-80, 1994; Birren et al., Genome Analysis, 1:543, 1997).
BLASTN nimmt eine Nukleotidsequenz (die Abfragesequenz) und ihr reverses Komplement und sucht sie gegen eine Nukleotidsequenzdatenbank. BLASTN wurde zur schnellen, nicht maximalen Sensitivität entworfen und kann nicht entfernt verwandte Kodierungssequenzen finden. BLASTX nimmt eine Nukleotidsequenz, translatiert sie in drei Vorwärtsleserahmen und drei reverse Komplementleserahmen und vergleicht dann die sechs Translationen gegen eine Proteinsequenzdatenbank. BLASTX ist zur sensitiven Analyse von vorlaufigen (Single-pass) Sequenzdaten nützlich und ist zu Sequenzfehlern tolerant (Gish und States, Nature Genetics, 3: 266-272 (1993)). BLASTN und BLASTX können gemeinsam zur Analyse von EST-Daten verwendet werden (Coulson, Trends in Biotechnology, 12: 76-80 (1994); Birren, et al., Genome Analysis, 1: 543-559 (1997)).
Wenn eine kodierende Nukleotidsequenz gegeben ist, und das Protein kodiert sie, wird es oft bevorzugt, das Protein als die Abfragesequenz zur Durchsuchung einer Datenbank aufgrund der stark erhöhten Sensitivität zur Detektierung von feineren Beziehungen zu verwenden. Dies liegt an dem größeren Alphabet von Proteinen (20 Aminosäuren) im Vergleich mit dem Alphabet von Nukleinsäuresequenzen (4 Basen), wo es viel leichter ist, einen Treffer zufällig zu erhalten. Zudem wird mit Nukleotidausrichtungen nur ein Treffer (positiver Punkt) oder ein Negativtreffer (negativer Punkt) erhalten, aber mit Proteinen kann das Vorhandensein von konservierenden Aminosäurensubstitutionen in Betracht gezogen werden. Hier kann ein Negativtreffer einen positiven Punkt bringen, wenn der nicht-identische Rest physikalische/chemische Eigenschaften aufweist, die zu dem einen ähnlich sind, den er ersetzt. Verschiedene Punktematrizen werden verwendet, um die Substitutionspunkte von allen möglichen Aminosäurepaaren zu liefern. Ein allgemeines Zweckpunktesystem ist die BLOSUM62-Matrix (Henikoff und Henikoff, Proteins, 17: 49-61 (1993), die gegenwärtig die Grundeinstellungswahl für BLAST Programme ist. BLOSUM62 ist auf Ausrichtungen von moderat auseinandergehenden Sequenzen zugeschnitten und kann nicht die besten Ergebnisse unter allen Bedingungen bringen. Altschul, J. Mol. Biol. 36: 290-300 (1993) verwendet eine Kombination von drei Matrizen, um alle Möglichkeiten abzudecken. Dies kann die Sensitivität, aber mit einem Aufwand von langsameren Suchen, verbessern. In der Praxis wird oft eine einzige BLOSUM62-Matrix verwendet, aber andere (PAM40 und PAM250) können versucht werden, wenn eine zusätzliche Analyse notwendig ist. Niedrige PAM-Matrizen sind auf eine Detektion von sehr starken, aber lokalisierten Sequenzähnlichkeitn gerichtet, während hohe PAM-Matrizen auf eine Detektion von langen, aber schwachen Ausrichtungen zwischen sehr entfernt verwandten Sequenzen gerichtet sind.
Es sind Homologe in anderen Organismen erhältlich, die zur Vergleichssequenzanalyse verwendet werden können. Viele Ausrichtungen werden durchgeführt, um Ähnlichkeiten und Unterschiede in einer Gruppe von verwandten Sequenzen zu untersuchen. CLUSTAL W ist ein erhältliches Package für viele Sequenzausrichtungen, das progressive viele Sequenzausrichtungen auf Basis eines Verfahrens von Feng und Doolittle, J. Mol. Evol. 25: 351-360 (1987) durchführt. Jedes Paar von Sequenzen wird ausgerichtet, und der Abstand zwischen jedem Paar wird berechnet; von dieser Abstandsmatrix wird ein Leitbaum berechnet, und alle der Sequenzen werden progressiv auf Basis dieses Baums ausgerichtet. Ein Merkmal dieses Programms ist seine Sensitivität auf den Effekt von Lücken bei der Ausrichtung; Lückenbüßer werden variiert, um die Insertion von Lücken in mögliche Schleifenregionen anstelle in der Mitte von strukturierten Regionen zu fördern. Benutzer können Lückenbüßer spezifizieren, zwischen einer Anzahl von Punktematrizen wählen oder ihre eigene Punktematrix für sowohl die paarweisen Ausrichtungen als auch die mehrfachen Ausrichtungen zu liefern. CLUSTAL W für UNIX und VMS Systeme ist erhältlich bei: ftp.ebi.ac.uk. Ein anderes Programm ist MACAW (Schuler et al., Poteins, Struct. Func. Genet, 9:180-190 (1991), sowohl Macintosh als auch Microsoft Windows Versionen sind erhältlich. MACAW verwendet eine graphische Schnittstelle, stellt eine Wahl von mehreren Ausrichtungsalgorithmen bereit und ist durch anonyme ftp erhältlich bei: ncbi.nlm.nig.gov (directory/pub/macaw).
Irgendein Programm, das zur Motivsuche entworfen ist, weist ebenfalls Nützlichkeit in der vorliegenden Erfindung auf. Sequenzanalysenprogramme, die zur Motivsuche entworfen sind, können zur Identifizierung von cis Elementen verwendet werden. Bevorzugte Computerprogramme werden MEME, SIGNAL SCAN und GENESCAN einschließen, sind aber nicht darauf beschränkt. MEME ist ein Programm, das konservierte Motive (entweder Nukleinsäure oder Peptid) in einer Gruppe von unausgerichteten Sequenzen identifiziert. MEME sichert diese Motive als einen Satz von Profilen. Diese Profile können verwendet werden, um eine Datenbank von Sequenzen zu durchsuchen. Ein MEME-Algorithmus (Version 2.2) kann in Version 10.0 des GCG-Package gefunden werden; MEME (Bailey und Elkan, Machine Learning, 21(1-2):51-80, 1995 und der Ort der Webseite ist http://www.sdsc.edu/MEME/meme/website/COPYRIGHT.html. SIGNALSCAN ist ein Programm, das bekannte Motive in den Testsequenzen unter Verwendung einer Information von anderen Motivdatenbanken identifiziert (Prestridge, CABIOS 7, 203-206, 1991). Eine Information über SIGNALSCAN Version 4.0 ist auf der folgenden Webseite erhältlich: http://biosci.cbs.umn.edu/software/sigscan.html. Die ftp-Seite für SIGNALSCAN ist ftp://biosci.cbs.umn.edu/software/sigscan.html. Datenbanken, die mit SIGNALSCAN verwendet werden, schließen PLACE (http://www.dna.affrc.go.ip/htdocs/PLACE; Higo et al., Nucleic Acids Research 27(1):297-300, 1999) und TRANSFAC (Heinemeye, X. et al., Nucleic Acid Research 27(1):318-322) ein, das auf der folgenden Webseite gefunden werden kann: http://transfac.gbf.de/. GENESCAN ist ein anderes geeignetes Programm zur Motivsuche (Burge und Karlin, J. Mol. Biol. 268, 78-94, 1997), und eine Information über Version 1.0 ist auf der folgenden Webseite erhältlich: http://gnomic.stanford.edu/GENESCANW.html. Wie hierin verwendet, bezieht sich „ein Zielstrukturmotiv" oder „Zielmotiv" auf irgendeine rational ausgewählte Sequenz oder Kombination von Sequenzen, in der die Sequenzen) auf Basis einer dreidimensionalen Konfiguration gewählt wird (werden), die bei der Faltung des Zielmotivs gebildet wird. Es gibt eine Vielfalt von Zielmotiven, die dem Fachmann bekannt sind. Proteinzielmotive schließen enzymatische aktive Stellen und Signalsequenzen ein, sind aber nicht darauf beschränkt. Bevorzugte Zielmotive der vorliegenden Erfindung werden Promotersequenzen, cis Elemente, Haarnadelstrukturen und andere Expressionselemente, wie beispielsweise Proteinbindungssequenzen, einschließen, sind aber nicht darauf beschränkt.
Wie hierin verwendet, bezieht sich „Suchmittel" auf ein oder mehrere Programme, die auf dem Computer-basierten System implementiert werden, um eine Zielsequenz oder ein Zielstrukturmotiv mit der Sequenzinformation zu vergleichen, die innerhalb des Datenspeichermittels gespeichert ist.
Suchmittel werden verwendet, um Fragmente oder Regionen der Sequenzen der vorhegenden Erfindung zu identifizieren, die eine besondere Zielsequenz oder Zielmotiv treffen. Viele Sequenzen können ebenfalls verglichen werden, um übliche Regionen oder Motive zu identifizieren, die für spezifische Funktionen verantwortlich sein können. Zum Beispiel können cis Elemente oder Sequenzdomänen, die ein spezifisches Expressionsprofil verleihen, identifiziert werden, wenn viele Promoterregionen von ähnlichen Klassen von Promotern durch bestimmte Softwarepackages ausgerichtet und analysiert werden.
Die vorliegende Erfindung stellt weiterhin Systeme bereit, insbesondere Computer-basierte Systeme, die die Sequenzinformation enthalten, die hierin beschrieben ist. Wie hierin verwendet, bezieht sich ein „Computer-basiertes System" auf Festplattenmittel, Softwaremittel und Datenspeichermittel, die verwendet werden, um die Nukleotidsequenzinformation der vorliegenden Erfindung zu analysieren. Das minimale Festplattenmittel des Computer-basierten Systems der vorliegenden Erfindung umfasst eine Zentraleinheit (CPU), Eingabemittel, Ausgabemittel und Datenspeichermittel. Der Fachmann kann erkennen, dass irgendeines der erhältlichen Computer-basierten Systeme zur Verwendung in der vorliegenden Erfindung geeignet ist.
In einer bevorzugten Ausführungsform werden die Flankensequenzen, die die 5'-Regulatorelemente der vorliegenden Erfindung enthalten, unter Verwendung eines Genom-Wanderungs-Zugangs (Universal GenomeWalker^TM-Kit, CLONTECH Laboratories, Inc., Palo Alto, CA) isoliert. Kurz gesagt, die gereinigte genomische DNA wird einer Restriktionsenzymverdauung unterworfen, die genomischen DNA-Fragmente mit Enden erzeugt, die mit GenomeWalker^TM-Adaptern verbunden werden. GenomeWalker^TM-Primer werden zusammen mit Gen-spezifischen Primern in zwei aufeinanderfolgenden PCR-Reaktionen (primäre und eingenistete PCR-Reaktionen) verwendet, um PCR-Produkte zu erzeugen, die die 5'-Regulatorsequenzen enthalten, die anschließend geklont und sequenziert werden.
Zusätzlich zu ihrer Verwendung zur Modulation der Genexpression weisen die Promotersequenzen der vorliegenden Erfindung ebenfalls Nützlichkeit als Sonden oder Primer in Nukleinsäurehybridisierungsexperimenten auf. Die Nukleinsäuresonden und -primer der vorliegenden Erfindung können unter stringenten Bedingungen zu einer Ziel-DNA-Sequenz hybridisieren. Der Ausdruck „stringente Hybridisierungsbedingungen" wird als Bedingungen definiert, unter denen eine Sonde oder ein Primer mit einer Zielsequenz(en) und nicht mit Nicht-Zielsequenzen spezifisch hybridisiert, wie empirisch bestimmt werden kann. Der Ausdruck „stringente Bedingungen" wird funktional im Hinblick auf die Hybridisierung einer Nukleinsäuresonde mit einer Zielnukleinsäure (d.h. mit einer besonderen Nukleinsäuresequenz von Interesse) durch die spezifische Hybridisierungsprozedur definiert (siehe zum Beispiel Sambrook et al., 1989, bei 9.52-9.55 und 9.47-9.52, 9.56-9.58; Kanehisa, Nucl. Acids Res. 12:203-213, 1984; Wetmur und Davidson, J. Mol. Biol. 31:349-370, 1968). Angemessene Stringenzbedingungen, die eine DNA-Hybridisierung fördern, sind, zum Beispiel, 6,0 × Natriumchlorid/Natriumcitrat (SSC) bei etwa 45°C, gefolgt von einer Waschung mit 2,0 × SCC bei 50°C, und sie sind dem Fachmann bekannt oder können in Laborhandbüchern, einschließlich Current Protocols in Molecular Biology, John Wiley & Sons, N. Y., 1989, 6.3.1-6.3.6, aber nicht darauf beschränkt, gefunden werden. Zum Beispiel kann die Salzkonzentration in dem Waschschritt von einer niedrigen Stringenz von etwa 2,0 × SCC bei 50°C bis zu einer hohen Stringenz von etwa 0,2 × SCC bei 50°C ausgewählt werden. Zudem kann die Temperatur in dem Waschschritt von niedrigen Stringenz-Bedingungen bei Raumtemperatur, etwa 22°C, zu hohen Stringenz-Bedingungen bei etwa 65°C erhöht werden. Sowohl Temperatur als auch Salz können variiert werden, oder entweder die Temperatur oder die Salzkonzentration können konstant gehalten werden, während die andere Variable geändert wird. Zum Beispiel kann eine Hybridisierung unter Verwendung von DNA- oder RNA-Sonden oder -Primern bei 65°C in 6 × SCC, 0,5% SDS, 5 × Denhardt's, 100 μg/ml unspezifischer DNA (z.B., beultraschallte Lachssperma-DNA) mit Waschung bei 0,5 × SCC, 0,5% SDS bei 65°C für hohe Stringenz durchgeführt werden.
Es wird erwogen, dass Hybridisierungsbedingungen niedrigerer Stringenz, wie beispielsweise niedrigere Hybridisierungs- und/oder Waschtemperaturen verwendet werden können, um verwandte Sequenzen mit einem niedrigeren Grad an Sequenzähnlichkeit zu identifizieren, wenn eine Spezifität der Bindung der Sonde oder des Primers mit Zielsequenzen(en) erhalten wird. Dementsprechend können die Nukleotidsequenzen der vorliegenden Erfindung für ihre Fähigkeit verwendet werden, Duplexmoleküle mit komplementären Strecken von DNA-Fragmenten selektiv zu bilden. Eine Detektion von DNA-Segmenten durch Hybridisierung ist dem Fachmann wohl bekannt. Folglich wird man in Abhängigkeit von der sich vorgestellten Anwendung wünschen, variierende Hybridisierungsbedingungen einzusetzen, um variierende Grade an Selektivität einer Sonde in Richtung zu einer Zielsequenz zu erreichen, und das Verfahren der Wahl wird von den gewünschten Ergebnissen abhängen.
Die Nukleinsäuresequenz in SEQ ID NO: 1 ist in der Lage, mit anderen Nukleinsäuresequenzen unter angemessen ausgewählten Stringenzbedingungen zu hybridisieren. Wie hierin verwendet, wird gesagt, dass zwei Nukleinsäuremoleküle in der Lage sind, miteinander spezifisch zu hybridisieren, wenn die zwei Moleküle in der Lage sind, eine anti-parallele, doppelsträngige Nukleinsäurestruktur zu bilden. Es wird gesagt, dass ein Nukleinsäuremolekül, das „Komplement" eines anderen Nukleinsäuremoleküls ist, wenn sie Komplementarität zeigen. Wie hierin verwendet, wird gesagt, dass Moleküle „vollständige Komplementarität" zeigen, wenn jedes Nukleotid eines der Moleküle mit einem Nukleotid des anderen komplementär ist. Es wird gesagt, dass zwei Moleküle „minimal komplementär" sind, wenn sie miteinander mit ausreichender Stabilität hybridisieren können, um ihnen zu erlauben, miteinander unter zum Mindesten herkömmlichen Bedingungen „niedriger Stringenz" angetempert zu bleiben. Genauso wird gesagt, dass die Moleküle „komplementär" sind, wenn sie miteinander mit ausreichender Stabilität hybridisieren können, um ihnen zu erlauben, miteinander unter herkömmlichen Bedingungen „hoher Stringenz" angetempert zu bleiben. Herkömmliche Stringenzbedingungen werden von Sambrook et al. (Molecular Cloning, A Laboratory Manual, 2^nd Ed., Cold Spring Harbor Press, Cold Spring Harbor, New York, 1989) und von Haymes et al. (Nucleic Acid Hybridization, A Practical Approach, IRL Press; Washington, DC, 1985) beschrieben.
In einer bevorzugten Ausführungsform kann die Nukleinsäuresequenz SEQ ID NO: 1 in Hybridisierungsassays von anderen Pflanzengeweben verwendet werden, um nahe verwandte oder homologe Gene und assoziierte Regulatorsequenzen zu identifizieren. Diese schließen Southern oder Northern Hybridisierungsassays auf irgendeinem Substrat, einschließlich, aber nicht beschränkt auf ein angemessen erzeugtes Pflanzengewebe, Cellulose, Nylon oder Kombinationsfilter, Chip oder Glasobjektträger, ein, sind aber nicht darauf beschränkt. Solche Methodologien sind im Fachgebiet wohl bekannt und sind in einem Kit oder Präparat erhältlich, die von kommerziellen Verkäufern geliefert werden können.
Natürlich können Nukleinsäurefragmente ebenfalls durch andere Techniken, wie beispielsweise durch direkte Synthetisierung des Fragments durch chemische Mittel, erhalten werden, wie es gewöhnlich durch Verwendung einer automatisierten Oligonukleotidsynthesevorrichtung praktiziert wird. Fragmente können ebenfalls durch Anwendung von Nukleinsäurereproduktionstechnologie, wie beispielsweise PCR^TM- (Polymerasekettenreaktion-) Technologie oder durch rekombinante DNA-Techniken erhalten werden, die dem Fachmann der Molekularbiologie im Allgemeinen bekannt sind. Im Hinblick auf die Amplifikation einer Zielnukleinsäuresequenz (z.B., durch PCR) unter Verwendung einer besonderen Amplifikation des Primerpaars beziehen sich „stringente PCR-Bedingungen" auf Bedingungen, die dem Primerpaar erlauben, nur mit der Zielnukleinsäuresequenz zu hybridisieren, an die ein Primer mit der entsprechenden Wildtyp-Sequenz (oder ihrem Komplement) binden wird und bevorzugt um ein einzigartiges Amplifikationsprodukt zu erzeugen.
Die Nukleinsäuresequenzen der vorliegenden Erfindung können ebenfalls als Sonden und Primer verwendet werden. Nukleinsäuresonden und -primer können auf Basis einer nativen Gensequenz erzeugt werden. Eine „Sonde" ist eine isolierte Nukleinsäure, an die ein herkömmlich detektierbares Label oder Reportermolekül, z.B., ein radioaktives Isotop, Ligand, chemiluminiszentes Mittel oder Enzym, angehängt ist. „Primer" sind isolierte Nukleinsäuren, die mit einem komplementären Ziel-DNA-Strang durch Nukleinsäurehybridisierung angetempert werden, um ein Hybrid zwischen dem Primer und dem Ziel-DNA-Strang zu bilden, dann entlang des Ziel-DNA-Strangs durch eine Polymerase, z. B., eine DNA-Polymerase, erstreckt werden. Primerpaare können zur Amplifikation einer Nukleinsäuresequenz, z. B., durch die Polymerasekettenreaktion (PCR) oder andere herkömmliche Nukleinsäureamplifikationsverfahren verwendet werden.
Sonden und Primer hybridisieren spezifisch mit einer Ziel-DNA- oder -RNA-Sequenz unter Hybridisierungsbedingungen hoher Stringenz und hybridisieren spezifisch mit einer nativen Zielsequenz von anderen Spezies unter Bedingungen niedriger Stringenz. Bevorzugt weisen Sonden und Primer gemäß der vorliegenden Erfindung vollständige Sequenzähnlichkeit mit der nativen Sequenz auf, obwohl Sonden, die sich von der nativen Sequenz unterscheiden und die die Fähigkeit zur Hybridisierung mit nativen Zielsequenzen beibehalten, durch herkömmliche Verfahren entworfen werden können. Verfahren zur Erzeugung und Verwendung von Sonden und Primern sind beschrieben (siehe Sambrook et al., 1989; Ausubel et al., 1992 und Innis et al., 1990). PCR-Primerpaare können von einer bekannten Sequenz abgeleitet werden, zum Beispiel, durch Verwendung von Computerprogrammen, die für diesen Zweck beabsichtigt sind, wie beispielsweise Primer (Version 0.5, © 1991, Whitehead Institute for Biochemical Research, Cambridge, MA).
Native oder synthetische Nukleinsäuren gemäß der vorliegenden Erfindung können in rekombinante Nukleinsäure-Konstrukte, typischerweise DNA-Konstrukte, eingebaut werden, die zur Einführung in und Replikation in eine Wirtszelle in der Lage sind. In einer bevorzugten Ausführungsform wird die Nukleotidsequenz der vorliegenden Erfindung, wie in SEQ ID NO: 1 gezeigt, in eine Expressionsvektorkassette eingebaut, die die Promoterregionen der vorliegenden Erfindung einschließt, die mit einer genetischen Komponente, wie beispielsweise einem selektierbaren, screenbaren oder markierbaren Markergen, operabel verbunden ist. Die offenbarte Nukleinsäuresequenz der vorliegenden Erfindung ist bevorzugt mit einer genetischen Komponente, wie beispielsweise einer Nukleinsäure, operabel verbunden, die eine wünschenswerte Charakteristik verleiht, die mit der Pflanzenmorphologie, Physiologie, Wachstum und Entwicklung, Ertrag, Nährstoffverbesserung, Krankheit, wie beispielsweise Fusarium-Kopfmehltau-Krankheit oder Plagen- bzw. Schädlingsresistenz, umfeldbedingter oder chemischer Toleranz assoziiert ist. Diese genetischen Komponenten, wie beispielsweise Markergene oder agronomische Gene von Interesse können bei der Identifizierung einer transformierten Pflanzenzelle oder Pflanze oder einer Erzeugung eines Produkts von agronomischer Nützlichkeit funktionieren.
In einer bevorzugten Ausführungsform erzeugt eine genetische Komponente ein Produkt, das als eine Selektionsvorrichtung dient und in einem regenerierbaren Pflanzengewebe funktioniert, um eine Verbindung zu erzeugen, die dem Pflanzengewebe Resistenz zu einer andernfalls toxischen Verbindung verleihen wird. Gene von Interesse zur Verwendung als ein selektierbarer, screenbarer oder markierbarer Marker werden GUS (Kodierungssequenz für beta-Glucuronidase), GFP (Kodierungssequenz für Grünfluoreszenzprotein), LUX (Kodierungsgen für Luciferase), Markergene für Antibiotika-Resistenz oder Herbizidtoleranzgene einschließen, sind aber nicht darauf beschränkt. Beispiele von Transposons und assoziierten Antibiotikaresistenzgenen schließen die Transposons Tns (bla), Tn5 (nptII), Tn7 (dhfr), Penicilline, Kanamycin (und Neomycin, G418, Bleomycin); Methotrexat (und Trimethoprim); Chloramphenicol; und Tetracycline ein.
Charakteristiken, die für selektierbare Marker in Pflanzen nützlich sind, sind in einem Bericht über die Verwendung von Mikroorganismen (Advisory Commitee on Novel Foods and Processes, July 1994) umrissen worden. Diese umfassen stringente Selektion mit minimaler Anzahl an nicht transformierten Geweben, große Anzahl an unabhängigen Transformationsereignissen mit keiner signifikanten Störung bei der Regeneration, Anwendung auf eine große Anzahl an Spezies und Verfügbarkeit eines Assays, um die Gewebe auf Vorhandensein des Markers zu markieren.
Eine Anzahl an selektierbaren Markergenen ist in dem Fachgebiet bekannt, und einige Antibiotikaresistenzmarker erfüllen diese Kriterien, einschließlich jener, die gegen Kanamycin (nptII), Hygromycin B (aph IV) und Gentamycin (aac3 und aac4) resistent sind. Nützliche dominante selektierbare Markergene schließen Gene ein, die Antibiotikaresistenzgene (z. B., Resistenz gegen Hygromycin, Kanamycin, Bleomycin, G418, Streptomycin oder Spectinomycin); und Herbizidresistenzgene (z. B., Phosphinothricinacetyltransferase) kodieren. Eine nützliche Strategie zur Selektion von Transformanten für eine Herbizidresistenz wird, z. B., in Vasil (Cell Culture and Somatic Cell Genetics of Plants, Vols. I-III, Laboratory Procedures and Their Applications Academic Press, New York, 1984) beschrieben. Besonders bevorzugte selektierbare Markergene zur Verwendung in der vorliegenden Erfindung werden Gene einschließen, die Resistenz gegen Verbindungen, wie beispielsweise Antibiotika wie Kanamycin und Herbizide wie Glyphosat, verleihen (Della-Cioppa et al., Bio/Technology 5(6), 1987; U. S. Patent 5,463,175; U. S. Patent 5,633,435). Andere Selektionsvorrichtungen können ebenfalls ausgeführt werden und werden immer noch innerhalb des Schutzumfangs der vorliegenden Erfindung fallen.
Für die Praxis der vorliegenden Erfindung werden herkömmliche Zusammensetzungen und Verfahren zur Erzeugung und Verwendung von Vektoren und Wirtszellen eingesetzt, wie, unter anderem, in Sambrook et al., 1989, diskutiert. In einer bevorzugten Ausführungsform ist die Wirtszelle eine Pflanzenzelle. Eine Anzahl an Vektoren, die zu der stabilen Transfektion von Pflanzenzellen oder zu der Schaffung von transgenen Pflanzen geeignet sind, sind in, z. B., Pouwels et al. (Cloning Vectors: A Laboratory Manual, 1985, supp. 1987); Weissbach und Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989); Gelvin et al. (Plant Molecular Biology Manual, Kluwer Academic Publishers, 1990); und Croy (Plant Molecular Biology LabFax, BIOS Scientific Publishers, 1993) beschrieben worden. Pflanzenexpressionsvektoren können, zum Beispiel, ein oder mehrere geklonte Pflanzengene unter der Transkriptionskontrolle von 5'- und 3'-Regulatorsequenzen einschließen. Sie können ebenfalls einen selektierbaren Marker einschließen, wie beschrieben, um Wirtszellen zu selektieren, die den Expressionsvektor enthalten. Solche Pflanzenexpressionsvektoren enthalten ebenfalls eine Promoterregulatorregion (z. B., eine Regulatorregion, die induzibel oder konstitutiv kontrolliert, umfeldbedingt oder Entwicklungs-reguliert ist, oder Zell- oder Gewebe-spezifische Expression), eine Transkriptionsinitiationsstartstelle, eine Ribosom-Bindungsstelle, ein RNA-Verarbeitungssignal, eine Transkriptionsterminationsstelle und ein Polyadenylationssignal. Andere Sequenzen aus bakteriellem Ursprung sind ebenfalls enthalten, um dem Vektor zu erlauben, in einem bakteriellen Wirt geklont zu werden. Der Vektor wird ebenfalls typischerweise einen breiten prokaryotischen Wirtsbereichsreplikationsurspung haben. In einer besonders bevorzugten Ausführungsform ist die Wirtszelle eine Pflanzenzelle, und der Pflanzenexpressionsvektor umfasst eine Promoterregion, wie in SEQ ID NO: 1 offenbart, eine operabel verbundene transkribierbare Sequenz und eine Transkriptionsterminationssequenz. Andere Regulatorsequenzen, die sich als genetische Komponenten in einem Expressionsvektor vorgestellt sind, schließen eine nicht translatierte Leitsequenz ein, die mit dem Promoter gekoppelt werden kann, sind aber nicht darauf beschränkt. Pflanzenexpressionsvektoren können ebenfalls zusätzliche Sequenzen umfassen, die Restriktionsenzymstellen, die für Klonierungszwecke nützlich sind, einschließen, aber nicht darauf beschränkt sind.
Eine Anzahl an Promotern weisen Nützlichkeit zur Pflanzengenexpression irgendeines Gens von Interesse auf, das selektierbare Marker, markierbare Marker, Gene für Plagen- bzw. Schädlingstoleranz, Krankheitstoleranz, Nährstoffverbesserungen und irgendein anderes Gen, das ein gewünschtes Merkmal oder Charakteristik verleiht, einschließt, aber nicht darauf beschränkt ist. Beispiele konstitutiver Promoter, die zur Pflanzengenexpression nützlich sind, schließen den Blumenkohl-Mosaik-Virus- bzw. Cauliflower Mosaic Virus (CaMV) 35S Promoter, der eine konstitutive Expression mit hohem Pegel in den meisten Pflanzengeweben verleiht (siehe, z. B., Odel et al., Nature 313:810, 1985), einschließlich von Monokotyledonen (siehe, z. B., Dekeyser et al., Plant Cell 2:591, 1990; Terada und Shimamoto, Mol. Gen. Genet. 220:389, 1990); den Nopalin-Synthase-Promoter (An et al., Plant Physiol. 88:547, 1988); den Octopin-Synthase-Promoter (Fromm et al., Plant Cell 1:977, 1989); und den Braunwurz-Mosaik-Virus- bzw. Figwort Mosaic Virus- (FMV) Promoter, wie in U.S. Patent Nr. 5,378,619 beschrieben, ein, sind aber nicht darauf beschränkt.
Eine Vielfalt an Pflanzengenpromotern, die in Antwort auf umfeldbedingte, hormonale, chemische und/oder Entwicklungs-Signalen reguliert werden, können zur Expression eines operabel verbundenen Gens in Pflanzenzellen verwendet werden, einschließlich von Promotern, die durch (1) Wärme (Callis et al., Plant Physiol. 88:965, 1988), (2) Licht (z. B., Erbsen-rbcS-3A-Promoter, Kuhlemeier et al., Plant Cell 1:471, 1989; Mais-rbcS-Promoter, Schaffner und Sheen, Plant Cell 3:997, 1991; oder Chlorophyll-a/b-Bindungsprotein-Promoter, Simpson et al., EMBO J. 4:2723, 1985), (3) Hormone, wie beispielsweise Abscissäure (Marcotte et al., Plant Cell 1:969, 1989), (4) Verletzung (z. B., wunI, Siebertz et al., Plant Cell 1:961, 1989); oder (5) Chemikalien, wie beispielsweise Methyljasmonat, Salicylsäure, oder Safener reguliert werden. Es kann ebenfalls vorteilhaft sein, (6) Organ-spezifische Promoter (z. B., Roshal et al., EMBO J. 6:1155, 1987; Schernthaner et al., EMBO J. 7:1249, 1988; Bustos et al., Plant Cell 1:839, 1989) einzusetzen.
Pflanzenexpressionsvektoren können RNA-Verarbeitungssignale, z. B., Introns einschließen, die stromaufwärts oder stromabwärts einer Polypeptid-kodierenden Sequenz in dem Transgen positioniert sein können. Zudem können die Expressionsvektoren zusätzliche Regulatorsequenzen von der 3'-nichttranslatierten Region von Pflanzengenen einschließen (Thornburg et al., Proc. Natl. Acad. Sci. USA 84:744, 1987; An et al., Plant Cell 1:115, 1989), z. B., eine 3'-Terminatorregion, um die mRNA-Stabilität der mRNA zu erhöhen, wie beispielsweise die PI-II-Terminatorregion von Kartoffel- oder Octopin- oder Nopalin-Synthase-3'-Terminatorregionen. Fünf-endständige nichttranslatierte Regionen einer mRNA können eine wichtige Rolle bei der Translationsinitiation spielen und können ebenfalls eine genetische Komponente in einem Pflanzenexpressionsvektor sein. Zum Beispiel ist gezeigt worden, dass nichttranslatierte 5'-Leitsequenzen, die von Wärmeschockproteinen abgeleitet sind, eine Genexpression in Pflanzen verstärken (siehe, zum Beispiel U. S. 5,362,865). Diese zusätzlichen stromaufwärts oder stromabwärts gelegenen Regulatorsequenzen können von einer Quelle abgeleitet werden, die nativ oder heterolog in Bezug auf andere Elemente ist, die auf dem Expressionsvektor vorhanden sind.
Die Promotersequenz der vorliegenden Erfindung wird verwendet, um die Genexpression in monokotylen Pflanzenzellen, insbesondere in Getreidepflanzen und sogar noch besonderer in definierten Weizenzellen, zu kontrollieren. Die offenbarten Promotersequenzen sind genetische Komponenten, die Teil von Vektoren sind, die zur Pflanzentransformation verwendet werden. Die Promotersequenz der vorliegenden Erfindung kann mit irgendeinem geeigneten Pflanzentransformationsplasmid oder Vektor verwendet werden, der einen selektierbaren oder screenbaren Marker und assoziierte Regulatorelemente, wie beschrieben, zusammen mit einer oder mehreren Nukleinsäuren enthält, die in einer Weise exprimiert werden, die ausreichend ist, um ein besonderes wünschenswertes Merkmal zu verleihen. Beispiele von geeigneten Strukturgenen von agronomischem Interesse, die sich von der vorliegenden Erfindung vorgestellt sind, werden ein oder mehrere Gene zur Insektentoleranz, wie beispielsweise ein Gen, das ein B.t Endotoxin kodiert, Plagen- bzw. Schädlingstoleranz, wie beispielsweise Gene zur Pilzkrankheitskontrolle, insbesondere zur Fusarium-Kopfmehltau-Krankheitskontrolle, Herbizidtoleranz, wie beispielsweise Gene, die Glyphosattoleranz verleihen, und Gene zu Qualitätsverbesserungen, wie beispielsweise Ertrag, Physiologie, Düngemittel, Wachstum, Entwicklung, Morphologie oder Pflanzenprodukt(e) einschließen, sind aber nicht darauf beschränkt.
Die Promotersequenzen der vorliegenden Erfindung können in Weizengewebe verwendet werden, um eine Genexpression, die in die Ertragsverbesserung involviert ist, anti-fungale und anti-mikrobielle Befälle, z. B. Fusarium, Microdochium, Stagnospora und Blumeria, zu kontrollieren. Die Promotersequenzen gemäß der vorliegenden Erfindung können zur Kontrolle der Expression jener Gene verwendet werden, die gegen insektizide Schädigung auf Korn aktiv sind, die normalerweise zur Keimung vor der Ernte führt, weil Feuchtigkeit in das durch das Insekt beschädigte Korn eindringt. Zudem können die Promotersequenzen der vorliegenden Erfindung zur Kontrolle der Expression von jenen Genen verwendet werden, die einen starken Einfluss auf Pflanzenbelastung, z. B., Wärme- oder Wasserbelastung, aufweisen.
Alternativ können die DNA-Kodierungssequenzen diese Phenotypen durch Kodierung eines nichttranslatierbaren RNA-Moleküls bewirken, das die gezielte Inhibierung der Expression eines endogenen Gens, zum Beispiel durch Antisense- oder Counterdrückungs-vermittelte Mechanismen verursacht (siehe, zum Beispiel, Bird et al., Biotech. Gen. Engin. Rev. 9:207, 1991). Die RNA kann ebenfalls ein katalytisches RNA-Molekül (z. B., ein Ribozym) sein, das entwickelt wird, um ein gewünschtes endogenes mRNA-Produkt zu spalten (siehe zum Beispiel, Gibson und Shillitoe, Mol. Biotech. 7:125, 1997). Folglich ist irgendein Gen, das ein Protein oder eine mRNA erzeugt, das bzw. die einen Phenotyp oder eine Morphologieänderung von Interesse exprimiert, für die Praxis der vorliegenden Erfindung nützlich.
Zusätzlich zu Regulatorelementen oder -sequenzen, die stromaufwärts (5') oder innerhalb einer DNA-Sequenz angeordnet sind, gibt es stromabwärts gelegene (3') Sequenzen, die die Genexpression beeinflussen, und folglich bezieht sich der Ausdruck Regulatorsequenz, wie hierin verwendet, auf irgendeine Nukleotidsequenz, die stromaufwärts, innerhalb oder stromabwärts zu einer DNA-Sequenz angeordnet ist, die die Expression eines Genprodukts in Verbindung mit der Proteinsynthesevorrichtung der Zelle kontrolliert, vermittelt oder beeinflusst.
Die Promotersequenzen der vorliegenden Erfindung können, zum Beispiel, zur Expression in anderen Pflanzensystemen modifiziert werden. In einem anderen Zugang können neue Hybridpromoter durch eine Anzahl an Verfahren entworfen oder entwickelt werden. Viele Promoter enthalten stromaufwärts gelegene Sequenzen, die die Stringenz und/oder Spezifizität des Promoters aktivieren, verbessern oder definieren (Atchinson, Ann. Rev. Cell Biol. 4:127, 1988). T-DNA-Gene, zum Beispiel, enthalten „TATA"-Boxen, die die Stelle der Transkriptionsinitiation definieren, und andere stromaufwärts gelegene Elemente, die stromaufwärts der Transkrisptionsinitiationsstelle angeordnet sind, passen Transkriptionspegel an (Gelvin, In: Transgenic Plants, Kung und Us, eds, San Diego: Academic Press, S. 49-87, 1988). Chimäre Promoter kombinierten ein Trimer des Octopin-Synthase- (ocs) Aktivators mit dem Mannopin-Synthase- (mas) Aktivator plus Promoter und berichteten eine Erhöhung bei der Expression eines Reportergens (Min Ni et al., The Plant Journal 7:661, 1995). Die stromaufwärts gelegenen Regulatorsequenzen der vorliegenden Erfindung können für die Konstruktion solcher chimären oder hybriden Promotern verwendet werden. Verfahren zur Konstruktion verschiedener Promoter der vorliegenden Erfindung schließen eine Kombinierung von Kontrollelementen unterschiedlicher Promoter oder eine Duplizierung von Abschnitten oder Regionen eines Promoters ein, sind aber nicht darauf beschränkt (siehe zum Beispiel U. S. Patent 5,110,732 und U. S. Patent 5,097,025). Die Fachleute sind mit den Standardquellenmaterialien vertraut, die spezifische Bedingungen und Prozeduren für die Konstruktion, Manipulation und Isolation von Makromolekülen (z. B., DNA-Molekülen, Plasmiden usw.), Erzeugung von rekombinanten Organismen und das Screening und die Isolation von Genen beschreiben (siehe zum Beispiel Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, 1989; Maliga et al., Methods in Plant Molecular Biology, Cold Spring Harbor Press, 1995; Birren et al., Genome Analysis: volume 1, Analyzing DNA, (1997), volume 2, Detecting Genes, (1998), volume 3, Cloning Systems, (1999), volume 4, Mapping Genomes, (1999), Cold Spring Harbor, New York).
Die Promotersequenzen der vorliegenden Erfindung können in einen Expressionsvektor eingebaut werden, der screenbare oder markierbare Marker, wie beschrieben, verwendet und in Durchgangsanalysen getestet werden, die eine Indikation der Genexpression in stabilen Pflanzensystemen bereitstellen. Verfahren zum Testen der Genexpression in Durchgangsassays sind dem Fachmann bekannt. Über eine Durchgangsexpression von Markergenen ist unter Verwendung einer Vielfalt von Pflanzen, Geweben und DNA-Zuführsystemen berichtet worden. Zum Beispiel können Typen von Durchgangsanalysen direkte Genzuführung durch Elektroporation oder Partikelbombardement von Geweben in irgendeinem Durchgangspflanzenassay unter Verwendung irgendeiner Pflanzenspezies von Interesse einschließen, sind aber nicht darauf beschränkt. Solche Durchgangssysteme werden Protoplasten aus Suspensionskulturen in Weizen (Zhou et al., Plant Cell Reports 12:612.1993), Elektroporation von Blattprotoplasten von Weizen (Sethi et al., J. Crop Sci. 52: 152, 1983); Elektroporation von Protoplasten, die aus Getreidegewebe hergestellt sind (Sheen, The Plant Cell 3: 225, 1991) oder Partikelbombardement von spezifischen Geweben von Interesse einschließen, sind aber nicht darauf beschränkt. Die vorliegende Erfindung umfasst die Verwendung von irgendeinem Durchgangsexpressionssystem, um Regulatorsequenzen zu bewerten, die mit selektierten Reportergenen, Markergenen oder agronomischen Genen von Interesse operabel verbunden sind. Beispiele von Pflanzengeweben, die sich vorgestellten sind, in Durchgängen durch ein angemessenes Zuführsystem getestet zu werden, werden Blattbasisgewebe, Schwielen, Keimblätter, Wurzeln, Endosperm, Fruchtkeime bzw. Embryos, Blütengewebe, Pollen und epidermales Gewebe einschließen, sind aber nicht darauf beschränkt.
Irgendein markierbarer oder screenbarer Marker kann in einem Durchgangsassay verwendet werden. Bevorzugte Markergene für Durchgangsanalysen der Promoter oder 5'-Regulatorsequenzen der vorliegenden Erfindung schließen ein GUS-Gen oder ein GFP-Gen ein. Die Expressionsvektoren, die die 5'-Regulatorsequenzen enthalten, die mit einem Markergen operabel verbunden sind, werden zu den Geweben zugeführt, und die Gewebe werden durch einen angemessenen Mechanismus in Abhängigkeit des Markers analysiert. Die quantitativen oder qualitativen Analysen werden als ein Werkzeug verwendet, um das potenzielle Expressionsprofil der 5'-Regulatorsequenzen zu bewerten, wenn sie mit Genen von agronomischen Interesse in stabilen Pflanzen operabel verbunden sind. Schließlich werden die 5'-Regulatorsequenzen der vorliegenden Erfindung in geeignete Pflanzentransformationsexpressionsvektoren direkt eingebaut, die die 5'-Regulatorsequenzen umfassen, die mit einer transkribierbaren DNA-Sequenz von Interesse operabel verbunden sind, in Pflanzen transformiert, und die stabil transformierten Pflanzen und deren Nachkommenschaft werden auf das gewünschte Expressionsprofil analysiert, das durch die 5'-Regulatorsequenzen verliehen wird.
Die Fachleute kennen die Vektoren, die zur Pflanzentransformation geeignet sind. Geeignete Vektoren werden unschädlich gemachte Ti-Plasmide für Agrobacterium-vermittelte Verfahren einschließen, sind aber nicht darauf beschränkt. Diese Vektoren können einen Resistenzmarker, 1-2 T-DNA-Grenzen und Replikationsursprünge für E. coli und Agrobacterium zusammen mit einem oder mehreren Genen von Interesse und assoziierten Regulatorregionen enthalten. Die Fachleute wissen, dass für Agrobacterium-vermittelte Zugänge eine Anzahl von Bakterienstämmen und Verfahren verfügbar sind. Solche Bakterienstämme werden Agrobacterium-Bakterienstämme C58, LBA4404, EHA101 und EHA105 einschließen, sind aber nicht darauf beschränkt. Besonders bevorzugte Bakterienstämme sind Agrobacterium tumefaciens-Bakterienstämme. Andere DNA-Zuführsysteme zur Pflanzentransformation sind den Fachleuten ebenfalls bekannt und schließen Partikelbombardement von ausgewählten Pflanzengeweben ein, sind aber nicht darauf beschränkt.
Beispielhafte Nukleinsäuren, die durch die Verfahren eingeführt werden können, die von der vorliegenden Erfindung umfasst sind, schließen, zum Beispiel, DNA-Sequenzen oder Gene von anderen Spezies oder sogar Gene oder Sequenzen ein, die ursprünglich aus oder in der gleichen Spezies vorhanden sind, aber in Empfängerzellen durch Gentechnikverfahren eher als durch die klassische Reproduktion oder Züchttechniken eingeführt werden. Der Ausdruck exogen ist jedoch ebenfalls beabsichtigt, um sich auf Gene zu beziehen, die normalerweise in der Zelle, die transformiert wird, nicht vorhanden oder vielleicht einfach nicht in der Form, Struktur usw. vorhanden sind, wie festgestellt wird, dass in dem transformierenden DNA-Segment oder Gen oder Genen, die normalerweise vorhanden sind, von denen man immer noch wünscht, dass sie z. B., über-exprimiert haben. Der Ausdruck „exogenes" oder alternativ „heterologes" Gen oder DNA ist folglich beabsichtigt, sich auf irgendein Gen oder DNA-Segment zu beziehen, das in eine Empfängerzelle eingeführt wird, egal, ob ein ähnliches Gen bereits in solch einer Zelle vorhanden sein kann. Der Typ an DNA, der in der exogenen DNA enthalten ist, kann DNA, die bereits in der Pflanzenzelle vorhanden ist, DNA von einer anderen Pflanze, DNA aus einem unterschiedlichen Organismus oder eine DNA einschließen, die extern erzeugt wird, wie beispielsweise eine DNA-Sequenz, die eine Antisense-Message bzw. Nachricht eines Gens enthält, oder eine DNA-Sequenz, die eine synthetische oder modifizierte Version eines Gens kodiert.
Die Pflanzentransformationsvektoren, die die Promotersequenzen der vorliegenden Erfindung enthalten, können in Pflanzen durch irgendein Pflanzentransformationsverfahren eingeführt werden. Einige Verfahren sind zur Einführung von DNA-Sequenzen in Pflanzenzellen verfügbar und sind in dem Fachgebiet wohl bekannt. Geeignete Verfahren schließen bakterielle Infektion, binäre bakterielle künstliche Chromosomvektoren, direkte Zuführung von DNA (z. B. durch PEG-vermittelte Transformation, Dürre-/Inhibierungs-vermittelte DNA-Aufnahme, Elektroporation, Schüttlung mit Siliziumcarbidfasern) und Beschleunigung von DNA-beschichteten Partikeln (ein Überblick wird gegeben in Potrykus, Ann. Rev. Plant. Physiol. Plant Mol. Biol., 42: 205, 1991) ein, sind aber nicht darauf beschränkt.
Verfahren zur spezifischen Transformation von Dikotyledonen verwenden hauptsächlich Agrobacterium tumefaciens. Zum Beispiel schließen berichtete transgene Pflanzen Baumwolle (U. S. Patent Nr. 5,004,863; U.S. Patent Nr. 5,159,135; U. S. Patent Nr. 5,518,908, WO 97/43430), Sojabohne/U. S. Patent Nr. 5,569,834; U. S. Patent Nr. 5,416,011; McCabe et al., Bio/Technology, 6:923, 1988; Christou et al., Plant Physiol., 87:671, 1988); Brassica (U. S. Patent Nr. 5,463,174) und Erdnuss (Cheng et al., Plant Cell Rep., 15:653, 1996) ein, sind aber nicht darauf beschränkt.
Ähnliche Verfahren wurden bei der Transformation von Monokotyledonen berichtet. Eine Transformation und Pflanzenregeneration unter Verwendung dieser Verfahren wurden für eine Anzahl an Saaten beschrieben, die Spargel (Asparagus officinalis; Bytebier et al., Proc. Natl. Acad. Sci. U.S.A., 84: 5345, 1987); Gerste (Hordeum vulgarae; Wan und Lemaux, Plant Physiol, 104; 37, 1994); Mais (Zea mays; Rhodes et al., Science, 240:204, 1988; Gordon-Kamm et al., Plant Cell, 2: 603, 1990; Fromm et al., Bio/Technology, 8: 833, 1990; Koziel et al., Bio/Technology, 11:194, 1993); Hafer (Avena sativa; Somers et al., Bio/Technology, 10: 1589, 1992); Knaulgras (Dactylis glomerata; Horn et al., Plant Cell Rep., 7: 469, 1988); Reis (Oryza sativa, einschließlich Indica- und Japonica-Varietäten, Toriyama et al., Bio/Technology, 6: 10, 1988; Zhang et al., Plant Cell Rep., 7:379, 1988; Luo und Wu, Plant Mol. Biol. Rep., 6: 165, 1988; Zhang und Wu, Theor. Appl. Genet., 76: 835, 1988; Christou et al., Bio/Technology, 9: 957, 1991); Hirse (Sorghum bicolor; Casas et al., Proc. Natl. Acad. Sci. U.S.A., 90: 11212, 1993); Zuckerrohr (Saccharum spp.; Bower und Birch, Plant J., 2: 409, 1992); hoher Schwingel (Festuca arundinacea; Wang et al., Bio/Technology, 10:691, 1992), Torfgras (Agrostis palustris; Zhong et al., Plant Cell Rep., 13: 1, 1993); Weizen (Triticum aestivum; Vasil et al., Bio/Technology, 10: 667, 1992; Weeks et al., Plant Physiol., 102: 1077, 1993; Becker et al., Plant, J. 5: 299, 1994) und Alfalfa (Massoud et al., Transgen. Res., 5: 313, 1996) einschließen, aber nicht darauf beschränkt sind. Es ist dem Fachmann klar, dass eine Anzahl an Transformationstechnologien verwendet und zur Erzeugung von stabilen transgenen Pflanzen aus irgendeiner Anzahl von Zielsaaten von Interesse modifiziert werden können.
Die transformierten Pflanzen werden auf das Vorhandensein der Gene von Interesse und den Expressionspegel und/oder -profil analysiert, der bzw. das durch die Promotersequenzen der vorliegenden Erfindung verliehen wird. Die Fachleute kennen die zahlreichen Verfahren, die für die Analyse von transformierten Pflanzen verfügbar sind. Eine Vielfalt an Verfahren wird verwendet, um die Genexpression zu bewerten und zu bestimmen, ob das (die) eingeführte(n) Gen(e) integriert wird (werden), korrekt funktioniert und wie erwartet vererbt wird (werden). Für die vorliegende Erfindung können die Promoter durch Bestimmung der Expressionspegel von Genen bewertet werden, mit dem die Promoter operabel verbunden sind. Eine vorläufige Bewertung der Promoterfunktion kann durch ein Durchgangsassayverfahren unter Verwendung von Reportergenen bestimmt werden, aber eine definitivere Promoterbewertung kann von der Analyse von stabilen Pflanzen bestimmt werden. Verfahren zur Pflanzenanalyse schließen Southern Blots oder Northern Blots, PCR-basierende Zugänge, biochemische Analysen, Phenotyp-Screeningverfahren, Feldbewertungen und immunodiagnostische Assays ein, sind aber nicht darauf beschränkt.
Die Verfahren der vorliegenden Erfindung, die Erzeugung einer cDNA-Bank, Erzeugung einer genomischen Bank, Sequenzierung, Sequenzanalysen, PCR-Technologien, Vektorkonstruktion, Durchgangsassays und Pflanzentransformationsverfahren einschließen, aber nicht darauf beschränkt sind, sind den Fachleuten wohl bekannt und werden unter Verwendung von Standardtechniken oder deren Modifikationen durchgeführt.
Die folgenden Beispiele sind enthalten, um bevorzugte Ausführungsformen der vorliegenden Erfindung zu zeigen.
BEISPIELE
Beispiel 1 – Pflanzenmaterial, RNA-Isolierung und cDNA-Konstruktion
Ein Gewebe für die Konstruktion der Deckspelzen-/Vorspelzen-Bank (LIB3399) wird wie folgt gesammelt. Eine Triticum aestivum- (var. Bobwhite bzw. Wachtel) Saat wird gekeimt und in einer Wachstumskammer (Feuchtigkeit – 65%, Temperatur-/Lichtzyklus – 16 Std. Licht [18°C]/8 Std. Dunkelheit [16°C], Lichtstärke – 43 kLux) wachsen gelassen. Eine Gewebeernte wird nach ungefähr 8 Wochen Wachstum als die Pflanzen die Stufe 65 von der BBCH Wachstumsskala (die gemeinschaftlich mit Deutschen Landwirtschaftsinstituten entwickelt worden ist) erreichten, wenn 50% Staubbeutel extrudiert werden, durchgeführt. Das Deckspelzen- und Vorspelzengewebe wird entfernt und sofort in flüssigen Stickstoff mit anschließender Lagerung bei –80°C gelegt.
Die gesamte RNA wird von dem Deckspelzen- und Vorspelzengewebe unter Verwendung von Trizol (Gibco BRL, Life Technologies, Gaithersburg, Maryland U.S.A.) gereinigt, wie im Wesentlichen von dem Hersteller empfohlen. Poly A+ RNA (mRNA) wird unter Verwendung von magnetischen Olio dT Perlen gereinigt, wie von dem Hersteller empfohlen (Dynabeads, Dynal Corporation, Lake Success, New York U.S.A.).
Eine Konstruktion von Pflanzen-cDNA-Banken ist in dem Fachgebiet wohl bekannt, und eine Anzahl von Klonierungsstrategien ist vorhanden. Eine Anzahl von cDNA-Bankkonstruktions-Kits ist kommerziell erhältlich. Das Superscript^TM-Plasmid-System für die cDNA-Synthese und Plasmid Cloning (Gibco BRL, Life Technologies, Gaitherburg, Maryland U.S.A.) wurden verwendet, den Bedingungen folgend, die von dem Hersteller vorgeschlagen sind. cDNA wird synthetisiert, unter Verwendung einer Sephacryl-Säule (500-2000 bp inklusive) Größen-selektiert und direkt in pSPORT1 (GibcoBRL, Life Technologies, Gaitherburg, Maryland U.S.A.) geklont.
Die cDNA-Banken werden auf LB Agar plattiert, das die angemessenen Antibiotika zur Selektion enthält, und bei 37°C über eine ausreichende Zeit inkubiert, um das Wachstum von individuellen Kolonien zu erlauben. Einzelne Kolonien werden in individuelle Vertiefungen von Mikrotiterplatten mit 96 Vertiefungen platziert, die LB Flüssigkeit, einschließlich der selektiven Antikörper, enthalten. Die Platten werden über Nacht bei ungefähr 37°C mit leichtem Schütteln inkubiert, um das Wachstum der Kulturen zu fördern. Plasmid-DNA wird aus jedem Klon unter Verwendung von Qiaprep-Plasmid-Isolierungs-Kits unter Verwendung der Bedingungen isoliert, die von dem Hersteller empfohlen werden (Quiagen Inc., Santa Clara, California U.S.A.).
Die Templat-Plasmid-DNA-Klone werden durch Initiation von dem 5'-Ende jedes cDNA-Klons sequenziert, die sich ergebenden Sequenzen werden als exprimierte Sequenz-Tags (ESTs) bezeichnet. Die Templat-Plasmid-DNA-Klone werden dann sequenziert. Die cDNAs werden unter Verwendung eines kommerziell erhältlichen Sequenzierungs-Kits, wie beispielsweise ABI PRISM dRhodamine Terminator Cycle Sequencing Ready Reaction Kit mit AmpliTaq^® DNA Polymerase, unter den Bedingungen sequenziert, die von dem Hersteller (PE Applied Biosystems, Foster City, CA) empfohlen werden.
Eine Anzahl an Sequenzierungstechniken ist in dem Fachgebiet bekannt, einschließlich Fluoreszenz-basierter Sequenzierungsmethodologien. Diese Verfahren weisen die Detektion-, Automatisierungs- und Instrumentationsfähigkeit auf, die für die Analyse großer Umfänge an Sequenzdaten notwendig sind. Gegenwärtig erlaubt die 377 DNA-Sequenzierungsvorrichtung (Perkin-Elmer Corp., Applied Biosystems Div., Foster City, CA) die schnellste Elektrophorese und Datensammlung. Mit diesen Typen an automatisierten Systemen werden fluoreszente Farbstoff-gelabelte Sequenzreaktionsprodukte detektiert, und Daten werden direkt in den Computer eingegeben, der ein Chromatogramm erzeugt, das anschließend unter Verwendung der entsprechenden Softwareprogramme gesehen, gespeichert und analysiert wird. Diese Verfahren sind den Fachleuten bekannt und sind beschrieben, und ein Überblick ist gegeben worden (Birren et al., Genome Analysis: Analyzing DNA, 1, Cold Spring Harbor, New York).
Beispiel 2 – EST-Clustern
Die ESTs, die aus Sequenzierung eines Bereichs von T. asetivum-cDNA-Banken erzeugt sind, werden in einer Computerdatenbank gespeichert. Die ,rohen' ESTs werden in Gruppen von zusammenhängenden ESTs, d.h., ESTs, die ursprünglich aus homologen mRNA-Transkripten sind, in einem Prozess sortiert, der als Clustern bekannt ist.
Der Clusterprozess besteht aus drei Hauptschritten:

1. Die Banken werden auf Vektorkontamination und Sequenz schlechter Qualität gescreent.
2. Die Sequenzen werden miteinander verglichen. Jene Sequenzen, die 90% Identität über einen Bereich von 100 Basenpaaren aufweisen, werden erwogen, in dem gleichen „Behältnis" zu sein.
3. Alle der Sequenzen in jedem „Behältnis" werden ausgerichtet, was eine übereinstimmende Sequenz erzeugt, die als eine EST-Cluster-Sequenz bekannt ist. Die Sequenzen in einem „Behältnis", die sich nicht ausrichten, werden zu einem neuen Behältnis bewegt.

Die Deckspelzen- und Vorspelzen-cDNA-Bank (LIB3399) umfasst 5856 Klone, jedes von ihnen wird sequenziert, um einen EST zu erzeugen. Diese ESTs werden dann mit anderen verfügbaren ESTs aus weiteren T. aestivum-cDNA-Banken geclustert, um einen Satz an T. aestivum-EST-Clustersequenzen zu erzeugen. Tabelle 1 (im Anhang) zeigt 40 der abundantesten EST-Clustersequenzen in LIB3399. Die Abundanz ist als Zielzählung (Anzahl an ESTs aus LIB3399, die den Cluster umfasst) und prozentuale Abundanz (Zielzählung als ein Prozentsatz der Gesamtzahl an ESTs in LIB3399) ausgedrückt.
Beispiel 3 – Messung der Abundanz an EST-Clustern unter Verwendung von BLAST
BLAST (Basic Local Alignment Search Tool) ist ein Satz an Ähnlichkeitssuchprogrammen, die entworfen sind, um DNA- und Proteinsequenz-Datenbanken abzufragen. Die BLAST-Programme wurden für Geschwindigkeit mit einem minimalen Verlust an Sensitivität zu entfernten Sequenzbeziehungen entworfen. Die Markierungen, die in einer BLAST-Suche zugeordnet werden, weisen eine wohl definierte statistische Interpretation auf, was es einfacher macht, reale Treffer von zufälligen Hintergrund-Hits zu unterscheiden. BLAST verwendet einen heuristischen Algorithmus, der lokal im Gegensatz zu globalen Ausrichtungen sucht und deshalb in der Lage ist, Beziehungen unter Sequenzen zu detektieren, die nur isolierte Ähnlichkeitsregionen teilen (Altschul et al. J. Mol. Biol. 215(3): 403-410).
Die Anzahl an ESTs, die aus einer besonderen Bank stammen, die einen besonderen EST-Cluster umfassen, stellt ein Maß der Abundanz des entsprechenden mRNA-Transkripts in dem Gewebe bereit, das verwendet wird, um die Bank herzustellen.
Die 96 abundantesten EST-Cluster aus LIB3399 wurden als Abfragesequenzen verwendet, um einen Bereich aus cDNA-Banken (siehe Tabelle 2 im Anhang) unter Verwendung des BLAST-Algorithmus zu suchen. Die Anzahl an ,Hits' mit einem E-Wert <= 1 × 10^–7 und einem Bitscore >=100 (unter Verwendung von Fehlerparametern mit Ausnahme der Schwellenausdehnung >=100) wurden für jede DNA-Bank kollationiert, von der die Anzahl an ,Hits' in jedem Gewebetyp berechnet wurde (siehe Tabelle 3 im Anhang).
Ausgewählte EST-Cluster waren jene, in denen die Gesamtanzahl an Hits im Stängel bzw. Halm, Blatt, Embryo, Endosperm und Wurzel <5 waren. Siebenunddreißig der analysierten 96 EST-Cluster erfüllten dieses Kriterium. Diese wurden weiterhin auf 30 EST Cluster durch Auswählen auf dem Kriterium einer sehr niedrigen Expression (<=1 Hit) im Stängel bzw. Halm, Blatt, Embryo und Wurzel reduziert. Wenn jedoch irgendeine Staubbeutelexpression offensichtlich war, wurde ein höherer Pegel der Expression im Stängel, Blatt, Embryo und Wurzel toleriert (<=5 Hits). Siehe Ablaufdiagramm (1 im Anhang) zum Vergleich des Expressionsmusters von 3 EST-Clustern (jeweils 3849_1, 17859_1 und 88_3) mit gewünschten Expressionsmustern und andere 4 mit ungewünschten Expressionsmustern.
Beispiel 4 – Identifizierung von homologen Reis-cDNAs und Expressionsanalyse
Die 30 Weizen-EST-Cluster wurden dann als Abfragesequenzen gegen O. sativa-Unigen-Datenbank (geclusterte und zusammengesetzte ganze EST-Datensätze von Reisspezies vom 21. Sept. 2000) verwendet (seq VersionCollection – Oryza_sativa_Unigene20000921), letzte Aktualisierung: 19. Oktober 2000 11:55 AM), um homologe Reis-cDNAs zu suchen. Reis-cDNA-Homologe wurden für 25 der 30 Weizen-EST-Cluster gefunden (siehe Tabelle 5).
Die 25 homologen Reis-cDNA-Sequenzen wurden dann als Abfragesequenzen gegen einen Bereich von EST-Datenbanken von O. sativa-Rispen und Blatt/vegetativem Gewebe verwendet (siehe Tabelle 4 im Anhang). Die Anzahl an Hits (E-Wert <= 1 × 10^–7, Bitscore >=100 und Schwellenausdehnung >=100) wurden für den Gewebetyp kollatisiert, der einen Vergleich des Gewebetypexpressionsmusters erlaubt.
Siehe Tabelle 5 (im Anhang) zur Zusammenfassung der 30 Weizen-EST-Cluster, die mit einem Reis-cDNA-Homolog und einer genomischen DNA-Reis-Sequenz assoziiert sind.
Reis-cDNA: 109_1.R2011 (LP1 genannt) zeigte eine bevorzugte Expression in Reisrispen über Blattgewebe. Eine stringentere Analyse der Abfrage-/Subjektsequenzausrichtung deutete an, dass diese cDNA noch bevorzugt abundanter in den Rispen-Banken war als durch die ursprünglichen Suchbedingungen angedeutet (siehe Tabelle 6 im Anhang).
Beispiel 5 – Identifizierung und Klonierung von mutmaßlichen Promoterregionen
Die 25 identifizierten Reis-cDNA-Homologsequenzen wurden als Abfragesequenzen gegen eine genomische O. sativa-DNA-Bank verwendet, um entsprechende genomische DNA-Sequenzen zu identifizieren (siehe Zusammenfassung in Tabelle 5).
Ein BLASTX- (alle sechs Nukleotidleserahmen) Suche einer GenPeptPRT-Datenbank (öffentlich zugängliche Proteinsequenz) wurde mit der Reis-Unigen-cDNA-LP1 ausgeführt. Beste ,Hits' sind nachstehend gezeigt, cDNA/gDNA-Ausrichtungen folgen in Tabelle 6 im Anhang.
Die Reis-cDNA-Sequenzen wurden mit ihrer entsprechenden genomischen Reis-DNA-Sequenz ausgerichtet, die genomische Reissequenz wurde in dem gleichen Rahmen wie der cDNA-Rahmen translatiert, der die vorstehenden Hits hervorrief. Dies ermöglichte eine Deduktion der Position der mutmaßlichen ,TATA'-Box und ATG-Translationsstartkodons für die Gensequenz (siehe 2). Ein weiterer Beweis für die Position des Translationstartkodons wurde durch Vergleichen der aminoterminalen Aminosäuresequenz von anderen nah verwandten Proteinsequenzen gesammelt.
Eingenistete Paare von Oligonukleotid-PCR-Primern wurden für die genomische Reis-DNA-Sequenz entworfen. Ein ,äußeres' primäres Paar wurde unter Verwendung von Primerentwurfcomputersoftware (PrimerSelect – DNAStar) entworfen, um eine Region von ungefähr 1700 bp stromaufwärts des mutmaßlichen Translationsstartkodons auf 200 bp stromabwärts des mutmaßlichen Translationsstartkodons zu amplifizieren. Dieses Paar an Primern wurde mit einem genomischen Reis-(Nipponbare) DNA-Templat verwendet, um primäre PCR-Produkte zu erzeugen.
Das ,innere' sekundäre Paar an Primern wurde manuell entworfen. Der Vorwärtsprimer baute entweder eine SalI-Stelle ein oder temperte an eine Region unmittelbar stromaufwärts einer SalI-Stelle innerhalb des mutmaßlichen Promoters ungefähr 1500 bp stromaufwärts des mutmaßlichen Translationsstartkodons an. Der reverse Primer wurde entworfen, um an die Region des mutmaßlichen ATG-Translationsstartkodons anzutempern, aber durch diese Ausführung das ATG in dem amplifizierten Produkt durch eine einzige Basenpaarsubstitution zu zerstören. Eine NotI-Restriktionsstelle war ebenfalls unmittelbar stromabwärts des zerstörten ATG-Kodons enthalten. Das sekundäre Paar an Primern wurde verwendet, um den mutmaßlichen Promoter unter Verwendung des primären PCR-Produkts als ein Templat mittels PCR zu amplifizieren.
Mit diesem Verfahren wurden ungefähr 1500 bp jedes mutmaßlichen Promoters, einschließlich von Nukleotiden unmittelbar stromaufwärts des mutmaßlichen ATG-Translationsstartkodons, amplifizert und in einen geeigneten Klonierungsvekor unter Verwendung von SalI- und NotI-Restriktionsstellen geklont.
Beispiel 6 – Promoteranalyse in Pflanzen
Für eine stabile Pflanzentransformation wird die 5'-Regulatorsequenz in einen Pflanzentransformationsvektor, wie beispielsweise der gezeigte pMON-CAM1 (3), geklont. Dies ist ein binärer Doppelrand- (rechte und linke T-DNA-Ränder) Pflanzentransformationsvektor und enthält die folgenden genetischen Komponenten: RACT ist das erste Intron von dem Reisactin-Gen; GUS ist die Kodierungsregion für das Reportergen β-Glucoronidase; NOS ist das 3'-Terminationssignal von dem Nopalin-Synthase-Gen; Spec/Strep ist die Kodierungsregion für Spectinomycin- und Streptomycin-Resistenz; ori-pUC und ori-V sind Replikationsursprünge; NPTII ist die Kodierungsregion für Kanamycin-Resistenz; HSP70 ist ein Intron vom Maiswärmeschockprotein 70 Gen, wie in U. S. Patent Nrn. 5,593,874 und 5,859,347 beschrieben; und CaMV35S ist der Promoter für die 35S RNA vom Cauliflower Mosaic Virus, der eine Duplikation der -90 bis -300 Region enthält.
Der Promoter wird mit dem GUS-Reportergen zusammen mit anderen Regulatorsequenzen operabel verbunden, die nichttranslatierte Leiter und Terminatoren, wie vorstehend beschrieben, einschließen, aber nicht darauf beschränkt sind, und in eine Zielsaat von Interesse durch ein angemessenes Zuführsystem, wie beispielsweise eine Agrobacterium-vermittelte Transformation (siehe, zum Beispiel, U. S. Patent Nr. 5,569,834, U. S. Patent Nr. 5,416,011, U. S. Patent Nr. 5,631,152, U. S. Patent Nr. 5,159,135 und U. S. Patent Nr. 5,004,863) oder Partikelbombardementverfahren (siehe, zum Beispiel, Patentanmeldungen WO 92/15675, WO 97/48814 und Europäische Patentanmeldung 586,355 und U. S. Patent Nrn. 5,120,657, 5,503,998, 5,830,728 und 5,015,580) transformiert.
Eine große Anzahl an Transformations- und Regenerationssystemen und -verfahren sind verfügbar und dem Fachmann wohl bekannt. Die stabil transformierten Pflanzen und Nachkommenschaft werden anschließend auf die Expression des Gens in Geweben von Interesse durch irgendeine Anzahl an molekularen, immunodiagnostischen, biochemischen und/oder Feldbewertungs-Verfahren analysiert, die dem Fachmann bekannt sind.
Weizenpflanzen, die mit verschiedenen Promoterreporter-Konstrukten transformiert waren, wurden auf GUS-Aktivität jeweils in der Spelze, Deckspelze, Vorspelze und dem Markierungsblatt analysiert. Der erhaltenen Ergebnisse sind in Tabelle 7 gezeigt.
Tabelle 7. Vergleich der GUS-Aktivität in Weizenpflanzen, die mit verschiedenen Promoterreporter-Konstrukten transformiert waren.
ScBV – Promoter aus Zuckerrohr-Badnavirus, der eine konstitutive Expression antreibt (Tzafrir et. al. 1998 Plant. Mol. Biol. 38, 347). PER1 – Promoter des Hordeum vulgare-Peroxiredoxingens, das im Embryo- und Aleuron-Gewebe exprimiert wird (Stacy et. al. 1996 Plant. Mol. Biol. 31, 1205). Für LP1: siehe SEQ ID NO.1.
Gewebe wurden aus zahlreichen Pflanzen für jedes Konstrukt präpariert und histochemisch auf GUS-Aktivität gemäß dem Protokoll von Jefferson (1987, Plant. Mol. Biol. Rep. 5, 387) individuell gefärbt. Die GUS-Aktivität wurde durch Markierung der Intensität der Blaufärbung mit dem Auge und unter Zuordnung der folgenden Werte bewertet:
– für undetektierbar, + für detektierbar und ++ für niedrig, +++ für mittelmäßig und ++++ für hoch.
SEQUENZ 1, wie in der Anmeldung beschrieben SEQ. ID. NO.1
SEQUENZPROTOKOLL

Claims

Chimäre monokotyle Regulatorsequenz umfassend SEQ ID NO. 1 und einen Minimal-CaMV- oder einen Reisactin-Promoter.
Chimäre monokotyle Regulatorsequenz gemäß Anspruch 1, wobei der Minimalpromoter einen CaMV-35S-Minimalpromoter darstellt.
DNA-Konstrukt umfassend eine isolierte Nucleinsäuresequenz von SEQ ID NO. 1 und, damit operabel verbunden, eine transkribierbare DNA-Sequenz und eine 3'-nichtranslatierte Region.
Pflanzenzelle umfassend ein DNA-Konstrukt gemäß Anspruch 3.
Pflanzengewebe umfassend eine Pflanzenzelle gemäß Anspruch 4.
Transgene Pflanze umfassend ein DNA-Konstrukt umfassend eine isolierte Nucleinsäuresequenz von SEQ ID NO. 1 und, damit operabel verbunden, eine transkribierbare DNA-Sequenz und eine 3'-nichtranslatierte Region.
Verwendung einer monokotylen Regulatorsequenz von SEQ ID NO. 1 zur Regulierung der Transkription einer damit operabel verbundenen Nucleinsäuresequenz in monokotylem Deckspelzen-, Vorspelzen- und/oder Spelzengewebe.
Verwendung gemäß Anspruch 7, wobei die SEQ ID NO. 1 ein Teil eines chimären Promoters darstellt.
Verfahren zur Herstellung einer transgenen Pflanze umfassend das Einführen eines DNA-Konstrukts gemäß Anspruch 3 in eine Pflanzenzelle.