-
GEBIET DER
ERFINDUNG
-
Gegenstand
der Erfindung ist das Gebiet der mikrobiellen Herstellung von Polysacchariden.
Gegenstand der Erfindung sind spezifischer Nukleinsäure-Moleküle, die
für ein
Enzym kodieren, das an der Biosynthese von Exopolysacchariden aus
Methylomonas sp. beteiligt ist.
-
HINTERGRUND
DER ERFINDUNG
-
Polysaccharide
stellen Zucker-Polymere dar, die verbreitet als ein Verdickungsmittel
in den Nahrungsmittel- und Nichtnahrungsmittelindustrien verwendet
wurden (Sanford et al. Pure & Appl.
Chem. 56: 879–892 (1984);
Sutherland, Trends Biotechnol, 16(1): 41–6 (1998)). Sie können in
Nahrungsmittelprodukten, wie zum Beispiel Salatsoßen, Marmelade,
tiefgefrorenen Nahrungsmitteln, Bäckereiprodukten, Nahrungsmitteln
in Dosen und Trockennahrungsmitteln gefunden werden. Viele andere
Applikationen schließen
Suspensionsmittel für
Pestizide, Anstrichstoffe und andere Beschichtungsmittel ein. Sie
können
als Flockungsmittel, Bindungsmittel, Filmbildner, Gleitmittel und
Friktionsreduktionsmittel wirken. Exopolysaccharide werden überdies
häufig in Ölfeldern
zur Ölrückgewinnung
verwendet.
-
Herkömmlicherweise
leiteten sich industriell nützliche
Polysaccharide aus Algen- und Pflanzenquellen her. Im Verlauf des
letzten Jahrzehnts haben sich von Mikroben herleitende Polysaccharide
zunehmend Verwendung gefunden (Sanford et al. Pure & Appl. Chem. 56:
879–892
(1984)); Sutherland, Trends Biotechnol 16(1): 41–6 (1998)). Eines der gewerblich
weithin bekannten mikrobiellen Exopolysaccharide stellt Xanthangummi
dar. Xanthangummi stellt ein komplexes Exopolysaccharide dar, das
von einem Gram-negativen Bakterium Xanthomonas campestris pv. campestris
gebildet wird, bei dem es sich um ein Pathogen für Kreuzblütler handelt. Xanthan besteht
aus einer β-1,4-verknüpften D-Glucose-Hauptkette
mit Trisaccharid-Seitenketten, die sich aus Mannose-(β-1,4)-glucuronsäure-(β-1,2)-mannose zusammensetzen,
die durch α-1,3-Verknüpfungen
an alternierende Glucosereste in der Hauptkette gebunden sind. Die
polymerisierten Pentasaccharid-Wiederholungseinheiten sind durch
die sequenzielle Addition von Glucose-1-phosphat, Glucose, Mannose,
Glucuronsäure
und Mannose auf einem Polyprenolphosphat-Träger assembliert (Ielpi et al.,
J. Bacteriol. 175:2490–2500,
1993).
-
Einer
der am besten charakterisierten Wege für die Produktion mikrobieller
Exopolysaccharide ist in Xanthomonas zu finden Der Biosyntheseweg
von Xanthan in Xanthomonas campestris umfasst beispielsweise fünf Stufen:
(i) Umwandlung einfacher Zucker in Nukleotidylderivat-Präkursoren,
(ii) Assemblieren von Pentasaccharid-Untereinheiten, die an den
Träger
der inneren Membran von Polyprenolphosphat gebunden sind, (iii)
Addition von Acetyl- und Pyruvatgruppen, (iv) Polymerisation von
Pentasaccharid-Wiederholungseinheiten und (v) Sekretion eines Polymers.
-
Mehrere
an der Biosynthese von Xanthan und anderen Exopolysacchariden beteiligten
Enzyme oder Proteine sind aus dem Stand der Technik weithin bekannt.
UDP-Glucosepyrophosphorylase stellt das Enzym dar, das die Reaktion
katalysiert, die UDP-Glucose (UTP + Glucose-1-phosphat <-> UDP-Glucose + Ppi)
generiert (Wei et al., Biochem. Biophys. Res. Commun. 226:607–12 (1996)).
UDP-Glucose stellt die Bausteine für viele Glucose enthaltende
Exopolysaccharide dar.
-
Es
wird gefunden, dass ein Cluster aus Gummi-Genen für die Xanthangummi-Synthese
in Xanthomonas campestris erforderlich sind (Katzen et al. J. Bacteriol.
180:1607–1617
(1998); Chou, F.L., et al. Biochem. Biophys. Res. Commun. 233 (1),
265–269
(1997)). So ist zum Beispiel GumD, die Glycosyltransferase, für den Transfer
der ersten Glucose an die Lipid-verknüpften Intermediärprodukte
in der Exopolysaccharid-Biosynthese in Xanthomonas campestris verantwortlich.
GumH stellt das Protein dar, das am Transfer der Mannose an die
Lipid-verknüpften
Intermediärprodukte
bei der Exopolysaccharid-Synthese in Xanthomonas campestris beteiligt
ist.
-
Viele
andere an der Exopolysaccharid-Biosynthese beteiligten Gene wurden
aus anderen Organismen charakterisiert oder sequenziert. Das epsB-Gen,
das für
das EpsB-Protein kodiert, das wahrscheinlich an der Polymerisation
und/oder dem Export von EPS beteiligt ist, wurde in Ralstonia sola
sequenziert (Huang et al., Mol. Microbiol. 16: 977–989 (1995).
Das espM-Gen, das für
das EspM-Protein kodiert, wurde im esp-Gencluster von Streptococcus
thermophilus gefunden (Stingele et al., J. Bacteriol. 178:1680–1690 (1996)).
Ein anderes putatives Polysaccharid-Exportprotein, WZA, wird in
E. coli identifiziert (Blattner et al., Science 277:1453–1474 (1997)).
Das epsV-Gen kodiert schließlich
für das
EpsV-Protein, eine Transferase, welche den Zucker an Polysaccharid-Intermediärprodukte
transferiert, und es wurde auch in Streptococcus thermophilus sequenziert
(Bourgoin et al. Plasmid 40:44–49
(1998); Bourgoin, F., et al., Gene 233:151–161 (1999).
-
Trotz
der Informationsfülle
in Bezug auf Gen-kodierende mikrobielle Exopolysaccharide wurden
keine an diesem Weg beteiligten Gene isoliert oder aus den C1 verwertenden Organismen, wie zum Beispiel
Methylomonas, charakterisiert. Wie vorstehend angemerkt wurde, weisen
mikrobielle Exopolysaccharide eine Reihe verschiedener Verwendungszwecke
auf und es wäre
ein Vorteil, dieses Material aus einer Fülle von und preisgünstigen
Kohlenstoffquellen, wie zum Beispiel Methan, zu synthetisieren.
-
Das
zu lösende
Problem besteht deshalb darin, die Gene zu identifizieren, die für die Exopolysaccharid-Synthese
in einem C1 verwertenden Organismus zur
Herstellung von Exopolysacchariden in ähnlichen ebenso wie in nicht
verwandten Mikroben relevant sind. Die Anmelder haben das angegebene
Problem durch Isolierung und Charakterisierung eines kompletten
enzymatischen Wegs für
die Synthese von Exopolysaccharid aus einem Methylomonas sp. und
insbesondere einem Nukleinsäuremolekül, kodierend
für ein
Enzym der Exopolysaccharid-Synthese, gelöst.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Gegenstand
der vorliegenden Erfindung ist die Bereitstellung eines isolierten
Nukleinsäuremoleküls, das
für ein
biosynthetisches Exopolysaccharid-Enzym von Methylmonas sp. kodiert,
das aus der Gruppe ausgewählt
ist, bestehend aus: (a) einem isolierten Nukleinsäuremolekül, kodierend
für die
Aminosäuresequenz, wie
in SEQ ID NO: 4 dargelegt und (b) einem isolierten Nukleinsäuremolekül, das zu
(a) komplementär
ist. Ein derartiges Nukleinsäuremolekül kann SEQ
ID NO: 3 darstellen. Es wird weiter angenommen, dass isolierte Nukleinsäuremoleküle, die
für Exopolysaccharid-Enzyme
von Methylomonas sp. kodieren, aber nicht als ein erfindungsgemäßer Teil
beansprucht werden, durch SEQ ID NO: 2, 6, 8, 10, 12, 14, 16 und
18 definiert sind. Ein isoliertes Nukleinsäuremolekül, das mit jedweder von SEQ
ID NO: 2, 4, 6, 8, 10, 12, 14, 16 und 18 unter den folgenden Hybridisierungsbedingungen
hybridisiert: 0,1 × SSC,
0,1 % SDS, 65 °C
und gewaschen mit 2 × SSC, 0,1
% SDS, gefolgt von 0,1 × SSC,
0,1 % SDS, kann für
ein entsprechendes Enzym von äquivalenter
Funktion kodieren.
-
Andere
repräsentative
Nukleinsäuremoleküle, die
für biosynthetische
Exopolysaccharid-Enzyme kodieren, aber keinen wie vorstehend beanspruchten
erfindungsgemäßen Teil
bilden, schließen
Folgendes ein: 1) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz,
kodierend für
ein Polypeptid aus mindestens 293 Aminosäuren, das bezogen auf das Alignment-Verfahren
nach Smith-Waterman
bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID
NO:2 dargelegt, eine Identität
von mindestens 58 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst; 2) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
473 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:4
dargelegt, eine Identität
von mindestens 36 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst; 3) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
366 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:6
dargelegt, eine Identität
von mindestens 36 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst, 4) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
779 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:8
dargelegt, eine Identität
von mindestens 35 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst; 5) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz; kodierend für ein Polypeptid aus mindestens
472 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:10
dargelegt, eine Identität
von mindestens 23 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst; 6) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
272 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:
12 dargelegt, eine Identität
von mindestens 28 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst; 7) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
284 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:
14 dargelegt, eine Identität
von mindestens 21 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst; 8) ein isoliertes
Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
398 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei
Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:
16 dargelegt, eine Identität
von mindestens 26 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst und 9) ein
isoliertes Nukleinsäuremolekül, umfassend
eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens
317 Aminosäuren,
das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich
mit einem Polypeptid mit der Sequenz wie in SEQ ID NO: 18 dargelegt,
eine Identität
von mindestens 51 % aufweist, oder eine zweite Nukleotidsequenz,
die das Komplement der ersten Nukleotidsequenz umfasst.
-
Gegenstand
der Erfindung ist auch die Bereitstellung chimärer Gene, umfassend das wie
vorstehend definierte erfindungsgemäße isolierte Nukleinsäuremolekül, das funktionsfähig mit
geeigneten Regulationssequenzen verknüpft ist. Gegenstand der Erfindung
ist außerdem
die Bereitstellung des Polypeptids, das durch das erfindungsgemäße Nukleinsäuremolekül kodiert
wird.
-
Gegenstand
der Erfindung ist auf ähnliche
Weise die Bereitstellung einer transformierten Wirtszelle, die die
erfindungsgemäßen chimären Gene
umfasst.
-
Ein
Verfahren zum Erhalt eines Nukleinsäuremoleküls, das für ein biosynthetisches Exopolysaccharid-Enzym
von Methylomonas sp. kodiert, beinhaltet Folgendes: (a) Sondieren
einer genomischen Bibliothek mit dem erfindungsgemäßen Nukleinsäuremolekül; (b) Identifizieren
eines DNA-Klons,
der mit dem erfidungsgemäßen Nukleinsäuremolekül hybridisiert;
und (c) Sequenzieren des genomischen Fragments, das den in Schritt
(b) identifizierten Klon umfasst, worin das sequenzierte genomische
Fragment für
ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp.
kodiert.
-
Als
Alternative könnte
ein anderes Verfahren zum Erhalt eines Nukleinsäuremoleküls, das für ein biosynthetisches Exopolysaccharid-Enzym
von Methylomonas sp. kodiert, Folgendes beinhalten: (a) Synthetisieren
von mindestens einem Oligonukleotid-Primer, der einem Anteil der
Sequenz entspricht, die aus der Gruppe ausgewählt ist, bestehend aus SEQ
ID NO: 1, 3, 5, 7, 9, 11, 13, 15 und 17; und (b) Amplifizieren eines
in einem Klonierungsvektor anwesenden Inserts unter Verwendung des
Oligonukleotid-Primers von Schritt (a); worin das amplifizierte
Insert für
einen Anteil einer Aminosäuresequenz
kodiert, die für
ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp.
kodiert.
-
In
einer erfindungsgemäßen Ausführungsform
wird ein Verfahren zur Herstellung eines Exopolysaccharids bereitgestellt,
das Folgendes umfasst: Kontaktieren einer transformierten Wirtszelle
unter geeigneten Wachstumsbedingungen mit einer wirksamen Menge
einer Kohlenstoffquelle, wodurch Exopolysaccharid gebildet wird,
wobei die transformierte Wirtszelle ein für SEQ ID NO: 4 kodierendes
Nukleinsäuremolekül umfasst,
unter der Kontrolle geeigneter Regulatorsequenzen.
-
Andere
Nukleinsäwemoleküle, die
verwendet werden könnten,
schließen
diejenigen ein, die für
SEQ ID NO: 2, 6, 8, 10, 12, 14, 16 und 18 kodieren.
-
Ein
mutiertes Nukleinsäuremolekül, das für ein biosynthetisches
Exopolysaccharid-Enzym von Methylomonas sp. mit einer veränderten
biologischen Aktivität
kodiert, kann mittels eines Verfahrens hergestellt werden, das die
folgenden Schritte umfasst:
- (i) Aufschließen eines
Gemischs aus erfindungsgemäßen Nukleotidsequenzen
oder wie in jedweder der SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 oder
17 dargelegten Nukleotidsequenzen mit Restriktionsendonukleasen,
worin das Gemisch Folgendes umfasst:
a) Ein natives mikrobielles
Gen;
b) eine erste Population aus Nukleotid-Fragmenten, die
an die native mikrobielle Sequenz hybridisieren;
c) eine zweite
Population aus Nukleotid-Fragmenten, die nicht an die native mikrobielle
Sequenz hybridisieren;
worin ein Gemisch aus Restriktionsfragmenten
gebildet wird;
- (ii) Denaturieren des Gemischs aus Restriktionsfragmenten;
- (iii) Inkubieren des denaturierten Gemischs aus Restriktionsfragmenten
von Schritt (ii) mit einer Polymerase;
- (iv) Wiederholen der Schritte (ii) und (iii), worin ein mutiertes
mikrobielles Gen hergestellt wird, das für ein Protein mit einer veränderten
biologischen Aktivität
kodiert.
-
KURZE BESCHREIBUNG DER
ZEICHNUNGEN, SEQUENZBESCHREIBUNGEN UND BIOLOGISCHEN HINTERLEGUNGEN
-
1 zeigt
die DNA-Region, enthaltend gumD-, wza-, espB-, espM-, waaE-, espV-,
gumH- und Glycosyltransferase-Gene in Stamm 16a von Methylomonas
spp. Das Gen, das für
das Gen ugp, UDP-Glucosepyrophosphorylase,
kodiert, befindet sich in einer anderen Region.
-
Die
Erfindung kann anhand der folgenden ausführlichen Beschreibung und den
beiliegenden Sequenzbeschreibungen, die einen Teil dieser Anmeldung
bilden, vollständiger
verstanden werden.
-
Die
folgenden anhängenden
Sequenzbeschreibungen und Sequenzprotokolle hierzu befolgen die Vorschriften,
welche die Offenbarungen von Nukleotid- und/oder Aminosäuresequenzen
in Patentanmeldungen regeln, wie in 37 C.F.R. § 1.821–1.825 ausgeführt ist.
Die Sequenzbeschreibungen enthalten den Einbuchstabencode für Nukleotidsequenz-Zeichen
und die Dreibuchstabencodes für
Aminosäuren,
wie in Konformität mit
den IUPAC-IYUB-Standards definiert, die in Nucleic Acids Research
13:3021–3030
(1985) und im Biochemical Journal 219 (No. 2):345–373 (1984)
beschrieben sind. Die für
die Nukleotid- und Aminosäuresequenz-Daten
verwendeten Symbole und das Format befolgen die in 37 C.F.R. § 1.822 ausgeführten Vorschriften.
SEQ
ID NO:1 stellt die Nukleotidsequenz des ugp-Gens dar.
SEQ ID
NO:2 stellt die deduzierte Aminosäuresequenz des durch SEQ ID
NO:1 kodierten ugp-Gens
dar.
SEQ ID NO:3 stellt die Nukleotidsequenz von ORF 1, umfassend
das gumD-Gen dar.
SEQ ID NO:4 stellt die deduzierte Aminosäuresequenz
des durch ORF 3 kodierten gumD-Genproduktes dar.
SEQ ID NO:5
stellt die Nukleotidsequenz von ORF 2, umfassend das wza-Gen dar.
SEQ
ID NO:6 stellt die deduzierte Aminosäuresequenz von wza, dem durch
ORF 5 kodierten Genprodukt dar.
SEQ ID NO:7 stellt die Nukleotidsequenz
von ORF 3, umfassend das epsB-Gen dar.
SEQ ID NO:8 stellt die
deduzierte Aminosäuresequenz
von epsB, dem durch ORF 7 kodierten Genprodukt dar.
SEQ ID
NO:9 stellt die Nukleotidsequenz von ORF 4, umfassend das epsM-Gen
dar.
SEQ ID NO:10 stellt die deduzierte Aminosäuresequenz
des durch ORF 9 kodierten epsM-Genprodukts dar.
SEQ ID NO:11
stellt die Nukleotidsequenz von ORF 5, umfassend das waaE-Gen dar.
SEQ
ID NO:12 stellt die deduzierte Aminosäuresequenz des durch ORF 11
kodierten waaF-Genprodukts
dar.
SEQ ID NO:13 stellt die Nukleotidsequenz von ORF 6, umfassend
das epsV-Gen dar.
SEQ ID NO:14 stellt die deduzierte Aminosäuresequenz
des durch ORF 13 kodierten epsV-Genprodukts
dar.
SEQ ID NO:15 stellt die Nukleotidsequenz von ORF 7, umfassend
das gumH-Gen dar.
SEQ ID NO:16 stellt die deduzierte Aminosäuresequenz
des durch ORF 15 kodierten gumH-Genprodukts
dar.
SEQ ID NO:17 stellt die Nukleotidsequenz von ORF 8, umfassend
das Glycosyltransferase-Gen dar.
SEQ ID NO:18 stellt die deduzierte
Aminosäuresequenz
des durch ORF 17 kodierten Glycosyltransferase-Genprodukts dar.
-
Die
Anmelder nahmen die folgenden biologischen Hinterlegungen unter
den Bestimmungen des Budapester Vertrags über die internationale Anerkennung
der Hinterlegung von Mikroorganismen für die Zwecke von Patentverfahren
vor:
-
-
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
-
Die
an der Kodierung von Enzymen zur Herstellung von Exopolysaccharid
beteiligten Nukleinsäurefragmente
wurden aus einem Stamm von Methylomonas spp. (Stamm 16a) isoliert
und durch Vergleich mit öffentlichen
Datenbanken, enthaltend Nukleotid- und Proteinsequenzen, unter Verwendung
der dem Fachmann weithin bekannten BLAST- und FASTA-Algorithmen
identifiziert.
-
Die
erfindungsgemäß beschriebenen
Gene ermöglichen
die Überexpression
eines am Biosynthese-Weg
von Exopolysaccharid beteiligten Enzyms. Die Überexpression von erfindungsgemäßen Genen
in entweder einem natürlichen
Wirt, Methylomonas 16a, oder in heterologen Wirten führt zu einer
verbesserten Exopolysaccharid-Ausbeute, wobei sowohl Zeit als auch
Geld eingespart werden. Die erfindungsgemäßen Gene können außerdem mit Genen aus anderen
Wegen zur Herstellung von Enzymen mit unterschiedlicher Substratspezifität mutagenisiert
oder rekombiniert werden, wobei neue Polymere mit neuer Funktionalität produziert werden.
Eine derartig neue Funktionalität
kann neue Geliereigenschaften, Temperaturbeständigkeit und Suspensionsfähigkeit
einschließen.
-
Unter
einigen Umständen
ist die Herstellung von Exopolysacchariden nachteilig und ein System
zum Screening auf Inhibitoren der Exopolysaccharid-Synthese ist
nützlich.
So wird zum Beispiel angenommen, dass Exopolysaccharide in der Natur
eine wichtige Rolle bei der Erleichterung der bakteriellen Adhäsion und der
Bildung von Biofilmen spielen. Bakterielle Biofilme sind beim Biofouling
und Verstopfen von Rohrleitungen bei Herstellungsverfahren, die
Bakterien als eine Herstellungsplattform verwenden, impliziert.
Auf ähnliche Weise
ist in medizinischen Umgebungen die Bildung bakterieller Biofilme
problematisch. Sobald sich zum Beispiel ein Biofilm auf Transplantaten
oder Kathetern gebildet hat, ist eine von Bakterien ausgelöste Infektion sehr
schwer zu eradizieren. Deshalb besitzen Inhibitoren der Biofilmbildung
einen sehr signifikanten gewerblichen Wert, und die hier beschriebenen
Gene oder die Genprodukte können
als Targets zum Screening auf potenzielle Inhibitoren verwendet
werden.
-
In
dieser Offenbarung werden eine Reihe von Begriffen und Abkürzungen
verwendet. Die folgenden Definitionen werden bereitgestellt.
-
„Offener
Leserahmen" ist
als ORF abgekürzt.
-
„Polymerase-Kettenreaktion" ist als PCR abgekürzt.
-
Wie
hierin verwendet, werden die Begriffe „isoliertes Nukleinsäurefragment" und „isoliertes
Nukleinsäuremolekül" gegenseitig austauschbar
verwendet und man versteht darunter ein RNA- oder DNA-Polymer, das
ein- oder doppelsträngig
ist und optional synthetische, nicht natürliche oder veränderte Nukleotidbasen enthält. Ein
isoliertes Nukleinsäurefragment
in der Form eines DNA-Polymers kann sich aus einem oder mehr Segmenten)
von cDNA, genomischer DNA oder synthetischer DNA zusammensetzen.
-
Der
Begriff „ugp" verweist auf ein
Gen, das für
UDP-Glucose-pyrophosphorylase, UGP, kodiert.
-
Der
Begriff „gumD" verweist auf ein
Gen, das für
die Glycosyltransferase, GumD, kodiert.
-
Der
Begriff „wza" verweist auf ein
Gen, das für
das Polysaccharid-Exportprotein Wza kodiert.
-
Der
Begriff „epsB" verweist auf ein
Gen, das für
ein Polysaccharid-Exportprotein EpsB kodiert.
-
Der
Begriff „epsM" verweist auf ein
Gen, das für
das auf die Polysaccharid-Biosynthese bezogene Protein EpsM kodiert.
-
Der
Begriff „waaE" verweist auf ein
Gen, das für
die Glycosyltransferase, WaaE, kodiert.
-
Der
Begriff „epsV" verweist auf ein
Gen, das für
die Zucker-Transferase EpsV kodiert.
-
Der
Begriff „gumH" verweist auf ein
Gen, das für
die Galactosyltransferase, GumH, kodiert.
-
Der
Begriff „UDP" verweist auf Uridin-5-diphosphat.
-
Der
Begriff „UTP" verweist auf Uridin-5-triphosphat.
-
Wie
hierin verwendet versteht man unter dem Begriff „biosynthetischer Weg" von „Exopolysaccharid" oder „Polysaccharid" einen enzymatischen
Weg, umfassend die vorstehend beschriebenen Gene ugp, gumD, wza,
epsB, epsM, waaE, epsV und gumH. Unter dem Begriff „Exopolysaccharid-Gen" oder „Polysaccharid-Gen" versteht man jedwedes
Gen oder alle die Gene ugp, gumD, wza, epsB, epsM, waaE, epsV und
gumH. Unter dem Begriff „biosynthetisches
Exopolysaccharid-Enzym" oder „biosynthetisches
Polysaccharid-Enzym" versteht
man jedwedes Genprodukt oder alle die Genprodukte der Gene ugp,
gumD, wza, epsB, epsM, waaE, epsV und gumH.
-
Unter
dem Begriff „Monosaccharid" versteht man ein
einzelnes Polyhydroxyaldehyd oder Ketoneinheiten der allgemeinen
Formel (CH2O)n. „Polysaccharide" stellen Moleküle dar,
die viele Monosaccharideinheiten enthalten, die in langen linearen
oder verzweigten Ketten miteinander verbunden sind. Unter dem Begriff „Exopolysaccharid" versteht man jedwedes
biologisch hergestellte Polysaccharid, das von einer Zelle exkretiert wird.
-
Unter
dem Begriff „Embden-Meyerhof-Kohlenstoff-Weg" versteht man die
Reihe biochemischer Reaktionen zur Umwandlung von Hexosen, wie zum
Beispiel Glucose und Fructose, in wichtige zelluläre C3-Intermediärprodukte, wie zum Beispiel
Glyceraldehyd-3-phosphat, Dihydroxyacetonphosphat, Phosphoenolpyruvat
und Pyruvat. Diese Reaktionen laufen in der Regel mit einer Nettoausbeute
der biochemisch nützlichen Energie
in der Form von ATP ab. Bei den wichtigsten Enzymen, die für den Embden-Meyerhof-Kohlenstoff-Weg
einzigartig sind, handelt es sich um die Phosphofructokinase und
Fructose-1,6-bisphosphat-aldolase.
-
Unter
dem Begriff „Entner-Douderoff-Weg" versteht man eine
Reihe von biochemischen Reaktionen zur Umwandlung von Hexosen, wie
zum Beispiel Glucose oder Fructose, in wichtige zelluläre C3-Intermediärprodukte, Pyruvat und Gyceraldehyd-3-phosphat,
ohne jedwede Nettoproduktion biochemisch nützlicher Energie. Die für den Entner-Douderoff-Weg
einzigartigen wichtigen Enzyme sind die 6-Phosphogluconat-dehydratase
und die Keto-desoxy-phosphogluconat-Aldolase.
-
Unter
dem Begriff „methanotropher
Bakterienstamm mit hohem Wachstum" versteht man ein Bakterium, das zum
Wachstum mit Methan oder Methanol als einzige Kohlenstoff- und Energiequelle
fähig ist,
die einen funktionellen Embden-Meyerhof-Kohlenstoff-Weg für den Kohlenstoffflux
besitzt, der zur Ausbeute von Zellmasse pro Gramm metabolisiertem
C1-Substrat führt. Unter dem hierin beschriebenen
spezifischen „methanotrophen
Bakterienstamm mit hohem Wachstum" versteht man „Methylomonas 16a" oder „16a", welche Begriffe
gegeneinander austauschbar verwendet werden.
-
Wie
hierin verwendet, verweist „im
Wesentlichen ähnlich" auf Nukleinsäurefragmente,
worin Änderungen
in einer oder mehr Nukleotidbase(n) zur Substitution von einer oder
mehr Aminosäure(n)
führen,
die sich aber nicht auf die funktionellen Eigenschaften des von
der DNA-Sequenz kodierten Proteins auswirken. „Im Wesentlichen ähnlich" verweist auch auf
Nukleinsäurefragmente,
worin sich Veränderungen
in einer oder mehr Nukleotidbase(n) nicht auf die Fähigkeit
des Nukleinsäurefragments
zum Vermitteln der Veränderung
der Genexpression durch Antisense- oder Cosuppressionstechnologie
auswirken. „Im
Wesentlichen ähnlich" verweist auch auf
Modifikationen der Nukleinsäurefragmente,
wie zum Beispiel Deletion oder Insertion von einer oder mehr Nukleotidbase(n),
die sich nicht im Wesentlichen auf die funktionellen Eigenschaften
des sich ergebenden Transkripts auswirken. Man sollte deshalb zur
Kenntnis nehmen, dass erfindungsgemäß mehr als die spezifischen
beispielhaften Sequenzen enthalten sind.
-
So
ist zum Beispiel im Stand der Technik überall bekannt, dass sich Veränderungen
in einem Gen, die zur Herstellung einer chemisch äquivalenten
Aminosäure
an einem gegebenen Ort führen,
sich aber nicht auf die funktionellen Eigenschaften des kodierten
Proteins auswirken, häufig
finden. Zu erfindungsgemäßen Zwecken
sind die Substitutionen als Austausch in einer der folgenden fünf Gruppen
wie folgt definiert:
- 1. Kleine aliphatische,
nicht polare oder leicht polare Reste: Ala, Ser, Thr (Pro, Gly);
- 2. polare, negativ geladene Reste und ihre Amide: Asp, Asn,
Glu, Gln;
- 3. polare, positiv geladene Reste: His, Arg, Lys;
- 4. große
aliphatische, nicht polare Reste: Met, Leu, Ile, Val (Cys); und
- 5. große
aromatische Reste: Phe, Tyr, Trp.
-
Folglich
kann ein Codon für
die Aminosäure
Alanin, eine hydrophobe Aminosäure,
durch ein Codon substituiert werden, das für einen anderen weniger hydrophoben
Rest (wie zum Beispiel Glycin) oder einen hydrophoberen Rest (wie
zum Beispiel Valin, Leucin oder Isoleucin) kodiert. Es kann auch
erwartet werden, dass Änderungen,
welche auf ähnliche
Weise zur Substitution eines negativ geladenen Restes für einen
anderen (wie zum Beispiel Asparaginsäure für Glutaminsäure) oder eines positiv geladenen
Restes für
einen anderen (wie zum Beispiel Lysin für Arginin) führen, ein
funktionell äquivalentes
Produkt produzieren.
-
In
vielen Fällen
würde also
nicht erwartet, dass Veränderungen
des Nukleotids, die zur Veränderung der
N-terminalen und C-terminalen Anteile des Proteinmoleküls führen, die
Aktivität
des Proteins verändern.
-
Jede
der vorgeschlagenen Modifikationen ebenso wie die Bestimmung der
Beibehaltung der biologischen Aktivität der kodierten Produkte befinden
sich durchaus im Kompetenzbereich des Durchschnittsfachmanns. Der
Fachmann erkennt zudem, dass im Wesentlichen ähnliche Sequenzen auch durch
ihre Fähigkeit definiert
werden können,
unter stringenten Bedingungen (0,1 X SSC, 0,1 % SDS, 65 °C und mit
2 X SSC, 0,1 % SDS gewaschen, gefolgt von 0,1 X SSC, 0,1 % SDS)
mit den hierin erläuterten
Sequenzen zu hybridisieren. Obwohl nicht im Rahmen der Ansprüche enthalten,
handelt es sich bei solchen im Wesentlichen ähnlichen Nukleinsäurefragmenten
um die Nukleinsäurefragmente,
deren DNA-Sequenzen mindestens zu 80 % mit der hierin berichteten
DNA-Sequenz der Nukleinsäurefragmente
identisch sind, z. B. können
solche Nukleinsäurefragmente
mindestens zu 90 % mit der hierin berichteten DNA-Sequenz der Nukleinsäurefragmente
identisch sein oder mindestens zu 95 % mit der hierin berichteten
DNA-Sequenz der Nukleinsäurefragmente
identisch sein.
-
Ein
Nukleinsäuremolekül ist mit
einem anderen Nukleinsäuremolekül, wie zum
Beispiel einer cDNA, genomischen DNA oder RNA „hybridisierbar", wenn sich eine
einsträngige
Form des Nukleinsäuremoleküls unter
geeigneten Bedingungen hinsichtlich der Temperatur und Ionenstärke der
Lösung
an das andere Nukleinsäuremolekül annealen
kann. Die Hybridisierungs- und Waschbedingungen sind gut bekannt
und in Sambrook, J., Fritsch, E. F. und Maniatis, T. Molecular Cloning:
A Laboratory Manual, zweite Auflage, Cold Spring Harbor Laboratory
Press, Cold Spring Harbor (1989), insbesondere Kapitel 11 und Tabelle
11.1 darin (hierin vollkommen unter Bezugnahme eingeschlossen) erläutert. Die
Bedingungen von Temperatur und Ionenstärke bestimmen die „Stringenz" der Hybridisierung.
Die Stringenzbedingungen können
zum Screening auf moderat ähnliche
Fragmente, wie zum Beispiel homologe Sequenzen aus entfernt verwandten
Organismen, bis zu sehr ähnlichen
Fragmenten, wie zum Beispiel Genen, die die funktionellen Enzyme
aus nahe verwandten Organismen duplizieren, angepasst werden. Die
Wäschen
nach der Hybridisierung bestimmen die Stringenzbedingungen. Ein
Set bevorzugter Bedingungen verwendet eine Reihe von Wäschen, beginnend
mit 6 X SSC, 0,5 % SDS 15 min bei Raumtemperatur, dann mit 2 X SSC,
0,5 % SDS 30 min bei 45 °C
wiederholt und danach zweimal mit 0,2 X SSC, 0,5 % SDS 30 min bei
50 °C wiederholt.
Ein bevorzugter Set stringenter Bedingungen verwendet höhere Temperaturen,
bei denen die Wäschen
identisch zu den Vorstehenden sind, außer dass die Temperatur der
letzten zwei 30 minütigen
Wäschen
in 0,2 X SSC, 0,5 % SDS auf 60 °C
erhöht
wurde. Ein anderer bevorzugter Set hoch stringenter Bedingungen
verwendet zwei endgültige
Wäschen
in 0,1 X SSC, 0,1 % SDS bei 65 °C.
Die Hybridisierung erfordert, dass die beiden Nukleinsäuren komplementäre Sequenzen enthalten,
obwohl abhängig
von der Stringenz der Hybridisierung Mismatches zwischen den Basen
möglich
sind. Die entsprechende Stringenz zur Hybridisierung von Nukleinsäuren hängt von
der Länge
der Nukleinsäuren und
dem Grad der Komplementierung, Variablen, die aus dem Stand der
Technik gut bekannt sind, ab. Je größer der Grad der Ähnlichkeit
oder Homologie zwischen den zwei Nukleotidsequenzen ist, um so größer ist
der Tm-Wert für
Hybriden von Nukleinsäuren,
die diese Sequenzen aufweisen. Die relative Stabilität (entspricht dem
höheren
Tm) der Hybridisierungen von Nukleinsäuren nimmt in der folgenden
Reihenfolge RNA:RNA, DNA:RNA, DNA:DNA ab. Für Hybriden von größerer Länge als
100 Nukleotide wurden Gleichungen zum Berechnen des Tm abgeleitet
(siehe Sambrook et al., vorstehend, 9.50–9.51). Für Hybridisierungen mit kürzeren Nukleinsäuren, d.
h. Oligonukleotiden wird die Position von Mismatches wichtiger und
die Länge
des Oligonukleotids bestimmt seine Spezifität (siehe Sambrook et al., vorstehend,
11.7–11.8).
Im Allgemeinen beträgt
die Länge
für eine
hybridisierbare Nukleinsäure
mindestens ca. 10 Nukleotide. Eine Minimumlänge für eine hybridisierbare Nukleinsäure beträgt bevorzugt
mindestens ca. 15 Nukleotide; bevorzugter mindestens ca. 20 Nukleotide;
und am bevorzugtesten beträgt
die Länge
mindestens 30 Nukleotide. Der Fachmann wird überdies erkennen, dass die
Temperatur und die Salzkonzentration der Waschlösung gegebenenfalls gemäß den Faktoren,
wie zum Beispiel der Länge
der Sonde, angepasst werden können.
-
Ein „wesentlicher
Anteil" einer Aminosäure oder
einer Nukleotidsequenz umfasst genug von der Aminosäuresequenz
eines Polypeptids oder der Nukleotidsequenz eines Gens zur putativen
Identifikation dieses Polypeptids oder Gens, entweder durch manuelle
Bewertung der Sequenz durch einen Fachmann oder durch einen Computer-automatisierten
Vergleich und einer Identifikation der Sequenz unter Verwendung
von Algorithmen, wie zum Beispiel BLAST (Basic Local Alignment Search
Tool; Altschul, S. F., et al., (1993) J. Mol. Biol. 215:403–410; siehe
auch www.ncbi.nlm.nih.gov/BLAST/). Im Allgemeinen ist eine Sequenz
von zehn oder mehr benachbarten Aminosäuren oder dreißig oder
mehr Nukleotiden notwendig, um ein Polypeptid- oder eine Nukleinsäuresequenz
putativ als homolog zu einem bekannten Protein oder Gen zu identifizieren.
In Bezug auf Nukleotidsequenzen können überdies Gen-spezifische Oligonukleotid-Sonden,
umfassend 20–30
benachbarte Nukleotide in Sequenz-abhängigen Verfahren der Genidentifikation
(z. B. Southern-Hybridisierung) und Isolation (z. B. in situ-Hybridisierung
von Bakterienkolonien oder Bakteriophagen-Plaques) verwendet werden. Außerdem können kurze
Oligonukleotide von 12–15
Basen als Amplifikations-Primer in PCR zum Erhalt eines bestimmten
Nukleinsäurefragments,
umfassend die Primer, verwendet werden. Demzufolge umfasst ein „wesentlicher
Anteil" einer Nukleotidsequenz
genug von der Sequenz, um ein Nukleinsäurefragment, umfassend die
Sequenz, spezifisch zu identifizieren und/oder zu isolieren. Die
vorliegende Beschreibung lehrt partielle oder komplette Aminosäure- und
Nukleotidsequenzen, die für
ein oder mehr bestimmtes) mikrobielles) Proteine) kodiert/kodieren.
Der Fachmann, der den Vorteil der wie hierin berichteten Sequenzen
hat, kann nun alle oder einen wesentlichen Anteil der offenbarten
Sequenzen für
dem Fachmann bekannte Zwecke verwenden. Hierin beansprucht werden
jedoch nur die isolierten Nukleinsäuresequenzen, die für das Polypeptid
von SEQ ID NO:4, einschließlich
SEQ ID NO:3 und einer dazu komplementären Nukleinsäure kodieren.
-
Der
Begriff „komplementär" wird zur Beschreibung
des Verhältnisses
zwischen Nukleotidbasen verwendet, die zur Hybridisierung aneinander
fähig sind.
In Bezug auf DNA ist Adenosin zum Beispiel komplementär zu Thymin
und Cytosin ist komplementär
zu Guanin. Demzufolge sind erfindungsgemäß isolierte Nukleinsäurefragmente
eingeschlossen, die zu den Sequenzen, die für das Polypeptid von SEQ ID
NO: 4 kodieren, komplementär
sind.
-
Der
aus dem Stand der Technik bekannte Begriff „Identität in Prozent" stellt ein Verhältnis zwischen zwei
oder mehr Polypeptidsequenzen oder zwei oder mehr Polynukleotidsequenzen,
wie durch den Vergleich der Sequenzen bestimmt, dar. Im Stand der
Technik versteht man unter „Identität" je nachdem auch
den Grad der Verwandtschaft von Sequenzen zwischen Polypeptid- oder
Polynukleotidsequenzen wie durch das Match zwischen den Strings
solcher Sequenzen bestimmt wurde. „Identität" und „Ähnlichkeit" können
ohne weiteres anhand bekannter Verfahren berechnet werden, einschließlich, aber
nicht begrenzt auf die, die in Computational Molecular Biology (Lesk,
A. M., Hrsg.) Oxford University Press, New York (1988); Biocomputing:
Informatics and Genome Projects (Smith. D. W., Hrsg.) Academic Press,
New York (1993): Computer Analysis of Sequence Data. Teil 1 (Griffin,
A. M., und Griffin, H. G., Hrsg.) Humana Press, NJ (1994), Sequence
Analysis in Molecular Biology (von Heinje, G., Hrsg.) Academic Press
(1987); und Sequence Analysis Primer (Gribskov, M. und Devereux,
J., Hrsg.) Stockton Press, NY (1991) beschrieben sind. Bevorzugte
Verfahren zur Bestimmung der Identität werden zum Erhalt des besten
Match zwischen den getesteten Sequenzen konzipiert. Verfahren zur
Bestimmung der Identität
und Ähnlichkeit
werden in öffentlich
zur Verfügung
stehenden Computer-Programmen
kodifiziert. Sequenz-Alignments und Identitätsberechnungen in Prozent können unter
Verwendung des Megalign-Programms des LASERGENE Bioinformatik-Rechnerpakets
(DNASTAR Inc., Madison, WI) durchgeführt werden. Mehrfaches Alignment
der Sequenzen wurde unter Verwendung des Clustalverfahrens zum Alignment
(Higgins und Sharp (1989) CABIOS 5:151–153) mit den Defaultparametern
(GAP PENALTY=10, GAP LENGTH PENALTY=10) durchgeführt. Defaultparameter für die paarweisen
Alignments unter Verwendung des Clustalverfahrens stellen KTUPLE
1, GAP PENALTY=3, WINDOW=5 und DIAGONALS SAVED=5 dar.
-
Obwohl
nicht beansprucht, kodieren geeignete Nukleinsäurefragmente (isolierte Polynukleotide)
für Polypeptide,
die mindestens zu ca. 70 %, bevorzugt mindestens zu ca. 80 % mit
den hierin berichteten Aminosäuresequenzen
identisch sind. Bevorzugte Nukleinsäurefragmente kodieren für Aminosäuresequenzen, die
zu ca. 85 % mit den hierin berichteten Aminosäuren identisch sind. Bevorzugtere
Nukleinsäurefragmente kodieren
für Aminosäuresequenzen,
die mindestens zu 90 % mit den hierin berichteten Aminosäuresequenzen identisch
sind. Am bevorzugtesten sind Nukleinsäurefragmente, die für Aminosäuresequenzen
kodieren, die mindestens zu 95 % mit den hierin berichteten Aminosäuresequenzen
identisch sind. Geeignete Nukleinsäurefragmente weisen nicht nur
die vorstehenden Homologien auf, sondern kodieren in der Regel für ein Polypeptid
mit mindestens 50 Aminosäuren,
bevorzugt mindestens 100 Aminosäuren,
bevorzugter mindestens 150 Aminosäuren, noch bevorzugter mindestens
200 Aminosäuren
und am bevorzugtesten mindestens 250 Aminosäuren.
-
Unter „Codon-Degeneriertheit" versteht man die
Beschaffenheit des genetischen Codes, die eine Variation der Nukleotidsequenz
zulässt,
ohne sich auf die Aminosäuresequenz
eines kodierten Polypeptids auszuwirken. Demzufolge bezieht sich
die Patentbeschreibung auf jedwedes Nukleinsäurefragment, das für die Aminosäuresequenz
kodiert, die für
das wie in SEQ ID NO: 4 dargelegte vorliegende mikrobielle Polypeptid kodiert.
Der Fachmann wird sich sehr wohl des „Codon-Bias" bewusst sein, der
durch eine spezifische Wirtszelle bei der Usage von Nukleotid-Codonen
zur Spezifizierung einer gegebenen Aminosäure aufgewiesen wird. Wenn
folglich ein Gen zur verbesserten Expression in einer Wirtszelle
synthetisiert wird, ist es wünschenswert,
das Design des Gens dergestalt auszulegen, dass sich seine Frequenz
der Codon Usage der Frequenz der bevorzugten Codon Usage der Wirtszelle
annähert.
-
„Synthetische
Gene" können aus
Oligonukleotid-Bausteinen assembliert werden, die unter Verwendung
der dem Fachmann bekannten Verfahren chemisch synthetisiert werden.
Diese Bausteine werden zur Bildung von Gensegmenten, die dann zur
Konstruktion des gesamten Gens enzymatisch assembliert werden, ligiert
und annealt. Unter „chemisch
synthetisiert",
wie in Bezug auf eine DNA-Sequenz, versteht man, dass die Nukleotid-Komponenten
in vitro assembliert wurden Eine manuelle chemische Synthese von
DNA kann unter Verwendung gut etablierter Verfahren erreicht werden,
oder es kann eine automatisierte chemische Synthese unter Verwendung
einer Reihe von gewerblich erhältlichen
Geräten
durchgeführt
werden. Demgemäß können die
Gene zur optimalen Genexpression basierend auf der Optimierung der
Nukleotidsequenz zur Widerspiegelung des Codon-Bias der Wirtszelle
maßgeschneidert
werden. Der Fachmann erkennt die Likelihood der erfolgreichen Genexpression,
wenn die Codon Usage in Richtung der vom Wirt begünstigten
Codonen ausgerichtet ist. Die Bestimmung bevorzugter Codonen kann
auf einem Gen-Survey basieren, der sich von der Wirtszelle herleitet,
wo Sequenzinformationen verfügbar
sind.
-
Unter „Gen" versteht man ein
Nukleinsäurefragment,
das ein spezifisches Protein, einschließlich Regulationssequenzen
vor (nicht kodierende Sequenzen an 5') und nach (nicht kodierende Sequenzen
an 3') der Kodierungssequenz
exprimiert. Unter „nativem
Gen" versteht man
ein Gen, wie es in der Natur vorkommt, mit seinen eigenen Regulationssequenzen.
Unter „chimärem Gen" versteht man jedwedes
Gen, bei dem es sich nicht um ein natives Gen handelt, umfassend
Regulations- und Kodierungssequenzen, die nicht zusammen in der
Natur vorkommen. Ein chimäres
Gen kann demgemäß Regulationssequenzen
und Kodierungssequenzen umfassen, die sich von verschiedenen Quellen
herleiten, oder Regulationssequenzen und Kodierungssequenzen, die
sich von der gleichen Quelle herleiten, aber in einer Weise angeordnet
sind, die sich von der in der Natur gefundenen unterscheidet. Unter „endogenem
Gen" versteht man
ein natives Gen an seinem natürlichen Ort
im Genom eines Organismus. Unter einem „Fremdgen" versteht man ein Gen, das in der Regel
nicht im Wirtsorganismus gefunden wird, das aber mittels Gentransfer
in den Wirzsorganismus eingeführt
wird. Fremdgene können
native Gene, die in einen nicht nativen Organismus insertiert werden,
oder chimäre
Gene umfassen. Unter einem „Transgen" versteht man ein
Gen, das durch ein Transformationsverfahren in das Genom eingeführt wurde.
-
Unter „Kodierungssequenz" versteht man eine
DNA-Sequenz, die für
eine spezifische Aminosäuresequenz
kodiert. Unter „geeigneten
Regulationssequenzen" versteht
man Nukleotidsequenzen, die sich oberstromig in (nicht kodierende
Sequenzen an 5')
oder unterstromig (nicht kodierende Sequenzen an 3') von einer Kodierungssequenz
befinden und die die Transkription, das RNA-Processing oder die
-stabilität
oder Translation der assoziierten Kodierungssequenz beeinflussen.
Regulationssequenzen können
Promotoren, Translationsleader-Sequenzen, Introne, Polyadenylierungs-Erkennungssequenzen,
einen RNA-Processing-Ort,
einen Effektorbindungsort und eine Stem-Loop-Struktur einschließen.
-
Unter „Promotor" versteht man eine
DNA-Sequenz, die zur Kontrolle der Expression einer Kodierungssequenz
oder funktionellen RNA fähig
ist. Im Allgemeinen befindet sich eine Kodierungssequenz am 3'-Ende an einer Promotorsequenz.
Promotoren können
sich in ihrer Gesamtheit von einem nativen Gen herleiten oder sich
aus verschiedenen Elementen zusammensetzen, die sich von verschiedenen
in der Natur vorkommenden Promotoren herleiten oder sogar synthetische
DNA-Segmente umfassen. Ein Fachmann wird erkennen, dass verschiedene
Promotoren die Expression eines Gens in verschiedenen Geweben oder
Zelltypen oder auf verschiedenen Stufen der Entwicklung oder als
Response auf verschiedene umweltabhängige oder physiologische Bedingungen
richten können.
Unter Promotoren, welche ein Gen veranlassen, in den meisten Zelltypen die
meiste Zeit über
exprimiert zu werden, bezeichnet man im Allgemeinen als „konstitutive
Promotoren". Es wird
weiter erkannt, dass DNA-Fragmente unterschiedlicher Längen eine
identische Promotor-Aktivität
aufweisen können,
da in den meisten Fällen
die genauen Grenzen der Regulationssequenzen nicht vollständig definiert
wurden.
-
Unter
den „nicht
kodierenden Sequenzen an 3'" versteht man DNA-Sequenzen,
die sich unterstromig von einer Kodierungssequenz befinden und Polyadenylierungs-Erkennungssequenzen
und andere Sequenzen einschließen,
die für
Regulationssignale kodieren, die zur Bewirkung des mRNA-Processings
oder der Genexpression fähig
sind. Das Polyadenylierungssignal ist im Allgemeinen durch die Bewirkung
der Addition von Polyadenylsäure-Schwänzen an
das 3'-Ende des
mRNA-Präkursors
gekennzeichnet.
-
Unter „RNA-Transkript" versteht man das
Produkt, das sich aus der RNA-Polymerasekatalysierten Transkription
einer DNA-Sequenz ergibt. Wenn es sich bei dem RNA-Transkript um
eine perfekte komplementäre
Kopie der DNA-Sequenz handelt, wird auf sie als auf das primäre Transkript
verwiesen oder es kann sich um eine RNA-Sequenz handeln, die sich
von dem posttranskriptionalen Processing des primären Transkripts herleitet
und auf die als auf die mature RNA verwiesen wird. Unter „messenger-RNA
(mRNA)" versteht
man die RNA, die ohne Intronen ist und die durch die Zelle in Protein
translatiert werden kann. Unter „cDNA" versteht man eine doppelsträngige DNA,
die zur mRNA komplementär
ist und sich von ihr herleitet. Unter „Sense-RNA" versteht man ein RNA-Transkript, das
die mRNA einschließt
und auf diese Weise durch die Zelle in Protein translatiert werden
kann. Unter „Antisense-RNA" versteht man ein
RNA-Transkript, das zum gesamten oder einem Teil eines primären Target-Transkripts
oder zur mRNA komplementär
ist und das die Expression eines Target-Gens blockiert (US-Patent
Nr. 5,107,065; WO 9928508). Die Komplementarität einer Antisense-RNA kann
mit jedwedem Teil des spezifischen Gen-Transkripts, d. h., der nicht
kodierenden Sequenz an 5', der
nicht kodierenden Sequenz an 3' oder
der Kodierungssequenz bestehen. Unter „funktioneller RNA" versteht man eine
Antisense-RNA, Ribozym-RNA oder andere RNA, die bisher nicht translatiert
wurde, die aber dennoch eine Wirkung auf die zellulären Vorgänge ausübt.
-
Unter
dem Begriff „funktionsfähig verknüpft" versteht man die
Assoziation von Nukleinsäuresequenzen auf
einem einzelnen Nukleinsäurefragment,
so dass die Funktion des einen von dem anderen beeinflusst wird. So
ist zum Beispiel ein Promotor funktionsfähig mit einer Kodierungssequenz
verknüpft,
wenn er dazu fähig ist,
die Expression dieser Kodierungssequenz zu beeinflussen (d. h. dass
sich die Kodierungssequenz unter der transkriptionalen Kontrolle
des Promoters befindet). Kodierungssequenzen können funktionsfähig mit
den Regulationssequenzen in der Sense- oder Antisense-Orientierung
verknüpft
sein.
-
Unter
dem Begriff „Expression", wie hierin verwendet,
versteht man die Transkription und stabile Akkumulation von Sense-(mRNA)
oder Antisense-RNA, die sich vom erfindungsgemäßen Nukleinsäurefragment herleiten.
Die Expression kann auch auf die Translation von mRNA in ein Polypeptid
verweisen.
-
Unter „maturem" Protein versteht
man ein posttranslational verarbeitetes Polypeptid, d. h. eines,
aus dem jedwede vorliegenden Prä-
oder Propeptide im primären
Translationsprodukt entfernt wurden. Unter „Präkursor"-Protein versteht man das primäre Produkt
der mRNA-Translation; d. h. worin die Prä- und Propeptide noch vorliegen. Prä- und Propeptide
können
gegebenenfalls auf die intrazellulären Lokalisierungssignale beschränkt sein,
sind aber nicht darauf beschränkt.
-
Unter
dem Begriff „Signalpeptid" versteht man ein
Amino-terminales Polypeptid, das dem sezernierten maturen Protein
vorausgeht. Das Signalpeptid wird vom maturen Protein abgespalten
und liegt deshalb nicht in ihm vor. Signalpeptide weisen die Funktion
des Richtens und Translozierens sezernierter Proteine durch die Zellmembranen
auf. Unter Signalpeptid versteht man auch ein Signalprotein.
-
Unter „Transformation" versteht man den
Transfer eines Nukleinsäurefragments
in das Genom eines Wirtsorganismus, was zu genetisch stabilem Erbgut
führt.
Unter Wirtsorganismen, enthaltend die transformierten Nukleinsäurefragmente,
versteht man „transgene" oder „rekombinante" oder „transformierte" Organismen.
-
Unter
den Begriffen „Plasmid", „Vektor" und „Kassette" versteht man ein
zusätzliches
chromosomales Element, das oft Gene trägt, die nicht Teil des zentralen
Metabolismus der Zelle bilden, und gewöhnlich in der Form von ringförmigen doppelsträngigen DNA-Molekülen vorliegen.
Solche Elemente können
autonom replizierende Sequenzen, Genom-integrierende Sequenzen,
Phagen- oder Nukleotidsequenzen, lineare oder ringförmige, von
einer ein- oder doppelsträngigen
DNA oder RNA darstellen, die sich von jedweder Quelle herleiten,
worin eine Anzahl an Nukleotidsequenzen in einer einzigartigen Konstruktion
zusammengefügt
oder rekombiniert wurden, die zum Einführen eines Promotor-Fragments
und einer DNA-Sequenz für
ein ausgewähltes
Genprodukt zusammen mit einer angemessenen nicht translatierten
Sequenz an 3' in
eine Zelle fähig
ist. Unter „Transformationskassette" versteht man einen
spezifischen Vektor, enthaltend ein Fremdgen und mit Elementen zusätzlich zum
Fremdgen, die die Transformation einer bestimmten Wirtszelle erleichtert.
Unter „Expressionskassette" versteht man einen
spezifischen Vektor, enthaltend ein Fremdgen und mit Elementen zusätzlich zum
Fremdgen, die eine verstärkte
Expression dieses Gens in einem Fremdwirt ermöglicht.
-
Unter
dem Begriff „veränderte biologische
Aktivität" versteht man eine
Aktivität,
die mit einem Protein assoziiert ist, das durch eine mikrobielle
Nukleotidsequenz kodiert wird, die durch ein Assay-Verfahren gemessen
werden kann, worin diese Aktivität
entweder größer als
oder geringer als die mit der nativen mikrobiellen Sequenz assoziierte
Aktivität
ist. Unter „verstärkter biologischer
Aktivität" versteht man eine
veränderte
Aktivität,
die größer als
die mit der nativen Sequenz assoziierte ist. Unter „verminderter
biologischer Aktivität" versteht man eine
veränderte
Aktivität,
die geringer als die mit der nativen Sequenz assoziierte ist.
-
Unter
dem Begriff „Sequenzanalysen-Software" versteht man jedweden
Computer-Algorithmus oder jedwedes Computer-Software-Programm, das
für die
Analyse der Nukleotid- oder Aminosäuresequenzen nützlich ist.
Die „Sequenzanalysen-
Software" kann gewerblich
erhältlich
sein oder unabhängig
entwickelt werden. Die typische Sequenzanalysen-Software schließt Folgendes
ein, ist aber nicht darauf beschränkt: das GCG-Programmpaket
(Wisconsin Package Version 9.0, Genetics Computer Group (GCG), Madison,
WI), BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol. 215:403–410 (1990)
und DNASTAR (DNASTAR, Inc. 1228 S. Park St. Madison, WI 53715 USA).
Im Rahmen dieser Anmeldung ist zur Kenntnis zu nehmen, dass wenn
die Sequenzanalysen-Software zur Analyse verwendet wird, die Analysenergebnisse,
sofern nicht anderweitig spezifiziert ist, auf die „Defaultwerte" des angegebenen
Programms bezogen sind. Wie hierin verwendet, versteht man unter „Defaultwerten" jedweden Set von
Werten oder Parametern, die ursprünglich mit der Software geladen
werden, wenn diese zuerst initialisiert wird.
-
Die
hier verwendete rekombinante Standard-DNA und die molekularen Klonierungsverfahren
sind im Stand der Technik weithin bekannt und werden von Sambrook,
J., Fritsch, E. F. und Maniatis, T., Molecular Cloning: A Laboratory
Manual, zweite Auflage, Cold Spring Harbor Laboratory Press, Cold
Spring Harbor, NY (1989) (hierin nachstehend „Maniatis"); und von Silhavy, T. J., Bennan, M.
L. und Enquist, L. W., Experiments with Gene Fusions, Cold Spring
Harbor Laboratory Cold Press Spring Harbor, NY (1984); und von Ausubel,
F. M. et al., Current Protocols in Molecular Biology, veröffentlicht
von der Greene Publishing Assoc. und Wiley-Interscience (1987),
beschrieben.
-
ISOLATION
VON HOMOLOGEN
-
Die
erfindungsgemäßen Nukleinsäurefragmente
können
zum Isolieren von Genen verwendet werden, die für homologe Proteine aus der
gleichen oder anderen mikrobiellen Spezies kodieren. Die Isolierung
homologer Gene unter Verwendung Sequenz-abhängiger Protokolle ist aus dem
Stand der Technik weithin bekannt. Beispiele von Sequenz-abhängigen Protokollen
schließen
folgende ein, sind aber nicht darauf beschränkt: Verfahren der Nukleinsäurehybridisierung
und Verfahren der DNA- und RNA-Amplifikation, wie durch verschiedene
Verwendungsmöglichkeiten
von Nukleinsäure-Amplifikationstechnologien
(z. B. Polymerase-Kettenreaktion (PCR), Mullis et al., US-Patent
4,683,202), Ligase-Kettenreaktion (LCR), Tabor, S. et al., Proc.
Acad. Sci. USA 82, 1074, (1985)) oder Strangverdrängungsamplifikation
(SDA, Walker, et al., Proc. Natl. Acad. Sci. USA, 89, 392, (1992))
erläutert
wird.
-
So
könnten
zum Beispiel Gene, die für ähnliche
wie die erfindungsgemäßen Proteine
oder Polypetide kodieren, unter Verwendung von allen oder einem
Anteil der vorliegenden Nukleinsäurefragmente
als DNA-Hybridisierungssonden zum Screening von Bibliotheken von
jedweden gewünschten
Bakterien unter Verwendung der Methodologie, die dem Fachmann weithin
bekannt ist, direkt isoliert werden. Auf den vorliegenden Nukleinsäuresequenzen
basierende spezifische Oligonukleotid-Sonden können durch aus dem Stand der Technik
bekannte Verfahren ausgelegt und synthetisiert werden (Maniatis).
Die gesamten Sequenzen können überdies
direkt zum Synthetisieren von DNA-Sonden mittels den dem Fachmann
bekannten Verfahren, wie zum Beispiel DNA-Markierung mit Zufallsprimern,
Nick-Translation oder Endmarkierungsverfahren, oder RNA-Sonden unter
Verwendung verfügbarer
in vitro-Transkriptionssysteme verwendet werden. Spezifische Primer
können
außerdem
zur Amplifikation eines Teils oder der vollen Länge der vorliegenden Sequenzen
ausgelegt und verwendet werden. Die sich ergebenden Amplifikationsprodukte
können
während
der Amplifikationsreaktionen direkt markiert werden oder nach den
Amplifikationsreaktionen markiert und als Sonden zur Isolation von
DNA-Fragmenten voller Länge
unter Bedingungen von angemessener Stringenz verwendet werden.
-
Bei
Amplifikationsverfahren des PCR-Typs weisen die Primer in der Regel
verschiedene Sequenzen auf und sind nicht komplementär zueinander.
In Abhängigkeit
von den gewünschten
Testbedingungen sollten die Sequenzen der Primer zur Bereitstellung
sowohl für
eine effiziente als auch getreue Replikation der Target-Nukleinsäure ausgelegt
sein. Verfahren zum PCR-Primerdesign sind üblich und aus dem Stand der
Technik weithin bekannt. (Thein and Wallace, „The use of oligonucleotide
as specific hybridization probes in the Diagnosis of Genetic Disorders", in Human Genetic
Diseases: A Practical Approach, K. E. Davis Hrsg., (1986) S. 33–50, IRL
Press, Hemdon, Virginia); Rychlik, W. (1993) in White, B. A. (Hrsg.).
Methods in Molecular Biology. Vol. 15, Seiten 31–39, PCR Protocols: Current
Methods and Applications. Humania Press, Inc., Totowa, NJ.)
-
Im
Allgemeinen können
in Polymerase-Kettenreaktionsprotokollen zum Amplifizieren langer
Nukleinsäurefragmente,
die für
homologe Gene aus DNA oder RNA kodieren, zwei kurze Segmente der
vorliegenden Sequenzen verwendet werden. Die Polymerase-Kettenreaktion
kann auch an einer Bibliothek aus klonierten Nukleinsäurefragmenten
durchgeführt
werden, worin sich die Sequenz von einem Primer von den vorliegenden
Nukleinsäurefragmenten
herleitet, und die Sequenz vom anderen Primer den Vorteil des Vorliegens
der Polyadenylsäure-Schwänze am 3'-Ende des mRNA-Präkursors,
der für
mikrobielle Gene kodiert, wahrnimmt. Als Alternative kann die zweite
Primer-Sequenz auf Sequenzen basiert sein, die sich vom Klonierungsvektor herleiten.
So kann der Fachmann zum Beispiel das RACE-Protokoll (Frohman et
al., PNAS USA 85:8998 (1988)) zum Generieren von cDNAs unter Verwendung
der PCR zur Amplifikation von Kopien der Region zwischen einem einzelnen
Punkt im Transkript und dem 3'-
oder 5'-Ende befolgen.
In den 3'- und 5'-Richtungen orientierte
Primer können
aus den vorliegenden Sequenzen konzipiert werden. Unter Verwendung
von gewerblich erhältlichen
3'-RACE- oder 5'-RACE-Systemen (BRL)
können
spezifisch cDNA-Fragmente an 3' oder 5' isoliert werden
(Ohara et al., PNAS USA 86:5673 (1989); Loh et al., Science 243:217
(1989)).
-
Die
vorliegenden Sequenzen können
als Alternative als Hybridisierungsreagenzien zur Identifikation von
Homologen eingesetzt werden. Die grundlegenden Komponenten eines
Nukleinsäure-Hybridisierungstests
schließen
eine Sonde, eine Probe, die vermutlich das Gen oder Genfragment
von Interesse enthält,
und ein spezifisches Hybridisierungsverfahren ein. Bei den Sonden
handelt es sich in der Regel um einsträngige Nukleinsäuresequenzen,
die zu den nachzuweisenden Nukleinsäuresequenzen komplementär sind.
Die Sonden sind an die nachzuweisende Nukleinsäuresequenz „hybridisierbar". Die Sondenlänge kann
von 5 Basen bis zu Zehntausenden von Basen variieren und hängt vom
durchzuführenden
spezifischen Test ab. Eine Sondenlänge von ca. 15 Basen bis ca.
30 Basen ist in der Regel geeignet. Es braucht nur ein Teil des
Sondenmoleküls
komplementär
zur nachzuweisenden Nukleinsäuresequenz
zu sein. Außerdem
braucht die Komplementarität
zwischen der Sonde und der Targetsequenz nicht perfekt zu sein.
Die Hybridisierung tritt zwischen Imperfekt komplementären Molekülen mit
dem Ergebnis auf, dass eine bestimmte Fraktion der Basen in der
hybridisierten Region nicht mit der richtigen komplementären Base
gepaart ist.
-
Die
Hybridisierungsverfahren sind gut definiert. Die Sonde und Probe
müssen
in der Regel unter Bedingungen gemischt werden, die die Nukleinsäurehybridisierung
zulassen. Dies beinhaltet das Kontaktieren der Sonde und Probe in
Gegenwart eines anorganischen oder organischen Salzes unter den
ordnungsgemäßen Konzentrations-
und Temperaturbedingungen. Die Sonden- und Probennukleinsäuren müssen sich
lange genug in Kontakt miteinander befinden, damit eine mögliche Hybridisierung
zwischen der Sonde und Probennukleinsäure auftreten kann. Die Konzentration
von Sonde oder Target im Gemisch bestimmen die Zeit, die bis zum
Auftreten der Hybridisierung notwendig ist. Je höher die Sonden- oder Target-Konzentration
ist, um so kürzer
ist die für
die Hybridisierung benötigte
Inkubationszeit. Optional kann ein chaotropes Mittel zugefügt werden.
Das chaotrope Mittel stabilisiert Nukleinsäuren durch Inhibition der Nuklease-Aktivität. Das chaotrope Mittel
ermöglicht überdies
die empfindliche und stringente Hybridisierung von kurzen Oligonukleotid-Sonden bei
Raumtemperatur [Van Ness und Chen (1991) Nucl. Acids Res. 19:5143–5151].
Zu geeigneten chaotropen Mitteln gehören: Guanidiniumchlorid, Guanidiniumthiocyanat,
Natriumthiocyanat, Lithiumtetrachloracetat, Natriumperchlorat, Rubidiumtetrachloracetat,
Kaliumiodid und Cäsiumtrifluoracetat
u.a. Das chaotrope Mittel liegt in der Regel in einer Endkonzentration
von ca. 3 M vor. Gegebenenfalls kann man dem Hybridisierungsgemisch
Formamid, in der Regel 30–50
Vol-%, zufügen.
-
Es
können
verschiedene Hybridisierungslösungen
eingesetzt werden. Diese umfassen in der Regel von ca. 20 bis 60
Vol-%, bevorzugt 30 Vol-% eines polaren organischen Lösungsmittels.
Eine übliche
Hybridisierungslösung
setzt ca. 30–50
Vol-% Formamid, ca. 0,15 bis 1 M Natriumchlorid, ca. 0,05 bis 0,1
M Puffer, wie zum Beispiel Natriumcitrat, Tris-HCl, PIPES oder HEPES
(pH-Bereich ca. 6–9),
ca. 0,05 bis 0,2 % Detergens, wie zum Beispiel Natriumdodecylsulfat
oder zwischen 0,5 – 20
mM EDTA, FICOLL (Pharmacia Inc.) (ca. 300–500 Kilodalton (kD)), Polyvinylpyrrolidon
(ca. 250–500
kD) und Serumalbumin ein. Auch eingeschlossen in die typische Hybridisierungslösung werden
nicht markierte Träger-Nukleinsäuren von
ca. 0,1 bis 5 mg/ml, fragmentierte Nukleinsäure-DNA, z. B. DNA aus dem
Kalbsthymus oder Lachsspermata oder Hefe-RNA und optional von ca.
0,5 bis 2 % (w/v) Glycin. Andere Zusatzmittel können auch eingeschlossen werden,
wie zum Beispiel Volumenausschlussmittel, die viele verschiedene
polare, wasserlösliche
oder quellbare Mittel, wie zum Beispiel Polyethylenglykol, anionische
Polymere, wie zum Beispiel Polyacrylat oder Polymethylacrylat und
anionische Saccharid-Polymere, wie zum Beispiel Dextransulfat, einschließen.
-
Die
Nukleinsäure-Hybridisierung
ist auf viele verschiedene Assayformate anpassbar. Eines der geeignetsten
stellt das Sandwich-Assayformat dar. Der Sandwich-Assay ist insbesondere
an die Hybridisierung unter nicht denaturierenden Bedingungen anpassbar.
Eine primäre
Komponente eines Assays des Sandwich-Typs stellt einen festen Träger dar.
Der feste Träger
weist adsorbiert oder kovalent gekoppelt an ihn eine immobilisierte
Nukleinsäure-Sonde
auf, die nicht markiert und komplementär zu einem Anteil der Sequenz
ist.
-
REKOMBINANTE
EXPRESSION – MIKROBIELL
-
Das
durch Sequenzen repräsentierte
Gen, das für
das Polypeptid von SEQ ID NO:4 kodiert und das Genprodukt (das genannte
Polypeptid) der vorliegenden Sequenzen kann in heterologen Wirtszellen,
insbesondere in den Zellen mikrobieller Wirte hergestellt werden.
Die Expression in rekombinanten mikrobiellen Wirten kann für die Expression
von verschiedenen Intermediärprodukten
im Weg, für
die Modulation von Wegen, die bereits im Wirt für die Synthese neuer Produkte,
die bisher unter Verwendung des Wirts nicht möglich waren, nützlich sein.
Zusätzlich
können
die Genprodukte zur Verleihung höherer Wachstumsausbeuten
aus dem Wirt oder zur Ermöglichung
der Verwendung einer alternativen Wachstumsform genutzt werden.
-
Bevorzugte
heterologe Wirtszellen zur Expression der vorliegenden Nukleinsäuremoleküle stellen
mikrobielle Wirte dar, die in großen Zügen in den Pilz- oder Bakterienfamilien
gefunden werden und die über
einen weiten Bereich von Temperaturen, pH-Werten und Lösungsmitteltoleranzen
wachsen. Da der Transkriptions-, Translations- und biosynthetische
Protein-Apparat ungeachtet des zellulären Rohsubstrats gleich ist, werden
funktionelle Gene ungeachtet des zur Herbeiführung der zellulären Biomasse
verwendeten Kohlenstoff-Rohsubstrats exprimiert. Mikrobielles Wachstum
in großem
Umfang und die funktionelle Genexpression können eine weite Reihe einfacher
oder komplexer Kohlenhydrate, organischer Säuren und Alkohole, gesättigter
Kohlenwasserstoffe, wie zum Beispiel Methan oder Kohlendioxid, im
Fall von photosynthetischen oder chemoautotrophen Wirten verwerten.
Die funktionellen Gene können
jedoch durch spezifische Wachstumsbedingungen, die die Form und
Menge von Stickstoff, Phosphor, Schwefel, Sauerstoff, Kohlenstoff
oder jedwede Spur von Mikronährstoffen,
einschließlich
kleiner anorganischer Ionen einschließen können, reguliert, reprimiert
oder gedämpft
werden. Außerdem
kann die Regulation funktioneller Gene durch die An- oder Abwesenheit
spezifischer Regulationsmoleküle
erreicht werden, die der Kultur zugefügt werden können und in der Regel nicht
als Nährstoff-
oder Energiequellen in Betracht gezogen werden. Die Wachstumsrate
kann auch einen wichtigen Regulationsfaktor bei der Genexpression
darstellen. Beispiele von Wirtsstämmen schließen folgende ein, sind aber
nicht beschränkt
auf Pilz- oder Hefespezies, wie zum Beispiel Aspergillus, Trichoderma,
Saccharomyces, Pichia, Candida, Hansenula, oder Bakterienspezies,
wie zum Beispiel: Salmonella, Bacillus, Acinetobacter, Rhodococcus,
Streptomyces, Escherichia, Pseudomonas, Methylomonas, Methylobacter,
Alcaligenes, Synechocystis, Anabaena, Thiobacillus, Methanobacterium
und Klebsiella.
-
Von
besonderem erfindungsgemäßem Interesse
sind obligate Methanotrophe mit hohem Wachstum mit einem energetisch
vorteilhaften Kohlenstofffluxweg. So haben die Anmelder zum Beispiel
einen spezifischen Methanotrophen-Stamm mit mehreren Merkmalen des
Wegs entdeckt, der ihn für
die Kohlenstoffflux-Manipulation besonders nützlich macht. Dieser Stamm-Typ
hat in der vorliegenden Anmeldung als Wirt gedient und ist als Methylomonas
16a (ATCC PTA 2402) bekannt.
-
Der
vorliegende Stamm enthält
mehrere Anomalien im Kohlenstoffverwertungsweg. So wird zum Beispiel
gezeigt, dass basierend auf den Genom-Sequenzdaten, der Stamm Gene
für zwei
Wege des Hexosestoffwechsels enthält. Der Entner-Douderoff-Weg,
der das Keto-desoxy-phosphogluconat-Aldolaseenzym verwendet, ist in dem
Stamm anwesend. Es ist im Allgemeinen überall anerkannt, dass es sich
hierbei um den funktionsfähigen
Weg in obligaten Methanotrophen handelt. Auch anwesend ist jedoch
der Embden-Meyerhof-Kohlenstoff-Weg, der das Fructosebisphosphat-Aldolaseenzym
verwendet. Es ist weithin bekannt, dass dieser Weg entweder nicht
anwesend oder in obligaten Methanotrophen nicht funktionsfähig ist.
Aus energetischer Sicht ist der letztere Weg am vorteilhaftesten
und ermöglicht
eine größere Ausbeute
von biologisch nützlicher
Energie und letztendlich die Produktion einer Zellmasse und anderer
Zellmassen-abhängiger
Produkte in Methylomonas 16a. Die Aktivität dieses Wegs im vorliegenden
Stamm 16a wurde durch Mikroarray-Daten und biochemische Evidenz,
wobei die ATP-Reduktion gemessen wird, bestätigt. Obwohl gezeigt wurde,
dass der Stamm 16a Enzyme des Embden-Meyerhof-Kohlenstoff- ebenso wie des
Entner-Douderoff-Wegs besitzt, deuten die Daten darauf hin, dass die
Enzyme des Embden-Meyerhof-Kohlenstoff-Wegs stärker exprimiert werden als
die Enzyme des Entner-Douderoff-Wegs. Dieses Ergebnis ist überraschend
und läuft
der bestehenden Ansicht über
den glykolytischen Metabolismus von methanotrophen Bakterien zuwider. Die
Anmelder haben andere methanotrophe Bakterien mit diesen Charakteristika,
einschließlich
zum Beispiel Methylomonas clara und Methylosinus sporium, entdeckt.
Es ist möglich,
dass diese Aktivität
in Methanotrophen aufgrund des Aktivitätsmangels des Enzyms mit ATP,
dem typischen Phosphoryl-Donor für
das Enzym in den meisten Bakteriensystemen unentdeckt blieb. Ein
besonders neues und nützliches
Merkmal des Embden-Meyerhof-Kohlenstoff-Weges
im Stamm 16a besteht darin, dass der wichtige Phosphofructokinase-Schritt Pyrophosphat-
anstelle von ATP-abhängig
ist. Dieses Merkmal trägt
zur Energieausbeute des Weges unter Verwendung von Pyrophosphat
anstelle von ATP bei. Aufgrund seiner Signifikanz bei der Bereitstellung
eines energetischen Vorteils für
den Stamm wird dieses Gen im Kohlenstofffluxweg als diagnostisches
Mittel für
den vorliegenden Stamm in Betracht gezogen.
-
In
methanotrophen Bakterien wird Methan über einen als Ribulose-Monophosphat-Weg
oder RuMP-Zyklus bekannten cyclischen Reaktionsset in Biomoleküle umgewandelt.
Dieser Weg setzt sich aus drei Phasen zusammen, wobei jede Phase
aus einer Reihe von enzymatischen Schritten besteht. Der erste Schritt stellt
die „Fixierung" oder Inkorporation
von C1 (Formaldehyd) in eine Pentose zur
Bildung einer Hexose oder eines C6-Zuckers
dar. Dies tritt über
eine Kondensationsreaktion zwischen einem aus C5-Zucker
(Pentose) und Formaldehyd auf und wird durch die Hexulose-Monophosphat-Synthase
katalysiert. Die zweite Phase wird als „Spaltung" bezeichnet und führt zur Aufspaltung dieser
Hexose in zwei C3-Moleküle. Eines dieser C3-Moleküle wird über den
RuMP-Weg rezykliert und das andere C3-Fragment
wird für
das Zellwachstum genutzt. In Methanotrophen und Methylotophen kann
der RuMP-Weg als einer von drei Varianten auftreten. Im Allgemeinen werden
jedoch nur zwei dieser Varianten gefunden – der FBP/TA-Weg (Fructosebisphosphatase/Transaldolase-Weg)
oder der KDPG/TA-Weg (Keto-desoxyphospho-gluconat/Transaldolase-Weg).
(Dijkhuizen L., G.E. Devries. The Physiology and Biochemistry of
aerobic methanol-utilizing gram negative and gram positive bacteria.
In: Methane and Methanol Utilizers 1992, Hrsg. Colin Murrell und
Howard Dalton, Plenum Press NY.
-
Der
vorliegende Stamm ist in der Weise einzigartig, dass er die „Spaltungsschritte" handhabt, in denen Gene
gefunden wurden, die diese Umwandlung über Fructosebisphosphat als
ein Haupintermediärprodukt durchführen. Die
Gene für
die Fructosebisphosphat-Aldolase und Transaldolase wurden zusammengeclustert auf
einem DNA-Stück
gefunden. Zweitens wurde gefunden, dass die Gene für die andere
am Keto-desoxy-phosphogluconat-Intermediärprodukt beteiligte Variante
auch zusammengeclustert waren. Die zur Verfügung stehende Literatur lehrt,
dass sich diese Organismen (obligate Methylotrophe und Methanotrophe)
einzig auf den KDPG-Weg verlassen und dass der FBP-abhängige Fixierungsweg
von fakultativen Methylotophen genutzt wird (Dijkhuizen et al.,
vorstehend). Deshalb wird die letztere Beobachtung erwartet, die
erstere hingegen nicht. Der Befund für die FBP-Gene in einem obligaten
Methan-verwertenden Bakterium ist nicht nur überraschend, sondern deutet
auch auf seinen Nutzen hin. Der FBP-Weg ist aufgrund der Tatsache,
dass mehr Energie (ATP) als im KDPG-Weg verwertet wird, für den Wirtsorganismus
energetisch vorteilhaft. Folglich können Organismen, die den FBP-Weg
nutzen, einen energetischen Vorteil und Wachstumsvorteil gegenüber denen
aufweisen, die den KDPG-Weg nutzen. Dieser Vorteil kann auch für Energie
erfordernde Produktionswege im Stamm nützlich sein. Durch Verwendung
dieses Wegs kann ein Methan-verwertendes Bakterium einen Vorteil
gegenüber
anderen Methan-verwertenden Organismen als Produktionsplattformen
für entweder
Einzelzellprotein oder für
jedwedes andere sich vom Kohlenstofffluss durch den RuMP-Weg herleitende
Produkt aufweisen.
-
Gegenstand
der Erfindung stellt folglich die Bereitstellung eines Verfahrens
zur Herstellung von Exopolysaccharid unter Verwendung eines energetisch
vorteilhaften Stammes von Methylomonas dar, der
- (a)
auf einem C1-Kohlenstoffsubstrat wächst, der
aus der Gruppe ausgewählt
ist, die aus Methan und Methanol besteht; und
- (b) einen funktionellen Embden-Meyerhof-Kohlenstoff-Weg umfasst,
wobei der Weg ein Gen umfasst, das für ein Pyrophosphat-abhängiges Phosphofructokinase-Enzym
kodiert.
-
Mikrobielle
Expressionssysteme und Expressionsvektoren, die Regulationssequenzen
enthalten, welche die hochgradige Expression von Fremdproteinen
richten, sind dem Fachmann weithin bekannt. Jedwede von diesen könnten zur
Konstruktion chimärer
Gene zur Produktion von jedwedem der Genprodukte der vorliegenden
Sequenzen verwendet werden. Diese chimären Gene könnten dann über die Transformation zur
Bereitstellung einer hochgradigen Expression der Enzyme in entsprechende
Mikroorganismen eingeführt
werden.
-
Die
vorliegenden Gene sind außerdem
bei der Veränderung
der Eigenschaften der Wirtsmikrobe wirksam. So wird zum Beispiel
erwartet, dass Wirtszellen mit chimären Genen, die für eine oder
mehr der vorliegenden Sequenzen kodieren, um die Überexpression
von Exopolysaccharid zu induzieren oder die Produktion von Exopolysacchariden
durch Änderung
des Biosyntheseweges von Exopolysaccharid in Wirtszellen zur Reduktion
der Exopolysaccharidproduktion in Wirtszellen zur Reduktion der
Biofilmbildung zu manipulieren, transformiert werden können.
-
Für die Transformation
geeigneter Wirtszellen nützliche
Vektoren oder Kassetten sind aus dem Stand der Technik weithin bekannt.
Der Vektor oder die Kassette enthält in der Regel Sequenzen,
welche die Transkription und Translation des relevanten Gens, eines
selektierbaren Markers und von Sequenzen, welche die autonome Replikation
oder chromosomale Integration zulassen, richten. Geeignete Vektoren
umfassen eine Region 5' des
Gens, welches die transkriptionalen Initiationskontrollen beherbergt
und eine Region 3' des DNA-Fragments,
welche die transkriptionale Terminierung kontrolliert. Es ist am
bevorzugtesten, wenn sich beide Kontrollregionen von Genen herleiten,
die zur transformierten Wirtszelle homolog sind, obwohl man zur Kenntnis
nehmen sollte, dass sich solche Kontrollregionen nicht von den Genen
herzuleiten brauchen, die für die
als einen Produktionswirt gewählte
spezifische Spezies nativ sind.
-
Es
gibt zahlreiche Initiationskontrollregionen oder Promotoren, die
zum Antrieb der Expression der vorliegenden ORFs in der gewünschten
Wirtszelle nützlich
und dem Fachmann geläufig
sind. Fast jedweder Promotor, der zum Antrieb dieser Gene fähig ist,
ist erfindungsgemäß geeignet,
einschließlich
aber nicht begrenzt auf CYC1, HIS3, GAL1, GAL10, ADH1, PGK, PH05,
GAPDH, ADC1, TRP1, URA3, LEU2, ENO, TP1 (nützlich für die Expression in Saccharomyces);
A0X1 (nützlich
für die
Expression in Pichia); und lac, ara, tet, trp, IPL,
IPR, T7, tac, und trc (nützlich für die Expression in Escherichia
coli) ebenso wie die Promotoren amy, apr, npr und verschiedene Phagenpromotoren,
die für
die Expression in Bacillus nützlich
sind.
-
Die
Kontrollregionen für
die Termination können
sich auch von verschiedenen Genen herleiten, die für die bevorzugten
Wirte nativ sind. Optional könnte
ein Terminationsort unnötig
sein, es ist jedoch am bevorzugtesten, wenn er eingeschlossen ist.
-
PATHWAY-ENGINEERING
-
In
einer bevorzugten Ausführungsform
können
die vorliegenden Gene in verschiedenen methanotrophen Stämmen zur
Modulation oder Regulation der Produktion von Exopolysacchariden
verwendet werden. Das Gen und seine Sequenzen können auf viele verschiedene
Weisen zur Modulation bestehender Polysaccharidwege verwendet werden.
Verfahren zur Manipulation genetischer Wege sind aus dem Stand der
Technik allgemein und überall
bekannt. Ausgewählte
Gene in einem bestimmten Weg können
mithilfe einer Reihe verschiedener Verfahren up- oder downreguliert
werden. Ein Organismus in konkurrierenden Wegen kann durch Gen-Disruption
und ähnliche
Verfahren eliminiert oder sublimiert werden.
-
Sobald
ein wichtiger genetischer Weg identifiziert und sequenziert wurde,
können
spezifische Gene zur Erhöhung
der Leistung des Wegs upreguliert werden. So können zum Beispiel zusätzliche
Kopien der targetierten Gene in die Wirtszelle auf Multikopie-Plasmiden,
wie zum Beispiel pBR322, eingeführt
werden. Als Alternative können
die Target-Gene modifiziert werden, so dass sie sich unter der Kontrolle
von nicht nativen Promotoren befinden. Wenn erwünscht ist, dass ein Weg an
einem bestimmten Punkt in einem Zellzyklus oder während eines
Fermentierungslaufs arbeitet, können
regulierte oder induzierbare Promotoren zum Ersatz des nativen Promotors
des Target-Gens verwendet werden. Auf ähnliche Weise kann der native
oder endogene Promotor in einigen Fällen zur Steigerung der Genexpression
modifiziert werden. So können
zum Beispiel die endogenen Promotoren durch Mutation, Deletion und/oder
Substitution in vivo verändert
werden (siehe Kmiec, US-Patent 5,565,350; Zarling et al., PCT/US93/03868).
-
Als
Alternative kann es notwendig sein, die Expression bestimmter Gene
im Target-Weg oder in konkurrierenden Wegen, die als konkurrierende
Sammler für
Energie oder Kohlenstoff dienen können, zu reduzieren oder eliminieren.
Verfahren zum Downregulieren von Genen für diesen Zweck wurden exploriert.
Wo bekannt ist, dass die Sequenz des Gens unterbrochen ist, stellt
die targetierte Gen-Disruption eines der wirksamsten Verfahren der
Gen-Downregulation dar, wobei die Fremd-DNA in ein strukturelles
Gen insertiert wird, um auf diese Weise die Transkription zu unterbrechen.
Dies kann durch die Herbeiführung
von genetischen Kassetten bewirkt werden, umfassend die zu insertierende
DNA (oft einen genetischen Marker), die von einer Sequenz mit einer
hochgradigen Homologie zu einem Anteil des Gens, das disrupiert
werden soll, flankiert ist. Die Einführung der Kassette in die Wirtszelle
führt zur
Insertion der Fremd-DNA in das strukturelle Gen über die nativen DNA-Replikationsmechanismen
der Zelle. (Siehe zum Beispiel Hamilton et al. (1989) J. Bacteriol. 171:4617–4622, Balbas
et al. (1993) Gene 136:211–213,
Gueldener et al. (1996) Nucleic Acids Res. 24:2519–2524 und
Smith et al. (1996) Methods Mol. Cell. Biol. 5:270–277.)
-
Die
Antisense-Technologie stellt ein anderes Verfahren zur Downregulation
von Genen dar, wo die Sequenz des Target-Gens bekannt ist. Um dies
zu erreichen, wird ein Nukleinsäuresegment
aus dem gewünschten
Gen kloniert und funktionsfähig
mit einem Promotor dergestalt verknüpft, dass der Antisense-Strang
der RNA transkribiert wird. Dieses Konstrukt wird dann in die Wirtszelle
eingeführt,
und der Antisense-Strang der RNA wird produziert. Die Antisense-RNA
inhibiert die Genexpression durch Verhinderung der Akkumulation von
mRNA, die für
das Protein von Interesse kodiert. Es wird dem Fachmann bekannt
sein, dass mit der Verwendung der Antisense-Technologien spezielle
Erwägungen
assoziiert sind, um die Expression bestimmter Gene zu reduzieren.
So kann zum Beispiel der richtige Expressionsgrad der Antisense-Gene
die Verwendung verschiedener chimärer Gene erforderlich machen,
die sich verschiedene, dem Fachmann bekannte Regulationselemente
zunutze machen.
-
Obwohl
die targetierte Gen-Disruption und Antisense-Technologie wirksame
Mittel zur Downregulation von Genen bieten, bei denen die Sequenz
bekannt ist, wurden andere weniger spezifische Methodologien entwickelt,
die nicht Sequenz-basiert sind. So können zum Beispiel Zellen der
UV-Strahlung ausgesetzt
und dann auf den gewünschten
Phänotyp
gescreent werden. Die Mutagenese mit chemischen Mitteln ist auch
zur Generierung von Mutanten und häufig verwendeten Substanzen,
einschließlich
Chemikalien wirksam, die sich auf eine nicht replizierende DNA,
wie zum Beispiel HNO2 und NH2OH
auswirken, ebenso wie Mittel, die sich auf die Replikation von DNA
auswirken, wie zum Beispiel Acridin-Färbemittel, die dafür bekannt
sind, dass sie Frameshift-Mutationen verursachen. Spezifische Verfahren
zur Herbeiführung
von Mutanten unter Verwendung von Strahlung oder Chemikalien sind
im Stand der Technik gut dokumentiert. Siehe zum Beispiel Thomas D.
Brock in Biotechnology: A Textbook of Industrial Microbiology, zweite
Auflage (1989) Sinauer Associates, Inc., Sunderland, MA. oder Deshpande,
Mukund V., Appl. Biochem. Biotechnol., 36, 227, (1992).
-
Ein
anderes nicht spezifisches Verfahren der Gen-Disruption besteht
in der Verwendung von transposablen Elementen oder Transposons.
Transposons stellen genetische Elemente dar, die zufällig in
die DNA insertiert werden, aber später auf der Basis der Sequenz
zur Bestimmung zurückgewonnen
werden können, wo
die Inserion aufgetreten ist. Sowohl in vivo- als auch in vitro-Transpositionsverfahren
sind bekannt. Beide Verfahren beinhalten die Verwendung eines transposablen
Elements in Kombination mit einem Transposase-Enzyms. Wenn das transposable
Element oder Transposon mit einem Nukleinsäurefragment in Gegenwart der
Transposase in Kontakt gebracht wird, wird das transposable Element
zufällig
in das Nukleinsäurefragment insertiert.
Das Verfahren ist für
die zufällige
Mutagenese und für
die Genisolation nützlich,
da das disruptierte Gen auf der Basis der Sequenz des transposablen
Elements identifiziert werden kann. Kits für die in vitro-Transposition
sind gewerblich erhältlich
(siehe zum Beispiel das Primer Island Transposition Kit, erhältlich von
Perkin Elmer Applied Biosystems, Branchburg, NJ, basierend auf dem
Ty1-Element von Hefe; das Genome Priming System, erhältlich von
New England Biolabs, Beverly, MA; basierend auf dem bakteriellen
Transposon Tn7; und den EZ::TN Transposon Insertion Systems, erhältlich von
Epicentre Technologies, Madison, WI, basierend auf dem bakteriellen
transposablen Element Tn5.
-
Im
erfindungsgemäßen Kontext
könnte
es nützlich
sein, die Expression des Exopolysaccharid-Wegs zu modulieren. Wie
angemerkt wurde, weist der vorliegende Stamm die Fähigkeit
auf, Polysaccharide in großen
Mengen zu produzieren. Dieses Verfahren wird von einem Satz von
Genen, einschließlich
des ugp-Gens, der gumD- und gumH-Gene, der epsB-, epsM- und epsV-Gene
und des waaD-Gens
bestimmt. Während
es sich hierbei um keinen erfindungsgemäß beanspruchten Aspekt handelt,
kann es in diesem Weg von besonderer Bedeutung sein, die Upregulation
des an der Polymerisation und/oder dem Export des Polysaccharids beteiligten
espB-Gens oder des den Transfer von Zucker an die Polysaccharid-Intermediärprodukte
kontrollierenden epsY-Gens zu veranlassen.
-
PRODUKTION
IM INDUSTRIELLEN MAßSTAB
-
Wenn
die gewerbliche Produktion von Exopolysacchariden erwünscht ist,
können
eine Reihe verschiedener Kultur-Methodologien angewendet werden.
So kann zum Beispiel eine Produktion im großen Maßstab sowohl durch Batch- als
auch kontinuierliche Kulturmethodologien hergestellt werden.
-
Ein
klassisches Batch-Kulturverfahren stellt ein geschlossenes System
dar, worin die Zusammensetzung der Medien zu Beginn der Kultur eingestellt
wird und während
des Kultivierungsverfahrens keinen artifiziellen Veränderungen
unterliegt. Folglich werden die Medien zu Beginn des Kultivierungsverfahren
mit dem/den gewünschten
Organismus/Organismen inokuliert und das Auftreten von Wachstum
oder metabolischer Aktivität
ist zulässig,
wobei dem System nichts zugefügt
wird. Eine „Batch"-Kultur stellt jedoch
in der Regel in Bezug auf das Zufügen einer Kohlenstoffquelle
einen Batch dar, und es werden häufig
Versuche zur Kontrolle von Faktoren, wie zum Beispiel pH und der
Sauerstoffkonzentration, unternommen. In Batch-Systemen ändern sich
die Metabolit- und Biomassenzusammensetzungen des Systems ständig bis
zu dem Zeitpunkt, an dem die Kultur terminiert wird. In Batch-Kulturen
werden die Zellen durch eine statische lag-Phase bis zu einer log-Phase
mit hohem Wachstum und schließlich
zu einer stationären
Phase, in der die Wachstumsrate nachlässt oder stoppt, moderiert.
Wenn unbehandelt, sterben die sich in der stationären Phase
befindenden Zellen allmählich
ab. Zellen in der log-Phase sind häufig für den größten Teil der Produktion des
Endprodukts oder Intermediärprodukts
in einigen Systemen verantwortlich. Die Produktion in der stationären oder
postexponentiellen Phase kann in anderen Systemen erhalten werden.
-
Eine
Variation an dem Standardbatch-System stellt das Fed-Batch-System
dar. Fed-Batch-Kulturverfahren
sind erfindungsgemäß auch geeignet
und umfassen ein typisches Batch-System mit der Ausnahme, dass das
Substrat in Inkrementen mit fortschreitender Kultur zugefügt wird.
Fed-Batch-Systeme sind nützlich, wenn
eine Katabolit-Repression dazu neigt, den Metabolismus der Zellen
zu inhibieren und wo es wünschenswert
ist, dass man limitierte Substratmengen in den Medien hat. Die Messung
der tatsächlichen
Substratkonzentration in Fed-Batch-Systemen ist schwierig, und es
wird deshalb auf der Basis der Änderungen
der messbaren Faktoren, wie zum Beispiel pH, aufgelöstem Sauerstoff
und dem Partialdruck der Abfallgase, wie zum Beispiel CO2, ermittelt. Batch- und Fed-Batch-Kulturverfahren
sind im Stand der Technik allgemein und weithin bekannt, und Beispiele
können
in Thomas D. Brock in Biotechnology: A Textbook of industrial Microbiology; zweite
Auflage (1989) Sinauer Associates, Inc., Sunderland, MA., oder Deshpande,
Mukund V., Appl. Biochem. Biotechnol., 36, 227, (1992) gefunden
werden.
-
Die
gewerbliche Produktion von Exopolysacchariden kann auch mit einer
kontinuierlichen Kultur erreicht werden. Kontinuierliche Kulturen
stellen ein offenes System dar, in dem einem Bioreaktor kontinuierlich ein
definiertes Kulturmedium zugefügt
wird und eine gleiche Menge von konditioniertem Medium gleichzeitig zur
Verarbeitung entfernt wird. Kontinuierliche Kulturen erhalten im
Allgemeinen die Zellen bei einer konstanten hohen Dichte in der
Flüssigphase
aufrecht, in der sich Zellen primär in der log-Phase des Wachstums
befinden. Als Alternative kann die kontinuierliche Kultur mit immobilisierten
Zellen praktisch ausgeführt
werden, wobei der Kohlenstoff und die Nährstoffe kontinuierlich zugefügt werden
und wertvolle Produkte, Nebenprodukte oder Abfallprodukte kontinuierlich
aus der Zellmasse entfernt werden. Zellimmobilisierung kann unter Verwendung
einer weiten Reihe von festen Trägern,
die aus natürlichen
und/oder synthetischen Materialien aufgebaut sind, durchgeführt werden.
-
Die
kontinuierliche oder semikontinuierliche Kultur lässt die
Modulation eines Faktors oder jedweder Anzahl an Faktoren zu, die
sich auf das Zellwachstum oder die Endprodukt-Konzentration auswirken.
So erhält ein
Verfahren zum Beispiel einen limitierten Nährstoff, wie zum Beispiel die
Kohlenstoff- oder Stickstoffkonzentration bei einer fixierten Rate
aufrecht und erlaubt, dass alle anderen Parameter moderiert werden
können.
In anderen Systemen können
eine Anzahl an Faktoren, die sich auf das Wachstum auswirken, kontinuierlich
verändert
werden, während
die Zellkonzentration, gemessen anhand der Trübheit des Mediums, konstant
gehalten wird. Kontinuierliche Systeme streben die Aufrechterhaltung
von Wachstumsbedingungen im Steady-state an und folglich muss der
Zellverlust aufgrund des Abzugs von Medium gegen die Zellwachstumsrate
in der Kultur ausgeglichen werden. Verfahren zum Modulieren der
Nährstoffe
und Wachstumsfaktoren für
kontinuierliche Kulturverfahren ebenso wie für Verfahren zur Maximierung
der Produktbildungsrate sind aus dem Stand der industriellen Mikrobiologie
weithin bekannt und viele verschiedene Verfahren werden von Brock,
vorstehend, ausführlich
beschrieben.
-
Die
erfindungsgemäßen Fermentierungsmedien
müssen
geeignete Kohlenstoffsubstrate enthalten. Geeignete Substrate können folgende
einschließen,
sind aber nicht darauf beschränkt:
Monosaccharide, wie zum Beispiel Glucose und Fructose, Oligosaccharide,
wie zum Beispiel Lactose oder Saccharose, Polysaccharide, wie zum
Beispiel Stärke
oder Cellulose oder Gemische davon und ungereinigte Gemische von
erneuerbaren Rohsubstraten, wie zum Beispiel Käsemolke-Permeat, Maisweichwasser,
Zuckerrübenmelasse
und Gerstenmalz. Das Kohlenstoffsubstrat kann zusätzlich auch
C1-Substrate, wie zum Beispiel Kohlendioxid,
Methan oder Methanol darstellen, für das die metabolische Umwandlung
in wichtige biochemische Intermediärprodukte nachgewiesen wurde.
Außer
C1- und C2-Substraten
sind auch methylotrophe Organismen zur Verwertung einer Anzahl anderer
Kohlenstoff-enthaltender Verbindungen, wie zum Beispiel Methylamin,
Glucosamin und eine Reihe verschiedener Aminosäuren für die metabolische Aktivität bekannt.
So sind zum Beispiel methylotrophe Hefe zur Verwertung des Kohlenstoffs
aus Methylamin zur Bildung von Trehalose oder Glycerol bekannt (Bellion
et al., Microb. Growth Cl Compd., [Int. Symp.], 7. (1993), 415–32. Hrsg.:
Murrell. J. Collin; Kelly, Don P. Verlag: Intercept, Andover, UK).
Auf ähnliche
Weise metabolisieren verschiedene Candida-Spezies Alanin oder Ölsäure (Sulter
et al., Arch. Microbiol. 153:485–489 (1990)). Folglich wird
daran gedacht, dass die erfindungsgemäß verwertete Kohlenstoffquelle
eine weite Reihe verschiedener Kohlenstoff-enthaltender Substrate
umfassen kann und nur durch die Wahl des Organismus begrenzt ist.
-
REKOMBINANTE
PRODUKTION – PFLANZEN
-
Pflanzen
und Algen sind auch bekannt dafür,
dass sie Polysaccharide produzieren. Die erfindungsgemäßen Nukleinsäurefragmente
können
zur Herbeiführung
transgener Pflanzen mit der Fähigkeit
zur Expression des mikrobiellen Proteins verwendet werden. Bevorzugte
Pflanzenwirte stellen jedwede Varietät, die einen hohen Produktionsgrad
der vorliegenden Proteine unterstützen, dar. Geeignete grüne Pflanzen
schließen
folgende ein, sind aber nicht darauf beschränkt: Sojabohnen, Rapssamen (Brassica
napus, B. campestris), Sonnenblumen (Helianthus annus), Baumwolle
(Gossypium hirsutum), Mais, Tabak (Nicotiana tabacum), Alfalfa (Medicago
sativa), Weizen (Triticum sp), Gerste (Hordeum vulgare), Hafer (Avena
sativa, L), Sorghum (Sorghum bicolor), Reis (Oryza sativa), Arabidopsis,
Kohlgemüse
(Brokkoli, Blumenkohl, Kohl, Pastinaken usw.), Melonen, Karotten,
Sellerie, Petersilie, Tomaten, Kartoffeln, Erdbeeren, Erdnüsse, Trauben,
Grassaatgut, Zuckerrüben,
Zuckerrohr, Bohnen, Erbsen, Roggen, Flachs, Laubbäume, Nadelbäume und
Futtergräser.
Algenspezies schließen
folgende ein, sind aber nicht auf gewerblich signifikante Wirte
beschränkt,
wie zum Beispiel Spirulina und Dunalliela. Eine Überexpression der erfindungsgemäßen Proteine
kann zunächst
durch Konstruieren chimärer
Gene erreicht werden, worin die Kodierungsregion mit Promotoren
funktionsfähig
verknüpft sind,
die zur Richtung der Expression eines Gens in den gewünschten
Geweben auf der gewünschten
Entwicklungsstufe fähig
sind. Aus Gründen
der Zweckmäßigkeit
können
die chimären
Gene Promotor-Sequenzen und Translationsleader-Sequenzen umfassen,
die sich von den gleichen Genen herleiten. Nicht kodierende Sequenzen
an 3', die für Transkriptionsterminationssignale
kodieren, müssen
auch bereitgestellt werden. Die vorliegenden chimären Gene
können
auch ein oder mehr Intron(e) zur Förderung der Genexpression umfassen.
-
Jedwede
Kombination an jedwedem Promotor und jedwedem Terminator, die zur
Induktion der Expression einer kodierenden Region fähig ist,
kann in der chimären
genetischen Sequenz verwendet werden. Einige geeignete Beispiele
von Promotoren und Terminatoren schließen die von den Nopalinsynthase-
(nos), Octopinsynthase- (ocs) und den Blumenkohl-Mosaikvirus-Genen
(CaMV) ein. Ein effizienter Pflanzenpromotortyp, der verwendet werden
kann, stellt einen hochaktiven Pflanzenpromotor dar. Solche Promotoren
in funktionsfähiger
Verknüpfung
mit den genetischen Sequenzen oder die vorliegende Erfindung sollten
zur Promotion der Expression des vorliegenden Genprodukts fähig sein.
Hochaktive Pflanzenpromotoren, die erfindungsgemäß verwendet werden können, schließen den
Promotor der kleinen Untereinheit (ss) der Ribulose-1,5-bisphosphat-carboxylase,
wie zum Beispiel aus der Sojabohne (Berry-Lowe et al., J. Molecular
and App. Gen., 1:483–498
1982)), und den Promotor des Chlorophyll-a/b-Bindungsproteins ein.
Es ist bekannt, dass diese beiden Promotoren in Pflanzenzellen Licht-induziert
werden (siehe zum Beispiel, Genetic Engineering of Plants, an Agricultural
Perspective. A. Cashmore, Plenum, New York (1983), Seiten 29–38; Coruzzi,
G. et al. The Journal of Biological Chemistry 258:1399 (1983), und
Dunsmuir, P. et al., Journal of Molecular and Applied Genetics,
2:285 (1983)).
-
Plasmidvektoren,
umfassend die vorliegenden chimären
Gene, können
dann konstruiert werden. Die Wahl des Plasmidvektors hängt vom
Verfahren ab, das zum Transformieren der Wirtspflanzen verwendet
wird. Der Fachmann wird sich der genetischen Elemente, die auf dem
Plasmidvektor vorliegen müssen,
um die Wirtszellen, die das chimäre
Gen enthalten, erfolgreich transformieren, auswählen und propagieren zu können, bewusst
sein. Der Fachmann wird auch erkennen, dass verschiedene unabhängige Transformationsereignisse
verschiedene Expressionsgrade und -muster ergeben (Jones et al.,
(1985) FMBO J. 4:2411–2418; De
Almeida et al., (1989) Mol. Gen. Genetics 218:78–86), und dass folglich mehrfache
Ereignisse gescreent werden müssen,
um Linien zu erhalten, die den gewünschten Expressionsgrad und
das -muster aufweisen. Solches Screening kann mithilfe der Southern-Analyse
von DNA-Blots (Southern, J. Mol. Biol. 98, 503, (1975)), der Northern-Analyse
der mRNA-Expression (Kroczek, J. Chromatogr. Biomed. Appl., 618
(1–2)
(1993) 133–145),
der Western-Analyse der Proteinexpression oder der Phänotyp-Analyse
erreicht werden.
-
Für einige
Applikationen wird es nützlich
sein, die vorliegenden Proteine an verschiedene Zellkompartimente
zu richten. Es wird folglich für
möglich
gehalten, dass die vorstehend beschriebenen chimären Gene durch Veränderung
der Kodierungssequenzen zum Kodieren von Enzymen mit den entsprechenden
intrazellulären
Targeting-Sequenzen, wie zum Beispiel Transit-Sequenzen (Keegstra,
K., Cell 56:247–253
(1989)), Signal-Sequenzen oder Sequenzen, die für die Lokalisierung des endoplasmatischen
Retikulums kodieren (Chrispeels, J. J., Ann. Rev. Plant Phys. Plant
Mol. Biol. 42:21–53
(1991)), oder nuklearen Lokalisierungssignalen (Raikhel, N. Plant
Phys.100:1627–1632
(1992)) zugefügt
und/oder mit bereits vorliegenden Targeting-Sequenzen entfernt,
weiter supplementiert werden. Während
die zitierten Referenzen Beispiele von jedem von diesen geben, ist
die Liste nicht erschöpfend
und weitere nützliche
Targeting-Signale könnten
gegebenenfalls künftig
entdeckt werden, die erfindungsgemäß nützlich sind.
-
PROTEIN-ENGINEERING
-
Es
wird in Betracht gezogen, dass das vorliegende Nukleotid zur Herstellung
von Genprodukten mit verstärkter
oder veränderter
Aktivität
verwendet werden kann. Es sind verschiedene Verfahren zum Mutieren einer
nativen Gensequenz zur Herstellung eines Genprodukts mit veränderter
oder verstärkter
Aktivität,
einschließlich,
aber nicht beschränkt
darauf, Fehlern unterliegender PCR (Melnikov et al., Nucleic Acids
Research, (15. Feb. 1999) Vol. 27, Nr. 4, S. 1056–1062);
ortsgerichteter Mutagenese (Coombs et al., Proteins (1998), 259–311, 1
Platte. Hrsg.: Angeletti, Ruth Hogue. Verlag: Academic, San Diego,
Calif.) und „Gen-Shuffling" (
US 5,605,793 ;
US 5,811,238 ;
US 5,830,721 ; und
US 5,837,458 ) bekannt.
-
Das
Verfahren des Gen-Shufflings ist aufgrund seiner leichten Implementierung
und der hohen Mutageneserate und der Leichtigkeit des Screenings
besonders attraktiv. Das Verfahren des Gen-Shufflings beinhaltet
die Spaltung eines Gens von Interesse mittels der Restriktionsendonuklease
in Fragmente von spezifischer Größe in Gegenwart
zusätzlicher
Populationen aus DNA-Regionen von sowohl mit Ähnlichkeit als auch einem Unterschied
zu dem Gen von Interesse. Dieser Pool von Fragmenten wird dann zur
Herbeiführung
eines mutierten Gens denaturiert und reannealt. Das mutierte Gen
wird dann auf eine veränderte
Aktivität
gescreent.
-
Die
vorliegenden erfindungsgemäßen mikrobiellen
Sequenzen können
mittels dieses Verfahrens mutiert und auf eine veränderte oder
verstärkte
Aktivität
gescreent werden. Die Sequenzen sollten doppelsträngig sein
und können
von verschiedenen Längen
im Bereich von 50 bp bis 10 kb sein. Die Sequenzen können unter Verwendung
von im Stand der Technik überall
bekannten Restriktionsendonukleasen zufällig in Fragmente im Bereich
von ca. 10 bp bis 1000 bp aufgeschlossen werden (Maniatis vorstehend).
Außer
den vorliegenden mikrobiellen Sequenzen können Populationen von Fragmenten,
die an die gesamte mikrobielle oder Anteile der mikrobiellen Sequenz
hybridisierbar sind, zugefügt
werden. Auf ähnliche
Weise kann auch eine Population von Fragmenten, die nicht an die
vorliegende Sequenz hybridisierbar ist, zugefügt werden. In der Regel werden diese
zusätzlichen
Fragment-Populationen in einem ca. 10- bis 20fachen Gewichtsüberschuss
im Vergleich zur Gesamtnukleinsäure
zugefügt.
Wenn dieses Verfahren befolgt wird, liegt im Allgemeinen die Anzahl
an verschiedenen spezifischen Nukleinsäurefragmenten im Gemisch bei
ca. 100 bis ca. 1000. Die gemischte Population zufälliger Nukleinsäurefragmente
wird zur Bildung einsträngiger
Nukleinsäurefragmente
denaturiert und dann reannealt. Nur die einsträngigen Nukleinsäurefragmente
mit Regionen der Homologie mit anderen einsträngigen Nukleinsäurefragmenten
werden reannealt. Die zufälligen
Nukleinsäurefragmente
können
durch Erhitzen denaturiert werden. Ein Fachmann könnte die
Bedingungen bestimmen, die zur vollkommenen Denaturierung der doppelsträngigen Nukleinsäure notwendig
sind. Die Temperatur beträgt
bevorzugt von 80 °C bis
100 °C.
Die Nukleinsäurefragmente
können
durch Abkühlen
reannealt werden. Die Temperatur beträgt bevorzugt von 20 °C bis 75 °C. Die Renaturierung
kann durch das Zufügen
von Polyethylenglykol („PEG") oder Salz beschleunigt
werden. Eine geeignete Salzkonzentration kann im Bereich von 0 mM
bis 200 mM liegen. Die annealten Nukleinsäurefragmente werden dann in
Gegenwart einer Nukleinsäure-Polymerase
und dNTPs (d. h. dATP, dCTP, dGTP und dTTP) inkubiert. Die Nukleinsäure-Polymerase
kann das Klenow-Fragment, die Taq-Polymerase oder jedwede andere
im Stand der Technik bekannte DNA-Polymerase sein. Die Polymerase kann
den zufälligen
Nukleinsäurefragmenten
vor dem Annealing, gleichzeitig mit dem Annealing oder nach dem
Annealing zugefügt
werden. Der Zyklus von Denaturierung, Renaturierung und Inkubation
in der Gegenwart von Polymerase wird gegebenenfalls mehrmals wiederholt.
Der Zyklus wird bevorzugt von 2- bis 50-mal wiederholt, die Sequenz
wird bevorzugter von 10- bis 40-mal wiederholt. Die sich ergebende
Nukleinsäure stellt
ein größeres doppelsträngiges Polynukleotid
im Bereich von ca. 50 bp bis ca. 100 kb dar und kann anhand des
Standard-Klonierungs- und Expressionsprotokolls auf Expression und
veränderte
Aktivität
gescreent werden. (Manatis, vorstehend).
-
Ein
Hybriden-Protein kann überdies
durch Fusion funktioneller Domänen
unter Verwendung des Gen-Shuffling-Verfahrens (Exon-Shuffling-Verfahrens)
(Nixon et al., PNAS, 94:1069–1073
(1997)) assembliert werden. Die funktionelle Domäne des vorliegenden Gens kann
mit der funktionellen Domäne
anderer Gene zur Herbeiführung
neuer Enzyme mit der gewünschten
katalytischen Funktion kombiniert werden. Ein Hybriden-Enzym kann
unter Verwendung eines Overlap-Extension-PCR-Verfahrens konstruiert
und unter Verwendung von dem Fachmann bekannten Verfahren in die
verschiedenen Expressionsvektoren kloniert werden.
-
GENEXPRESSION-PROFILING
-
Alle
oder ein Anteil der erfindungsgemäßen Nukleinsäurefragmente
können
auch als Sonden zur Überwachung
der Genexpression und zum Genexpression-Profiling verwendet werden.
Viele externe Veränderungen,
wie zum Beispiel Veränderungen
der Wachstumsbedingungen und Chemikalienexposition, können zur
Induktion oder Repression von Genen in der Zelle führen. Die
Induktion oder Repression von Genen kann für ein Screening-System zur
Bestimmung der besten Wachstumsbedingung für die Produktion des Organismus,
Entdeckung von Arzneimitteln mit ähnlichem Wirkmechanismus der
Verbindung, um nur wenige zu nennen, verwendet werden. Andererseits
kann man durch Amplifizieren oder Disruptieren von Genen die Herstellung
der Menge von Zellprodukten, die Biofilmbildung ebenso wie den zeitlichen
Ablauf manipulieren.
-
So
können
zum Beispiel alle oder ein Anteil der vorliegenden Nukleinsäurefragmente
auf einer Nylonmembran oder einem Glasobjektträger immobilisiert werden. Ein
Generation II DNA-Spotter (Molecular Dynamics) stellt eine der verfügbaren Technologien
zum Anordnen der DNA-Proben im Array auf den beschichteten Glasobjektträgern dar.
Andere Array-Verfahren sind auch erhältlich und aus dem Stand der
Technik überall
bekannt. Nachdem die Zellen unter verschiedenen Wachstumsbedingungen
gezüchtet
oder mit potenziellen Kandidaten behandelt wurden, wird die zelluläre RNA gereinigt.
Fluoreszenz- oder radioaktiv markierte Target-cDNA kann durch reverse
Transkription von mRNA hergestellt werden. Das Target-Gemisch wird
an die Sonden hybridisiert, die unter Verwendung von Bedingungen
gewaschen werden, die aus dem Stand der Technik überall bekannt sind. Die Menge
der Target-Genexpression wird durch die Intensität der Radioaktivität oder der
Fluoreszenzmarkierung (z. B. konfokales Laser-Mikroskop: Molecular
Dynamics) quantifiziert. Die Intensitäten der Radioaktivitäts- oder
der Fluoreszenzmarkierung an den immobilisierten Sonden werden unter
Verwendung der im Stand der Technik bekannten Technologie gemessen.
Das zweifarbige Fluoreszenz-Detektionsschema (z. B. Cy3 und Cy5)
weist den Vorteil gegenüber
radioaktiv markierten Targets dahingehend auf, dass es eine rasche
und simultane Differential-Expressionsanalyse von unabhängigen Proben
ermöglicht.
Außerdem
kompensiert die Verwendung der Verhältnismessungen für die von
Sonde zu Sonde auftretende Variation der Intensität, die auf
die DNA-Konzentration und Hybridisierungseffizienz zurückzuführen ist.
Im Fall der Fluoreszenzmarkierung machen die beiden mit der entsprechenden
Anregung und den Emissionsfiltern erhaltenen Fluoreszenzbilder die
Rohdaten aus, die aus den Verhältniswerten
der Differential-Genexpression
berechnet wurden. Die Intensität
der Bilder wird unter Verwendung der verfügbaren Software (z. B. Array
Vision 4.0: Imaging Research Inc.), die aus dem Stand der Technik überall bekannt
sind, analysiert und zur Kompensation für die unterschiedlichen Effizienzen
der Markierung und der Detektion der Markierung normalisiert. Es gibt
im Stand der Technik viele verschiedene Weisen zur Normalisierung
der Signale. Eines dieser Verfahren zur Normalisierung des Signals
erfolgt durch die Bereinigung des Signals gegen interne Kontrollen.
Ein anderer Vorgang besteht darin, ein getrenntes Array mit markierter
genomisch getriebener DNA laufen zu lassen und das Signal mit den
RNA-getriebenen Signalen zu vergleichen. Dieses Verfahren ermöglicht auch
die Messung der Transkriptfülle.
Die Array-Daten eines individuellen Gens wird untersucht und zur
Bestimmung der Induktion oder Repression des Gens unter den Testbedingungen
bewertet.
-
BEISPIELE
-
ALLGEMEINE
VERFAHREN
-
In
den Beispielen verwendete rekombinante Standard-DNA- und molekulare
Klonierungsverfahren sind aus dem Stand der Technik überall bekannt
und werden von Sambrook, J., Fritsch, E. F. und Maniatis, T. Molecular
Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press:
Cold Spring Harbor, (1989) (Maniatis) und von T. J. Silhavy, M.
L. Bennan, und L. W. Enquist, Experiments with Gene Fusions, Cold
Spring Harbor Laboratory, Cold Spring Harbor, NY (1984) und von
Ausubel, F. M. et al., Current Protocols in Molecular Biology, Verlag:
Greene Publishing Assoc. und Wiley-Interscience(1987), beschrieben.
-
Für die Aufrechterhaltung
und das Wachstum von Bakterienkulturen geeignete Materialien und
Verfahren sind im Stand der Technik überall bekannt. Zur Verwendung
in den folgenden Beispielen geeignete Verfahren können wie
in Manual of Methods for General Bacteriology (Phillipp Gerhardt,
R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A.
Wood, Noel R. Krieg und G. Briggs Phillips, Hrsg.), American Society for
Microbiology, Washington, DC, (1994)) oder von Thomas D. Brock in
Biotechnology: A Textbook of Industrial Microbiology, zweite Auflage,
Sinauer Associates, Inc., Sunderland, MA (1989) dargelegt, gefunden
werden. Alle für
das Wachstum und die Erhaltung von Bakterienzellen verwendeten Reagenzien,
Restriktionsenzyme und Materialien wurden von Aldrich Chemicals
(Milwaukee, WI), DIFCO Laboratories (Detroit, MI), GIBCO/BRL (Gaithersburg,
MD) oder der Sigma Chemical Company (St. Louis, MO) bezogen, sofern
nicht anderweitig angegeben wird.
-
Manipulationen
genetischer Sequenzen wurden unter Verwendung eines Programm-Pakets
erreicht, das von der Genetics Computer Group Inc. (Wisconsin Package
Version 9.0, Genetics Computer Group (GCG), Madison, WI) erhältlich ist.
Wenn das GCG-Programm „Pileup" verwendet wurde,
wurden der Defaultwert der Gap Creation von 12 und der Defaultwert
der Gap Extension von 4 verwendet. Wenn die CGC-Programme „Gap" oder „Bestfit" verwendet wurden,
wurden die Default Gap Creation Penalty von 50 und die Default Gap
Extension Penalty von 3 verwendet. In jedwedem Fall, in dem die
GCG-Programmparameter für
diese oder jedwedes andere GCG-Programm nicht angefordert wurden,
wurden Defaultwerte verwendet.
-
Multiples
Alignment der Sequenzen wurde unter Verwendung des FASTA-Programms,
das den Smith-Waterman-Algorithmus inkorporiert, durchgeführt (W.
R. Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994),
Tagungsdatum 1992, 111–20.
Herausgeber): Suhai, Sandor. Publisher: Plenum, New York, NY).
-
Die
Bedeutung der Abkürzungen
ist wie folgt: „h" bedeutet Stunde(n), „min" bedeutet Minute(n), „sec" bedeutet Sekunde(n), „d" bedeutet Tag(e), „ml" bedeutet Milliliter, „l" bedeutet Liter.
-
ISOLATION DES STAMMES
VON METHYLOMONAS 16a
-
Die
aus der Umwelt stammende Originalprobe, enthaltend das Isolat, wurde
aus einem Teichsediment aus dem Naturschutzgebiet in Pennsylvania
gewonnen. Das Teichsediment wurde direkt in ein definiertes Mineralmedium
unter 25 % Methan in Luft inokuliert. Methan stellte die einzige
Kohlenstoff- und Energiequelle dar. Das Wachstum wurde verfolgt,
bis die optische Dichte bei 660 nm beständig war, worauf die Kultur
in frisches Medium dergestalt transferiert wurde, dass eine Verdünnung von
1:100 erreicht wurde. Nach drei aufeinanderfolgenden Transfers mit
Methan als einzige Kohlenstoff- und
Energiequelle wurde die Kultur auf ein definiertes Agar-Minimalmedium
ausplattiert und unter 25 % Methan in Luft inkubiert. Methylomonas
16a wurde aufgrund des raschen Wachstums von Kolonien und der großen Koloniengröße als der
zu untersuchende Organismus ausgewählt. Der Genus des ausgewählten Organismus
wurde durch die 16SrRNA-Analyse bestätigt. Aus dem Stamm extrahierte
16SrRNA wurde sequenziert und mit bekannten 16SrRNAs aus anderen
Mikroorganismen verglichen. Die Daten weisen eine 96%ige Ähnlichkeit
mit Sequenzen aus Methylomonas sp. KSP III und Methylomonas sp.
Stamm LW 13 auf.
-
BEISPIEL 1
-
DIE HERSTELLUNG
GENOMISCHER DNA ZUM SEQUENZIEREN UND SEQUENZ-GENERATION
-
Die
genomische DNA wurde aus Methylomonas 16a gemäß den Standardprotokollen isoliert.
-
Die
genomische DNA- und Bibliothek-Konstruktion wurden gemäß den veröffentlichten
Protokollen hergestellt (Friseur et al., The Minimal Gene Complement
of Mycoplasma genitalium, Science 270, 1995). Ein Zellpellet wurde
in einer Lösung,
enthaltend 100 mM Na-EDTA, pH 8,0, 10 mM Tris-HCl, pH 8,0, 400 mM
NaCl und 50 mM MgCl2 resuspendiert.
-
Herstellung
der genomischen DNA. Nach der Resuspension wurden die Zellen vorsichtig
in 10 % SDS lysiert und 30 min bei 55 °C inkubiert. Nach der Inkubation
bei Raumtemperatur wurde die Proteinase K 100 μg/ml zugefügt und bei 37 °C inkubiert,
bis die Suspension klar war. Die DNA wurde zweimal mit Tris-äquilibriertem
Phenol und zweimal mit Chloroform extrahiert. Die DNA wurde in 70
% Ethanol präzipitiert
und in einer Lösung,
enthaltend 10 mM Tris-HCl und 1 mM Na-EDTA (TE), pH 7,5, resuspendiert.
Die DNA-Lösung
wurde mit einer Mischung aus RNAasen behandelt, dann zweimal mit
Tris-äquilibriertem
Phenol und zweimal mit Chloroform extrahiert. Dem schloss sich die
Präzipitation
in Ethanol und Resuspension in TE an.
-
Konstruktion
der Bibliothek. 200 bis 500 μg
chromosomale DNA wurden in einer Lösung aus 300 mM Natriumacetat,
10 mM Tris-HCl, 1 mM Na-EDTA und 30 % Glycerol resuspendiert und
60 sec bei 12 psi in einer Aeromist Downdraft Nebulizer-Kammer (IBI
Medical Products, Chicago, IL) geschert. Die DNA wurde präzipitiert,
resuspendiert und mit Bal31-Nuklease behandelt. Nach der Größenfraktionierung
wurde eine Fraktion (2,0 kb oder 5,0 kb) ausgeschnitten, gereinigt
und es wurde ein Zweischritt-Ligationsverfahren
zur Herstellung einer Bibliothek mit einem hohen Titer mit größer als
99 % einzelnen Inserts verwendet.
-
Sequenzierung.
Es wurde ein Ansatz in der Form einer Shotgun-Sequenzierungsstrategie
zur Sequenzierung des gesamten mikrobiellen Genoms übernommen
(Fleischmann, Robert et al., Whole-Genome Random sequencing and assembly
of Haemophilus influenzae Rd Science, 269:1995).
-
Die
Sequenz wurde an einem ABI Automatic Sequencer unter Verwendung
der Dye Terminator Technology (
U.S.
5366860 ;
EP 272007 )
unter Verwendung einer Kombination aus Vektor- und Insertspezifischen Primern
verwendet. Sequence Editing wurde entweder unter DNAStar (DNA Star
Inc.) oder dem Wisconsin GCG-Programm (Wisconsin Package Version
9.0, Genetics Computer Group (GCG), Madison, WI) und dem CONSED-Paket
(Version 7.0) durchgeführt.
Alle Sequenzen stellen mindestens eine zweimalige Abdeckung in beiden
Richtungen bereit.
-
BEISPIEL 2
-
IDENTIFIKATION
UND CHARAKTERISIERUNG VON BAKTERIELLEN ORFs
-
ORFs,
die für
ugp, gumD, wza, epsB, epsM, waaE, epsV, gumH und Glycosyltransferase
von Methylomonas 16a kodieren, wurden initial mittels Durchführung von
BLAST-Suchen (Basic Local Alignment Search Tool; Altschul, S. F.,
et al., (1993) J. Mol. Biol. 215:403–410; siehe auch www.ncbi.nlm.nih.gov/BLAST/)
auf Ähnlichkeit
mit in der BLAST-"nr"-Datenbank enthaltenen
Sequenzen (umfassend alle nicht redundanten (nr) GenBank CDS-Translationen,
Sequenzen, die sich von der der 3-dimensionalen Struktur Brookhaven
Protein Data Bank, der SWISS-PROT-Proteinsequenz-Datenbank, EMBL- und DDBJ-Datenbanken
herleiten) identifiziert. Die in Beispiel 1 erhaltenen Sequenzen
wurden auf Ähnlichkeit
mit allen öffentlich
verfügbaren
DNA-Sequenzen, die in der „nr"-Datenbank enthalten
sind, unter Verwendung des von dem National Center for Biotechnology
Information (NCBI) bereitgestellten BLASTN-Algorithmus analysiert.
Die DNA-Sequenzen wurden in allen Leserahmen translatiert und mit
allen öffentlich
verfügbaren
Proteinsequenzen, die in der „nr"-Datenbank enthalten
sind, unter Verwendung des vom NCBI bereitgestellten BLASTP-Algorithmus
(Altschul, S. F., et al., Nucleic Acid Res. 25:3389–3402) (1997),
auf Ähnlichkeit
verglichen.
-
Alle
initialen Vergleiche wurden unter Verwendung von entweder dem BLASTNnr-
oder BLASTPnr-Algorithmus durchgeführt. Eine verfeinerte Ähnlichkeitssuche
wurde unter Verwendung von FASTA (Version 32) mit den Defaultparametereinstellungen
(BLOSUM 50 Scoring-Matrix, Wortlänge
ktup = 2, Gap Penalty = –12 für den ersten
Rest und –2
für jeden
zusätzlichen
Rest im Gap) durchgeführt.
Die Ergebnisse des FASTA-Vergleichs sind in Tabelle 1 ersichtlich,
die die Sequenzen zusammenfasst, mit denen sie die größte Ähnlichkeit aufweisen.
Tabelle 1 weist Daten auf, die auf dem FASTA-Algorithmus basieren,
mit Werten, die als Expect Values (E-Werte) berichtet werden. Der
Expect Value ermittelt die statistische Signifikanz des Matchs,
wobei die Anzahl an Matches spezifiziert wird, mit einem gegebenen
Score, die bei einer Suche in einer Datenbank dieser Größe, absolut
durch Zufall, erwartet werden.
-
Gencluster
von Genen gumD, wza, epsB, epsM, waaE, epsV, gumH, und Glycosyltransferase
sind in 1 ersichtlich.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-