DE60118401T2

DE60118401T2 - Gen, das für das gumd polypeptid aus methylomonas sp. kodiert und das an der herstellung von exopolysacchariden beteiligt ist

Info

Publication number: DE60118401T2
Application number: DE60118401T
Authority: DE
Inventors: Mattheos Wilmington KOFFAS; M. James Kennett Square ODOM; Siqun Wilmington WANG; Tao Hockessin WANG; W. Rick Hockessin YE
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2000-09-01
Filing date: 2001-08-28
Publication date: 2006-12-14
Anticipated expiration: 2021-08-29
Also published as: US20030148494A1; WO2002020797A3; EP1358333A2; CA2417243A1; ATE321864T1; AU2001286863A1; US20020102697A1; NO20030962D0; NO20030962L; EP1358333B1; DE60118401D1; WO2002020797A2; PE20020454A1; US20030166171A1; US6537786B2

Description

GEBIET DER ERFINDUNG
Gegenstand der Erfindung ist das Gebiet der mikrobiellen Herstellung von Polysacchariden. Gegenstand der Erfindung sind spezifischer Nukleinsäure-Moleküle, die für ein Enzym kodieren, das an der Biosynthese von Exopolysacchariden aus Methylomonas sp. beteiligt ist.
HINTERGRUND DER ERFINDUNG
Polysaccharide stellen Zucker-Polymere dar, die verbreitet als ein Verdickungsmittel in den Nahrungsmittel- und Nichtnahrungsmittelindustrien verwendet wurden (Sanford et al. Pure & Appl. Chem. 56: 879–892 (1984); Sutherland, Trends Biotechnol, 16(1): 41–6 (1998)). Sie können in Nahrungsmittelprodukten, wie zum Beispiel Salatsoßen, Marmelade, tiefgefrorenen Nahrungsmitteln, Bäckereiprodukten, Nahrungsmitteln in Dosen und Trockennahrungsmitteln gefunden werden. Viele andere Applikationen schließen Suspensionsmittel für Pestizide, Anstrichstoffe und andere Beschichtungsmittel ein. Sie können als Flockungsmittel, Bindungsmittel, Filmbildner, Gleitmittel und Friktionsreduktionsmittel wirken. Exopolysaccharide werden überdies häufig in Ölfeldern zur Ölrückgewinnung verwendet.
Herkömmlicherweise leiteten sich industriell nützliche Polysaccharide aus Algen- und Pflanzenquellen her. Im Verlauf des letzten Jahrzehnts haben sich von Mikroben herleitende Polysaccharide zunehmend Verwendung gefunden (Sanford et al. Pure & Appl. Chem. 56: 879–892 (1984)); Sutherland, Trends Biotechnol 16(1): 41–6 (1998)). Eines der gewerblich weithin bekannten mikrobiellen Exopolysaccharide stellt Xanthangummi dar. Xanthangummi stellt ein komplexes Exopolysaccharide dar, das von einem Gram-negativen Bakterium Xanthomonas campestris pv. campestris gebildet wird, bei dem es sich um ein Pathogen für Kreuzblütler handelt. Xanthan besteht aus einer β-1,4-verknüpften D-Glucose-Hauptkette mit Trisaccharid-Seitenketten, die sich aus Mannose-(β-1,4)-glucuronsäure-(β-1,2)-mannose zusammensetzen, die durch α-1,3-Verknüpfungen an alternierende Glucosereste in der Hauptkette gebunden sind. Die polymerisierten Pentasaccharid-Wiederholungseinheiten sind durch die sequenzielle Addition von Glucose-1-phosphat, Glucose, Mannose, Glucuronsäure und Mannose auf einem Polyprenolphosphat-Träger assembliert (Ielpi et al., J. Bacteriol. 175:2490–2500, 1993).
Einer der am besten charakterisierten Wege für die Produktion mikrobieller Exopolysaccharide ist in Xanthomonas zu finden Der Biosyntheseweg von Xanthan in Xanthomonas campestris umfasst beispielsweise fünf Stufen: (i) Umwandlung einfacher Zucker in Nukleotidylderivat-Präkursoren, (ii) Assemblieren von Pentasaccharid-Untereinheiten, die an den Träger der inneren Membran von Polyprenolphosphat gebunden sind, (iii) Addition von Acetyl- und Pyruvatgruppen, (iv) Polymerisation von Pentasaccharid-Wiederholungseinheiten und (v) Sekretion eines Polymers.
Mehrere an der Biosynthese von Xanthan und anderen Exopolysacchariden beteiligten Enzyme oder Proteine sind aus dem Stand der Technik weithin bekannt. UDP-Glucosepyrophosphorylase stellt das Enzym dar, das die Reaktion katalysiert, die UDP-Glucose (UTP + Glucose-1-phosphat <-> UDP-Glucose + Ppi) generiert (Wei et al., Biochem. Biophys. Res. Commun. 226:607–12 (1996)). UDP-Glucose stellt die Bausteine für viele Glucose enthaltende Exopolysaccharide dar.
Es wird gefunden, dass ein Cluster aus Gummi-Genen für die Xanthangummi-Synthese in Xanthomonas campestris erforderlich sind (Katzen et al. J. Bacteriol. 180:1607–1617 (1998); Chou, F.L., et al. Biochem. Biophys. Res. Commun. 233 (1), 265–269 (1997)). So ist zum Beispiel GumD, die Glycosyltransferase, für den Transfer der ersten Glucose an die Lipid-verknüpften Intermediärprodukte in der Exopolysaccharid-Biosynthese in Xanthomonas campestris verantwortlich. GumH stellt das Protein dar, das am Transfer der Mannose an die Lipid-verknüpften Intermediärprodukte bei der Exopolysaccharid-Synthese in Xanthomonas campestris beteiligt ist.
Viele andere an der Exopolysaccharid-Biosynthese beteiligten Gene wurden aus anderen Organismen charakterisiert oder sequenziert. Das epsB-Gen, das für das EpsB-Protein kodiert, das wahrscheinlich an der Polymerisation und/oder dem Export von EPS beteiligt ist, wurde in Ralstonia sola sequenziert (Huang et al., Mol. Microbiol. 16: 977–989 (1995). Das espM-Gen, das für das EspM-Protein kodiert, wurde im esp-Gencluster von Streptococcus thermophilus gefunden (Stingele et al., J. Bacteriol. 178:1680–1690 (1996)). Ein anderes putatives Polysaccharid-Exportprotein, WZA, wird in E. coli identifiziert (Blattner et al., Science 277:1453–1474 (1997)). Das epsV-Gen kodiert schließlich für das EpsV-Protein, eine Transferase, welche den Zucker an Polysaccharid-Intermediärprodukte transferiert, und es wurde auch in Streptococcus thermophilus sequenziert (Bourgoin et al. Plasmid 40:44–49 (1998); Bourgoin, F., et al., Gene 233:151–161 (1999).
Trotz der Informationsfülle in Bezug auf Gen-kodierende mikrobielle Exopolysaccharide wurden keine an diesem Weg beteiligten Gene isoliert oder aus den C₁ verwertenden Organismen, wie zum Beispiel Methylomonas, charakterisiert. Wie vorstehend angemerkt wurde, weisen mikrobielle Exopolysaccharide eine Reihe verschiedener Verwendungszwecke auf und es wäre ein Vorteil, dieses Material aus einer Fülle von und preisgünstigen Kohlenstoffquellen, wie zum Beispiel Methan, zu synthetisieren.
Das zu lösende Problem besteht deshalb darin, die Gene zu identifizieren, die für die Exopolysaccharid-Synthese in einem C₁ verwertenden Organismus zur Herstellung von Exopolysacchariden in ähnlichen ebenso wie in nicht verwandten Mikroben relevant sind. Die Anmelder haben das angegebene Problem durch Isolierung und Charakterisierung eines kompletten enzymatischen Wegs für die Synthese von Exopolysaccharid aus einem Methylomonas sp. und insbesondere einem Nukleinsäuremolekül, kodierend für ein Enzym der Exopolysaccharid-Synthese, gelöst.
ZUSAMMENFASSUNG DER ERFINDUNG
Gegenstand der vorliegenden Erfindung ist die Bereitstellung eines isolierten Nukleinsäuremoleküls, das für ein biosynthetisches Exopolysaccharid-Enzym von Methylmonas sp. kodiert, das aus der Gruppe ausgewählt ist, bestehend aus: (a) einem isolierten Nukleinsäuremolekül, kodierend für die Aminosäuresequenz, wie in SEQ ID NO: 4 dargelegt und (b) einem isolierten Nukleinsäuremolekül, das zu (a) komplementär ist. Ein derartiges Nukleinsäuremolekül kann SEQ ID NO: 3 darstellen. Es wird weiter angenommen, dass isolierte Nukleinsäuremoleküle, die für Exopolysaccharid-Enzyme von Methylomonas sp. kodieren, aber nicht als ein erfindungsgemäßer Teil beansprucht werden, durch SEQ ID NO: 2, 6, 8, 10, 12, 14, 16 und 18 definiert sind. Ein isoliertes Nukleinsäuremolekül, das mit jedweder von SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16 und 18 unter den folgenden Hybridisierungsbedingungen hybridisiert: 0,1 × SSC, 0,1 % SDS, 65 °C und gewaschen mit 2 × SSC, 0,1 % SDS, gefolgt von 0,1 × SSC, 0,1 % SDS, kann für ein entsprechendes Enzym von äquivalenter Funktion kodieren.
Andere repräsentative Nukleinsäuremoleküle, die für biosynthetische Exopolysaccharid-Enzyme kodieren, aber keinen wie vorstehend beanspruchten erfindungsgemäßen Teil bilden, schließen Folgendes ein: 1) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 293 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:2 dargelegt, eine Identität von mindestens 58 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst; 2) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 473 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:4 dargelegt, eine Identität von mindestens 36 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst; 3) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 366 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:6 dargelegt, eine Identität von mindestens 36 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst, 4) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 779 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:8 dargelegt, eine Identität von mindestens 35 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst; 5) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz; kodierend für ein Polypeptid aus mindestens 472 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO:10 dargelegt, eine Identität von mindestens 23 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst; 6) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 272 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO: 12 dargelegt, eine Identität von mindestens 28 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst; 7) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 284 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO: 14 dargelegt, eine Identität von mindestens 21 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst; 8) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 398 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO: 16 dargelegt, eine Identität von mindestens 26 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst und 9) ein isoliertes Nukleinsäuremolekül, umfassend eine erste Nukleotidsequenz, kodierend für ein Polypeptid aus mindestens 317 Aminosäuren, das bezogen auf das Alignment-Verfahren nach Smith-Waterman bei Vergleich mit einem Polypeptid mit der Sequenz wie in SEQ ID NO: 18 dargelegt, eine Identität von mindestens 51 % aufweist, oder eine zweite Nukleotidsequenz, die das Komplement der ersten Nukleotidsequenz umfasst.
Gegenstand der Erfindung ist auch die Bereitstellung chimärer Gene, umfassend das wie vorstehend definierte erfindungsgemäße isolierte Nukleinsäuremolekül, das funktionsfähig mit geeigneten Regulationssequenzen verknüpft ist. Gegenstand der Erfindung ist außerdem die Bereitstellung des Polypeptids, das durch das erfindungsgemäße Nukleinsäuremolekül kodiert wird.
Gegenstand der Erfindung ist auf ähnliche Weise die Bereitstellung einer transformierten Wirtszelle, die die erfindungsgemäßen chimären Gene umfasst.
Ein Verfahren zum Erhalt eines Nukleinsäuremoleküls, das für ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp. kodiert, beinhaltet Folgendes: (a) Sondieren einer genomischen Bibliothek mit dem erfindungsgemäßen Nukleinsäuremolekül; (b) Identifizieren eines DNA-Klons, der mit dem erfidungsgemäßen Nukleinsäuremolekül hybridisiert; und (c) Sequenzieren des genomischen Fragments, das den in Schritt (b) identifizierten Klon umfasst, worin das sequenzierte genomische Fragment für ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp. kodiert.
Als Alternative könnte ein anderes Verfahren zum Erhalt eines Nukleinsäuremoleküls, das für ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp. kodiert, Folgendes beinhalten: (a) Synthetisieren von mindestens einem Oligonukleotid-Primer, der einem Anteil der Sequenz entspricht, die aus der Gruppe ausgewählt ist, bestehend aus SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 und 17; und (b) Amplifizieren eines in einem Klonierungsvektor anwesenden Inserts unter Verwendung des Oligonukleotid-Primers von Schritt (a); worin das amplifizierte Insert für einen Anteil einer Aminosäuresequenz kodiert, die für ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp. kodiert.
In einer erfindungsgemäßen Ausführungsform wird ein Verfahren zur Herstellung eines Exopolysaccharids bereitgestellt, das Folgendes umfasst: Kontaktieren einer transformierten Wirtszelle unter geeigneten Wachstumsbedingungen mit einer wirksamen Menge einer Kohlenstoffquelle, wodurch Exopolysaccharid gebildet wird, wobei die transformierte Wirtszelle ein für SEQ ID NO: 4 kodierendes Nukleinsäuremolekül umfasst, unter der Kontrolle geeigneter Regulatorsequenzen.
Andere Nukleinsäwemoleküle, die verwendet werden könnten, schließen diejenigen ein, die für SEQ ID NO: 2, 6, 8, 10, 12, 14, 16 und 18 kodieren.
Ein mutiertes Nukleinsäuremolekül, das für ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp. mit einer veränderten biologischen Aktivität kodiert, kann mittels eines Verfahrens hergestellt werden, das die folgenden Schritte umfasst:

(i) Aufschließen eines Gemischs aus erfindungsgemäßen Nukleotidsequenzen oder wie in jedweder der SEQ ID NO: 1, 3, 5, 7, 9, 11, 13, 15 oder 17 dargelegten Nukleotidsequenzen mit Restriktionsendonukleasen, worin das Gemisch Folgendes umfasst: a) Ein natives mikrobielles Gen; b) eine erste Population aus Nukleotid-Fragmenten, die an die native mikrobielle Sequenz hybridisieren; c) eine zweite Population aus Nukleotid-Fragmenten, die nicht an die native mikrobielle Sequenz hybridisieren; worin ein Gemisch aus Restriktionsfragmenten gebildet wird;
(ii) Denaturieren des Gemischs aus Restriktionsfragmenten;
(iii) Inkubieren des denaturierten Gemischs aus Restriktionsfragmenten von Schritt (ii) mit einer Polymerase;
(iv) Wiederholen der Schritte (ii) und (iii), worin ein mutiertes mikrobielles Gen hergestellt wird, das für ein Protein mit einer veränderten biologischen Aktivität kodiert.

KURZE BESCHREIBUNG DER ZEICHNUNGEN, SEQUENZBESCHREIBUNGEN UND BIOLOGISCHEN HINTERLEGUNGEN
1 zeigt die DNA-Region, enthaltend gumD-, wza-, espB-, espM-, waaE-, espV-, gumH- und Glycosyltransferase-Gene in Stamm 16a von Methylomonas spp. Das Gen, das für das Gen ugp, UDP-Glucosepyrophosphorylase, kodiert, befindet sich in einer anderen Region.
Die Erfindung kann anhand der folgenden ausführlichen Beschreibung und den beiliegenden Sequenzbeschreibungen, die einen Teil dieser Anmeldung bilden, vollständiger verstanden werden.
Die folgenden anhängenden Sequenzbeschreibungen und Sequenzprotokolle hierzu befolgen die Vorschriften, welche die Offenbarungen von Nukleotid- und/oder Aminosäuresequenzen in Patentanmeldungen regeln, wie in 37 C.F.R. § 1.821–1.825 ausgeführt ist. Die Sequenzbeschreibungen enthalten den Einbuchstabencode für Nukleotidsequenz-Zeichen und die Dreibuchstabencodes für Aminosäuren, wie in Konformität mit den IUPAC-IYUB-Standards definiert, die in Nucleic Acids Research 13:3021–3030 (1985) und im Biochemical Journal 219 (No. 2):345–373 (1984) beschrieben sind. Die für die Nukleotid- und Aminosäuresequenz-Daten verwendeten Symbole und das Format befolgen die in 37 C.F.R. § 1.822 ausgeführten Vorschriften.
SEQ ID NO:1 stellt die Nukleotidsequenz des ugp-Gens dar.
SEQ ID NO:2 stellt die deduzierte Aminosäuresequenz des durch SEQ ID NO:1 kodierten ugp-Gens dar.
SEQ ID NO:3 stellt die Nukleotidsequenz von ORF 1, umfassend das gumD-Gen dar.
SEQ ID NO:4 stellt die deduzierte Aminosäuresequenz des durch ORF 3 kodierten gumD-Genproduktes dar.
SEQ ID NO:5 stellt die Nukleotidsequenz von ORF 2, umfassend das wza-Gen dar.
SEQ ID NO:6 stellt die deduzierte Aminosäuresequenz von wza, dem durch ORF 5 kodierten Genprodukt dar.
SEQ ID NO:7 stellt die Nukleotidsequenz von ORF 3, umfassend das epsB-Gen dar.
SEQ ID NO:8 stellt die deduzierte Aminosäuresequenz von epsB, dem durch ORF 7 kodierten Genprodukt dar.
SEQ ID NO:9 stellt die Nukleotidsequenz von ORF 4, umfassend das epsM-Gen dar.
SEQ ID NO:10 stellt die deduzierte Aminosäuresequenz des durch ORF 9 kodierten epsM-Genprodukts dar.
SEQ ID NO:11 stellt die Nukleotidsequenz von ORF 5, umfassend das waaE-Gen dar.
SEQ ID NO:12 stellt die deduzierte Aminosäuresequenz des durch ORF 11 kodierten waaF-Genprodukts dar.
SEQ ID NO:13 stellt die Nukleotidsequenz von ORF 6, umfassend das epsV-Gen dar.
SEQ ID NO:14 stellt die deduzierte Aminosäuresequenz des durch ORF 13 kodierten epsV-Genprodukts dar.
SEQ ID NO:15 stellt die Nukleotidsequenz von ORF 7, umfassend das gumH-Gen dar.
SEQ ID NO:16 stellt die deduzierte Aminosäuresequenz des durch ORF 15 kodierten gumH-Genprodukts dar.
SEQ ID NO:17 stellt die Nukleotidsequenz von ORF 8, umfassend das Glycosyltransferase-Gen dar.
SEQ ID NO:18 stellt die deduzierte Aminosäuresequenz des durch ORF 17 kodierten Glycosyltransferase-Genprodukts dar.
Die Anmelder nahmen die folgenden biologischen Hinterlegungen unter den Bestimmungen des Budapester Vertrags über die internationale Anerkennung der Hinterlegung von Mikroorganismen für die Zwecke von Patentverfahren vor:
AUSFÜHRLICHE BESCHREIBUNG DER ERFINDUNG
Die an der Kodierung von Enzymen zur Herstellung von Exopolysaccharid beteiligten Nukleinsäurefragmente wurden aus einem Stamm von Methylomonas spp. (Stamm 16a) isoliert und durch Vergleich mit öffentlichen Datenbanken, enthaltend Nukleotid- und Proteinsequenzen, unter Verwendung der dem Fachmann weithin bekannten BLAST- und FASTA-Algorithmen identifiziert.
Die erfindungsgemäß beschriebenen Gene ermöglichen die Überexpression eines am Biosynthese-Weg von Exopolysaccharid beteiligten Enzyms. Die Überexpression von erfindungsgemäßen Genen in entweder einem natürlichen Wirt, Methylomonas 16a, oder in heterologen Wirten führt zu einer verbesserten Exopolysaccharid-Ausbeute, wobei sowohl Zeit als auch Geld eingespart werden. Die erfindungsgemäßen Gene können außerdem mit Genen aus anderen Wegen zur Herstellung von Enzymen mit unterschiedlicher Substratspezifität mutagenisiert oder rekombiniert werden, wobei neue Polymere mit neuer Funktionalität produziert werden. Eine derartig neue Funktionalität kann neue Geliereigenschaften, Temperaturbeständigkeit und Suspensionsfähigkeit einschließen.
Unter einigen Umständen ist die Herstellung von Exopolysacchariden nachteilig und ein System zum Screening auf Inhibitoren der Exopolysaccharid-Synthese ist nützlich. So wird zum Beispiel angenommen, dass Exopolysaccharide in der Natur eine wichtige Rolle bei der Erleichterung der bakteriellen Adhäsion und der Bildung von Biofilmen spielen. Bakterielle Biofilme sind beim Biofouling und Verstopfen von Rohrleitungen bei Herstellungsverfahren, die Bakterien als eine Herstellungsplattform verwenden, impliziert. Auf ähnliche Weise ist in medizinischen Umgebungen die Bildung bakterieller Biofilme problematisch. Sobald sich zum Beispiel ein Biofilm auf Transplantaten oder Kathetern gebildet hat, ist eine von Bakterien ausgelöste Infektion sehr schwer zu eradizieren. Deshalb besitzen Inhibitoren der Biofilmbildung einen sehr signifikanten gewerblichen Wert, und die hier beschriebenen Gene oder die Genprodukte können als Targets zum Screening auf potenzielle Inhibitoren verwendet werden.
In dieser Offenbarung werden eine Reihe von Begriffen und Abkürzungen verwendet. Die folgenden Definitionen werden bereitgestellt.
„Offener Leserahmen" ist als ORF abgekürzt.
„Polymerase-Kettenreaktion" ist als PCR abgekürzt.
Wie hierin verwendet, werden die Begriffe „isoliertes Nukleinsäurefragment" und „isoliertes Nukleinsäuremolekül" gegenseitig austauschbar verwendet und man versteht darunter ein RNA- oder DNA-Polymer, das ein- oder doppelsträngig ist und optional synthetische, nicht natürliche oder veränderte Nukleotidbasen enthält. Ein isoliertes Nukleinsäurefragment in der Form eines DNA-Polymers kann sich aus einem oder mehr Segmenten) von cDNA, genomischer DNA oder synthetischer DNA zusammensetzen.
Der Begriff „ugp" verweist auf ein Gen, das für UDP-Glucose-pyrophosphorylase, UGP, kodiert.
Der Begriff „gumD" verweist auf ein Gen, das für die Glycosyltransferase, GumD, kodiert.
Der Begriff „wza" verweist auf ein Gen, das für das Polysaccharid-Exportprotein Wza kodiert.
Der Begriff „epsB" verweist auf ein Gen, das für ein Polysaccharid-Exportprotein EpsB kodiert.
Der Begriff „epsM" verweist auf ein Gen, das für das auf die Polysaccharid-Biosynthese bezogene Protein EpsM kodiert.
Der Begriff „waaE" verweist auf ein Gen, das für die Glycosyltransferase, WaaE, kodiert.
Der Begriff „epsV" verweist auf ein Gen, das für die Zucker-Transferase EpsV kodiert.
Der Begriff „gumH" verweist auf ein Gen, das für die Galactosyltransferase, GumH, kodiert.
Der Begriff „UDP" verweist auf Uridin-5-diphosphat.
Der Begriff „UTP" verweist auf Uridin-5-triphosphat.
Wie hierin verwendet versteht man unter dem Begriff „biosynthetischer Weg" von „Exopolysaccharid" oder „Polysaccharid" einen enzymatischen Weg, umfassend die vorstehend beschriebenen Gene ugp, gumD, wza, epsB, epsM, waaE, epsV und gumH. Unter dem Begriff „Exopolysaccharid-Gen" oder „Polysaccharid-Gen" versteht man jedwedes Gen oder alle die Gene ugp, gumD, wza, epsB, epsM, waaE, epsV und gumH. Unter dem Begriff „biosynthetisches Exopolysaccharid-Enzym" oder „biosynthetisches Polysaccharid-Enzym" versteht man jedwedes Genprodukt oder alle die Genprodukte der Gene ugp, gumD, wza, epsB, epsM, waaE, epsV und gumH.
Unter dem Begriff „Monosaccharid" versteht man ein einzelnes Polyhydroxyaldehyd oder Ketoneinheiten der allgemeinen Formel (CH₂O)_n. „Polysaccharide" stellen Moleküle dar, die viele Monosaccharideinheiten enthalten, die in langen linearen oder verzweigten Ketten miteinander verbunden sind. Unter dem Begriff „Exopolysaccharid" versteht man jedwedes biologisch hergestellte Polysaccharid, das von einer Zelle exkretiert wird.
Unter dem Begriff „Embden-Meyerhof-Kohlenstoff-Weg" versteht man die Reihe biochemischer Reaktionen zur Umwandlung von Hexosen, wie zum Beispiel Glucose und Fructose, in wichtige zelluläre C₃-Intermediärprodukte, wie zum Beispiel Glyceraldehyd-3-phosphat, Dihydroxyacetonphosphat, Phosphoenolpyruvat und Pyruvat. Diese Reaktionen laufen in der Regel mit einer Nettoausbeute der biochemisch nützlichen Energie in der Form von ATP ab. Bei den wichtigsten Enzymen, die für den Embden-Meyerhof-Kohlenstoff-Weg einzigartig sind, handelt es sich um die Phosphofructokinase und Fructose-1,6-bisphosphat-aldolase.
Unter dem Begriff „Entner-Douderoff-Weg" versteht man eine Reihe von biochemischen Reaktionen zur Umwandlung von Hexosen, wie zum Beispiel Glucose oder Fructose, in wichtige zelluläre C₃-Intermediärprodukte, Pyruvat und Gyceraldehyd-3-phosphat, ohne jedwede Nettoproduktion biochemisch nützlicher Energie. Die für den Entner-Douderoff-Weg einzigartigen wichtigen Enzyme sind die 6-Phosphogluconat-dehydratase und die Keto-desoxy-phosphogluconat-Aldolase.
Unter dem Begriff „methanotropher Bakterienstamm mit hohem Wachstum" versteht man ein Bakterium, das zum Wachstum mit Methan oder Methanol als einzige Kohlenstoff- und Energiequelle fähig ist, die einen funktionellen Embden-Meyerhof-Kohlenstoff-Weg für den Kohlenstoffflux besitzt, der zur Ausbeute von Zellmasse pro Gramm metabolisiertem C₁-Substrat führt. Unter dem hierin beschriebenen spezifischen „methanotrophen Bakterienstamm mit hohem Wachstum" versteht man „Methylomonas 16a" oder „16a", welche Begriffe gegeneinander austauschbar verwendet werden.
Wie hierin verwendet, verweist „im Wesentlichen ähnlich" auf Nukleinsäurefragmente, worin Änderungen in einer oder mehr Nukleotidbase(n) zur Substitution von einer oder mehr Aminosäure(n) führen, die sich aber nicht auf die funktionellen Eigenschaften des von der DNA-Sequenz kodierten Proteins auswirken. „Im Wesentlichen ähnlich" verweist auch auf Nukleinsäurefragmente, worin sich Veränderungen in einer oder mehr Nukleotidbase(n) nicht auf die Fähigkeit des Nukleinsäurefragments zum Vermitteln der Veränderung der Genexpression durch Antisense- oder Cosuppressionstechnologie auswirken. „Im Wesentlichen ähnlich" verweist auch auf Modifikationen der Nukleinsäurefragmente, wie zum Beispiel Deletion oder Insertion von einer oder mehr Nukleotidbase(n), die sich nicht im Wesentlichen auf die funktionellen Eigenschaften des sich ergebenden Transkripts auswirken. Man sollte deshalb zur Kenntnis nehmen, dass erfindungsgemäß mehr als die spezifischen beispielhaften Sequenzen enthalten sind.
So ist zum Beispiel im Stand der Technik überall bekannt, dass sich Veränderungen in einem Gen, die zur Herstellung einer chemisch äquivalenten Aminosäure an einem gegebenen Ort führen, sich aber nicht auf die funktionellen Eigenschaften des kodierten Proteins auswirken, häufig finden. Zu erfindungsgemäßen Zwecken sind die Substitutionen als Austausch in einer der folgenden fünf Gruppen wie folgt definiert:

1. Kleine aliphatische, nicht polare oder leicht polare Reste: Ala, Ser, Thr (Pro, Gly);
2. polare, negativ geladene Reste und ihre Amide: Asp, Asn, Glu, Gln;
3. polare, positiv geladene Reste: His, Arg, Lys;
4. große aliphatische, nicht polare Reste: Met, Leu, Ile, Val (Cys); und
5. große aromatische Reste: Phe, Tyr, Trp.

Folglich kann ein Codon für die Aminosäure Alanin, eine hydrophobe Aminosäure, durch ein Codon substituiert werden, das für einen anderen weniger hydrophoben Rest (wie zum Beispiel Glycin) oder einen hydrophoberen Rest (wie zum Beispiel Valin, Leucin oder Isoleucin) kodiert. Es kann auch erwartet werden, dass Änderungen, welche auf ähnliche Weise zur Substitution eines negativ geladenen Restes für einen anderen (wie zum Beispiel Asparaginsäure für Glutaminsäure) oder eines positiv geladenen Restes für einen anderen (wie zum Beispiel Lysin für Arginin) führen, ein funktionell äquivalentes Produkt produzieren.
In vielen Fällen würde also nicht erwartet, dass Veränderungen des Nukleotids, die zur Veränderung der N-terminalen und C-terminalen Anteile des Proteinmoleküls führen, die Aktivität des Proteins verändern.
Jede der vorgeschlagenen Modifikationen ebenso wie die Bestimmung der Beibehaltung der biologischen Aktivität der kodierten Produkte befinden sich durchaus im Kompetenzbereich des Durchschnittsfachmanns. Der Fachmann erkennt zudem, dass im Wesentlichen ähnliche Sequenzen auch durch ihre Fähigkeit definiert werden können, unter stringenten Bedingungen (0,1 X SSC, 0,1 % SDS, 65 °C und mit 2 X SSC, 0,1 % SDS gewaschen, gefolgt von 0,1 X SSC, 0,1 % SDS) mit den hierin erläuterten Sequenzen zu hybridisieren. Obwohl nicht im Rahmen der Ansprüche enthalten, handelt es sich bei solchen im Wesentlichen ähnlichen Nukleinsäurefragmenten um die Nukleinsäurefragmente, deren DNA-Sequenzen mindestens zu 80 % mit der hierin berichteten DNA-Sequenz der Nukleinsäurefragmente identisch sind, z. B. können solche Nukleinsäurefragmente mindestens zu 90 % mit der hierin berichteten DNA-Sequenz der Nukleinsäurefragmente identisch sein oder mindestens zu 95 % mit der hierin berichteten DNA-Sequenz der Nukleinsäurefragmente identisch sein.
Ein Nukleinsäuremolekül ist mit einem anderen Nukleinsäuremolekül, wie zum Beispiel einer cDNA, genomischen DNA oder RNA „hybridisierbar", wenn sich eine einsträngige Form des Nukleinsäuremoleküls unter geeigneten Bedingungen hinsichtlich der Temperatur und Ionenstärke der Lösung an das andere Nukleinsäuremolekül annealen kann. Die Hybridisierungs- und Waschbedingungen sind gut bekannt und in Sambrook, J., Fritsch, E. F. und Maniatis, T. Molecular Cloning: A Laboratory Manual, zweite Auflage, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), insbesondere Kapitel 11 und Tabelle 11.1 darin (hierin vollkommen unter Bezugnahme eingeschlossen) erläutert. Die Bedingungen von Temperatur und Ionenstärke bestimmen die „Stringenz" der Hybridisierung. Die Stringenzbedingungen können zum Screening auf moderat ähnliche Fragmente, wie zum Beispiel homologe Sequenzen aus entfernt verwandten Organismen, bis zu sehr ähnlichen Fragmenten, wie zum Beispiel Genen, die die funktionellen Enzyme aus nahe verwandten Organismen duplizieren, angepasst werden. Die Wäschen nach der Hybridisierung bestimmen die Stringenzbedingungen. Ein Set bevorzugter Bedingungen verwendet eine Reihe von Wäschen, beginnend mit 6 X SSC, 0,5 % SDS 15 min bei Raumtemperatur, dann mit 2 X SSC, 0,5 % SDS 30 min bei 45 °C wiederholt und danach zweimal mit 0,2 X SSC, 0,5 % SDS 30 min bei 50 °C wiederholt. Ein bevorzugter Set stringenter Bedingungen verwendet höhere Temperaturen, bei denen die Wäschen identisch zu den Vorstehenden sind, außer dass die Temperatur der letzten zwei 30 minütigen Wäschen in 0,2 X SSC, 0,5 % SDS auf 60 °C erhöht wurde. Ein anderer bevorzugter Set hoch stringenter Bedingungen verwendet zwei endgültige Wäschen in 0,1 X SSC, 0,1 % SDS bei 65 °C. Die Hybridisierung erfordert, dass die beiden Nukleinsäuren komplementäre Sequenzen enthalten, obwohl abhängig von der Stringenz der Hybridisierung Mismatches zwischen den Basen möglich sind. Die entsprechende Stringenz zur Hybridisierung von Nukleinsäuren hängt von der Länge der Nukleinsäuren und dem Grad der Komplementierung, Variablen, die aus dem Stand der Technik gut bekannt sind, ab. Je größer der Grad der Ähnlichkeit oder Homologie zwischen den zwei Nukleotidsequenzen ist, um so größer ist der Tm-Wert für Hybriden von Nukleinsäuren, die diese Sequenzen aufweisen. Die relative Stabilität (entspricht dem höheren Tm) der Hybridisierungen von Nukleinsäuren nimmt in der folgenden Reihenfolge RNA:RNA, DNA:RNA, DNA:DNA ab. Für Hybriden von größerer Länge als 100 Nukleotide wurden Gleichungen zum Berechnen des Tm abgeleitet (siehe Sambrook et al., vorstehend, 9.50–9.51). Für Hybridisierungen mit kürzeren Nukleinsäuren, d. h. Oligonukleotiden wird die Position von Mismatches wichtiger und die Länge des Oligonukleotids bestimmt seine Spezifität (siehe Sambrook et al., vorstehend, 11.7–11.8). Im Allgemeinen beträgt die Länge für eine hybridisierbare Nukleinsäure mindestens ca. 10 Nukleotide. Eine Minimumlänge für eine hybridisierbare Nukleinsäure beträgt bevorzugt mindestens ca. 15 Nukleotide; bevorzugter mindestens ca. 20 Nukleotide; und am bevorzugtesten beträgt die Länge mindestens 30 Nukleotide. Der Fachmann wird überdies erkennen, dass die Temperatur und die Salzkonzentration der Waschlösung gegebenenfalls gemäß den Faktoren, wie zum Beispiel der Länge der Sonde, angepasst werden können.
Ein „wesentlicher Anteil" einer Aminosäure oder einer Nukleotidsequenz umfasst genug von der Aminosäuresequenz eines Polypeptids oder der Nukleotidsequenz eines Gens zur putativen Identifikation dieses Polypeptids oder Gens, entweder durch manuelle Bewertung der Sequenz durch einen Fachmann oder durch einen Computer-automatisierten Vergleich und einer Identifikation der Sequenz unter Verwendung von Algorithmen, wie zum Beispiel BLAST (Basic Local Alignment Search Tool; Altschul, S. F., et al., (1993) J. Mol. Biol. 215:403–410; siehe auch www.ncbi.nlm.nih.gov/BLAST/). Im Allgemeinen ist eine Sequenz von zehn oder mehr benachbarten Aminosäuren oder dreißig oder mehr Nukleotiden notwendig, um ein Polypeptid- oder eine Nukleinsäuresequenz putativ als homolog zu einem bekannten Protein oder Gen zu identifizieren. In Bezug auf Nukleotidsequenzen können überdies Gen-spezifische Oligonukleotid-Sonden, umfassend 20–30 benachbarte Nukleotide in Sequenz-abhängigen Verfahren der Genidentifikation (z. B. Southern-Hybridisierung) und Isolation (z. B. in situ-Hybridisierung von Bakterienkolonien oder Bakteriophagen-Plaques) verwendet werden. Außerdem können kurze Oligonukleotide von 12–15 Basen als Amplifikations-Primer in PCR zum Erhalt eines bestimmten Nukleinsäurefragments, umfassend die Primer, verwendet werden. Demzufolge umfasst ein „wesentlicher Anteil" einer Nukleotidsequenz genug von der Sequenz, um ein Nukleinsäurefragment, umfassend die Sequenz, spezifisch zu identifizieren und/oder zu isolieren. Die vorliegende Beschreibung lehrt partielle oder komplette Aminosäure- und Nukleotidsequenzen, die für ein oder mehr bestimmtes) mikrobielles) Proteine) kodiert/kodieren. Der Fachmann, der den Vorteil der wie hierin berichteten Sequenzen hat, kann nun alle oder einen wesentlichen Anteil der offenbarten Sequenzen für dem Fachmann bekannte Zwecke verwenden. Hierin beansprucht werden jedoch nur die isolierten Nukleinsäuresequenzen, die für das Polypeptid von SEQ ID NO:4, einschließlich SEQ ID NO:3 und einer dazu komplementären Nukleinsäure kodieren.
Der Begriff „komplementär" wird zur Beschreibung des Verhältnisses zwischen Nukleotidbasen verwendet, die zur Hybridisierung aneinander fähig sind. In Bezug auf DNA ist Adenosin zum Beispiel komplementär zu Thymin und Cytosin ist komplementär zu Guanin. Demzufolge sind erfindungsgemäß isolierte Nukleinsäurefragmente eingeschlossen, die zu den Sequenzen, die für das Polypeptid von SEQ ID NO: 4 kodieren, komplementär sind.
Der aus dem Stand der Technik bekannte Begriff „Identität in Prozent" stellt ein Verhältnis zwischen zwei oder mehr Polypeptidsequenzen oder zwei oder mehr Polynukleotidsequenzen, wie durch den Vergleich der Sequenzen bestimmt, dar. Im Stand der Technik versteht man unter „Identität" je nachdem auch den Grad der Verwandtschaft von Sequenzen zwischen Polypeptid- oder Polynukleotidsequenzen wie durch das Match zwischen den Strings solcher Sequenzen bestimmt wurde. „Identität" und „Ähnlichkeit" können ohne weiteres anhand bekannter Verfahren berechnet werden, einschließlich, aber nicht begrenzt auf die, die in Computational Molecular Biology (Lesk, A. M., Hrsg.) Oxford University Press, New York (1988); Biocomputing: Informatics and Genome Projects (Smith. D. W., Hrsg.) Academic Press, New York (1993): Computer Analysis of Sequence Data. Teil 1 (Griffin, A. M., und Griffin, H. G., Hrsg.) Humana Press, NJ (1994), Sequence Analysis in Molecular Biology (von Heinje, G., Hrsg.) Academic Press (1987); und Sequence Analysis Primer (Gribskov, M. und Devereux, J., Hrsg.) Stockton Press, NY (1991) beschrieben sind. Bevorzugte Verfahren zur Bestimmung der Identität werden zum Erhalt des besten Match zwischen den getesteten Sequenzen konzipiert. Verfahren zur Bestimmung der Identität und Ähnlichkeit werden in öffentlich zur Verfügung stehenden Computer-Programmen kodifiziert. Sequenz-Alignments und Identitätsberechnungen in Prozent können unter Verwendung des Megalign-Programms des LASERGENE Bioinformatik-Rechnerpakets (DNASTAR Inc., Madison, WI) durchgeführt werden. Mehrfaches Alignment der Sequenzen wurde unter Verwendung des Clustalverfahrens zum Alignment (Higgins und Sharp (1989) CABIOS 5:151–153) mit den Defaultparametern (GAP PENALTY=10, GAP LENGTH PENALTY=10) durchgeführt. Defaultparameter für die paarweisen Alignments unter Verwendung des Clustalverfahrens stellen KTUPLE 1, GAP PENALTY=3, WINDOW=5 und DIAGONALS SAVED=5 dar.
Obwohl nicht beansprucht, kodieren geeignete Nukleinsäurefragmente (isolierte Polynukleotide) für Polypeptide, die mindestens zu ca. 70 %, bevorzugt mindestens zu ca. 80 % mit den hierin berichteten Aminosäuresequenzen identisch sind. Bevorzugte Nukleinsäurefragmente kodieren für Aminosäuresequenzen, die zu ca. 85 % mit den hierin berichteten Aminosäuren identisch sind. Bevorzugtere Nukleinsäurefragmente kodieren für Aminosäuresequenzen, die mindestens zu 90 % mit den hierin berichteten Aminosäuresequenzen identisch sind. Am bevorzugtesten sind Nukleinsäurefragmente, die für Aminosäuresequenzen kodieren, die mindestens zu 95 % mit den hierin berichteten Aminosäuresequenzen identisch sind. Geeignete Nukleinsäurefragmente weisen nicht nur die vorstehenden Homologien auf, sondern kodieren in der Regel für ein Polypeptid mit mindestens 50 Aminosäuren, bevorzugt mindestens 100 Aminosäuren, bevorzugter mindestens 150 Aminosäuren, noch bevorzugter mindestens 200 Aminosäuren und am bevorzugtesten mindestens 250 Aminosäuren.
Unter „Codon-Degeneriertheit" versteht man die Beschaffenheit des genetischen Codes, die eine Variation der Nukleotidsequenz zulässt, ohne sich auf die Aminosäuresequenz eines kodierten Polypeptids auszuwirken. Demzufolge bezieht sich die Patentbeschreibung auf jedwedes Nukleinsäurefragment, das für die Aminosäuresequenz kodiert, die für das wie in SEQ ID NO: 4 dargelegte vorliegende mikrobielle Polypeptid kodiert. Der Fachmann wird sich sehr wohl des „Codon-Bias" bewusst sein, der durch eine spezifische Wirtszelle bei der Usage von Nukleotid-Codonen zur Spezifizierung einer gegebenen Aminosäure aufgewiesen wird. Wenn folglich ein Gen zur verbesserten Expression in einer Wirtszelle synthetisiert wird, ist es wünschenswert, das Design des Gens dergestalt auszulegen, dass sich seine Frequenz der Codon Usage der Frequenz der bevorzugten Codon Usage der Wirtszelle annähert.
„Synthetische Gene" können aus Oligonukleotid-Bausteinen assembliert werden, die unter Verwendung der dem Fachmann bekannten Verfahren chemisch synthetisiert werden. Diese Bausteine werden zur Bildung von Gensegmenten, die dann zur Konstruktion des gesamten Gens enzymatisch assembliert werden, ligiert und annealt. Unter „chemisch synthetisiert", wie in Bezug auf eine DNA-Sequenz, versteht man, dass die Nukleotid-Komponenten in vitro assembliert wurden Eine manuelle chemische Synthese von DNA kann unter Verwendung gut etablierter Verfahren erreicht werden, oder es kann eine automatisierte chemische Synthese unter Verwendung einer Reihe von gewerblich erhältlichen Geräten durchgeführt werden. Demgemäß können die Gene zur optimalen Genexpression basierend auf der Optimierung der Nukleotidsequenz zur Widerspiegelung des Codon-Bias der Wirtszelle maßgeschneidert werden. Der Fachmann erkennt die Likelihood der erfolgreichen Genexpression, wenn die Codon Usage in Richtung der vom Wirt begünstigten Codonen ausgerichtet ist. Die Bestimmung bevorzugter Codonen kann auf einem Gen-Survey basieren, der sich von der Wirtszelle herleitet, wo Sequenzinformationen verfügbar sind.
Unter „Gen" versteht man ein Nukleinsäurefragment, das ein spezifisches Protein, einschließlich Regulationssequenzen vor (nicht kodierende Sequenzen an 5') und nach (nicht kodierende Sequenzen an 3') der Kodierungssequenz exprimiert. Unter „nativem Gen" versteht man ein Gen, wie es in der Natur vorkommt, mit seinen eigenen Regulationssequenzen. Unter „chimärem Gen" versteht man jedwedes Gen, bei dem es sich nicht um ein natives Gen handelt, umfassend Regulations- und Kodierungssequenzen, die nicht zusammen in der Natur vorkommen. Ein chimäres Gen kann demgemäß Regulationssequenzen und Kodierungssequenzen umfassen, die sich von verschiedenen Quellen herleiten, oder Regulationssequenzen und Kodierungssequenzen, die sich von der gleichen Quelle herleiten, aber in einer Weise angeordnet sind, die sich von der in der Natur gefundenen unterscheidet. Unter „endogenem Gen" versteht man ein natives Gen an seinem natürlichen Ort im Genom eines Organismus. Unter einem „Fremdgen" versteht man ein Gen, das in der Regel nicht im Wirtsorganismus gefunden wird, das aber mittels Gentransfer in den Wirzsorganismus eingeführt wird. Fremdgene können native Gene, die in einen nicht nativen Organismus insertiert werden, oder chimäre Gene umfassen. Unter einem „Transgen" versteht man ein Gen, das durch ein Transformationsverfahren in das Genom eingeführt wurde.
Unter „Kodierungssequenz" versteht man eine DNA-Sequenz, die für eine spezifische Aminosäuresequenz kodiert. Unter „geeigneten Regulationssequenzen" versteht man Nukleotidsequenzen, die sich oberstromig in (nicht kodierende Sequenzen an 5') oder unterstromig (nicht kodierende Sequenzen an 3') von einer Kodierungssequenz befinden und die die Transkription, das RNA-Processing oder die -stabilität oder Translation der assoziierten Kodierungssequenz beeinflussen. Regulationssequenzen können Promotoren, Translationsleader-Sequenzen, Introne, Polyadenylierungs-Erkennungssequenzen, einen RNA-Processing-Ort, einen Effektorbindungsort und eine Stem-Loop-Struktur einschließen.
Unter „Promotor" versteht man eine DNA-Sequenz, die zur Kontrolle der Expression einer Kodierungssequenz oder funktionellen RNA fähig ist. Im Allgemeinen befindet sich eine Kodierungssequenz am 3'-Ende an einer Promotorsequenz. Promotoren können sich in ihrer Gesamtheit von einem nativen Gen herleiten oder sich aus verschiedenen Elementen zusammensetzen, die sich von verschiedenen in der Natur vorkommenden Promotoren herleiten oder sogar synthetische DNA-Segmente umfassen. Ein Fachmann wird erkennen, dass verschiedene Promotoren die Expression eines Gens in verschiedenen Geweben oder Zelltypen oder auf verschiedenen Stufen der Entwicklung oder als Response auf verschiedene umweltabhängige oder physiologische Bedingungen richten können. Unter Promotoren, welche ein Gen veranlassen, in den meisten Zelltypen die meiste Zeit über exprimiert zu werden, bezeichnet man im Allgemeinen als „konstitutive Promotoren". Es wird weiter erkannt, dass DNA-Fragmente unterschiedlicher Längen eine identische Promotor-Aktivität aufweisen können, da in den meisten Fällen die genauen Grenzen der Regulationssequenzen nicht vollständig definiert wurden.
Unter den „nicht kodierenden Sequenzen an 3'" versteht man DNA-Sequenzen, die sich unterstromig von einer Kodierungssequenz befinden und Polyadenylierungs-Erkennungssequenzen und andere Sequenzen einschließen, die für Regulationssignale kodieren, die zur Bewirkung des mRNA-Processings oder der Genexpression fähig sind. Das Polyadenylierungssignal ist im Allgemeinen durch die Bewirkung der Addition von Polyadenylsäure-Schwänzen an das 3'-Ende des mRNA-Präkursors gekennzeichnet.
Unter „RNA-Transkript" versteht man das Produkt, das sich aus der RNA-Polymerasekatalysierten Transkription einer DNA-Sequenz ergibt. Wenn es sich bei dem RNA-Transkript um eine perfekte komplementäre Kopie der DNA-Sequenz handelt, wird auf sie als auf das primäre Transkript verwiesen oder es kann sich um eine RNA-Sequenz handeln, die sich von dem posttranskriptionalen Processing des primären Transkripts herleitet und auf die als auf die mature RNA verwiesen wird. Unter „messenger-RNA (mRNA)" versteht man die RNA, die ohne Intronen ist und die durch die Zelle in Protein translatiert werden kann. Unter „cDNA" versteht man eine doppelsträngige DNA, die zur mRNA komplementär ist und sich von ihr herleitet. Unter „Sense-RNA" versteht man ein RNA-Transkript, das die mRNA einschließt und auf diese Weise durch die Zelle in Protein translatiert werden kann. Unter „Antisense-RNA" versteht man ein RNA-Transkript, das zum gesamten oder einem Teil eines primären Target-Transkripts oder zur mRNA komplementär ist und das die Expression eines Target-Gens blockiert (US-Patent Nr. 5,107,065; WO 9928508). Die Komplementarität einer Antisense-RNA kann mit jedwedem Teil des spezifischen Gen-Transkripts, d. h., der nicht kodierenden Sequenz an 5', der nicht kodierenden Sequenz an 3' oder der Kodierungssequenz bestehen. Unter „funktioneller RNA" versteht man eine Antisense-RNA, Ribozym-RNA oder andere RNA, die bisher nicht translatiert wurde, die aber dennoch eine Wirkung auf die zellulären Vorgänge ausübt.
Unter dem Begriff „funktionsfähig verknüpft" versteht man die Assoziation von Nukleinsäuresequenzen auf einem einzelnen Nukleinsäurefragment, so dass die Funktion des einen von dem anderen beeinflusst wird. So ist zum Beispiel ein Promotor funktionsfähig mit einer Kodierungssequenz verknüpft, wenn er dazu fähig ist, die Expression dieser Kodierungssequenz zu beeinflussen (d. h. dass sich die Kodierungssequenz unter der transkriptionalen Kontrolle des Promoters befindet). Kodierungssequenzen können funktionsfähig mit den Regulationssequenzen in der Sense- oder Antisense-Orientierung verknüpft sein.
Unter dem Begriff „Expression", wie hierin verwendet, versteht man die Transkription und stabile Akkumulation von Sense-(mRNA) oder Antisense-RNA, die sich vom erfindungsgemäßen Nukleinsäurefragment herleiten. Die Expression kann auch auf die Translation von mRNA in ein Polypeptid verweisen.
Unter „maturem" Protein versteht man ein posttranslational verarbeitetes Polypeptid, d. h. eines, aus dem jedwede vorliegenden Prä- oder Propeptide im primären Translationsprodukt entfernt wurden. Unter „Präkursor"-Protein versteht man das primäre Produkt der mRNA-Translation; d. h. worin die Prä- und Propeptide noch vorliegen. Prä- und Propeptide können gegebenenfalls auf die intrazellulären Lokalisierungssignale beschränkt sein, sind aber nicht darauf beschränkt.
Unter dem Begriff „Signalpeptid" versteht man ein Amino-terminales Polypeptid, das dem sezernierten maturen Protein vorausgeht. Das Signalpeptid wird vom maturen Protein abgespalten und liegt deshalb nicht in ihm vor. Signalpeptide weisen die Funktion des Richtens und Translozierens sezernierter Proteine durch die Zellmembranen auf. Unter Signalpeptid versteht man auch ein Signalprotein.
Unter „Transformation" versteht man den Transfer eines Nukleinsäurefragments in das Genom eines Wirtsorganismus, was zu genetisch stabilem Erbgut führt. Unter Wirtsorganismen, enthaltend die transformierten Nukleinsäurefragmente, versteht man „transgene" oder „rekombinante" oder „transformierte" Organismen.
Unter den Begriffen „Plasmid", „Vektor" und „Kassette" versteht man ein zusätzliches chromosomales Element, das oft Gene trägt, die nicht Teil des zentralen Metabolismus der Zelle bilden, und gewöhnlich in der Form von ringförmigen doppelsträngigen DNA-Molekülen vorliegen. Solche Elemente können autonom replizierende Sequenzen, Genom-integrierende Sequenzen, Phagen- oder Nukleotidsequenzen, lineare oder ringförmige, von einer ein- oder doppelsträngigen DNA oder RNA darstellen, die sich von jedweder Quelle herleiten, worin eine Anzahl an Nukleotidsequenzen in einer einzigartigen Konstruktion zusammengefügt oder rekombiniert wurden, die zum Einführen eines Promotor-Fragments und einer DNA-Sequenz für ein ausgewähltes Genprodukt zusammen mit einer angemessenen nicht translatierten Sequenz an 3' in eine Zelle fähig ist. Unter „Transformationskassette" versteht man einen spezifischen Vektor, enthaltend ein Fremdgen und mit Elementen zusätzlich zum Fremdgen, die die Transformation einer bestimmten Wirtszelle erleichtert. Unter „Expressionskassette" versteht man einen spezifischen Vektor, enthaltend ein Fremdgen und mit Elementen zusätzlich zum Fremdgen, die eine verstärkte Expression dieses Gens in einem Fremdwirt ermöglicht.
Unter dem Begriff „veränderte biologische Aktivität" versteht man eine Aktivität, die mit einem Protein assoziiert ist, das durch eine mikrobielle Nukleotidsequenz kodiert wird, die durch ein Assay-Verfahren gemessen werden kann, worin diese Aktivität entweder größer als oder geringer als die mit der nativen mikrobiellen Sequenz assoziierte Aktivität ist. Unter „verstärkter biologischer Aktivität" versteht man eine veränderte Aktivität, die größer als die mit der nativen Sequenz assoziierte ist. Unter „verminderter biologischer Aktivität" versteht man eine veränderte Aktivität, die geringer als die mit der nativen Sequenz assoziierte ist.
Unter dem Begriff „Sequenzanalysen-Software" versteht man jedweden Computer-Algorithmus oder jedwedes Computer-Software-Programm, das für die Analyse der Nukleotid- oder Aminosäuresequenzen nützlich ist. Die „Sequenzanalysen- Software" kann gewerblich erhältlich sein oder unabhängig entwickelt werden. Die typische Sequenzanalysen-Software schließt Folgendes ein, ist aber nicht darauf beschränkt: das GCG-Programmpaket (Wisconsin Package Version 9.0, Genetics Computer Group (GCG), Madison, WI), BLASTP, BLASTN, BLASTX (Altschul et al., J. Mol. Biol. 215:403–410 (1990) und DNASTAR (DNASTAR, Inc. 1228 S. Park St. Madison, WI 53715 USA). Im Rahmen dieser Anmeldung ist zur Kenntnis zu nehmen, dass wenn die Sequenzanalysen-Software zur Analyse verwendet wird, die Analysenergebnisse, sofern nicht anderweitig spezifiziert ist, auf die „Defaultwerte" des angegebenen Programms bezogen sind. Wie hierin verwendet, versteht man unter „Defaultwerten" jedweden Set von Werten oder Parametern, die ursprünglich mit der Software geladen werden, wenn diese zuerst initialisiert wird.
Die hier verwendete rekombinante Standard-DNA und die molekularen Klonierungsverfahren sind im Stand der Technik weithin bekannt und werden von Sambrook, J., Fritsch, E. F. und Maniatis, T., Molecular Cloning: A Laboratory Manual, zweite Auflage, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY (1989) (hierin nachstehend „Maniatis"); und von Silhavy, T. J., Bennan, M. L. und Enquist, L. W., Experiments with Gene Fusions, Cold Spring Harbor Laboratory Cold Press Spring Harbor, NY (1984); und von Ausubel, F. M. et al., Current Protocols in Molecular Biology, veröffentlicht von der Greene Publishing Assoc. und Wiley-Interscience (1987), beschrieben.
ISOLATION VON HOMOLOGEN
Die erfindungsgemäßen Nukleinsäurefragmente können zum Isolieren von Genen verwendet werden, die für homologe Proteine aus der gleichen oder anderen mikrobiellen Spezies kodieren. Die Isolierung homologer Gene unter Verwendung Sequenz-abhängiger Protokolle ist aus dem Stand der Technik weithin bekannt. Beispiele von Sequenz-abhängigen Protokollen schließen folgende ein, sind aber nicht darauf beschränkt: Verfahren der Nukleinsäurehybridisierung und Verfahren der DNA- und RNA-Amplifikation, wie durch verschiedene Verwendungsmöglichkeiten von Nukleinsäure-Amplifikationstechnologien (z. B. Polymerase-Kettenreaktion (PCR), Mullis et al., US-Patent 4,683,202), Ligase-Kettenreaktion (LCR), Tabor, S. et al., Proc. Acad. Sci. USA 82, 1074, (1985)) oder Strangverdrängungsamplifikation (SDA, Walker, et al., Proc. Natl. Acad. Sci. USA, 89, 392, (1992)) erläutert wird.
So könnten zum Beispiel Gene, die für ähnliche wie die erfindungsgemäßen Proteine oder Polypetide kodieren, unter Verwendung von allen oder einem Anteil der vorliegenden Nukleinsäurefragmente als DNA-Hybridisierungssonden zum Screening von Bibliotheken von jedweden gewünschten Bakterien unter Verwendung der Methodologie, die dem Fachmann weithin bekannt ist, direkt isoliert werden. Auf den vorliegenden Nukleinsäuresequenzen basierende spezifische Oligonukleotid-Sonden können durch aus dem Stand der Technik bekannte Verfahren ausgelegt und synthetisiert werden (Maniatis). Die gesamten Sequenzen können überdies direkt zum Synthetisieren von DNA-Sonden mittels den dem Fachmann bekannten Verfahren, wie zum Beispiel DNA-Markierung mit Zufallsprimern, Nick-Translation oder Endmarkierungsverfahren, oder RNA-Sonden unter Verwendung verfügbarer in vitro-Transkriptionssysteme verwendet werden. Spezifische Primer können außerdem zur Amplifikation eines Teils oder der vollen Länge der vorliegenden Sequenzen ausgelegt und verwendet werden. Die sich ergebenden Amplifikationsprodukte können während der Amplifikationsreaktionen direkt markiert werden oder nach den Amplifikationsreaktionen markiert und als Sonden zur Isolation von DNA-Fragmenten voller Länge unter Bedingungen von angemessener Stringenz verwendet werden.
Bei Amplifikationsverfahren des PCR-Typs weisen die Primer in der Regel verschiedene Sequenzen auf und sind nicht komplementär zueinander. In Abhängigkeit von den gewünschten Testbedingungen sollten die Sequenzen der Primer zur Bereitstellung sowohl für eine effiziente als auch getreue Replikation der Target-Nukleinsäure ausgelegt sein. Verfahren zum PCR-Primerdesign sind üblich und aus dem Stand der Technik weithin bekannt. (Thein and Wallace, „The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders", in Human Genetic Diseases: A Practical Approach, K. E. Davis Hrsg., (1986) S. 33–50, IRL Press, Hemdon, Virginia); Rychlik, W. (1993) in White, B. A. (Hrsg.). Methods in Molecular Biology. Vol. 15, Seiten 31–39, PCR Protocols: Current Methods and Applications. Humania Press, Inc., Totowa, NJ.)
Im Allgemeinen können in Polymerase-Kettenreaktionsprotokollen zum Amplifizieren langer Nukleinsäurefragmente, die für homologe Gene aus DNA oder RNA kodieren, zwei kurze Segmente der vorliegenden Sequenzen verwendet werden. Die Polymerase-Kettenreaktion kann auch an einer Bibliothek aus klonierten Nukleinsäurefragmenten durchgeführt werden, worin sich die Sequenz von einem Primer von den vorliegenden Nukleinsäurefragmenten herleitet, und die Sequenz vom anderen Primer den Vorteil des Vorliegens der Polyadenylsäure-Schwänze am 3'-Ende des mRNA-Präkursors, der für mikrobielle Gene kodiert, wahrnimmt. Als Alternative kann die zweite Primer-Sequenz auf Sequenzen basiert sein, die sich vom Klonierungsvektor herleiten. So kann der Fachmann zum Beispiel das RACE-Protokoll (Frohman et al., PNAS USA 85:8998 (1988)) zum Generieren von cDNAs unter Verwendung der PCR zur Amplifikation von Kopien der Region zwischen einem einzelnen Punkt im Transkript und dem 3'- oder 5'-Ende befolgen. In den 3'- und 5'-Richtungen orientierte Primer können aus den vorliegenden Sequenzen konzipiert werden. Unter Verwendung von gewerblich erhältlichen 3'-RACE- oder 5'-RACE-Systemen (BRL) können spezifisch cDNA-Fragmente an 3' oder 5' isoliert werden (Ohara et al., PNAS USA 86:5673 (1989); Loh et al., Science 243:217 (1989)).
Die vorliegenden Sequenzen können als Alternative als Hybridisierungsreagenzien zur Identifikation von Homologen eingesetzt werden. Die grundlegenden Komponenten eines Nukleinsäure-Hybridisierungstests schließen eine Sonde, eine Probe, die vermutlich das Gen oder Genfragment von Interesse enthält, und ein spezifisches Hybridisierungsverfahren ein. Bei den Sonden handelt es sich in der Regel um einsträngige Nukleinsäuresequenzen, die zu den nachzuweisenden Nukleinsäuresequenzen komplementär sind. Die Sonden sind an die nachzuweisende Nukleinsäuresequenz „hybridisierbar". Die Sondenlänge kann von 5 Basen bis zu Zehntausenden von Basen variieren und hängt vom durchzuführenden spezifischen Test ab. Eine Sondenlänge von ca. 15 Basen bis ca. 30 Basen ist in der Regel geeignet. Es braucht nur ein Teil des Sondenmoleküls komplementär zur nachzuweisenden Nukleinsäuresequenz zu sein. Außerdem braucht die Komplementarität zwischen der Sonde und der Targetsequenz nicht perfekt zu sein. Die Hybridisierung tritt zwischen Imperfekt komplementären Molekülen mit dem Ergebnis auf, dass eine bestimmte Fraktion der Basen in der hybridisierten Region nicht mit der richtigen komplementären Base gepaart ist.
Die Hybridisierungsverfahren sind gut definiert. Die Sonde und Probe müssen in der Regel unter Bedingungen gemischt werden, die die Nukleinsäurehybridisierung zulassen. Dies beinhaltet das Kontaktieren der Sonde und Probe in Gegenwart eines anorganischen oder organischen Salzes unter den ordnungsgemäßen Konzentrations- und Temperaturbedingungen. Die Sonden- und Probennukleinsäuren müssen sich lange genug in Kontakt miteinander befinden, damit eine mögliche Hybridisierung zwischen der Sonde und Probennukleinsäure auftreten kann. Die Konzentration von Sonde oder Target im Gemisch bestimmen die Zeit, die bis zum Auftreten der Hybridisierung notwendig ist. Je höher die Sonden- oder Target-Konzentration ist, um so kürzer ist die für die Hybridisierung benötigte Inkubationszeit. Optional kann ein chaotropes Mittel zugefügt werden. Das chaotrope Mittel stabilisiert Nukleinsäuren durch Inhibition der Nuklease-Aktivität. Das chaotrope Mittel ermöglicht überdies die empfindliche und stringente Hybridisierung von kurzen Oligonukleotid-Sonden bei Raumtemperatur [Van Ness und Chen (1991) Nucl. Acids Res. 19:5143–5151]. Zu geeigneten chaotropen Mitteln gehören: Guanidiniumchlorid, Guanidiniumthiocyanat, Natriumthiocyanat, Lithiumtetrachloracetat, Natriumperchlorat, Rubidiumtetrachloracetat, Kaliumiodid und Cäsiumtrifluoracetat u.a. Das chaotrope Mittel liegt in der Regel in einer Endkonzentration von ca. 3 M vor. Gegebenenfalls kann man dem Hybridisierungsgemisch Formamid, in der Regel 30–50 Vol-%, zufügen.
Es können verschiedene Hybridisierungslösungen eingesetzt werden. Diese umfassen in der Regel von ca. 20 bis 60 Vol-%, bevorzugt 30 Vol-% eines polaren organischen Lösungsmittels. Eine übliche Hybridisierungslösung setzt ca. 30–50 Vol-% Formamid, ca. 0,15 bis 1 M Natriumchlorid, ca. 0,05 bis 0,1 M Puffer, wie zum Beispiel Natriumcitrat, Tris-HCl, PIPES oder HEPES (pH-Bereich ca. 6–9), ca. 0,05 bis 0,2 % Detergens, wie zum Beispiel Natriumdodecylsulfat oder zwischen 0,5 – 20 mM EDTA, FICOLL (Pharmacia Inc.) (ca. 300–500 Kilodalton (kD)), Polyvinylpyrrolidon (ca. 250–500 kD) und Serumalbumin ein. Auch eingeschlossen in die typische Hybridisierungslösung werden nicht markierte Träger-Nukleinsäuren von ca. 0,1 bis 5 mg/ml, fragmentierte Nukleinsäure-DNA, z. B. DNA aus dem Kalbsthymus oder Lachsspermata oder Hefe-RNA und optional von ca. 0,5 bis 2 % (w/v) Glycin. Andere Zusatzmittel können auch eingeschlossen werden, wie zum Beispiel Volumenausschlussmittel, die viele verschiedene polare, wasserlösliche oder quellbare Mittel, wie zum Beispiel Polyethylenglykol, anionische Polymere, wie zum Beispiel Polyacrylat oder Polymethylacrylat und anionische Saccharid-Polymere, wie zum Beispiel Dextransulfat, einschließen.
Die Nukleinsäure-Hybridisierung ist auf viele verschiedene Assayformate anpassbar. Eines der geeignetsten stellt das Sandwich-Assayformat dar. Der Sandwich-Assay ist insbesondere an die Hybridisierung unter nicht denaturierenden Bedingungen anpassbar. Eine primäre Komponente eines Assays des Sandwich-Typs stellt einen festen Träger dar. Der feste Träger weist adsorbiert oder kovalent gekoppelt an ihn eine immobilisierte Nukleinsäure-Sonde auf, die nicht markiert und komplementär zu einem Anteil der Sequenz ist.
REKOMBINANTE EXPRESSION – MIKROBIELL
Das durch Sequenzen repräsentierte Gen, das für das Polypeptid von SEQ ID NO:4 kodiert und das Genprodukt (das genannte Polypeptid) der vorliegenden Sequenzen kann in heterologen Wirtszellen, insbesondere in den Zellen mikrobieller Wirte hergestellt werden. Die Expression in rekombinanten mikrobiellen Wirten kann für die Expression von verschiedenen Intermediärprodukten im Weg, für die Modulation von Wegen, die bereits im Wirt für die Synthese neuer Produkte, die bisher unter Verwendung des Wirts nicht möglich waren, nützlich sein. Zusätzlich können die Genprodukte zur Verleihung höherer Wachstumsausbeuten aus dem Wirt oder zur Ermöglichung der Verwendung einer alternativen Wachstumsform genutzt werden.
Bevorzugte heterologe Wirtszellen zur Expression der vorliegenden Nukleinsäuremoleküle stellen mikrobielle Wirte dar, die in großen Zügen in den Pilz- oder Bakterienfamilien gefunden werden und die über einen weiten Bereich von Temperaturen, pH-Werten und Lösungsmitteltoleranzen wachsen. Da der Transkriptions-, Translations- und biosynthetische Protein-Apparat ungeachtet des zellulären Rohsubstrats gleich ist, werden funktionelle Gene ungeachtet des zur Herbeiführung der zellulären Biomasse verwendeten Kohlenstoff-Rohsubstrats exprimiert. Mikrobielles Wachstum in großem Umfang und die funktionelle Genexpression können eine weite Reihe einfacher oder komplexer Kohlenhydrate, organischer Säuren und Alkohole, gesättigter Kohlenwasserstoffe, wie zum Beispiel Methan oder Kohlendioxid, im Fall von photosynthetischen oder chemoautotrophen Wirten verwerten. Die funktionellen Gene können jedoch durch spezifische Wachstumsbedingungen, die die Form und Menge von Stickstoff, Phosphor, Schwefel, Sauerstoff, Kohlenstoff oder jedwede Spur von Mikronährstoffen, einschließlich kleiner anorganischer Ionen einschließen können, reguliert, reprimiert oder gedämpft werden. Außerdem kann die Regulation funktioneller Gene durch die An- oder Abwesenheit spezifischer Regulationsmoleküle erreicht werden, die der Kultur zugefügt werden können und in der Regel nicht als Nährstoff- oder Energiequellen in Betracht gezogen werden. Die Wachstumsrate kann auch einen wichtigen Regulationsfaktor bei der Genexpression darstellen. Beispiele von Wirtsstämmen schließen folgende ein, sind aber nicht beschränkt auf Pilz- oder Hefespezies, wie zum Beispiel Aspergillus, Trichoderma, Saccharomyces, Pichia, Candida, Hansenula, oder Bakterienspezies, wie zum Beispiel: Salmonella, Bacillus, Acinetobacter, Rhodococcus, Streptomyces, Escherichia, Pseudomonas, Methylomonas, Methylobacter, Alcaligenes, Synechocystis, Anabaena, Thiobacillus, Methanobacterium und Klebsiella.
Von besonderem erfindungsgemäßem Interesse sind obligate Methanotrophe mit hohem Wachstum mit einem energetisch vorteilhaften Kohlenstofffluxweg. So haben die Anmelder zum Beispiel einen spezifischen Methanotrophen-Stamm mit mehreren Merkmalen des Wegs entdeckt, der ihn für die Kohlenstoffflux-Manipulation besonders nützlich macht. Dieser Stamm-Typ hat in der vorliegenden Anmeldung als Wirt gedient und ist als Methylomonas 16a (ATCC PTA 2402) bekannt.
Der vorliegende Stamm enthält mehrere Anomalien im Kohlenstoffverwertungsweg. So wird zum Beispiel gezeigt, dass basierend auf den Genom-Sequenzdaten, der Stamm Gene für zwei Wege des Hexosestoffwechsels enthält. Der Entner-Douderoff-Weg, der das Keto-desoxy-phosphogluconat-Aldolaseenzym verwendet, ist in dem Stamm anwesend. Es ist im Allgemeinen überall anerkannt, dass es sich hierbei um den funktionsfähigen Weg in obligaten Methanotrophen handelt. Auch anwesend ist jedoch der Embden-Meyerhof-Kohlenstoff-Weg, der das Fructosebisphosphat-Aldolaseenzym verwendet. Es ist weithin bekannt, dass dieser Weg entweder nicht anwesend oder in obligaten Methanotrophen nicht funktionsfähig ist. Aus energetischer Sicht ist der letztere Weg am vorteilhaftesten und ermöglicht eine größere Ausbeute von biologisch nützlicher Energie und letztendlich die Produktion einer Zellmasse und anderer Zellmassen-abhängiger Produkte in Methylomonas 16a. Die Aktivität dieses Wegs im vorliegenden Stamm 16a wurde durch Mikroarray-Daten und biochemische Evidenz, wobei die ATP-Reduktion gemessen wird, bestätigt. Obwohl gezeigt wurde, dass der Stamm 16a Enzyme des Embden-Meyerhof-Kohlenstoff- ebenso wie des Entner-Douderoff-Wegs besitzt, deuten die Daten darauf hin, dass die Enzyme des Embden-Meyerhof-Kohlenstoff-Wegs stärker exprimiert werden als die Enzyme des Entner-Douderoff-Wegs. Dieses Ergebnis ist überraschend und läuft der bestehenden Ansicht über den glykolytischen Metabolismus von methanotrophen Bakterien zuwider. Die Anmelder haben andere methanotrophe Bakterien mit diesen Charakteristika, einschließlich zum Beispiel Methylomonas clara und Methylosinus sporium, entdeckt. Es ist möglich, dass diese Aktivität in Methanotrophen aufgrund des Aktivitätsmangels des Enzyms mit ATP, dem typischen Phosphoryl-Donor für das Enzym in den meisten Bakteriensystemen unentdeckt blieb. Ein besonders neues und nützliches Merkmal des Embden-Meyerhof-Kohlenstoff-Weges im Stamm 16a besteht darin, dass der wichtige Phosphofructokinase-Schritt Pyrophosphat- anstelle von ATP-abhängig ist. Dieses Merkmal trägt zur Energieausbeute des Weges unter Verwendung von Pyrophosphat anstelle von ATP bei. Aufgrund seiner Signifikanz bei der Bereitstellung eines energetischen Vorteils für den Stamm wird dieses Gen im Kohlenstofffluxweg als diagnostisches Mittel für den vorliegenden Stamm in Betracht gezogen.
In methanotrophen Bakterien wird Methan über einen als Ribulose-Monophosphat-Weg oder RuMP-Zyklus bekannten cyclischen Reaktionsset in Biomoleküle umgewandelt. Dieser Weg setzt sich aus drei Phasen zusammen, wobei jede Phase aus einer Reihe von enzymatischen Schritten besteht. Der erste Schritt stellt die „Fixierung" oder Inkorporation von C₁ (Formaldehyd) in eine Pentose zur Bildung einer Hexose oder eines C₆-Zuckers dar. Dies tritt über eine Kondensationsreaktion zwischen einem aus C₅-Zucker (Pentose) und Formaldehyd auf und wird durch die Hexulose-Monophosphat-Synthase katalysiert. Die zweite Phase wird als „Spaltung" bezeichnet und führt zur Aufspaltung dieser Hexose in zwei C₃-Moleküle. Eines dieser C₃-Moleküle wird über den RuMP-Weg rezykliert und das andere C₃-Fragment wird für das Zellwachstum genutzt. In Methanotrophen und Methylotophen kann der RuMP-Weg als einer von drei Varianten auftreten. Im Allgemeinen werden jedoch nur zwei dieser Varianten gefunden – der FBP/TA-Weg (Fructosebisphosphatase/Transaldolase-Weg) oder der KDPG/TA-Weg (Keto-desoxyphospho-gluconat/Transaldolase-Weg). (Dijkhuizen L., G.E. Devries. The Physiology and Biochemistry of aerobic methanol-utilizing gram negative and gram positive bacteria. In: Methane and Methanol Utilizers 1992, Hrsg. Colin Murrell und Howard Dalton, Plenum Press NY.
Der vorliegende Stamm ist in der Weise einzigartig, dass er die „Spaltungsschritte" handhabt, in denen Gene gefunden wurden, die diese Umwandlung über Fructosebisphosphat als ein Haupintermediärprodukt durchführen. Die Gene für die Fructosebisphosphat-Aldolase und Transaldolase wurden zusammengeclustert auf einem DNA-Stück gefunden. Zweitens wurde gefunden, dass die Gene für die andere am Keto-desoxy-phosphogluconat-Intermediärprodukt beteiligte Variante auch zusammengeclustert waren. Die zur Verfügung stehende Literatur lehrt, dass sich diese Organismen (obligate Methylotrophe und Methanotrophe) einzig auf den KDPG-Weg verlassen und dass der FBP-abhängige Fixierungsweg von fakultativen Methylotophen genutzt wird (Dijkhuizen et al., vorstehend). Deshalb wird die letztere Beobachtung erwartet, die erstere hingegen nicht. Der Befund für die FBP-Gene in einem obligaten Methan-verwertenden Bakterium ist nicht nur überraschend, sondern deutet auch auf seinen Nutzen hin. Der FBP-Weg ist aufgrund der Tatsache, dass mehr Energie (ATP) als im KDPG-Weg verwertet wird, für den Wirtsorganismus energetisch vorteilhaft. Folglich können Organismen, die den FBP-Weg nutzen, einen energetischen Vorteil und Wachstumsvorteil gegenüber denen aufweisen, die den KDPG-Weg nutzen. Dieser Vorteil kann auch für Energie erfordernde Produktionswege im Stamm nützlich sein. Durch Verwendung dieses Wegs kann ein Methan-verwertendes Bakterium einen Vorteil gegenüber anderen Methan-verwertenden Organismen als Produktionsplattformen für entweder Einzelzellprotein oder für jedwedes andere sich vom Kohlenstofffluss durch den RuMP-Weg herleitende Produkt aufweisen.
Gegenstand der Erfindung stellt folglich die Bereitstellung eines Verfahrens zur Herstellung von Exopolysaccharid unter Verwendung eines energetisch vorteilhaften Stammes von Methylomonas dar, der

(a) auf einem C₁-Kohlenstoffsubstrat wächst, der aus der Gruppe ausgewählt ist, die aus Methan und Methanol besteht; und
(b) einen funktionellen Embden-Meyerhof-Kohlenstoff-Weg umfasst, wobei der Weg ein Gen umfasst, das für ein Pyrophosphat-abhängiges Phosphofructokinase-Enzym kodiert.

Mikrobielle Expressionssysteme und Expressionsvektoren, die Regulationssequenzen enthalten, welche die hochgradige Expression von Fremdproteinen richten, sind dem Fachmann weithin bekannt. Jedwede von diesen könnten zur Konstruktion chimärer Gene zur Produktion von jedwedem der Genprodukte der vorliegenden Sequenzen verwendet werden. Diese chimären Gene könnten dann über die Transformation zur Bereitstellung einer hochgradigen Expression der Enzyme in entsprechende Mikroorganismen eingeführt werden.
Die vorliegenden Gene sind außerdem bei der Veränderung der Eigenschaften der Wirtsmikrobe wirksam. So wird zum Beispiel erwartet, dass Wirtszellen mit chimären Genen, die für eine oder mehr der vorliegenden Sequenzen kodieren, um die Überexpression von Exopolysaccharid zu induzieren oder die Produktion von Exopolysacchariden durch Änderung des Biosyntheseweges von Exopolysaccharid in Wirtszellen zur Reduktion der Exopolysaccharidproduktion in Wirtszellen zur Reduktion der Biofilmbildung zu manipulieren, transformiert werden können.
Für die Transformation geeigneter Wirtszellen nützliche Vektoren oder Kassetten sind aus dem Stand der Technik weithin bekannt. Der Vektor oder die Kassette enthält in der Regel Sequenzen, welche die Transkription und Translation des relevanten Gens, eines selektierbaren Markers und von Sequenzen, welche die autonome Replikation oder chromosomale Integration zulassen, richten. Geeignete Vektoren umfassen eine Region 5' des Gens, welches die transkriptionalen Initiationskontrollen beherbergt und eine Region 3' des DNA-Fragments, welche die transkriptionale Terminierung kontrolliert. Es ist am bevorzugtesten, wenn sich beide Kontrollregionen von Genen herleiten, die zur transformierten Wirtszelle homolog sind, obwohl man zur Kenntnis nehmen sollte, dass sich solche Kontrollregionen nicht von den Genen herzuleiten brauchen, die für die als einen Produktionswirt gewählte spezifische Spezies nativ sind.
Es gibt zahlreiche Initiationskontrollregionen oder Promotoren, die zum Antrieb der Expression der vorliegenden ORFs in der gewünschten Wirtszelle nützlich und dem Fachmann geläufig sind. Fast jedweder Promotor, der zum Antrieb dieser Gene fähig ist, ist erfindungsgemäß geeignet, einschließlich aber nicht begrenzt auf CYC1, HIS3, GAL1, GAL10, ADH1, PGK, PH05, GAPDH, ADC1, TRP1, URA3, LEU2, ENO, TP1 (nützlich für die Expression in Saccharomyces); A0X1 (nützlich für die Expression in Pichia); und lac, ara, tet, trp, IP_L, IP_R, T7, tac, und trc (nützlich für die Expression in Escherichia coli) ebenso wie die Promotoren amy, apr, npr und verschiedene Phagenpromotoren, die für die Expression in Bacillus nützlich sind.
Die Kontrollregionen für die Termination können sich auch von verschiedenen Genen herleiten, die für die bevorzugten Wirte nativ sind. Optional könnte ein Terminationsort unnötig sein, es ist jedoch am bevorzugtesten, wenn er eingeschlossen ist.
PATHWAY-ENGINEERING
In einer bevorzugten Ausführungsform können die vorliegenden Gene in verschiedenen methanotrophen Stämmen zur Modulation oder Regulation der Produktion von Exopolysacchariden verwendet werden. Das Gen und seine Sequenzen können auf viele verschiedene Weisen zur Modulation bestehender Polysaccharidwege verwendet werden. Verfahren zur Manipulation genetischer Wege sind aus dem Stand der Technik allgemein und überall bekannt. Ausgewählte Gene in einem bestimmten Weg können mithilfe einer Reihe verschiedener Verfahren up- oder downreguliert werden. Ein Organismus in konkurrierenden Wegen kann durch Gen-Disruption und ähnliche Verfahren eliminiert oder sublimiert werden.
Sobald ein wichtiger genetischer Weg identifiziert und sequenziert wurde, können spezifische Gene zur Erhöhung der Leistung des Wegs upreguliert werden. So können zum Beispiel zusätzliche Kopien der targetierten Gene in die Wirtszelle auf Multikopie-Plasmiden, wie zum Beispiel pBR322, eingeführt werden. Als Alternative können die Target-Gene modifiziert werden, so dass sie sich unter der Kontrolle von nicht nativen Promotoren befinden. Wenn erwünscht ist, dass ein Weg an einem bestimmten Punkt in einem Zellzyklus oder während eines Fermentierungslaufs arbeitet, können regulierte oder induzierbare Promotoren zum Ersatz des nativen Promotors des Target-Gens verwendet werden. Auf ähnliche Weise kann der native oder endogene Promotor in einigen Fällen zur Steigerung der Genexpression modifiziert werden. So können zum Beispiel die endogenen Promotoren durch Mutation, Deletion und/oder Substitution in vivo verändert werden (siehe Kmiec, US-Patent 5,565,350; Zarling et al., PCT/US93/03868).
Als Alternative kann es notwendig sein, die Expression bestimmter Gene im Target-Weg oder in konkurrierenden Wegen, die als konkurrierende Sammler für Energie oder Kohlenstoff dienen können, zu reduzieren oder eliminieren. Verfahren zum Downregulieren von Genen für diesen Zweck wurden exploriert. Wo bekannt ist, dass die Sequenz des Gens unterbrochen ist, stellt die targetierte Gen-Disruption eines der wirksamsten Verfahren der Gen-Downregulation dar, wobei die Fremd-DNA in ein strukturelles Gen insertiert wird, um auf diese Weise die Transkription zu unterbrechen. Dies kann durch die Herbeiführung von genetischen Kassetten bewirkt werden, umfassend die zu insertierende DNA (oft einen genetischen Marker), die von einer Sequenz mit einer hochgradigen Homologie zu einem Anteil des Gens, das disrupiert werden soll, flankiert ist. Die Einführung der Kassette in die Wirtszelle führt zur Insertion der Fremd-DNA in das strukturelle Gen über die nativen DNA-Replikationsmechanismen der Zelle. (Siehe zum Beispiel Hamilton et al. (1989) J. Bacteriol. 171:4617–4622, Balbas et al. (1993) Gene 136:211–213, Gueldener et al. (1996) Nucleic Acids Res. 24:2519–2524 und Smith et al. (1996) Methods Mol. Cell. Biol. 5:270–277.)
Die Antisense-Technologie stellt ein anderes Verfahren zur Downregulation von Genen dar, wo die Sequenz des Target-Gens bekannt ist. Um dies zu erreichen, wird ein Nukleinsäuresegment aus dem gewünschten Gen kloniert und funktionsfähig mit einem Promotor dergestalt verknüpft, dass der Antisense-Strang der RNA transkribiert wird. Dieses Konstrukt wird dann in die Wirtszelle eingeführt, und der Antisense-Strang der RNA wird produziert. Die Antisense-RNA inhibiert die Genexpression durch Verhinderung der Akkumulation von mRNA, die für das Protein von Interesse kodiert. Es wird dem Fachmann bekannt sein, dass mit der Verwendung der Antisense-Technologien spezielle Erwägungen assoziiert sind, um die Expression bestimmter Gene zu reduzieren. So kann zum Beispiel der richtige Expressionsgrad der Antisense-Gene die Verwendung verschiedener chimärer Gene erforderlich machen, die sich verschiedene, dem Fachmann bekannte Regulationselemente zunutze machen.
Obwohl die targetierte Gen-Disruption und Antisense-Technologie wirksame Mittel zur Downregulation von Genen bieten, bei denen die Sequenz bekannt ist, wurden andere weniger spezifische Methodologien entwickelt, die nicht Sequenz-basiert sind. So können zum Beispiel Zellen der UV-Strahlung ausgesetzt und dann auf den gewünschten Phänotyp gescreent werden. Die Mutagenese mit chemischen Mitteln ist auch zur Generierung von Mutanten und häufig verwendeten Substanzen, einschließlich Chemikalien wirksam, die sich auf eine nicht replizierende DNA, wie zum Beispiel HNO₂ und NH₂OH auswirken, ebenso wie Mittel, die sich auf die Replikation von DNA auswirken, wie zum Beispiel Acridin-Färbemittel, die dafür bekannt sind, dass sie Frameshift-Mutationen verursachen. Spezifische Verfahren zur Herbeiführung von Mutanten unter Verwendung von Strahlung oder Chemikalien sind im Stand der Technik gut dokumentiert. Siehe zum Beispiel Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology, zweite Auflage (1989) Sinauer Associates, Inc., Sunderland, MA. oder Deshpande, Mukund V., Appl. Biochem. Biotechnol., 36, 227, (1992).
Ein anderes nicht spezifisches Verfahren der Gen-Disruption besteht in der Verwendung von transposablen Elementen oder Transposons. Transposons stellen genetische Elemente dar, die zufällig in die DNA insertiert werden, aber später auf der Basis der Sequenz zur Bestimmung zurückgewonnen werden können, wo die Inserion aufgetreten ist. Sowohl in vivo- als auch in vitro-Transpositionsverfahren sind bekannt. Beide Verfahren beinhalten die Verwendung eines transposablen Elements in Kombination mit einem Transposase-Enzyms. Wenn das transposable Element oder Transposon mit einem Nukleinsäurefragment in Gegenwart der Transposase in Kontakt gebracht wird, wird das transposable Element zufällig in das Nukleinsäurefragment insertiert. Das Verfahren ist für die zufällige Mutagenese und für die Genisolation nützlich, da das disruptierte Gen auf der Basis der Sequenz des transposablen Elements identifiziert werden kann. Kits für die in vitro-Transposition sind gewerblich erhältlich (siehe zum Beispiel das Primer Island Transposition Kit, erhältlich von Perkin Elmer Applied Biosystems, Branchburg, NJ, basierend auf dem Ty1-Element von Hefe; das Genome Priming System, erhältlich von New England Biolabs, Beverly, MA; basierend auf dem bakteriellen Transposon Tn7; und den EZ::TN Transposon Insertion Systems, erhältlich von Epicentre Technologies, Madison, WI, basierend auf dem bakteriellen transposablen Element Tn5.
Im erfindungsgemäßen Kontext könnte es nützlich sein, die Expression des Exopolysaccharid-Wegs zu modulieren. Wie angemerkt wurde, weist der vorliegende Stamm die Fähigkeit auf, Polysaccharide in großen Mengen zu produzieren. Dieses Verfahren wird von einem Satz von Genen, einschließlich des ugp-Gens, der gumD- und gumH-Gene, der epsB-, epsM- und epsV-Gene und des waaD-Gens bestimmt. Während es sich hierbei um keinen erfindungsgemäß beanspruchten Aspekt handelt, kann es in diesem Weg von besonderer Bedeutung sein, die Upregulation des an der Polymerisation und/oder dem Export des Polysaccharids beteiligten espB-Gens oder des den Transfer von Zucker an die Polysaccharid-Intermediärprodukte kontrollierenden epsY-Gens zu veranlassen.
PRODUKTION IM INDUSTRIELLEN MAßSTAB
Wenn die gewerbliche Produktion von Exopolysacchariden erwünscht ist, können eine Reihe verschiedener Kultur-Methodologien angewendet werden. So kann zum Beispiel eine Produktion im großen Maßstab sowohl durch Batch- als auch kontinuierliche Kulturmethodologien hergestellt werden.
Ein klassisches Batch-Kulturverfahren stellt ein geschlossenes System dar, worin die Zusammensetzung der Medien zu Beginn der Kultur eingestellt wird und während des Kultivierungsverfahrens keinen artifiziellen Veränderungen unterliegt. Folglich werden die Medien zu Beginn des Kultivierungsverfahren mit dem/den gewünschten Organismus/Organismen inokuliert und das Auftreten von Wachstum oder metabolischer Aktivität ist zulässig, wobei dem System nichts zugefügt wird. Eine „Batch"-Kultur stellt jedoch in der Regel in Bezug auf das Zufügen einer Kohlenstoffquelle einen Batch dar, und es werden häufig Versuche zur Kontrolle von Faktoren, wie zum Beispiel pH und der Sauerstoffkonzentration, unternommen. In Batch-Systemen ändern sich die Metabolit- und Biomassenzusammensetzungen des Systems ständig bis zu dem Zeitpunkt, an dem die Kultur terminiert wird. In Batch-Kulturen werden die Zellen durch eine statische lag-Phase bis zu einer log-Phase mit hohem Wachstum und schließlich zu einer stationären Phase, in der die Wachstumsrate nachlässt oder stoppt, moderiert. Wenn unbehandelt, sterben die sich in der stationären Phase befindenden Zellen allmählich ab. Zellen in der log-Phase sind häufig für den größten Teil der Produktion des Endprodukts oder Intermediärprodukts in einigen Systemen verantwortlich. Die Produktion in der stationären oder postexponentiellen Phase kann in anderen Systemen erhalten werden.
Eine Variation an dem Standardbatch-System stellt das Fed-Batch-System dar. Fed-Batch-Kulturverfahren sind erfindungsgemäß auch geeignet und umfassen ein typisches Batch-System mit der Ausnahme, dass das Substrat in Inkrementen mit fortschreitender Kultur zugefügt wird. Fed-Batch-Systeme sind nützlich, wenn eine Katabolit-Repression dazu neigt, den Metabolismus der Zellen zu inhibieren und wo es wünschenswert ist, dass man limitierte Substratmengen in den Medien hat. Die Messung der tatsächlichen Substratkonzentration in Fed-Batch-Systemen ist schwierig, und es wird deshalb auf der Basis der Änderungen der messbaren Faktoren, wie zum Beispiel pH, aufgelöstem Sauerstoff und dem Partialdruck der Abfallgase, wie zum Beispiel CO₂, ermittelt. Batch- und Fed-Batch-Kulturverfahren sind im Stand der Technik allgemein und weithin bekannt, und Beispiele können in Thomas D. Brock in Biotechnology: A Textbook of industrial Microbiology; zweite Auflage (1989) Sinauer Associates, Inc., Sunderland, MA., oder Deshpande, Mukund V., Appl. Biochem. Biotechnol., 36, 227, (1992) gefunden werden.
Die gewerbliche Produktion von Exopolysacchariden kann auch mit einer kontinuierlichen Kultur erreicht werden. Kontinuierliche Kulturen stellen ein offenes System dar, in dem einem Bioreaktor kontinuierlich ein definiertes Kulturmedium zugefügt wird und eine gleiche Menge von konditioniertem Medium gleichzeitig zur Verarbeitung entfernt wird. Kontinuierliche Kulturen erhalten im Allgemeinen die Zellen bei einer konstanten hohen Dichte in der Flüssigphase aufrecht, in der sich Zellen primär in der log-Phase des Wachstums befinden. Als Alternative kann die kontinuierliche Kultur mit immobilisierten Zellen praktisch ausgeführt werden, wobei der Kohlenstoff und die Nährstoffe kontinuierlich zugefügt werden und wertvolle Produkte, Nebenprodukte oder Abfallprodukte kontinuierlich aus der Zellmasse entfernt werden. Zellimmobilisierung kann unter Verwendung einer weiten Reihe von festen Trägern, die aus natürlichen und/oder synthetischen Materialien aufgebaut sind, durchgeführt werden.
Die kontinuierliche oder semikontinuierliche Kultur lässt die Modulation eines Faktors oder jedweder Anzahl an Faktoren zu, die sich auf das Zellwachstum oder die Endprodukt-Konzentration auswirken. So erhält ein Verfahren zum Beispiel einen limitierten Nährstoff, wie zum Beispiel die Kohlenstoff- oder Stickstoffkonzentration bei einer fixierten Rate aufrecht und erlaubt, dass alle anderen Parameter moderiert werden können. In anderen Systemen können eine Anzahl an Faktoren, die sich auf das Wachstum auswirken, kontinuierlich verändert werden, während die Zellkonzentration, gemessen anhand der Trübheit des Mediums, konstant gehalten wird. Kontinuierliche Systeme streben die Aufrechterhaltung von Wachstumsbedingungen im Steady-state an und folglich muss der Zellverlust aufgrund des Abzugs von Medium gegen die Zellwachstumsrate in der Kultur ausgeglichen werden. Verfahren zum Modulieren der Nährstoffe und Wachstumsfaktoren für kontinuierliche Kulturverfahren ebenso wie für Verfahren zur Maximierung der Produktbildungsrate sind aus dem Stand der industriellen Mikrobiologie weithin bekannt und viele verschiedene Verfahren werden von Brock, vorstehend, ausführlich beschrieben.
Die erfindungsgemäßen Fermentierungsmedien müssen geeignete Kohlenstoffsubstrate enthalten. Geeignete Substrate können folgende einschließen, sind aber nicht darauf beschränkt: Monosaccharide, wie zum Beispiel Glucose und Fructose, Oligosaccharide, wie zum Beispiel Lactose oder Saccharose, Polysaccharide, wie zum Beispiel Stärke oder Cellulose oder Gemische davon und ungereinigte Gemische von erneuerbaren Rohsubstraten, wie zum Beispiel Käsemolke-Permeat, Maisweichwasser, Zuckerrübenmelasse und Gerstenmalz. Das Kohlenstoffsubstrat kann zusätzlich auch C₁-Substrate, wie zum Beispiel Kohlendioxid, Methan oder Methanol darstellen, für das die metabolische Umwandlung in wichtige biochemische Intermediärprodukte nachgewiesen wurde. Außer C₁- und C₂-Substraten sind auch methylotrophe Organismen zur Verwertung einer Anzahl anderer Kohlenstoff-enthaltender Verbindungen, wie zum Beispiel Methylamin, Glucosamin und eine Reihe verschiedener Aminosäuren für die metabolische Aktivität bekannt. So sind zum Beispiel methylotrophe Hefe zur Verwertung des Kohlenstoffs aus Methylamin zur Bildung von Trehalose oder Glycerol bekannt (Bellion et al., Microb. Growth Cl Compd., [Int. Symp.], 7. (1993), 415–32. Hrsg.: Murrell. J. Collin; Kelly, Don P. Verlag: Intercept, Andover, UK). Auf ähnliche Weise metabolisieren verschiedene Candida-Spezies Alanin oder Ölsäure (Sulter et al., Arch. Microbiol. 153:485–489 (1990)). Folglich wird daran gedacht, dass die erfindungsgemäß verwertete Kohlenstoffquelle eine weite Reihe verschiedener Kohlenstoff-enthaltender Substrate umfassen kann und nur durch die Wahl des Organismus begrenzt ist.
REKOMBINANTE PRODUKTION – PFLANZEN
Pflanzen und Algen sind auch bekannt dafür, dass sie Polysaccharide produzieren. Die erfindungsgemäßen Nukleinsäurefragmente können zur Herbeiführung transgener Pflanzen mit der Fähigkeit zur Expression des mikrobiellen Proteins verwendet werden. Bevorzugte Pflanzenwirte stellen jedwede Varietät, die einen hohen Produktionsgrad der vorliegenden Proteine unterstützen, dar. Geeignete grüne Pflanzen schließen folgende ein, sind aber nicht darauf beschränkt: Sojabohnen, Rapssamen (Brassica napus, B. campestris), Sonnenblumen (Helianthus annus), Baumwolle (Gossypium hirsutum), Mais, Tabak (Nicotiana tabacum), Alfalfa (Medicago sativa), Weizen (Triticum sp), Gerste (Hordeum vulgare), Hafer (Avena sativa, L), Sorghum (Sorghum bicolor), Reis (Oryza sativa), Arabidopsis, Kohlgemüse (Brokkoli, Blumenkohl, Kohl, Pastinaken usw.), Melonen, Karotten, Sellerie, Petersilie, Tomaten, Kartoffeln, Erdbeeren, Erdnüsse, Trauben, Grassaatgut, Zuckerrüben, Zuckerrohr, Bohnen, Erbsen, Roggen, Flachs, Laubbäume, Nadelbäume und Futtergräser. Algenspezies schließen folgende ein, sind aber nicht auf gewerblich signifikante Wirte beschränkt, wie zum Beispiel Spirulina und Dunalliela. Eine Überexpression der erfindungsgemäßen Proteine kann zunächst durch Konstruieren chimärer Gene erreicht werden, worin die Kodierungsregion mit Promotoren funktionsfähig verknüpft sind, die zur Richtung der Expression eines Gens in den gewünschten Geweben auf der gewünschten Entwicklungsstufe fähig sind. Aus Gründen der Zweckmäßigkeit können die chimären Gene Promotor-Sequenzen und Translationsleader-Sequenzen umfassen, die sich von den gleichen Genen herleiten. Nicht kodierende Sequenzen an 3', die für Transkriptionsterminationssignale kodieren, müssen auch bereitgestellt werden. Die vorliegenden chimären Gene können auch ein oder mehr Intron(e) zur Förderung der Genexpression umfassen.
Jedwede Kombination an jedwedem Promotor und jedwedem Terminator, die zur Induktion der Expression einer kodierenden Region fähig ist, kann in der chimären genetischen Sequenz verwendet werden. Einige geeignete Beispiele von Promotoren und Terminatoren schließen die von den Nopalinsynthase- (nos), Octopinsynthase- (ocs) und den Blumenkohl-Mosaikvirus-Genen (CaMV) ein. Ein effizienter Pflanzenpromotortyp, der verwendet werden kann, stellt einen hochaktiven Pflanzenpromotor dar. Solche Promotoren in funktionsfähiger Verknüpfung mit den genetischen Sequenzen oder die vorliegende Erfindung sollten zur Promotion der Expression des vorliegenden Genprodukts fähig sein. Hochaktive Pflanzenpromotoren, die erfindungsgemäß verwendet werden können, schließen den Promotor der kleinen Untereinheit (ss) der Ribulose-1,5-bisphosphat-carboxylase, wie zum Beispiel aus der Sojabohne (Berry-Lowe et al., J. Molecular and App. Gen., 1:483–498 1982)), und den Promotor des Chlorophyll-a/b-Bindungsproteins ein. Es ist bekannt, dass diese beiden Promotoren in Pflanzenzellen Licht-induziert werden (siehe zum Beispiel, Genetic Engineering of Plants, an Agricultural Perspective. A. Cashmore, Plenum, New York (1983), Seiten 29–38; Coruzzi, G. et al. The Journal of Biological Chemistry 258:1399 (1983), und Dunsmuir, P. et al., Journal of Molecular and Applied Genetics, 2:285 (1983)).
Plasmidvektoren, umfassend die vorliegenden chimären Gene, können dann konstruiert werden. Die Wahl des Plasmidvektors hängt vom Verfahren ab, das zum Transformieren der Wirtspflanzen verwendet wird. Der Fachmann wird sich der genetischen Elemente, die auf dem Plasmidvektor vorliegen müssen, um die Wirtszellen, die das chimäre Gen enthalten, erfolgreich transformieren, auswählen und propagieren zu können, bewusst sein. Der Fachmann wird auch erkennen, dass verschiedene unabhängige Transformationsereignisse verschiedene Expressionsgrade und -muster ergeben (Jones et al., (1985) FMBO J. 4:2411–2418; De Almeida et al., (1989) Mol. Gen. Genetics 218:78–86), und dass folglich mehrfache Ereignisse gescreent werden müssen, um Linien zu erhalten, die den gewünschten Expressionsgrad und das -muster aufweisen. Solches Screening kann mithilfe der Southern-Analyse von DNA-Blots (Southern, J. Mol. Biol. 98, 503, (1975)), der Northern-Analyse der mRNA-Expression (Kroczek, J. Chromatogr. Biomed. Appl., 618 (1–2) (1993) 133–145), der Western-Analyse der Proteinexpression oder der Phänotyp-Analyse erreicht werden.
Für einige Applikationen wird es nützlich sein, die vorliegenden Proteine an verschiedene Zellkompartimente zu richten. Es wird folglich für möglich gehalten, dass die vorstehend beschriebenen chimären Gene durch Veränderung der Kodierungssequenzen zum Kodieren von Enzymen mit den entsprechenden intrazellulären Targeting-Sequenzen, wie zum Beispiel Transit-Sequenzen (Keegstra, K., Cell 56:247–253 (1989)), Signal-Sequenzen oder Sequenzen, die für die Lokalisierung des endoplasmatischen Retikulums kodieren (Chrispeels, J. J., Ann. Rev. Plant Phys. Plant Mol. Biol. 42:21–53 (1991)), oder nuklearen Lokalisierungssignalen (Raikhel, N. Plant Phys.100:1627–1632 (1992)) zugefügt und/oder mit bereits vorliegenden Targeting-Sequenzen entfernt, weiter supplementiert werden. Während die zitierten Referenzen Beispiele von jedem von diesen geben, ist die Liste nicht erschöpfend und weitere nützliche Targeting-Signale könnten gegebenenfalls künftig entdeckt werden, die erfindungsgemäß nützlich sind.
PROTEIN-ENGINEERING
Es wird in Betracht gezogen, dass das vorliegende Nukleotid zur Herstellung von Genprodukten mit verstärkter oder veränderter Aktivität verwendet werden kann. Es sind verschiedene Verfahren zum Mutieren einer nativen Gensequenz zur Herstellung eines Genprodukts mit veränderter oder verstärkter Aktivität, einschließlich, aber nicht beschränkt darauf, Fehlern unterliegender PCR (Melnikov et al., Nucleic Acids Research, (15. Feb. 1999) Vol. 27, Nr. 4, S. 1056–1062); ortsgerichteter Mutagenese (Coombs et al., Proteins (1998), 259–311, 1 Platte. Hrsg.: Angeletti, Ruth Hogue. Verlag: Academic, San Diego, Calif.) und „Gen-Shuffling" ( US 5,605,793 ; US 5,811,238 ; US 5,830,721 ; und US 5,837,458 ) bekannt.
Das Verfahren des Gen-Shufflings ist aufgrund seiner leichten Implementierung und der hohen Mutageneserate und der Leichtigkeit des Screenings besonders attraktiv. Das Verfahren des Gen-Shufflings beinhaltet die Spaltung eines Gens von Interesse mittels der Restriktionsendonuklease in Fragmente von spezifischer Größe in Gegenwart zusätzlicher Populationen aus DNA-Regionen von sowohl mit Ähnlichkeit als auch einem Unterschied zu dem Gen von Interesse. Dieser Pool von Fragmenten wird dann zur Herbeiführung eines mutierten Gens denaturiert und reannealt. Das mutierte Gen wird dann auf eine veränderte Aktivität gescreent.
Die vorliegenden erfindungsgemäßen mikrobiellen Sequenzen können mittels dieses Verfahrens mutiert und auf eine veränderte oder verstärkte Aktivität gescreent werden. Die Sequenzen sollten doppelsträngig sein und können von verschiedenen Längen im Bereich von 50 bp bis 10 kb sein. Die Sequenzen können unter Verwendung von im Stand der Technik überall bekannten Restriktionsendonukleasen zufällig in Fragmente im Bereich von ca. 10 bp bis 1000 bp aufgeschlossen werden (Maniatis vorstehend). Außer den vorliegenden mikrobiellen Sequenzen können Populationen von Fragmenten, die an die gesamte mikrobielle oder Anteile der mikrobiellen Sequenz hybridisierbar sind, zugefügt werden. Auf ähnliche Weise kann auch eine Population von Fragmenten, die nicht an die vorliegende Sequenz hybridisierbar ist, zugefügt werden. In der Regel werden diese zusätzlichen Fragment-Populationen in einem ca. 10- bis 20fachen Gewichtsüberschuss im Vergleich zur Gesamtnukleinsäure zugefügt. Wenn dieses Verfahren befolgt wird, liegt im Allgemeinen die Anzahl an verschiedenen spezifischen Nukleinsäurefragmenten im Gemisch bei ca. 100 bis ca. 1000. Die gemischte Population zufälliger Nukleinsäurefragmente wird zur Bildung einsträngiger Nukleinsäurefragmente denaturiert und dann reannealt. Nur die einsträngigen Nukleinsäurefragmente mit Regionen der Homologie mit anderen einsträngigen Nukleinsäurefragmenten werden reannealt. Die zufälligen Nukleinsäurefragmente können durch Erhitzen denaturiert werden. Ein Fachmann könnte die Bedingungen bestimmen, die zur vollkommenen Denaturierung der doppelsträngigen Nukleinsäure notwendig sind. Die Temperatur beträgt bevorzugt von 80 °C bis 100 °C. Die Nukleinsäurefragmente können durch Abkühlen reannealt werden. Die Temperatur beträgt bevorzugt von 20 °C bis 75 °C. Die Renaturierung kann durch das Zufügen von Polyethylenglykol („PEG") oder Salz beschleunigt werden. Eine geeignete Salzkonzentration kann im Bereich von 0 mM bis 200 mM liegen. Die annealten Nukleinsäurefragmente werden dann in Gegenwart einer Nukleinsäure-Polymerase und dNTPs (d. h. dATP, dCTP, dGTP und dTTP) inkubiert. Die Nukleinsäure-Polymerase kann das Klenow-Fragment, die Taq-Polymerase oder jedwede andere im Stand der Technik bekannte DNA-Polymerase sein. Die Polymerase kann den zufälligen Nukleinsäurefragmenten vor dem Annealing, gleichzeitig mit dem Annealing oder nach dem Annealing zugefügt werden. Der Zyklus von Denaturierung, Renaturierung und Inkubation in der Gegenwart von Polymerase wird gegebenenfalls mehrmals wiederholt. Der Zyklus wird bevorzugt von 2- bis 50-mal wiederholt, die Sequenz wird bevorzugter von 10- bis 40-mal wiederholt. Die sich ergebende Nukleinsäure stellt ein größeres doppelsträngiges Polynukleotid im Bereich von ca. 50 bp bis ca. 100 kb dar und kann anhand des Standard-Klonierungs- und Expressionsprotokolls auf Expression und veränderte Aktivität gescreent werden. (Manatis, vorstehend).
Ein Hybriden-Protein kann überdies durch Fusion funktioneller Domänen unter Verwendung des Gen-Shuffling-Verfahrens (Exon-Shuffling-Verfahrens) (Nixon et al., PNAS, 94:1069–1073 (1997)) assembliert werden. Die funktionelle Domäne des vorliegenden Gens kann mit der funktionellen Domäne anderer Gene zur Herbeiführung neuer Enzyme mit der gewünschten katalytischen Funktion kombiniert werden. Ein Hybriden-Enzym kann unter Verwendung eines Overlap-Extension-PCR-Verfahrens konstruiert und unter Verwendung von dem Fachmann bekannten Verfahren in die verschiedenen Expressionsvektoren kloniert werden.
GENEXPRESSION-PROFILING
Alle oder ein Anteil der erfindungsgemäßen Nukleinsäurefragmente können auch als Sonden zur Überwachung der Genexpression und zum Genexpression-Profiling verwendet werden. Viele externe Veränderungen, wie zum Beispiel Veränderungen der Wachstumsbedingungen und Chemikalienexposition, können zur Induktion oder Repression von Genen in der Zelle führen. Die Induktion oder Repression von Genen kann für ein Screening-System zur Bestimmung der besten Wachstumsbedingung für die Produktion des Organismus, Entdeckung von Arzneimitteln mit ähnlichem Wirkmechanismus der Verbindung, um nur wenige zu nennen, verwendet werden. Andererseits kann man durch Amplifizieren oder Disruptieren von Genen die Herstellung der Menge von Zellprodukten, die Biofilmbildung ebenso wie den zeitlichen Ablauf manipulieren.
So können zum Beispiel alle oder ein Anteil der vorliegenden Nukleinsäurefragmente auf einer Nylonmembran oder einem Glasobjektträger immobilisiert werden. Ein Generation II DNA-Spotter (Molecular Dynamics) stellt eine der verfügbaren Technologien zum Anordnen der DNA-Proben im Array auf den beschichteten Glasobjektträgern dar. Andere Array-Verfahren sind auch erhältlich und aus dem Stand der Technik überall bekannt. Nachdem die Zellen unter verschiedenen Wachstumsbedingungen gezüchtet oder mit potenziellen Kandidaten behandelt wurden, wird die zelluläre RNA gereinigt. Fluoreszenz- oder radioaktiv markierte Target-cDNA kann durch reverse Transkription von mRNA hergestellt werden. Das Target-Gemisch wird an die Sonden hybridisiert, die unter Verwendung von Bedingungen gewaschen werden, die aus dem Stand der Technik überall bekannt sind. Die Menge der Target-Genexpression wird durch die Intensität der Radioaktivität oder der Fluoreszenzmarkierung (z. B. konfokales Laser-Mikroskop: Molecular Dynamics) quantifiziert. Die Intensitäten der Radioaktivitäts- oder der Fluoreszenzmarkierung an den immobilisierten Sonden werden unter Verwendung der im Stand der Technik bekannten Technologie gemessen. Das zweifarbige Fluoreszenz-Detektionsschema (z. B. Cy3 und Cy5) weist den Vorteil gegenüber radioaktiv markierten Targets dahingehend auf, dass es eine rasche und simultane Differential-Expressionsanalyse von unabhängigen Proben ermöglicht. Außerdem kompensiert die Verwendung der Verhältnismessungen für die von Sonde zu Sonde auftretende Variation der Intensität, die auf die DNA-Konzentration und Hybridisierungseffizienz zurückzuführen ist. Im Fall der Fluoreszenzmarkierung machen die beiden mit der entsprechenden Anregung und den Emissionsfiltern erhaltenen Fluoreszenzbilder die Rohdaten aus, die aus den Verhältniswerten der Differential-Genexpression berechnet wurden. Die Intensität der Bilder wird unter Verwendung der verfügbaren Software (z. B. Array Vision 4.0: Imaging Research Inc.), die aus dem Stand der Technik überall bekannt sind, analysiert und zur Kompensation für die unterschiedlichen Effizienzen der Markierung und der Detektion der Markierung normalisiert. Es gibt im Stand der Technik viele verschiedene Weisen zur Normalisierung der Signale. Eines dieser Verfahren zur Normalisierung des Signals erfolgt durch die Bereinigung des Signals gegen interne Kontrollen. Ein anderer Vorgang besteht darin, ein getrenntes Array mit markierter genomisch getriebener DNA laufen zu lassen und das Signal mit den RNA-getriebenen Signalen zu vergleichen. Dieses Verfahren ermöglicht auch die Messung der Transkriptfülle. Die Array-Daten eines individuellen Gens wird untersucht und zur Bestimmung der Induktion oder Repression des Gens unter den Testbedingungen bewertet.
BEISPIELE
ALLGEMEINE VERFAHREN
In den Beispielen verwendete rekombinante Standard-DNA- und molekulare Klonierungsverfahren sind aus dem Stand der Technik überall bekannt und werden von Sambrook, J., Fritsch, E. F. und Maniatis, T. Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press: Cold Spring Harbor, (1989) (Maniatis) und von T. J. Silhavy, M. L. Bennan, und L. W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984) und von Ausubel, F. M. et al., Current Protocols in Molecular Biology, Verlag: Greene Publishing Assoc. und Wiley-Interscience(1987), beschrieben.
Für die Aufrechterhaltung und das Wachstum von Bakterienkulturen geeignete Materialien und Verfahren sind im Stand der Technik überall bekannt. Zur Verwendung in den folgenden Beispielen geeignete Verfahren können wie in Manual of Methods for General Bacteriology (Phillipp Gerhardt, R. G. E. Murray, Ralph N. Costilow, Eugene W. Nester, Willis A. Wood, Noel R. Krieg und G. Briggs Phillips, Hrsg.), American Society for Microbiology, Washington, DC, (1994)) oder von Thomas D. Brock in Biotechnology: A Textbook of Industrial Microbiology, zweite Auflage, Sinauer Associates, Inc., Sunderland, MA (1989) dargelegt, gefunden werden. Alle für das Wachstum und die Erhaltung von Bakterienzellen verwendeten Reagenzien, Restriktionsenzyme und Materialien wurden von Aldrich Chemicals (Milwaukee, WI), DIFCO Laboratories (Detroit, MI), GIBCO/BRL (Gaithersburg, MD) oder der Sigma Chemical Company (St. Louis, MO) bezogen, sofern nicht anderweitig angegeben wird.
Manipulationen genetischer Sequenzen wurden unter Verwendung eines Programm-Pakets erreicht, das von der Genetics Computer Group Inc. (Wisconsin Package Version 9.0, Genetics Computer Group (GCG), Madison, WI) erhältlich ist. Wenn das GCG-Programm „Pileup" verwendet wurde, wurden der Defaultwert der Gap Creation von 12 und der Defaultwert der Gap Extension von 4 verwendet. Wenn die CGC-Programme „Gap" oder „Bestfit" verwendet wurden, wurden die Default Gap Creation Penalty von 50 und die Default Gap Extension Penalty von 3 verwendet. In jedwedem Fall, in dem die GCG-Programmparameter für diese oder jedwedes andere GCG-Programm nicht angefordert wurden, wurden Defaultwerte verwendet.
Multiples Alignment der Sequenzen wurde unter Verwendung des FASTA-Programms, das den Smith-Waterman-Algorithmus inkorporiert, durchgeführt (W. R. Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Tagungsdatum 1992, 111–20. Herausgeber): Suhai, Sandor. Publisher: Plenum, New York, NY).
Die Bedeutung der Abkürzungen ist wie folgt: „h" bedeutet Stunde(n), „min" bedeutet Minute(n), „sec" bedeutet Sekunde(n), „d" bedeutet Tag(e), „ml" bedeutet Milliliter, „l" bedeutet Liter.
ISOLATION DES STAMMES VON METHYLOMONAS 16a
Die aus der Umwelt stammende Originalprobe, enthaltend das Isolat, wurde aus einem Teichsediment aus dem Naturschutzgebiet in Pennsylvania gewonnen. Das Teichsediment wurde direkt in ein definiertes Mineralmedium unter 25 % Methan in Luft inokuliert. Methan stellte die einzige Kohlenstoff- und Energiequelle dar. Das Wachstum wurde verfolgt, bis die optische Dichte bei 660 nm beständig war, worauf die Kultur in frisches Medium dergestalt transferiert wurde, dass eine Verdünnung von 1:100 erreicht wurde. Nach drei aufeinanderfolgenden Transfers mit Methan als einzige Kohlenstoff- und Energiequelle wurde die Kultur auf ein definiertes Agar-Minimalmedium ausplattiert und unter 25 % Methan in Luft inkubiert. Methylomonas 16a wurde aufgrund des raschen Wachstums von Kolonien und der großen Koloniengröße als der zu untersuchende Organismus ausgewählt. Der Genus des ausgewählten Organismus wurde durch die 16SrRNA-Analyse bestätigt. Aus dem Stamm extrahierte 16SrRNA wurde sequenziert und mit bekannten 16SrRNAs aus anderen Mikroorganismen verglichen. Die Daten weisen eine 96%ige Ähnlichkeit mit Sequenzen aus Methylomonas sp. KSP III und Methylomonas sp. Stamm LW 13 auf.
BEISPIEL 1
DIE HERSTELLUNG GENOMISCHER DNA ZUM SEQUENZIEREN UND SEQUENZ-GENERATION
Die genomische DNA wurde aus Methylomonas 16a gemäß den Standardprotokollen isoliert.
Die genomische DNA- und Bibliothek-Konstruktion wurden gemäß den veröffentlichten Protokollen hergestellt (Friseur et al., The Minimal Gene Complement of Mycoplasma genitalium, Science 270, 1995). Ein Zellpellet wurde in einer Lösung, enthaltend 100 mM Na-EDTA, pH 8,0, 10 mM Tris-HCl, pH 8,0, 400 mM NaCl und 50 mM MgCl₂ resuspendiert.
Herstellung der genomischen DNA. Nach der Resuspension wurden die Zellen vorsichtig in 10 % SDS lysiert und 30 min bei 55 °C inkubiert. Nach der Inkubation bei Raumtemperatur wurde die Proteinase K 100 μg/ml zugefügt und bei 37 °C inkubiert, bis die Suspension klar war. Die DNA wurde zweimal mit Tris-äquilibriertem Phenol und zweimal mit Chloroform extrahiert. Die DNA wurde in 70 % Ethanol präzipitiert und in einer Lösung, enthaltend 10 mM Tris-HCl und 1 mM Na-EDTA (TE), pH 7,5, resuspendiert. Die DNA-Lösung wurde mit einer Mischung aus RNAasen behandelt, dann zweimal mit Tris-äquilibriertem Phenol und zweimal mit Chloroform extrahiert. Dem schloss sich die Präzipitation in Ethanol und Resuspension in TE an.
Konstruktion der Bibliothek. 200 bis 500 μg chromosomale DNA wurden in einer Lösung aus 300 mM Natriumacetat, 10 mM Tris-HCl, 1 mM Na-EDTA und 30 % Glycerol resuspendiert und 60 sec bei 12 psi in einer Aeromist Downdraft Nebulizer-Kammer (IBI Medical Products, Chicago, IL) geschert. Die DNA wurde präzipitiert, resuspendiert und mit Bal31-Nuklease behandelt. Nach der Größenfraktionierung wurde eine Fraktion (2,0 kb oder 5,0 kb) ausgeschnitten, gereinigt und es wurde ein Zweischritt-Ligationsverfahren zur Herstellung einer Bibliothek mit einem hohen Titer mit größer als 99 % einzelnen Inserts verwendet.
Sequenzierung. Es wurde ein Ansatz in der Form einer Shotgun-Sequenzierungsstrategie zur Sequenzierung des gesamten mikrobiellen Genoms übernommen (Fleischmann, Robert et al., Whole-Genome Random sequencing and assembly of Haemophilus influenzae Rd Science, 269:1995).
Die Sequenz wurde an einem ABI Automatic Sequencer unter Verwendung der Dye Terminator Technology ( U.S. 5366860 ; EP 272007 ) unter Verwendung einer Kombination aus Vektor- und Insertspezifischen Primern verwendet. Sequence Editing wurde entweder unter DNAStar (DNA Star Inc.) oder dem Wisconsin GCG-Programm (Wisconsin Package Version 9.0, Genetics Computer Group (GCG), Madison, WI) und dem CONSED-Paket (Version 7.0) durchgeführt. Alle Sequenzen stellen mindestens eine zweimalige Abdeckung in beiden Richtungen bereit.
BEISPIEL 2
IDENTIFIKATION UND CHARAKTERISIERUNG VON BAKTERIELLEN ORFs
ORFs, die für ugp, gumD, wza, epsB, epsM, waaE, epsV, gumH und Glycosyltransferase von Methylomonas 16a kodieren, wurden initial mittels Durchführung von BLAST-Suchen (Basic Local Alignment Search Tool; Altschul, S. F., et al., (1993) J. Mol. Biol. 215:403–410; siehe auch www.ncbi.nlm.nih.gov/BLAST/) auf Ähnlichkeit mit in der BLAST-"nr"-Datenbank enthaltenen Sequenzen (umfassend alle nicht redundanten (nr) GenBank CDS-Translationen, Sequenzen, die sich von der der 3-dimensionalen Struktur Brookhaven Protein Data Bank, der SWISS-PROT-Proteinsequenz-Datenbank, EMBL- und DDBJ-Datenbanken herleiten) identifiziert. Die in Beispiel 1 erhaltenen Sequenzen wurden auf Ähnlichkeit mit allen öffentlich verfügbaren DNA-Sequenzen, die in der „nr"-Datenbank enthalten sind, unter Verwendung des von dem National Center for Biotechnology Information (NCBI) bereitgestellten BLASTN-Algorithmus analysiert. Die DNA-Sequenzen wurden in allen Leserahmen translatiert und mit allen öffentlich verfügbaren Proteinsequenzen, die in der „nr"-Datenbank enthalten sind, unter Verwendung des vom NCBI bereitgestellten BLASTP-Algorithmus (Altschul, S. F., et al., Nucleic Acid Res. 25:3389–3402) (1997), auf Ähnlichkeit verglichen.
Alle initialen Vergleiche wurden unter Verwendung von entweder dem BLASTNnr- oder BLASTPnr-Algorithmus durchgeführt. Eine verfeinerte Ähnlichkeitssuche wurde unter Verwendung von FASTA (Version 32) mit den Defaultparametereinstellungen (BLOSUM 50 Scoring-Matrix, Wortlänge ktup = 2, Gap Penalty = –12 für den ersten Rest und –2 für jeden zusätzlichen Rest im Gap) durchgeführt. Die Ergebnisse des FASTA-Vergleichs sind in Tabelle 1 ersichtlich, die die Sequenzen zusammenfasst, mit denen sie die größte Ähnlichkeit aufweisen. Tabelle 1 weist Daten auf, die auf dem FASTA-Algorithmus basieren, mit Werten, die als Expect Values (E-Werte) berichtet werden. Der Expect Value ermittelt die statistische Signifikanz des Matchs, wobei die Anzahl an Matches spezifiziert wird, mit einem gegebenen Score, die bei einer Suche in einer Datenbank dieser Größe, absolut durch Zufall, erwartet werden.
Gencluster von Genen gumD, wza, epsB, epsM, waaE, epsV, gumH, und Glycosyltransferase sind in 1 ersichtlich.
SEQUENZPROTOKOLL

Claims

Isoliertes Nukleinsäuremolekül, kodierend für ein biosynthetisches Exopolysaccharid-Enzym von Methylomonas sp., das aus der Gruppe ausgewählt ist, bestehend aus: (a) Einem isolierten Nukleinsäuremolekül, kodierend für die Aminosäuresequenz, wie in SEQ ID NO: 4 dargelegt; und (b) einem isolierten Nukleinsäuremolekül, das sich zu (a) komplementär verhält.
Isoliertes Nukleinsäuremolekül nach Anspruch 1, wie in SEQ ID NO: 3 dargelegt.
Polypeptid, das durch das isolierte Nukleinsäuremolekül nach Anspruch 1 kodiert ist.
Polypeptid nach Anspruch 3, wie in SEQ ID NO: 4 dargelegt.
Chimäres Gen, umfassend das isolierte Nukleinsäuremolekül nach Anspruch 1, das mit geeigneten Regulationssequenzen funktionsfähig verknüpft ist.
Transformierte Wirtszelle, umfassend das chimäre Gen nach Anspruch 5.
Transformierte Wirtszelle nach Anspruch 6, worin die Wirtszelle aus der Gruppe ausgewählt ist, bestehend aus Bakterien, Hefe, filamentösen Pilzen und grünen Pflanzen.
Transformierte Wirtszelle nach Anspruch 7, worin die Wirtszelle aus der Gruppe ausgewählt ist, bestehend aus Aspergillus, Trichoderma, Saccharomyces, Pichia, Candida, Hansenula, Salmonella, Bacillus, Acinetobacter, Rhodococcus, Streptomyces, Escherichia, Pseudomonas, Methylomonas, Methylobacter, Alcaligenes, Synechocystis, Anabaena, Thiobacillus, Methanobacterium und Klebsiella.
Transformierte Wirtszelle nach Anspruch 7, worin die Wirtszelle aus der Gruppe ausgewählt ist, bestehend aus Sojabohnen, Rapssamen, Sonnenblumen, Baumwolle, Mais, Tabak, Alfalfa, Weizen, Gerste, Hafer, Sorghum, Reis, Arabidopsis, Kreuzblütler-Gemüse, Melonen, Karotten, Sellerie, Petersilie, Tomaten, Kartoffeln, Erdbeeren, Erdnüssen, Trauben, Grassaatgut, Zuckerrüben, Zuckerrohr, Bohnen, Erbsen, Roggen, Flachs, Laubbäumen, Nadelbäumen und Futtergräsern.
Verfahren zur Herstellung von Exopolysaccharid, umfassend: Kontaktieren einer transformierten Wirtszelle unter geeigneten Wachstumsbedingungen mit einer wirksamen Menge einer Kohlenstoffquelle, wodurch Exopolysaccharid gebildet wird, wobei die transformierte Wirtszelle das Nukleinsäuremolekül umfasst, das die SEQ ID NO: 4 kodiert, unter der Kontrolle geeigneter Regulatorsequenzen.
Verfahren nach Anspruch 10, worin die transformierte Wirtszelle aus der Gruppe ausgewählt ist, bestehend aus Aspergillus, Trichoderma, Saccharomyces, Pichia, Candida, Hansenula, Salmonella, Bacillus, Acinetobacter, Rhodococcus, Streptomyces, Escherichia, Pseudomonas, Methylomonas, Methylobacter, Alcaligenes, Synechocystis, Anabaena, Thiobacillus, Methanobacterium und Klebsiella.
Verfahren nach Anspruch 10, worin die transformierte Wirtszelle ein methanotrophes Bacterium darstellt, das: (a) auf einem C1-Kohlenstoffsubstrat wächst, das aus der Gruppe ausgewählt ist, die aus Methan und Methanol besteht; und (b) einen funktionellen Embden-Meyerhof-Kohlenstoff-Weg umfasst, wobei der Weg ein Gen umfasst, das für ein Pyrophosphat-abhängiges Phosphofructokinase-Enzym kodiert.
Verfahren nach Anspruch 12, worin das methanotrophe Bacterium Methylomonas 16a ATCC PTA 2402 darstellt.
Verfahren nach Anspruch 10, worin die transformierte Wirtszelle aus der Gruppe ausgewählt ist, bestehend aus: Sojabohnen, Rapssamen, Sonnenblumen, Baumwolle, Mais, Tabak, Alfalfa, Weizen, Gerste, Hafer, Sorghum, Reis, Arabidopsis, Kreuzblütler-Gemüse, Melonen, Karotten, Sellerie, Petersilie, Tomaten, Kartoffeln, Erdbeeren, Erdnüssen, Trauben, Grassaatgut, Zuckerrüben, Zuckerrohr, Bohnen, Erbsen, Roggen, Flachs, Laubbäumen, Nadelbäumen und Futtergräsern.
Verfahren nach Anspruch 10, worin die Kohlenstoffquelle aus der Gruppe ausgewählt ist, bestehend aus Monosacchariden, Oligosacchariden, Polysacchariden, Kohlendioxid, Methanol, Methan, Formaldehyd, Formiat und Kohlenstoff-enthaltende Amine.
Verfahren nach Anspruch 10, worin der transformierte Wirt aus der Gruppe ausgewählt ist, bestehend aus Methylomonas, Methylobacter und Methanobacterium und die Kohlenstoffquelle aus der Gruppe ausgewählt ist, bestehend aus Methan und Methanol.
Verfahren zur Regulation der Exopolysaccharid-Biosynthese in einem Organismus, umfassend die Überexpression von mindestens einem Exopolysaccharid-Biosynthese-Gen, wie in SEQ ID NO: 3 in einem Organismus dergestalt dargelegt ist, dass die Exopolysaccharid-Biosynthese im Organismus verändert wird.
Verfahren nach Anspruch 17, worin das Exopolysaccharid-Gen auf einem Multikopie-Plasmid überexprimiert wird.
Verfahren nach Anspruch 17, worin das Exopolysaccharid-Gen funktionsfähig mit einem induzierbaren oder regulierten Promotor verknüpft ist.
Verfahren nach Anspruch 17, worin das Exopolysaccharid-Gen in Antisense-Orientierung exprimiert wird.
Verfahren nach Anspruch 17, worin das Exopolysaccharid-Gen durch Insertion von Fremd-DNA in die Kodierungsregion unterbrochen wird.