-
GEBIET DER ERFINDUNG
-
Die
vorliegende Erfindung betrifft in Hefe hergestellte Polypeptide,
ein DNA-Konstrukt,
das eine derartige Polypeptide kodierende DNA-Sequenz umfasst, derartige
DNA-Fragmente tragende Vektoren und mit diesen Vektoren transformierte
Hefezellen sowie ein Verfahren zur Herstellung heterologer Proteine
in Hefe.
-
HINTERGRUND DER ERFINDUNG
-
Hefeorganismen
stellen etliche intrazellulär
synthetisierte Proteine her, die jedoch eine Funktion außerhalb
der Zelle haben. Derartige extrazelluläre Proteine werden als sezernierte
Proteine bezeichnet. Diese sezernierten Proteine werden zunächst innerhalb
der Zelle in einer Vorläufer-
oder Vorform exprimiert, die eine Präpeptidsequenz enthält, welche
eine wirksame Führung
des exprimierten Produkts über
die Membran des Endoplasmatischen Reticulums (ER) gewährleistet.
Das normalerweise als Signalpeptid bezeichnete Präpeptid wird
im Allgemeinen von dem gewünschten
Produkt während
der Translokation abgespalten. Sobald das Protein in den sekretorischen
Weg eingetreten ist, wird es zum Golgi-Apparat transportiert. Vom
Golgi-Apparat kann das Protein verschiedenen Routen folgen, die
zu Kompartimenten wie z.B. der Zellvakuole oder der Zellmembran
führen,
oder es kann aus der Zelle geleitet werden, um ins externe Medium
sezerniert zu werden (Pfeffer, S. R. und Rothman, J. E. Ann. Rev.
Biochem. 56 (1987), 829–852.
-
Mehrere
Vorgehensweisen wurden für
die Expression und Sekretion von für die Hefe heterologen Proteinen
in Hefe nahe gelegt. Die Europäische
Veröffentlichung
Nr. 0088632A beschreibt ein Verfahren, durch das für die Hefe
heterologe Proteine durch das Transformieren eines Hefeorganismus
mit einem Expressions vektor, der eine das gewünschte Protein und ein Signalpeptid
kodierende DNA trägt,
das Herstellen einer Kultur des transformierten Organismus, das
Züchten
der Kultur und Gewinnen des Proteins aus dem Kulturmedium, exprimiert,
verarbeitet und sezerniert werden. Bei dem Signalpeptid kann es
sich um das eigene Signalpeptid des gewünschten Proteins, d.h. ein
heterologes Signalpeptid, oder ein Hybrid eines homologen und eines
heterologen Signalpeptids handeln.
-
Ein
bei der Verwendung der für
Hefe heterologen Signalpeptide anzutreffendes Problem könnte sein, dass
das heterologe Signalpeptid keine wirksame Translokation und/oder
Spaltung nach dem Signalpeptid gewährleistet.
-
Der
MFα1 (α-Faktor)
von Saccharomyces cerevisiae wird als eine Präproform von 165 Aminosäuren synthetisiert,
die eine 19 Aminosäuren
langes Signal- oder Präpeptid
umfasst, gefolgt von einem 64 Aminosäuren langen „Leader" oder Propeptid,
der/das drei N-verknüpfte
Glykosylierungsstellen umfasst, gefolgt von (LysArg(Asp/Glu, Ala)2-3α-Faktor)4 (Kurjan, J. und Herskowitz, I. Cell 30
(1982), 933–943).
Der Signal-Leader-Teil des Präpro-MFα1 wurde weitgehend
verwendet, um die Synthese und Sekretion heterologer Proteine in
S. cerevisiae zu erzielen.
-
Die
Verwendung von für
die Hefe homologen Signal-/Leaderpeptiden ist unter anderem von
dem US-Patent Nr. 4,546,082, den Europäischen Veröffentlichungen Nr. 0116201A,
0123294A, 0123544A, 0163529A, 0123289A, dem Europäischen Patent
Nr. 0100561B und der PCT-Veröffentlichung
Nr. WO 95/02059 bekannt.
-
In
EP 0123289A ist
die Verwendung des α-Faktor-Vorläufers von
S. cerevisiae beschrieben, während
EP 0100561 die Verwendung
des PHO5-Signals von Saccharomyces cerevisiae und WO 95/02059 die
Verwendung des YAP3-Signalpeptids
zur Sekretion fremder Proteine beschreibt.
-
Das
US-Patent Nr. 4,546,082 und die Europäischen Veröffentlichungen Nr. 0016201A,
0123294A, 0123544A und 0163529A beschreiben Verfahren, durch welche
der Signal-Leader des α-Faktors
von Saccharomyces cerevisiae (MFα1
oder MFα2)
in dem Sekretionsverfahren der exprimierten heterologen Proteine
in Hefe verwendet wird. Die Sekretion und Verarbeitung des gewünschten
Proteins wurde durch Fusionieren einer DNA-Sequenz, die das Signal-/Leaderpeptid
des MFα1
von S. cerevisiae kodiert, am 5'-Ende
des Gens des gewünschten
Proteins demonstriert.
-
EP 0206783 offenbart ein
System zur Sekretion von Polypeptiden von S. cerevisiae, wobei die
Signal-/Leadersequenz des α-Faktors
zur Beseitigung der in der natürlichen
Sequenz vorliegenden vier α-Faktor-Peptide
verkürzt
wurde, um das Signal-/Leaderpeptid selbst, das mit einem heterologen
Polypeptid über die
Verarbeitungsstelle Lys-Arg-Glu-Ala-Glu-Ala des α-Faktors fusioniert ist, zu
hinterlassen. Es ist beschrieben, dass diese Konstruktion zu einem
wirksamen Verfahren zur Herstellung kleinerer Peptide (weniger als
50 Aminosäuren)
führt.
Zur Sekretion und Verarbeitung größerer Polypeptide wurde die
Leadersequenz des natürlichen α-Faktors
verkürzt,
um ein oder zwei α-Faktor-Peptide
zwischen dem Leaderpeptid und dem Polypeptid zu hinterlassen.
-
Etliche
sezernierte Proteine werden gesteuert, so dass der Vorläufer einem
proteolytischen Verarbeitungssystem, das die Peptidbindung am Carboxyende
von zwei aufeinander folgenden basischen Aminosäuren spalten kann, ausgesetzt
ist. Diese enzymatische Aktivität
ist in S. cerevisiae durch das Gen KEX 2 kodiert (Julius, D. A.
et al., Cell 37 (1984b), 1075). Die Verarbeitung des Produkts durch
die Protease KEX 2 ist zur Sekretion des aktiven Paarungsfaktors α1 (MFα1 oder α-Faktor) von S. cerevisiae
erforderlich, ist jedoch nicht an der Sekretion des aktiven Paarungsfaktors
a von S. cerevisiae beteiligt.
-
Die
Sekretion und korrekte Verarbeitung eines zur Sekretion bestimmten
Polypeptids wird in manchen Fällen
erzielt, wenn ein Hefeorganismus, der mit einem Vektor transformiert
ist, der wie in den vorstehend aufgeführten Dokumenten angegeben
konstruiert wurde, kultiviert wird. In vielen Fällen ist jedoch der Wert der Sekretion
sehr gering oder die Sekretion unterbleibt oder die proteolytische
Verarbeitung kann fehlerhaft oder unvollständig sein. Wie in der PCT-Veröffentlichung
Nr. WO 90/10075 beschrieben wird vermutet, dass dies zum Teil einem
unzureichenden Aussetzen der Verarbeitungsstelle, die zwischen dem
C-terminalen Ende des Leaderpeptids und dem N-terminalen Ende des
heterologen Proteins vorliegt, zuzuschreiben ist, um sie der proteolytischen
Spaltung, unter anderem der Spaltung durch die Protease KEX 2 unzugänglich oder
weniger zugänglich
zu machen.
-
WO
90/10075 beschreibt ein Hefeexpressionssystem mit verbesserter Verarbeitung
eines heterologen Polypeptids, die durch die Bereitstellung bestimmter
Modifikatiopen nahe der Verarbeitungsstelle am C-terminalen Ende
des Leaderpeptids und/oder des N-terminalen Endes eines mit dem
Leaderpeptid fusionierten heterologen Polypeptids erzielt wird.
Somit ist es möglich,
eine höhere
Ausbeute an korrekt verarbeitetem Protein zu erhalten, als es mit
nicht modifizierten Konstruktionen aus Leaderpeptid und heterologem
Polypeptid erhältlich
ist.
-
Des
Weiteren beschreibt WO 95/35384 DNA-Konstrukte, die Polypeptide
mit Modifikationen des N-terminalen Endes des heterologen Polypeptids
kodieren, die als Verlängerungen
entworfen sind, die durch Hefeproteasen vor der Reinigung aus den
Kulturmedien oder durch Proteolyse in vitro während oder im Anschluss an
die Reinigung des Produkts aus dem Kulturmedium abgespalten werden
können.
Die Polypeptide weisen die Formel Signalpeptid-Leaderpeptid-X1-X2-X3-X4-X5-X6-X7-heterologes Protein auf, wobei X1-X2 eine zweibasige
Verarbeitungsstelle der Hefeprotease, wie z.B. Lys-Arg, definiert
und wobei die Sequenz X3-X4-X5-X6-X7 nicht
EEGEPK umfasst.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Die
vorliegende Erfindung beschreibt eine Verbesserung von Modifikationen
des N-terminalen Endes des heterologen Polypeptids, die als Verlängerungen
entworfen sind, welche durch Proteolyse in vitro während oder
im Anschluss an die Reinigung des Produkts aus dem Kulturmedium
abgespalten werden können,
was zu höheren
Ausbeuten eines homogenen heterologen Proteinprodukts führt.
-
Die
vorliegende Erfindung betrifft ein DNA-Konstrukt, das eine Polypeptidsequenz
mit der folgenden Struktur
SP-LP-EEGEPK-*Polypeptid*
kodiert,
wobei SP eine DNA-Sequenz ist, die ein Signalpeptid kodiert,
LP
eine DNA-Sequenz ist, die ein Leaderpeptid kodiert und
EEGEPK
eine Aminosäuresequenz
ist, die als eine N-terminale Verlängerung des folgenden *Polypeptids*,
bei dem es sich um ein herzustellendes Protein oder anderes Polypeptid
handelt, lokalisiert ist.
-
...führt zu einer
verbesserten Ausbeute an heterologem Protein, was möglicherweise
eine verbesserte Translokation und/oder Sekretion widerspiegelt,
da Glycin mit nur einem Wasserstoffatom als Seitenkette eine viel
größere Vielfalt
an Konformationen als andere Aminosäurereste annehmen kann, was
somit ungewöhnliche
Hauptkettenkonformationen und möglicherweise
einen instabileres/n Vorläufer-Polypeptid
und Sekretionsverlauf ermöglicht.
-
Die
Sequenz EEGEPK bildet eine Verlängerung
am N-Terminus des heterologen Polypeptids. Diese Verlängerung
erhöht
nicht nur die Fermentationsausbeute, sondern ist gegen die Verarbeitung
durch die Dipeptidyl-Aminopeptidase (DPAP A) geschützt, was
zu einem homogenen N-Terminus des Polypeptids führt. Die Verlängerung
ist derart konstruiert, dass sie gegen proteolytische Spaltung während der
Fermentation resistent ist, so dass das N-terminal verlängerte heterologe
Proteinprodukt aus dem Kulturmedium zur anschließenden proteolytischen Rei fung
in vitro, z.B. durch eine für
basische Aminosäuren
spezifische Protease, wie z.B. Trypsin oder die Protease I von Achromobacter
lyticus, gereinigt werden kann. Die gewünschte Entfernung der N-terminalen
Verlängerung
EEGEPK in vitro wird entweder durch Trypsin oder Protease I von
Achromobacter lyticus einfach bewerkstelligt, vermutlich aufgrund
der Flexibilität
des N-terminalen Verlängerungspeptids,
was zu einer verbesserten Ausbeute an gereiftem heterologen Protein
führt.
-
Im
vorliegenden Zusammenhang ist es selbstverständlich, dass der Begriff „Signalpeptid" ein Präpeptid bedeutet,
das als eine N-terminale Sequenz der Vorläuferform eines in Hefe exprimierten,
extrazellulären Proteins
vorliegt. Die Funktion des Signalpeptids besteht darin, dem zu sezernierenden
heterologen Protein es zu ermöglichen,
in das Endoplasmatische Reticulum einzudringen. Das Signalpeptid
wird normalerweise im Laufe dieses Vorgangs abgespalten. Das Signalpeptid
kann zu dem das Protein herstellenden Hefeorganismus heterolog oder
homolog sein. Ein bevorzugtes Signalpeptid in dieser Erfindung ist
das Signalpeptid der Aspartat-Protease 3 von Hefe (YAP3). YAP3 wurde
von Egel-Mitani, M. et al., YEAST 6, S. 127–137, 1990, kloniert und charakterisiert.
-
Der
Ausdruck „Leaderpeptid" wird als eine Bezeichnung
einer Polypeptidsequenz verstanden, deren Funktion darin besteht,
dem zu sezernierenden heterologen Protein es zu ermöglichen,
vom Endoplasmatischen Reticulum zum Golgi-Apparat und weiter zu
einem sekretorischen Vesikel zur Sekretion ins Medium (d.h. zum
Export des exprimierten Proteins oder Polypeptids über die
Zellwand oder mindestens durch die zelluläre Membran in den periplasmatischen
Raum der Zelle) geleitet zu werden. Vorzugweise ist das in der vorliegenden
Erfindung verwendete Leaderpeptid ausgewählt aus der folgenden Gruppe
von Leaderpeptiden
die als
SEQ ID NR. 1 bis 28 bezeichnet sind, welche in WO 95/34666 offenbart
sind, und alle C-terminal von einer Lys-Arg-Sequenz und einem beliebigen
funktionellen Analogon davon gefolgt werden, und stärker bevorzugt
weist das Leaderpeptid eine Aminosäuresequenz von 43 oder mehr
Aminosäuren
auf, wie z.B. das Leaderpeptid (LA 19):
GlnProIleAspAspThrGluSerAsnThrThrSerValAsnLeuMetAlaAspAspThrGluSerArgPheAlaThrAsnThrThrLeuAlaLeuAspValValAsnLeuIleSerMetAlaLysArg,
das als SEQ ID Nr. 67 in WO 95/34666 bezeichnet wird und das die
C-terminale LysArg-Verarbeitungsstelle einschließt. In dem DNA-Konstrukt der
vorliegenden Erfindung enthält
das Leaderpeptid vorzugsweise eine Endoprotease-Verarbeitungsstelle am C-terminalen
Ende, wie z.B. eine Lys-Arg-Sequenz.
-
Noch
stärker
bevorzugte, durch die DNA-Konstrukte der Erfindung kodierte Leaderpeptide
sind
-
-
Der
Ausdruck „heterologes
Protein" ist dafür bestimmt,
ein Protein oder Polypeptid zu bezeichnen, das durch den Wirishefeorganismus
in der Natur nicht hergestellt wird.
-
In
einer weiteren Ausführungsform
betrifft die Erfindung ein Verfahren zur Herstellung eines heterologen
Proteins in Hefe, das das Züchten
des transformierten Hefestams in einem geeigneten Medium umfasst, um
die Expression und Sekretion des heterologen Proteins zu erzielen,
danach wird das Protein aus dem Medium isoliert.
-
DETAILLIERTE
BESCHREIBUNG DER ERFINDUNG
-
Bei
dem durch das Verfahren der Erfindung hergestellte, N-terminal verlängerte heterologe,
Protein kann es sich um ein beliebiges Protein handeln, das vorteilhaft
in Hefe hergestellt werden kann. Beispiele derartiger Proteine sind
Aprotinin, Gewebefaktorweghemmer oder andere Proteasehemmer und
Insulin oder Insulinvorläufer,
Insulinanaloga, insulinartige Wachstumsfaktoren, wie z.B. IGF I
und IGF II, Human- oder Rinderwachstumshormon, Interleukin, Gewebeplasminogenaktivator,
Glucagon, glucagonartiges Peptid 1 (GLP 1), glucagonartiges Peptid
2 (GLP 2), GRPP, Faktor VII, Faktor VIII, Faktor XIII, von Blutplättchen abgeleiteter Wachstumsfaktor,
Enzyme, wie z.B. Lipasen. Bei den bevorzugten Proteinen handelt
es sich um Vorläufer
von Insulin oder insulinartigen Wachstumsfaktoren und Peptiden der
Proglucagon-Familie, wie z.B. Glucagon, GLP 1, GLP 2 und GRPP, einschließlich verkürzter Formen,
wie z.B. GLP-1(1-45), GLP-1(1-39), GLP-(1-38), GLP-1(1-37), GLP-1(1-36),
GLP-1(1-35), GLP-1(1-34), GLP-1(7-45), GLP-1(7-39), GLP-1(7-38), GLP-1(7-37), GLP-1(7-36),
GLP-1(7-35) und GLP-1(7-34).
-
In
dem vorliegenden Zusammenhang ist der Begriff „funktionelles Analogon" dafür bestimmt,
ein Polypeptid mit einer ähnlichen
Funktion wie das natürliche
Protein zu bezeichnen (dies ist eher in Bezug auf die Natur als
den Wert der biologischen Aktivität des natürlichen Proteins zu verstehen).
Das Polypeptid kann dem natürlichen
Protein strukturell ähnlich
sein und von dem natürlichen
Protein durch Anhängen
eines oder mehrerer Aminosäuren
entweder am C- oder N-terminalen
oder sowohl am C- als auch am N-terminalen Ende des natürlichen
Proteins, durch Substitution eines oder mehrerer Aminosäuren an
einer oder etlichen verschiedenen Stellen in der natürlichen
Aminosäuresequenz,
durch Deletion einer oder mehrerer Aminosäuren an einem oder beiden Enden
des natürlichen
Proteins oder an einer oder einigen Stellen in der Aminosäuresequenz, oder
durch Insertion einer oder mehrerer Aminosäuren an einer oder mehreren
Stellen in der natürlichen
Aminosäuresequenz
abgeleitet sein. Derartige Modifikationen sind für einige der vorstehend erwähnten Proteine bekannt.
-
Die
Vorläufer
von Insulin, einschließlich
des Proinsulins sowie die Vorläufer
mit verkürztem
und/oder modifiziertem C-Peptid oder gänzlich fehlendem C-Peptid,
die Vorläufer
von Insulinanaloga, und insulinverwandte Peptide, wie z.B. insulinartige
Wachstumsfaktoren, können
menschlichen Ursprungs sein oder von anderen Tieren und rekombinanten
oder halbsynthetischen Quellen stammen. Die cDNA(s), die zur Expression der
Vorläufer
von Insulin, der Vorläufer
von Insulinanaloga oder insulinverwandter Peptide in dem Verfahren der
Erfindung verwendet wurden, schließen Formen mit optimierten
Codons zur Expression in Hefe ein.
-
Unter „einem
Vorläufer
von Insulin" oder „einem
Vorläufer
eines Insulinanalogons" ist
ein einzelkettiges Polypeptid zu verstehen, das durch ein oder mehrere
aufeinander folgende chemische und/oder enzymatische Verfahren in
ein zweikettiges Molekül
des Insulins oder Insulinanalogons mit korrekter Etablierung der
drei Disulfidbrücken,
wie sie in dem natürlichen
Humaninsulin vorkommen, umgewandelt werden kann. Bei den bevorzugten
Insulinvorläufern
handelt es sich um B(1-29)-A(1-21), bezeichnet als MI1; B(1-29)-Ala-Ala-Lys-A(1-21),
bezeichnet als MI3 (wie z.B. in
EP
163 529 beschrieben); B(1-27-Asp-Lys)-Ala-Ala-Lys-A(1-21), bezeichnet
als X14 (wie z.B. in der PCT-Veröffentlichung
Nr. 95/00550 beschrieben); B(1-27-Asp-Lys)-A(1-21); B(1-27-Asp-Lys)-Ser-Asp-Asp-Ala-Lys-A(1-21); B(1-29)-Ala-Ala-Arg-A(1-21)
(wie z.B. in der PCT-Veröffentlichung
Nr. 95/07931 beschrieben); B(1-29)-Ser-Asp-Asp-Ala-Lys-A(1-21),
bezeichnet als MI5; und B(1-29)-Ser-Asp-Asp-Ala-Arg-A(1-21); und stärker bevorzugt
B(1-29)-A(1-21), bezeichnet als MI1; B(1-29)-Ala-Ala-Lys-A(1-21),
das als MI3 bezeichnet wird; und B(1-29)-Ser-Asp-Asp-Ala-Lys-A(1-21),
bezeichnet als MI5.
-
Beispiele
von Insulinen und Insulinanaloga, die auf diese Weise hergestellt
werden können,
sind das Humaninsulin, vorzugsweise Des(B30)-Humaninsulin, Schweineinsulin
und Insulinanaloga, wobei mindestens ein Lys oder Arg vorliegt,
vorzugsweise Insulinanaloga, wobei Phe81 entfernt
wurde, Insulinanaloga, wobei die A-Kette und/oder die B-Kette eine
N-terminale Verlängerung
aufweisen, und Insulinanaloga, wobei die A-Kette und/oder die B-Kette
eine C-terminale Verlängerung
aufweisen. Bei den anderen bevorzugten Insulinanaloga handelt es
sich um derartige, worin ein oder mehrere der Aminosäurereste,
vorzugsweise ein, zwei oder drei davon durch einen anderen kodierbaren
Aminosäurerest
ersetzt wurden. Somit kann an Position A21 ein Ausgangsinsulin statt
Asn einen Aminosäurerest
aufweisen, der ausgewählt
ist aus der Gruppe, umfassend Ala, Gln, Glu, Gly, His, Ile, Leu,
Met, Ser, Thr, Trp, Tyr oder Val, insbesondere einen Aminosäurerest,
der ausgewählt
ist aus der Gruppe, umfassend Gly, Ala, Ser und Thr. Die Insulinanaloga
können
auch durch eine Kombination von den vorstehend er läuterten Änderungen
modifiziert werden. Desgleichen kann an Position B28 ein Ausgangsinsulin
statt Pro einen Aminosäurerest
aufweisen, der ausgewählt
ist aus der Gruppe, umfassend Asp und Lys, vorzugsweise Asp, und
an Position B29 ein Ausgangsinsulin statt Lys die Aminosäure Pro
aufweisen. Der Ausdruck „ein
kodierbarer Aminosäurerest" wie hierin verwendet
bezeichnet einen Aminosäurerest,
der durch den genetischen Code, d.h. ein Triplett („Codon") von Nukleotiden
kodiert werden kann.
-
Das
DNA-Konstrukt der Erfindung, das das Polypeptid der Erfindung kodiert,
kann durch etablierte Standardverfahren, z.B. das Phosphoramidit-Verfahren,
das von S. L. Beaucage und M. H. Caruthers, Tetrahedron Letters
22, 1981, S. 1859– 1869,
beschrieben ist, oder das Verfahren, das von Matthes et al., EMBO Journal
3, 1984, S. 801–805,
beschrieben ist, synthetisch hergestellt werden. Gemäß dem Phosphoramidit-Verfahren
werden die Oligonukleotide synthetisiert, z.B. in einem automatischen
DNA-Synthesizer, gereinigt, verdoppelt und ligiert, um das synthetische
DNA-Konstrukt zu bilden. Ein derzeit bevorzugter Weg zur Herstellung
des DNA-Konstrukts ist durch die Polymerasekettenreaktion (PCR),
wie z.B. in Sambrook et al., Molecular Cloning: A Laboratory Manual,
Cold Spring Harbor, NY, 1989).
-
Bei
dem DNA-Konstrukt der Erfindung kann es sich ebenso um einen genomischen
oder cDNA-Ursprung handeln und zum Beispiel durch Herstellen einer
genomischen oder cDNA-Genbank und Durchmustern der DNA-Sequenzen,
die alle oder einen Teil der Polypeptide der Erfindung kodieren,
durch Hybridisierung unter Verwendung synthetischer Oligonukleotidsonden
gemäß den Standardverfahren
(vgl. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold
Spring Harbor, 1989) erhalten werden. In diesem Fall kann die genomische
oder cDNA-Sequenz, die ein Signal- und Leaderpeptid kodiert, mit
einer das heterologe Protein kodierenden genomischen oder cDNA-Sequenz
verbunden werden, danach kann die DNA-Sequenz an einer Stelle, die
der Aminosäuresequenz
EEGEPK des Polypeptids entspricht, durch Einfügen synthetischer Oligonukleo tide,
die die gewünschte
Aminosäuresequenz
zur homologen Rekombination gemäß der bekannten Verfahren
kodieren, oder vorzugsweise durch Erzeugen der gewünschten
Sequenz durch PCR unter Verwendung geeigneter Oligonukleotide modifiziert
werden.
-
Schließlich kann
es sich bei dem DNA-Konstrukt um einen gemischten synthetischen
und genomischen, gemischten synthetischen und cDNA-, oder gemischten
genomischen und cDNA-Ursprung handeln, das durch Hybridisieren von
Fragmenten mit synthetischem, genomischem oder cDNA-Ursprung (dementsprechend),
wobei die Fragmente den verschiedenen Teilen des gesamten DNA-Konstrukts entsprechen,
gemäß den Standardverfahren
hergestellt wird. Somit ist es vorstellbar, dass die das heterologe
Protein kodierende DNA-Sequenz einen genomischen oder cDNA-Ursprung
haben kann, während
die das Signal- und Leaderpeptid kodierende Sequenz sowie die Sequenz,
die die N-terminale Verlängerung
EEGEPK kodiert, synthetisch hergestellt werden kann.
-
In
einer weiteren Ausführungsform
betrifft die Erfindung einen rekombinanten Expressionsvektor, der in
Hefe replizieren kann und der ein DNA-Konstrukt trägt, das
das vorstehend definierte Polypeptid kodiert. Bei dem rekombinanten
Expressionsvektor kann es sich um einen beliebigen Vektor handeln,
der in Hefeorganismen replizieren kann. In dem Vektor sollte die
das Polypeptid der Erfindung kodierende DNA-Sequenz funktionsfähig mit
einer geeigneten Promotersequenz verbunden sein. Bei dem Promoter
kann es sich um eine beliebige DNA-Sequenz handeln, die in Hefe
eine Transkriptionsaktivität
zeigt, und kann von Genen abgeleitet sein, die zur Hefe entweder
homologe oder heterologe Proteine kodieren. Der Promoter ist vorzugsweise
von einem Gen abgeleitet, das ein zur Hefe homologes Protein kodiert.
Beispiele von geeigneten Promotoren sind die Mα1-, TPI-, ADH- oder PGK-Promotoren
von Saccharomyces cerevisiae.
-
Die
das Polypeptid der Erfindung kodierende DNA-Sequenz kann ebenso
mit einem geeigneten Terminator, z.B. dem TPI-Terminator (vgl. T.
Alber und G. Kawasaki, J. Mol. Appl. Genet. 1, 1982, S. 419–434), funktionell
verbunden sein.
-
Der
rekombinante Expressionsvektor der Erfindung umfasst eine DNA-Sequenz,
die es dem Vektor ermöglicht,
in Hefe zu replizieren. Beispiele derartiger Sequenzen sind die
Replikationsgene REP 1–3
und der Replikationsursprungspunkt des Hefeplasmids 2μ. Der Vektor
kann auch einen selektierbaren Marker, z.B. das TPI-Gen von Schizosaccharomyces
pombe umfassen, wie von P. R. Russell, Gene 40, 1985, S. 125–130, beschrieben
wurde.
-
Die
Verfahren, die verwendet wurden, um die DNA-Sequenzen, welche die
Polypeptide der Erfindung kodieren, den Promoter und den Terminator
jeweils zu ligieren und sie in einen geeigneten Hefevektor einzufügen, der
die zur Hefereplikation erforderlichen Informationen enthält, sind
dem Fachmann bekannt (vgl. zum Beispiel Sambrook et al., angegebenes
Werk). Es wird selbstverständlich
sein, dass der Vektor entweder zunächst durch Herstellen eines
DNA-Konstrukts, das die gesamte, das Polypeptid der Erfindung kodierende DNA-Sequenz
enthält,
und anschließendes
Einfügen
dieses Fragments in einen geeigneten Expressionsvektor, oder durch
aufeinander folgendes Einfügen
von DNA-Fragmenten, die die genetische Information für die einzelnen
Elemente (wie z.B. das Signal, den Leader oder das heterologe Protein)
enthalten, gefolgt durch Ligation konstruiert werden kann.
-
Bei
dem Hefeorganismus, der in dem Verfahren der Erfindung verwendet
wird, kann es sich um einen beliebigen Hefeorganismus handeln, der
nach Züchtung
große
Mengen des fraglichen heterologen Proteins oder Polypeptids herstellt.
Beispiele geeigneter Hefeorganismen können Stämme sein, die aus den folgenden Hefestämmen ausgewählt sind:
Saccharomyces cerevisae, Saccharomyces kluyveri, Schizosaccharomyces pombe,
Saccharomyces uvarum, Kluyveromyces lactis, Hansenula polymorpha,
Pichia pastoris, Pichia methanolica, Pichia kluyveri, Yarrowia lipolytica,
Candida sp., Candida utilis, Candida cacaoi, Geotrichum sp. und Geotrichum
fermentans. Ein Fachmann wird es als nahe liegend ansehen, eine
beliebige andere Pilzzelle, wie z.B. Zellen der Gattung Aspergillus,
als Wirtsorganismus auszuwählen.
-
Die
Transformation der Hefezellen kann zum Beispiel durch Protoplastenbildung,
gefolgt von der Transformation in einer an sich bekannten Art und
Weise bewerkstelligt werden. Bei dem zum Züchten der Zellen verwendeten
Medium kann es sich um ein beliebiges herkömmliches Medium handeln, das
für das
Wachstum von Hefeorganismen geeignet ist. Das sezernierte heterologe
Protein, von dem ein wesentlicher Teil im Medium in einer korrekt
verarbeiteten Form vorliegen wird, kann aus dem Medium durch herkömmliche
Verfahren gewonnen werden, die das Abtrennen der Hefezellen aus
dem Medium durch Zentrifugation oder Filtration, das Fällen proteinöser Komponenten
des Überstands
oder Filtrats mit Hilfe von einem Salz, z.B. Ammoniumsulfat, gefolgt
von der Reinigung durch eine Vielfalt chromatographischer Verfahren,
z.B. Ionenaustauschchromatographie, Affinitätschromatographie oder dergleichen,
einschließen.
-
Nach
der Sekretion in das Kulturmedium kann das Protein verschiedenen
Verfahren unterzogen werden, um die Sequenz EEGEPK zu entfernen.
-
Es
ist festzustellen, dass die Verlängerung
stabil an das heterologe Protein während der Fermentation angeknüpft ist,
die den N-Terminus des heterologen Proteins gegen die proteolytische
Aktivität
der Hefeproteasen, wie z.B. DPAP, schützt. Die Anwesenheit der N-terminalen
Verlängerung
an dem heterologen Protein kann ebenso als ein Schutz der N-terminalen
Aminogruppe des heterologen Proteins während der chemischen Verarbeitung
des Proteins dienen, d.h. es kann als ein Ersatz für eine BOC
(t-Butyloxycarbonyl)- oder ähnliche Schutzgruppe
dienen. In derartigen Fällen
kann die Aminosäuresequenz
EEGEPK von dem gewonnenen heterologen Protein mit Hilfe eines proteolytischen
Enzyms, das für
eine basische Aminosäure
(d.h. K (Lys)) spezifisch ist, entfernt werden, so dass die endständige Verlängerung
an dem K abgespalten wird. Beispiele derartiger proteolytischer
Enzyme sind das Trypsin oder die Protease I von Achromobacter lyticus.
-
Die
vorliegende Erfindung ist in den folgenden Beispielen ausführlicher
beschrieben, die in keiner Weise dafür bestimmt sind, den beanspruchten
Umfang der Erfindung zu begrenzen.
-
Die
Erfindung ist unter Bezugnahme auf die Zeichnungen beschrieben,
wobei
-
1 das
Expressionsplasmid pAK773 zeigt, das Gene enthält, die die N-terminal verlängerten
Polypeptide der Erfindung exprimieren. In 1 sind die
folgenden Symbole verwendet:
TPI-PROMOTER: Bezeichnet die Promotersequenz
des TPI-Gens von S. cerevisiae.
2: Bezeichnet die Region, die
ein Signal-/Leaderpeptid kodiert (z.B. von dem YAP3-Signalpeptid
und LA19-Leaderpeptid in Verbindung mit dem durch EEGEPK N-terminal
verlängerten
MI3-Insulinvorläufer).
TPI-TERMINATOR:
Bezeichnet die Terminatorsequenz des TPI-Gens von S. cerevisiae.
TPI-POMBE:
Bezeichnet das TPI-Gen von S. pombe.
Origin: Bezeichnet eine
Sequenz des 2μ-Plasmids
von S. cerevisiae, die seinen Ursprungspunkt der DNA-Replikation
in S. cerevisiae einschließt.
AMP-R:
Sequenz aus pBR322/pUC13, die das Ampicillin-Resistenzgen und einen
Ursprungspunkt der DNA-Replikation in E. coli einschließt.
-
2 die
DNA- und Aminosäuresequenzen
in pAK773 zeigt, die das YAP3-Signalpeptid
(Aminosäure Nr.
1 bis 21), das LA19-Leaderpeptid (Aminosäure Nr. 22 bis 64), die N-terminale
Verlängerung
EEGEPK (Aminosäure
Nr. 65 bis 70), den MI3-Insulinvorläufer BKette(1-29)-Ala-Ala-Lys-AKette(1-21)
(Aminosäure
Nr. 71 bis 123) kodiert.
-
3 das
Expressionsplasmid pAK729 zeigt, das Gene enthält, die die N-terminal verlängerten
Polypeptide der Erfindung exprimieren, und die folgenden Symbole
verwendet sind:
TPI-PROMOTER: Bezeichnet die Promotersequenz
des TPI-Gens von S. cerevisiae.
2: Bezeichnet die Region, die
ein Signal-/Leaderpeptid kodiert (z.B. von dem YAP3-Signalpeptid
und LA19-Leaderpeptid in Verbindung mit dem durch EEGEPK N-terminal
verlängerten
MI3-Insulinvorläufer).
TPI-TERMINATOR:
Bezeichnet die Terminatorsequenz des TPI-Gens von S. cerevisiae.
TPI-POMBE:
Bezeichnet das TPI-Gen von S. pombe.
Origin: Bezeichnet eine
Sequenz des 2μ-Plasmids
von S. cerevisiae, die seinen Ursprungspunkt der DNA-Replikation
in S. cerevisiae einschließt.
AMP-R:
Sequenz aus pBR322/pUC13, die das Ampicillin-Resistenzgen und einen
Ursprungspunkt der DNA-Replikation in E. coli einschließt.
-
Beispiel
-
Konstruktion des den EEGEPK-MI3-Insulinvorläufer exprimierenden
Hefestamms yAK773
-
Ein
synthetisches Gen, das die N-terminale Verlängerung des N-terminal verlängerten
Insulinvorläufers
EEGEPK-MI3 kodiert, wurde unter Verwendung der Polymerasekettenreaktion
(PCR) konstruiert.
-
Es
wurden die folgenden 2 Oligonukleotide synthetisiert:
#724
5'-GATCTCCATGGCTAAGAGAGAAGAAXYTGAACCAAAGTTCGTTAACC-3',
wobei X für A oder
G und Y für
T, A oder G steht, und
#2371 5'-TTAATCTTAGTTTCTAGAGCCTGCGGG-3'
-
Die
Oligonulcleotide wurden unter Verwendung eines automatischen DNA-Synthesizers (Applied
Biosystems Modell 380A) unter Verwendung der Phosphoramidit-Chemie
und der im Handel erhältlichen
Reagenzien synthetisiert (Beaucage, S. L. und Caruthers, M. H. Tetrahedron
Letters 22 (1981) 1859–1869).
-
Die
folgende PCR wurde unter Verwendung des Enzymgemischs „Expand
High Fidelity" (Boehringer Mannheim
GmbH, Sandhoefter Straße
116, Mannheim, Deutschland) gemäß den Herstellerangaben
durchgeführt.
Das PCR-Gemisch wurde mit 100 μl
Mineralöl
(Sigma Chemical Co., St. Louis MO, USA) überschichtet.
-
PCR
-
- 5 μl
Oligonukleotid #724 (gesamt 100 pMol)
- 5 μl
Oligonukleotid #2371 (gesamt 100 pMol)
- 10 μl
10x PCR-Puffer
- 8 μl
dNTP-Gemisch
- 0,75 μl
Enzymgemisch „Expand
High Fidelity"
- 0,5 μl
pAK729-Plasmid als Matrize (0,2 μg
DNA)
- 70,75 μl
destilliertes Wasser
-
Insgesamt
wurden 18 Zyklen durchgeführt,
ein Zyklus war 94°C
für eine
Dauer von 45 Sek.; 37°C
für eine
Dauer von 1 min; 72°C
für eine
Dauer von 1,5 min. Das PCR-Gemisch wurde dann auf ein 2,5%iges Agarosegel
aufgetragen und die Elektrophorese wurde unter Verwendung von Standardverfahren
(Sambrook, J., Fritsch E. F. und Maniatis, T., Molecular Cloning,
Cold Spring Harbour Laboratory Press, 1989) durchgeführt. Das
so erhaltene DNA-Fragment wurde aus dem Agarosegel ausgeschnitten
und mit dem „Gene
Clean Kit" (Bio
101 Inc., PO BOX 2284, La Jolla, CA 92038, USA) gemäß den Herstellerangaben
isoliert.
-
Das
gereinigte PCR-DNA-Fragment wurde in 14 μl Wasser und Restriktionsendonuklease-Puffer
gelöst
und mit den Restriktionsendonukleasen NcoI und XbaI gemäß den Standardver-fahren
(Sambrook, J., Fritsch E. F. und Maniatis, T., Molecular Cloning,
Cold Spring Harbour Laboratory Press, 1989) gespalten. Das NcoI-XbaI-DNA-Fragment
von 209 Nukleotidbasenpaaren wurde der Agarose-Elektrophorese unterzogen und unter
Verwendung des „Gene
Clean Kit" wie beschrieben
gereinigt.
-
Das
Plasmid pAK721 (siehe 3) wurde mit den Restriktionsendonukleasen
BglII und XbaI gespalten und das Vektorfragment von 10849 Nukleotidbasenpaaren
unter Verwendung des „Gene
Clean Kit" wie beschrieben
isoliert.
-
Das
Plasmid pAK721 wurde mit den Restriktionsendonukleasen BglII und
NcoI gespalten und das DNA-Fragment von 160 Nukleotidbasenpaaren
unter Verwendung des „Gene
Clean Kit" wie beschrieben
isoliert.
-
Die
drei DNA-Fragmente wurden unter Verwendung der T4-DNA-Ligase und
Standardverfahren (Sambrook, J., Fritsch E. F. und Maniatis, T.,
Molecular Cloning, Cold Spring Harbour Laboratory Press, 1989) zusammenligiert.
Das Ligationsgemisch wurde dann in einen kompetenten Stamm von
E. coli (R–,
M+) transformiert, gefolgt von der Selektion durch Ampicillin-Resistenz.
-
Das
Plasmid des so erhaltenen E. coli wurde unter Verwendung von Standardverfahren
(Sambrook, J., Fritsch E. F. und Maniatis, T., Molecular Cloning,
Cold Spring Harbour Laboratory Press, 1989) isoliert und bezüglich der
Insertion mit den entsprechenden Restriktionsendonukleasen, d.h.
BglII und NheI, geprüft. Durch
DNA-Sequenzanalyse (Sequenzee, U.S. Biochemical Corp., USA) wurde
gezeigt, dass das selektierte Plasmid die korrekte DNA-Sequenz der
DNA des EEGEPK-MI3-Insulinvorläufers
kodiert und dass es nach der DNA eingefügt ist, die die synthetische
LA19-Leader-DNA kodiert.
-
Das
Plasmid wurde als pAK773 bezeichnet.
-
Die
DNA-Sequenz, die den YAP3-Signalpeptid-LA19-Leader-EEGEPK-MI3-Insulinvorläufer-Komplex kodiert,
ist in 2 gezeigt.
-
Das
Plasmid pAK773 wurde in den Stamm MT663 von S. cerevisiae wie in
PCT/DK95/00250 beschrieben transformiert und der so erhaltene Stamm
als yAK773 bezeichnet.
-
Das
Hefe-Expressionsplasmid pAK773 ist vom C-POT-Typ (siehe
1)
und ist jenen in WO
EP 171 142 beschriebenen ähnlich,
die das Triosephosphat-Isomerase-Gen
von Schizosaccharomyces pombe (POT) zur Plasmidselektion und -stabilisierung
in S. cerevisiae enthalten. pAK773 enthält ebenso den Triosephosphat-Isomerase-Promoter
und -Terminator von S. cerevisiae. Der Promoter und Terminator sind
jenen in dem Plasmid pKFN1003 (in WO 90/100075 beschrieben) wie
alle Sequenzen im Plasmid ähnlich,
mit Ausnahme der Sequenz zwischen dem EcoRI-XbaI-Fragment, das den
YAP3-Signalpeptid-LA19-Leaderpeptid-EEGEPK-MI3-Insulinvorläufer kodiert.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-