<Desc/Clms Page number 1>
Die vorliegende Erfindung betrifft ein Verfahren zur Herstellung von menschlichem Proinsulin.
Insulin ist ein Hormon, das vor allem von den B-Zellen des Pankreas produziert wird. Zur Zeit ist die Verwendung des Hormons bei der Behandlung von Diabetes allgemein bekannt. Obwohl Schlschthauser Rinder- und Schweinepankreas als Insulinquelle in grösserer Menge liefern, kann es zu einem Engpass in der Versorgung mit diesem Hormon kommen, wenn die Zahl der Diabetiker weltweit zunimmt. Überdies zeigen manche Diabetiker eine allergische Reaktion auf Rinder-und Schweineinsulin mit schädlichen Folgen. Es wird daher mit Nachdruck angestrebt, menschliches Insulin in ausreichender Menge zu erzeugen, um den Weltbedarf decken zu können.
Insulin besteht aus zwei Polypeptidketten, bekannt als A und B Ketten, die miteinander durch Disulfidbrücken verbunden sind. Die A Kette besteht aus 21 Aminosäuren und die B Kette aus 30 Aminosäuren. Die Ketten werden nicht unmittelbar in vivo synthetisiert, leiten sich jedoch von einem unmittelbaren Prccurser ab, genannt Proinsulin. Proinsulin ist eine einzelne Polypeptidkette, die ein als C-Peptid bezeichnetes Peptid enthält und die A und B Ketten verbindet. Siehe Steiner, D. F. al., Science 157, 697 (1967).
Dieses C-Peptid wird während der
EMI1.1
EMI1.2
<tb>
<tb> S.1 <SEP> 10 <SEP>
<tb> NH2-Phe-Val-Asn-Gln-His-Leu-Cys-Gly-Ser-His-Leu-Val-Glu-
<tb> 20
<tb> Ala-Leu-Tyr-Leu-Val-Cys-Gly-Glu-Arg-Gly-Phe-Phe-Try-Thr-
<tb> 30 <SEP> 40
<tb> Pro-Lys-Thr-Arg-Arg-Glu¯Ala-Glu-Asp-Leu-Gln-Val-Gly-Gln-
<tb> 50
<tb> Val-Glu-Leu-Gly-Gly-Gly-Pro-Gly-Ala-Gly-Ser-Leu-Gln-Pro-
<tb> 60
<tb> Leu-Ala-Leu-Glu-Gly-Ser-Leu-Gln-Lys-Arg-Gly-Ile-Val-Glu-
<tb> 70 <SEP> 80
<tb> Gln-Cys-Cys-Thr-Ser-Ile-Cys-Ser-Leu-Tyr-Gln-Leu-Glu-Asn-
<tb> 86
<tb> Try <SEP> - <SEP> Cys <SEP> - <SEP> Asn <SEP>
<tb>
Die chemische Synthese dieser Sequenz von 86 Aminosäuren ist zwar möglich, aber dennoch nach üblichen Techniken schwierig.
EMI1.3
sondern ein- 24 Pre-proinsulin (siehe Fig. 2) hat das Signalpeptid 24 Aminosäuren und die Sequenz ist :
NH-Met-Alaa-Leu- - 20 -10
EMI1.4
- Met - Arg - Leu - Leu - Pro - Leu - Leu - Ala - Leu - Leu - Ala - Leu - Trp - Gly - Pro - Asp - Pro - Ala -Ala - Ala - Ala.
Die Sequenz von 24 Aminosäuren hat die Bedeutung eines spezifischen Signals für den sektoriellen Transport des synthetisieren Polypeptides in das endoplasmische Réticulum der B-Zelle und wird vom Proinsulin während dieser Phase abgespalten. Siehe Blobel. G. et al., J. Cell. Biol. 67,835 (1975).
In einigen Fällen weiss man, dass die Signalpcptide für den Transport eukaryotischer Proteine durch die Zellwände verantwortlich sind. In einem zellfreie System wurde ein spezifisches Spaltenzym beobachtet, dat. die Peplidbindung zwischen dem Signaipepüd und dem aktiven Protein spaltet, begleitet von einem Durchgang durch die Zellenmembran. (Siehe Blobel, G. et al., Proc. NaL Ac2d. Sei USA 75,361 (1978)).
Neuerliche Fortschritte in der Biochemie und der Technologie für die Rekombination der DNA haben es möglich gemacht, spezifische Proteine unter kontrollierten Bedingungen, unabhängig von dem höheren Organismus, von welchem sie normalerweise isoliert werden, zu synthetisieren. Solche biochemische Syntheseverfahren verwenden Enzyme und subzellulare Komponenten des Protein-Synthesemechanismus der lebenden Zelle, entweder in vitro, in zellfreien Systemen oder in vivo, in Mikroorganismen. In jedem Fall ist das
<Desc/Clms Page number 2>
EMI2.1
Folge von Prinzipien, von den das ganze Reich lebender Organismen durchdrungen isL
Ein geklontes Gen kann verwendet werden, um die Aminosäuresequenz von Proteinen, die in vitro synthetisiert wurden, zu spezifizieren. Protein-Synthesesysteme, von DNA gesteuert, sind in der Fachwelt gut
EMI2.2
Techniken könnenWeiterentwicklungen in der Rekombinationstechnik für DNA haben es möglich gemacht, spezifische Gene oder deren Teile aus höheren Organismen, sowohl weiblichen als auch männlichen, zu isolieren und die Gene oder deren Fragmente auf einen Mikroorganismus, wie Bakterien oder Hefe. zu übertragen. Das übertragene Gen
EMI2.3
Als Ergebnis kann der transformierte Mikroorganismus die Fähigkeit erhalten, das Protein zu produzieren, welches das Gen oder dessen Fragment codiert, mag es ein Enzym, ein Hormon, ein Antigen, ein Antikörper oder deren Teile sein. Der Mikroorganismus geht mit dieser Fähigkeit in seiner Nachkommenschaft auf, sodass tatsächlich die Übertragung einen neuen Stamm mit der beschriebenen Fähigkeit zum Ergebnis hat. Siehe beispielsweise Ullrich, A. et al., Science 196, 1313 (1977), und Seeburg. P. H., et al., Nature 270, 486 (1977).
EMI2.4
ist die,die DNA aller lebender Organismen, von Mikroben bis zum Menschen, chemisch ähnlich ist, wenn sie aus den selben vier Nucleotiden zusammengesetzt ist. Die signifikanten Unterschiede liegen in den Sequenzen dieser Nucleotide im polymeren DNA Molekül.
Die Nuclcotidsequenzen werden verwendet, um die Aminosäurescquenzen der Proteine, die der Organismus enthält, zu spezifizieren. Obowohl die meisten der Proteine verschiedener Organismen voneinander abweichen, ist die Codierungsbeziehung zwischen
EMI2.5
für die selbe Aminosäuresequenz, erkannt, wenn sie auf einen Mikroorganismus übertragen wird.
! n der Beschreibung verwendete Abkürzungen werden in Tabelle 2 wiedergegeben.
Tabelle 2
EMI2.6
<tb>
<tb> DNA <SEP> - <SEP> Iksoxyribonc1einsäure <SEP> A <SEP> - <SEP> Adenin <SEP>
<tb> RNA <SEP> - <SEP> Ribonucleinsäure <SEP> T <SEP> - <SEP> Thymin <SEP>
<tb> cDNA-komplimentare <SEP> DNA <SEP> G-Guanin <SEP>
<tb> (enzymatisch <SEP> synthesiert <SEP> C <SEP> - <SEP> Cytosin <SEP>
<tb> aus <SEP> einer <SEP> mRNA <SEP> Sequenz) <SEP> U <SEP> - <SEP> Uracil <SEP>
<tb> mRNA. <SEP> messenger <SEP> RNA <SEP> ATP-Adenosintriphosphat
<tb> dATP-Desoxyadenosintriphospat <SEP> TTP-Thymidintriphosphat <SEP>
<tb> dGTP-Desoxyguanosintriphosphat <SEP> EDTA-Äthylendiamintetraessigsäure
<tb>
Die Codierungsbezichungen zwischen der Nucleotidsequenz in der DNA und der Aminosäuresequenz im Protein sind allgemein bekannt als genetischer Code, wie er in Tabelle 3 gezeigt ist.
Tabelle 3 genetischer Code
EMI2.7
<tb>
<tb> Phenylalanin <SEP> (Phe) <SEP> TTK <SEP> Histidin <SEP> (His) <SEP> CAK
<tb> Lcucin <SEP> (Leu) <SEP> XTY <SEP> Glutamin <SEP> (Gln) <SEP> CAJ <SEP>
<tb> Isoleucin <SEP> <SEP> le) <SEP> ATM <SEP> Asparagin <SEP> (Asn) <SEP> AAK
<tb> Methionin <SEP> (Met) <SEP> ATG <SEP> Lysin <SEP> (Lys) <SEP> AAI
<tb> Valin <SEP> (Val) <SEP> GIL <SEP> Asparaginsäure <SEP> (Asp) <SEP> GAK
<tb> Serin <SEP> (Ser) <SEP> QRS <SEP> Glutaminsäure <SEP> (Glu) <SEP> GAJ
<tb> Prolin <SEP> (Pro) <SEP> CCL <SEP> Cystein <SEP> (Cys) <SEP> TGK
<tb> Threonin <SEP> (Ihr) <SEP> ACL <SEP> TryptophanCTty) <SEP> TGC <SEP>
<tb> Alanin <SEP> (Ala) <SEP> GCL <SEP> Arginin <SEP> (Arg) <SEP> WGZ
<tb> Tyrosin <SEP> (Tyr) <SEP> TAK <SEP> Glycin <SEP> (Gly)
<SEP> GGL
<tb> Tennination <SEP> Signal <SEP> TAI <SEP>
<tb> Tennination <SEP> Signal <SEP> TGA
<tb>
<Desc/Clms Page number 3>
Schlüssel : Jedes Desoxynuclcotidtriplett aus 3 Buchstaben entspricht einem Trinucleotid der mRNA mit einem 5-Ende links und einem 3'-Ende rechts. Alle DNA-Sequenzen, wie sie hier wiedergegeben sind, weisen einen Strang auf, dessen Sequenz der mRNA-Sequenz entspricht, substituiert mit Thymin statt Uracil. Die Buchstaben stehen für Purin oder Pyrimidinbasen, die die Desoxynucleotidsequenz bilden.
A = Adenin J = A odsr G G=Guanin K=ToderC C Cytosin L = A, T, C oder G
T=ThyminM=A, CoderT
X = T oder C, wenn Y A oder G ist
X = C, wenn Y C oder T ist
Y = A, G, C oder T, wenn X C ist
Y=AoderG, wennXTist W = C oder A, wenn Z A oder G ist
W = C, wenn Z C oder T ist Z = A, G, C oder T, wenn W C ist
Z=AoderG, wennWAist
QR = TC, wenn S A, G, C oder T ist
QR = AG, wenn S T oder C ist
S = A, G, C oder T, wenn QR TC ist
S-T oder C, wenn QR AG ist
EMI3.1
der genetischen Nachricht herangezogen werden, zu bezeichnen.
Viele Techniken zur Rekombination der DNS verwenden zwei Klassen von Verbindungen, Transfervektoren und Restriktionsenzyme, wie sie im nachfolgenden näher behandelt werden. Ein Transfervektor ist ein DNA
EMI3.2
sicherstellt,angewendet wird für jede autonome Replikations-DNA-Einheit, die in einer mikrobiellen Zelle gefunden werden kann, anders als das Genom der Wirtszelle selbst. Ein Plasmid ist genetisch nicht verbunden mit dem Chromosom der Wirtszelle. Plasmid-DNA existieren als doppelsträngige Ringstrukturen allgemein in der Grössenordnung einiger Millionen Daltons Molekulargewicht, obwohl einige grösser sind als 108 Daltons Molekulargewicht. Sie repräsentieren üblicherweise nur einen geringen Prozentsatz der gesamten DNA der Zelle.
Transfervektor-DNA ist üblicherweise abtrennbar von der Winszellen DNA auf Grund des riesigen Unterschiedes
EMI3.3
innerhalb der Wirtszelle befähigt, in den mseisten Fällen unabhängig von der Geschwindigkeit der Teilung der Wirtszelle. Einige Plasmide haben die Eigenschaften, dass ihre Replikationsgeschwindigkeit dadurch kontrolliert werden kann, dass man die Wachstumsbedingungen variiert. Durch geeignete Techniken kann der Ring der Plasmid-DNA geöffnet werden, ein Fragment einer hetcrologen DNA eingeführt und der Ring wieder geschlossen werden unter Bildung eines vergrösserten Moleküls, das das eingesetzte DNA-Segment enthalt.
Bakteriophage DNA kann ein Segment einer i. etern ! r's ? n DNA tragen, das anstelle eines bestimmten nicht essentiellen Phagen-Gens eingesetzt ist. In beiden Fallen dient der Transfervektor als Träger oder Vektor für ein eingesetztes Fragment der heterologen DNA.
Der Transfer ist begleitet von einem Prozess, den man als Transformation kennt. Während der Transformation bauen die bakteriellen Zellen, vermischt mit Plasmid-DNA vollständige Plasmidmoleküle in die Zellen ein.
Obwohl die Mechanismen des Verfahrens im Dunkeln bleiben, ist es möglich, das Verhältnis der bakteriellen Zellen, die die Fähigkeit haben, Plasmid-DNA aufzunehmen und nachdem sie transformiert wurden, durch gewisse empirisch bestimmte Behandlungen zu maximieren. Hat einmal die Zelle ein Plasmid einverleibt, so unterliegt letzteres der Replikation in der Zelle und die Plasmid-Repliken werden bei der Zellteilung auf die
EMI3.4
gegenüber bestimmten Antibiotika.
Verschiedene Plasmide können auf Grund ihrer verschiedenen Fähigkeiten oder Kombination von Fähigkeiten rekognisziert werden, die sie auf die Wirtszelle, welche sie enthält,
<Desc/Clms Page number 4>
EMI4.1
mit einem anderen Segment einfach durch Anfügen des verwendeten Restriktionsoligonucleotids an die Enden des Moleküls und Unterwerfung des Produktes einer hydrolytischen Behandlung durch die verwendete Restnktionsendonuclease. dabei bilden sich die erforderlichen kohasiven Enden. Siehe Heyneker, HL. et al., Nature 263. 748 (1976) und Scheller. R. H., et al., Science 196, 177 (1977). Ein wichtiges Merkmal der Verteilung der Kennlagen der Restriktionsendonuclease ist die Tatsache, dass sie wahllos verteilt sind mit Rücksicht auf den Abtastrahmen.
In der Folge kann die Spaltung durch die Restriktionsendonuclease zwischen benachbarten Codons oder innerhalb der Codons vor sich gehen.
Mehrere allgemcine Methoden für die Spaltung der DNA oder der Modifikation der Endsequenz stehen zur Verfügung. Eine Vielzahl nicht spezifischer Endonucleasen können verwendet werden, um die DNA an den Rändern zu spalten, wie sie hier diskutiert werden. Die Endsequenzen können durch die Bildung von Oligonucleotidschwänzen der dA an einem Ende und dT an dem anderen Ende oder dG und dC modifiziert werden. um Lagen für die Verknüpfung zu erzeugen, ohne dass man spezifische Bindegliedsequenzen benötigt. Der Ausdruck"Übersetzung*'wird verwendet, um die Tatsache festzuhalten, dass ein Organismus selten wenn je zu einem beliebten Zeitpunkt Gebrauch macht von allen seinen genetischen Fähigkeiten, mit denen er ausgestattet ist.
Gerade bei relativ einfachen Organismen, wie Bakterien, werden viele Proteine, welche die Zelle synthetisieren kann, nicht synthetisiert, obwohl sie unter den gegebenen Umweltbedingungen synthetisiert werden könnten. Wenn das Proteinprodukt, codiert durch ein gegebenes Gen, durch einen Organismus synthetisiert wird, dann wird das Gen als übersetzt bezeichnet. Normalerweise wird die Übersetzung von Genen in E. coli, wie hier allgemein beschrieben ist, in der Weise reguliert, dass Proteine, deren Funktion in einer vorgegebenen Umgebung nicht brauchbar ist, nicht synthetisiert werden und die Umwandlungsenergie erhalten wird.
Die Methoden, durch welche die Gcnübcrsctzung in E. coli kontrolliert wird, sind allgemein bekannt als ein Ergebnis weitreichende Studien über einen Zeitraum von 20 Jahren ; siehe allgemein Hayes, W.. The Genetics of
EMI4.2
Vielzahl von Kontrollelementen, einschliessend den Operator. Promotor und Sequenzen für Lagen der ribosomen Bindung, enthalten. Die Funktion dieser Lagen ist so, dass sie die Übersetzung solcher Gene unter ihrer Kontrolle gestatten, entsprechend den Bedürfnissen des Organismus. Beispielsweise werden Gene, die Enzyme codieren, welche ausschliesslich für die Nutzbarmachung der Lactose benötigt werden, normalerweise nicht merkbar
EMI4.3
Schlüssel für eine andere Folge von Umgebungssignalen auftritt.
Obwohl es viele Varianten bei diesem allgemeinen Schema gibt, ist ein wesentliches Faktum, dass ein Gen, um in ein Prokaryot wie E. coli übersetzt zu werden, im Hinblick auf einen Kontrollbereich mit einem Initiator für Transkription und Translationsfunktionen richtig lokalisiert sein muss.
Es wurde gezeigt, dass Gene, die normalerweise kein Teil eines gegebenen Operons sind, in ein solches
<Desc/Clms Page number 5>
eingeführt und von ihm kontrolliert werden können. Die klassische Demonstration wurde durch Jacob, F., et al., J. Mol. Biol. 13, 704 (1965) gemacht. In diesem Versuch wurden Gene, die Enzyme für die Purinbiosynthese codieren, in eine Region transferiert, die durch das Lactoseoperon kontrolliert ist. Die Übersetzung des Enzyms
EMI5.1
oderChampe, SP., Proc. NatAC2. d. Sci USA 48, 114 (1962) gezeigt.
Sobald ein Gen isoliert, gereinigt und in einen Transfervektor eingeführt wurde, sicher der Vorgang, der als Klonen des Gens bezeichnet wird, das Zur-Verfügung-Stehen in namhafter Menge. Das geklonte Gen wird auf
EMI5.2
Stellen in den selben Vektor bereitgestellt.
Die Übersetzung wird durch Transferierung des geklonten Gens in geeigneter Orientierung und in einem Abtastrahmen in einen Kontrollbereich erhalten, sodass das Ablesen von dem prokaryotischen Gen die Synthese eines chimären Proteins mit einer Aminosäuresequenz, codiert durch ein geklontes Gen, bewirkt. Das chimäre Protein kann an beliebiger Stelle durch eine Vielzahl von spezifischen Spalttechniken für Proteine gespalten werden, sodass die gewünschte Aminosäuresequenz abgelöst wird. worauf sie durch übliche Methoden gereinigt
EMI5.3
Das Verfahren, durch das ein Protein eines Säugetiers, wie menschliches Pre-proinsulin oder Proinsulin mit Hilfe einer Technologie für die Rekombination von DNA erzeugt wird, erfordert vorerst das Klonen eines
EMI5.4
Gens, indem das gc ! donte Gen als Hybridisierungssonde verwendet wird. Weiters eignet sich das geklonte Gen zu Überprüfung der Identität oder Homologie von selbständigen Isolaten derselben oder verwandter Gene durch Hybridisierung. Wegen der Natur des genetischen Codes steuert das geklonte Gen die Produktion nur der Aminosaurescquenz, für welches es als Code dient, und keine andere, wenn es in den geeigneten Abtastrahmen translaûcn wird.
Einige Arbeiten zur Isolierung und Reinigung von Ratten-Proinsulin wurden durchgeführt. Ullrich, A. et al., supra, und Villa-Komaroff, L. et al., supra beschreiben die Isolierung und Reinigung von Ratten-Proinsulin-Gen und ein Verfahren zum Transferieren dieses Gens auf einen Mikroorganismus und dessen Replikation. Ullrich et al. fanden einige Rekombinations-Plasmide, die die Codesequenz für Proinsulin, die 3'-nicht translatierte Region und einen Teil des Prepeptids enthielten. Die Übersetzung der Ratten-DNS, die den Code für die Insolinsequenz enthält, wird in der GB-PS 2 301 434 B geoffenbart. Villa-Komaroff et al. entdeckte ein rekombinierte
EMI5.5
Artikel beschreiben einige der grundlegenden Verfahren, die auf die Technologie für rckombinierte DNA angewandt werden.
Sie beschreiben jedoch nicht die Isolierung und Reinigung des menschlichen Pre-proinsulinGens oder menschlichen Proinsulin-Gens.
Crea, R. et al., Proc. Nat. Acad. Sci USA 75, 5765 (1978) haben einen abweichenden Weg eingeschlagen, um menschliches Insulin zu isolieren. Er besteht in der chemischen Synthese der Codesequenz für 1.) der A Kette und 2. ) der B Kette des menschlichen Insulins unter Verwendung von Codons, begünstigt durch E. coli. Diese beiden Seqenzen können in Plasmide, welche übersetzt werden können, um A und B Ketten zu bilden, eingesetzt werden.
Menschliches Insulin konnte dann durch Bildung der richtigen Disulfidbindungen zwischen den beiden Proteinen erzeugt werden.
Das geklonte Gen für menschliches Pre-proinsulin lässt sich in einer Vielzahl von Wegen verwenden. Die Umstellung auf einen Übersetzungs-Transfervektor erlaubt die Synthese von Pre-proinsulin durch einen Wirts- Mikroorganismus, transformiert mit dem Vektor, der das geklonte Gen tragt. Das Wachstum des transformierten Wirts führt zu der Synthese von Pre-proinsulin als Teil eines chimären Proteins. Wenn der prokaryotische Teil des Fusionsproteins der Signalteil eines abgesonderten oder auf andere Weise unterteilten Wirtsproteins ist, kann
<Desc/Clms Page number 6>
EMI6.1
Pre-proinsulin-Proteins wesentlich verbessertbeschrieben sind, zu erhalten.
Das geklonte Pre-proinsulin-Gen kann in einer Vielzahl von Techniken für die Herstellung von Pre-proinsulin eingesetzt werden. Pre-proinsulin selbst eignet sich, weil es in Proinsulin durch bekannte enzymatische und chemische Methoden überführt werden kann. Beispielsweise ist es möglich, das Prepcptid durch ein lösliches enzymatische Präparat, wie von Blobel, G. et al. beschrieben, das spezifisch für die Abtrennung von Signalpcptiden ist, abzutrennen. Das geklonte Proinsulin-Gen lässt sich ebenfalls in einer Vielzahl von Techniken für die Herstellung von Proinsulin verwenden. Das Proinsulin, erzeugt von einem Gen, ist selbst nützlich, da es in Insulin durch bekannte enzymatische oder chemische Methoden umgewandelt werden kann. Siehe Kemmber, W.. et al.. J. Biol.
Chem 242, 6786 (1971).
EMI6.2
und B-Kettenwurde, sodass die Proinsulin-Sequenz unter der Kontrolle einer zur Bewirkung ihrer Expression befähigten DNASequenz steht, unter Bedingungen gezüchtet wird, die zur Expression der für menschliches Proinsulin codierenden Sequenz geeignet sind, und dass das menschliche Proinsulin der Sequenz B-C-A aus dem Lysat oder Kulturmedium dieses Mikroorganismus gewonnen wird.
Bevorzugt wird bei diesem Verfahren der Produktcxpressionsvektor durch ein Verfahren hergestellt, das dadurch gekennzeichnet ist, dass eine für menschliches Proinsulin codierende DNA in einen Transfervektor eingesetzt wird,
EMI6.3
ligiertbefähigten DNA-Sequenz steht.
Weiters ist ein Verfahren bevorzugt, das dadurch gekennzeichnet ist, dass die für menschliches Proinsulin codierende Desoxyribonucleotidsequenz durch Hydrolyse der 3'-Enden der für menschliches Pre-proinsulin codierenden Desoxyribonucleotidsequenz in einem oder mehreren Zyklen eines stufenweisen exonucleolytischen Abbaus, der durch in Gegenwart eines Desoxyribonucleotid-Triphosphats wirkende T4 DNA Polymerase katalysiert wird, und Hydrolyse der 5'-Enden dieser Desoxyribonucleotidsequenz durch einen nucleolytischen Abbau, der durch ein für einzelsträngige DNA mit einem 5'-Ende spezifisches Nucleaseenzym katalysiert wird, hergestellt wird, und dass die so gewonnene,
für menschliches Proinsulin codierende Desoxynucleofidsequenz mil einem durch Spaltung eines Transfervektors mit einem Restriktionsenzym hergestellten DNA-Mol'cül umgesetzt wird.
Nach einer weiteren bevorzugten Ausführungsform der Erfindung ist das Verfahren dadurch gekennzeichnet, dass die für menschliches Proinsulin der Sequenz B-C-A codierende DNA eine C-codierende Sequenz der Formel (NaN). enthält, worin Na Nb und Nc A, T, G oder C sein können, jedoch NaNbNc nicht TGA, TAA oder TAG ist und j für eine ganze Zahl von 1 bis 100 steht.
Wie hier gezeigt, wurden eine cDNA mit der Basenscquenz, die für menschliches Pre-proinsulin codiert, und eine cDNA mit der Basensequenz, die für menschliches Proinsulin codiert, geklont. Die Struktur dieser geklonten cDNAs wurde durch Analyse der Nuclcoûd-Sequenz festgestellt
Die ursprüngliche Quelle für genetisches Material war Insulinoma, ein Insulin produzierender Tumor.
Messenger RNA wurde aus den Zellen isoliert.
DNA, die komplementär zu der isolierten messenger RNA (cDNA) ist, wurde unter Verwendung reverser Transkriptase in zwei Reaktionszyklen synthetisiert, um doppelstrangige cDNA zu erzeugen.
Die ungespaltene, heterogene, doppelstrangige cDNA wurde behandelt, um an jedem Ende eine spezifische Bindeglied-Oligonucleotidsequenz zu erhalten, was das Einführen in eine Lage von gleicher RestriktionSpezifität auf einem Transfervektor erleichtert.
Für das Klonen wurde ein Transfervektor mit guten Selektions-und stabilen Rcplikationscigenschaften ausgesucht Die behandelte cDNA wurde in einen Tiansfervektor an der vorbestimmten Stelle bei der VcktorDNA eingeführt, um einen rekombinieren Transfervektor nach einer der gängigen verfügbaren Techniken zu erhalten. Zellen des Wirtsmikroorganismus wurden mit dem rekombinieren Vektor transformiert. Die Transformanten wurden nach den Kriterien für das Einsetzen in die vorbestimmte Stelle ausgesucht Einzelne
EMI6.4
und in individuellen Kulturen gezüchtet, um die Replikation des rekombinieren Transfervektors von DNAKlonen zu ermöglichen. Durch ein modifiziertes Hybridisierungsverfahren der Kolonie wurde die TransfervcktorDNA für Insulinsequenzen abgeschirmt.
Die Kolonien, die rekombiniertc Transfervektor-DNA für Insulinsequenzen ergibt, wurden in grösseren individuellen Kulturen gezüchtet, um die Transfervektor-DNA zu isolieren und zu analysieren. Geeignete Klone wurden zur genauen Identifizierung der Nucleotidsequenz des geklonten Pre-proinsulin-oder Proinsulin-Gens und für den Transfer auf geeignete Übersetzungsplasmide
<Desc/Clms Page number 7>
gesammelt.
Der vollständige strukturelle codierende Teil des menschlichen Insulin-Gens wurde wie hier beschrieben,
EMI7.1
dass es speziell gespalten werden muss, um das gewünschte Produkt zu erhalten. In dem Fall von Proinsulin kennt man Techniken, welche die Aminosäuresequenz des Proteins ausnützen, um ein Fusionsprotein spezifisch zu spalten, wie in Beispiel 2 beschrieben.
Die geklonte Codicrsequenz kann auch direkt in der prokaryotischen Zelle durch Einführen der Sequenz direkt neben einem Promotor übersetzt werden. Der Vorteil in diesem Fall liegt darin, dass die spezifische Spaltung unnötig ist. Der grundlegende Nachteil ist, dass eine weitere Reinigung erforderlich ist.
Die Übersetzung des in E. coli eingesetzten Säugetier-Gens wurde durch das Einsetzen nahe der lac-, up-und
EMI7.2
ist. Es gibt zwei mögliche Stellen für das Einsetzen, nämlich kurze und lange prokaryotische Leitstellen für das Fusionsprotein. Eine Vielzahl genetischer Varianten ist verfügbar, die verschiedene Gehalte des endogenen Repressors aufweisen, tcmperaturinduzicrbar u. dgl. sind. Der trp-Promotor hat den Vorteil, dass höhere Ausmasse
EMI7.3
ebenfalls ausgeschieden oder man findet es im pcriplasmatischen Zwischenraum. Als Ergebnis sind weniger Reinigungsstufen erforderlich, um reines Proinsulin zu erhalten.
Die vorliegende Erfindung macht sich den Vorteil der Funktion des C-Peptides von Proinsulin zunutze, nämlich die spontane Faltung von Proinsulin zu erleichtern, um die A und B Ketten zueinander in die richtige Konfiguration zu bringen, sodass die Sulfhydrylgruppcn richtig paarweise angeordnet und die korrekten Disulfidbrücken gebildet werden, wie sie bei natürlichem Insulin gefunden werden. Vergleiche der C-Peptidsequenzen verschiedener Spezien zeigen, dass die C-Peptidsequenzen im Laufe der Evolution nicht gut konservie wurden. Daher sind viele Substitutionen der Aminosäuresequenz in dem C-Peptid möglich. Tatsächlich kann die Funktion des C-Peptids einfach darauf beruhen, dass eine Aminosäureschlinge von geeigneter Länge vorgesehen ist, um den A und B Ketten die Faltung in geeigneter Konfiguration zueinander zu erlauben.
Folglich könnte jede Codiersequenz anstelle einer C-Peptidsequenz des menschlichen Proinsulin eingefügt werden, ohne dass es im wesentlichen seine primäre Funktion ändern würde. Es liegen jedoch bestimmte Vorteile darin, wenn man die Verwendung von natürlichem C-Peptid favorisiert, beispielsweise braucht die Entfernung des Peptids aus dem Insulinpräparat nicht vollständig zu sein. weiters können auch so manche Vorteile darin gelegen
EMI7.4
Aminosäure codieren, könnten in der Sequenz substituiert werden, ohne die Sequenz oder Funktion des übersetzten Proteins zu berühren. Also beabsichtigt die vorliegende Erfindung, alle synthetischen Codiervarianten der Basen-Codiersequenz, die tatsächlich hier geklont wurde, zu umfassen, insofern als diese Variante menschliches Pre-proinsulin und menschliches Proinsulin codiert.
Die vorliegende Erfindung wird nun an Hand einiger Beispiele näher erläuten.
<Desc/Clms Page number 8>
EMI8.1
322 mit der Restriktions-Endonuclease Pst I gespalten und mit terminaler Transfer= in Anwesenheit von dGTP behandelt, um Oligo-dG Schwänze in 3'-Termini der linearen Plasmid-DNA zu bilden. Die so behandelte
EMI8.2
die Einfügung beide Enden der Pst I Kennsequenzen an beiden Enden der Einfügung, dadurch ist eine Ausscheidung der eingesetzten Sequenzen vorgesehen (siehe Villa-Kameroff, et al. ).
Das vorangehende"Schwanz-Verfahren"wurde verwendet, um pBR-322 Plasmide mit einer heterogenen Population von cDNS Einfügungen an der Pst I Lage zu bilden. Solche Plasmide werden Ampicillin-sensitiv, da die Pst I Lage in dem Beta-Laktamase-Gen ist, sie bleiben jedoch Tetracyclin-resistent. E. coli Stamm X 1776 wurde transformiert mit der Plasmid-DNA, die die Einfügungen enthalt. Es wurden 525 Tetracyclin-resistente Transformanten erhalten. Diese wurden für die Insulinsequenzen durch in situ Kolonie-Hybridisation, im
EMI8.3
Nat. Acad. Sci.Verwendung von DNS Polymerase I markiert wurde.
Da die Aminosäuresequenzen von menschlichem Insulin und dem der Ratte weitgehend ähnlich sind, (Insulin, 92% Homologie ; Proinsulin, 83% Homologie) war es vorauszusehen, dass die geklonte cDNA aus der Ratte kreuzweise mit menschlichen Insulin-Sequenzen unter reduzierten Bedingungen, wie einschlägig bekannt, hybridisieren würde. Durch Autoradiographie wurde gezeigt, dass zwei von den mit dem geklonten Pre-proinsulin I-Versuch aus der Ratte hybridisierten 525 Kolonien aus der Reihe fielen. Beide Kolonien waren Ampizillin-sensitiv. Die Plasmide, isoliert aus den Kolonien, waren
EMI8.4
Die mRNA-Sequenz. abgeleitet von der CDNA-Sequenz und die Aminosäuresequenz, hergeleitet von einem der Abtastrahmen, ist in Fig. 2 gezeigt. Die Primarstruktur des menschlichen Proinsulins, bestimmt auf diese
EMI8.5
früherePlasmiden werden durch Transformierung von E. coli HB-101 damit hergestellt. Der HB-101 Strang dient daher als geeigneter Wirt zum Erhalt und zur Replikation von Plasmiden mit geklonten Einfügungen, wie hier beschrieben.
Beispiel 2 :
Aufbau des Proinsulin-Transfervektors :
Die Insertion-DNA (insert) von pcHI-1 enthält die vollständige Codiersequenz für menschliches Preproinsulin. Für bestimmte Anwendungen, beispielsweise den Transfer auf andere Spezies von eucaryotischen Zellen, ist ein normaler Verfahrensablauf und Entfernung der Prescquenz und des C-Peptids, sowie die Erzielung
EMI8.6
<Desc/Clms Page number 9>
EMI9.1
Lagen bei der natürlichen Sequenz sind in Fig. 2 gezeigt.
Synthetische Proinsulin-DNA wird mit Alu I-EndonucIease behandelt, um zwei Fragmente von 43 bp und etwa 56 bp jeweils zu erhalten. Ähnlich wird die cDNS Einfügung vom pcHI-I, vorzugsweise durch Hha 1Spaltung wie in Beispiel 2B erhalten, durch Partialhydrolyse, katalysiert durch Alu I-Endonuc1ease, um Fragmente von etwa, 75,90, 110, 135, 165, 200, 245, 275, 375 und 455 bp jeweils zu bilden, gespalten. Diese werden durch Gel-Elektrophorese fraktioniert, um das 375 bp-Fragment zu erhalten ; das Ergebnis aus einer Spaltung der Single-Lage in dem Codon für Aminosäure Nr. 14.
Die Spaltfnmente des synthetischen Gens und der 375 bp Single-Lage der DNA-Einfügung sind durch eine stumpfendige Bindung (blunt-end ligation) verknüpft. Eine korrekte Verknüpfung des 43 bp synthetischen Fragments mit dem 375 bp cDNA-Fragment wird maximal dadurch erreicht, dass letztere in einem molaren Überschuss vorhanden ist. Die Möglichkeit zur unkorrekten Verknüpfung werden dadurch herabgesetzt, dass die synthetischen Fragmente einzelsträngige vorstehende Enden aufweisen, die nicht komplementär mit denen des 375 bp cDNS Fragments sind.
Des verknüpfte Molekül, eine Zusammensetzung der synthetischen Sequenzen mit dem Code für Methionin, gefolgt von den Aminosäuren 1-13, und die natürliche Sequenz mit dem Code für die Aminosäuren 14-86 des Proinsulins konstituiert eine Codiersequenz für Proinsulin. Diese kann in jedes gewählte Übersetzungsplasmid entweder durch Auffüllen oder Abspaltung der einzelsträngigen Enden und anschliessendes Anhängen geeigneter
EMI9.2
eingesetztCyanogenbromid abgespalten werden kann, um Proinsulin zu erhalten. Proinsulin wird nach der Methode von Kemmler, et al., in Insulin umgewandelt.
B. Die DNA-Einfügung von pcHI-l hat eine Hha I Lsge in der Sequenz der Codierung von Aminosäuren-14 bis -13, wie in Fig. 2 gezeigtL Weiters hat der Transfervektor pBR-322 eine Hha I Lage genau 22 bp von Pst I Lage am 5'Ende der Einfügung. Es ist daher möglich, eine Sequenz, die die gesamte Codiersequenz für Proinsulin und eine 22 bp Region von pBR-322 DNA durch Behandlung von pcHI-l mit Hha-l Endonuclease zu
EMI9.3
Die Behandlung beider Isolate mit Hha I Endonuclease ergibt eine Spaltung des Plusstranges zwischen den Aminosäuren-14 und-13 der Prcscquenz. (Der Plusstrang ist definiert als der Strang, dessen Nucleotidsequenz der mRNA Sequenz entspricht. Der Minusstrang ist derjenige, dessen Sequenz komplementär zu der mRNA Sequenz ist. ) Die bleibende Presequenz kann spezifisch durch Ausnutzung der 3'bis 5'Exonucleam-Aktivität von T4 DNA Polymerasc beseitigt werden, welche an dem Minusstrang beim Presequenz-Codierende und am Plusstrang
EMI9.4
Die vorhandene Presequenz kann spezifisch zum N-terminalen Phenylalanin-Codon von Aminosäure Nr. 1 durch drei Zyklen von T4 Polymerase-Abbau abgebaut werden. Zyklus 1 läuft in Anwesenheit von TTP ab, was den Abbau entgegengesetzt dem A des Glyzincodons in der Aminosäurestellung -7 begrenzL Zyklus 2 läuft ab in Anwesenheit von dCTP, was den Abbau entgegen dem G der Codonposition -5 (Asp) begrenzt Zyklus 3 läuft ab in Anwesenheit von dATP. welche den Abbau entgegen dem T, welches das erste Nucleotid der Position 1 von Proinsulin ist, begrenzt.
Nach jedem Zyklus des T4 Polymeraseabbaus muss das Triphosphat des gerade abgeschlossenen Zyklus entfernt und das Triphosphat für den anschliessenden Zyklus eingeführt werden. Zur Abtrennung der Triphosphate aus der Reaktionsmischung werden Minikolonen mit einem Dextran-Träger, der nach dem Molekulargewicht
EMI9.5
<Desc/Clms Page number 10>
wird durch Zentrifugieren. Alternativ wird das Enzym durch Temperaturen um 65 C vor der Chromatographierstufc inaktiviert. Der nachfolgende Zyklus wird dann durch Zugabe von frischem, aktiven
EMI10.1
Eine sehr geeignete Methode zum Klonen von Proinsulin codierender cDNS schliesst die Einverleibung von Oligo-A-Schwänzen unter Verwendung von terminaler Transferase an den 3'Enden der cDNS ein. Oligo-TSchwänze werden an den 3'Enden an einer geeigneten Lage an einem Übcrsetzungs-Transfervektor gebildet, beispielsweise an der EcoRl Lage in dem Beta-Galaktosidase-Gen bei dem Plasmid pTS-I (Ullrich, A. et al.) siehe auch GB-PS 2 301 434 B, auf die hier Bezug genommen wird. Der Einsatz von Proinsulin codierender
EMI10.2
oben beschrieben, umgewandelt wird. Alternativ wird das Fusionsprotein mit einer Kombination von Trypsin und Carboxypcptidasc B (oder Cathepsin B) behandelt, um aktives Insulin von dem Fusionsprotein in einer einzigen Reaktion zu geben.
C. Eine Proinsulin-Codiersequenz wird durch selektive Spaltung an einer inneren Lage in der Proinsulin-
EMI10.3
Jedes Fragment wird nach der Isolierung mit alkalischer Phosphatase behandelt, um die S'-terminalen Phosphatgruppen zu entfernen, dann wird durch Behandlung mit Restriktions-Endonuclease, einen einzigen Spaltpunkt in der Proinsulin-Codiersequenz aufweisend, gespalten. Vorzugsweise ist die Restriktionslage nahe von den Enden der Proinsulin-Codierscquenz lokalisiert. Die Alu I Lage in dem Bereich der Aminosäuren 13-14 sorgt für einen brauchbaren Spaltpunkt (siehe Fig. 2). Das Hha I Fragment von pcHI-I wird partiell mit Alu I Endonuclcasc gespalten, um zwei Fragmente von annähernd 76 bp und annähernd 375 bp entsprechend zu bilden.
Die Alu I Fragmente werden durch Gel-Elektrophorese fraktioniert, wie im Beispiel 2A beschrieben, und das 375 bp Fragment wird gewonnen.
Eine Nuc1cotidsequcnz mit dem Code für die ersten 13 Aminosäuren von Proinsulin mit einem 5'-terminalen
EMI10.4
Bioi. Chcm. 250.J. AM. Chem. Soc. 97, 7327 (1975). Der Plusstrang der synthetischen DNS hat die Sequenz 3'-TITGTGAACCAACACCfG TGCGGCTCACACCTGGTGGAAG-5', in Entsprechung zu der natürlichen Sequenz. Jedoch können andere Sequenzen mit der Codierung für die selben Aminosäuren synthetisiert werden, wie üblicherweise die Sequenz 3'-TTKGTLAAKCAJCAKXTYTGKGGLQRSCAKXTYGTLCAJG-5'. Die erhaltene Sequenz ist"stumpfendig"an das annähernd 375 bp Fragment des Hha I Fragments von pcHI-I
EMI10.5
50 % der Reaktionen verknüpft.
Die Ligase-behandelte DNS wird anschliessend zu einem geeigneten Übersetzungsplasmid geklont, entweder durch einen Oligo-A-Schwanz wie in Beispiel 2B beschrieben, oder durch Anhängen von Gliedern und Einführen in Übersetzungsplasmide bekannter Abtastrahmen. Im Falle von den Einfügungen von Oligo-A-Schwänzen wird die Übersetzung von Proinsulin in etwa 1/12 der Klone beobachtet Im Fall des direkten Einsetzens, wo der Abtastrahmen als korrekt bekannt ist, beträgt die Häufigkeit der Übersetzungsklone etwa 50 %.
<Desc/Clms Page number 11>
EMI11.1
3 :al., Science 205, 602 (1979)) ; und durch den Beta-Laktamase Promotor kontrolliert wird.
Die Übertragung wird durch Messung eines Produktes ermittelt, das zur immunochemischen Bindung mit einem Anti-Insulin Antikörper oder Anti-Proinsulin Antikörper fähig ist. Es wurden radioimmunologische Proben verwendet, in welchen der Antikörper radioaktiv markiert und die Paare : Antigen-Antikörper durch eine Preparation von in der Wärme abgetöteten Staphyloccoccus aureus C ausgefällt wurden. (Siehe Morgan und
EMI11.2
W., Ummuno\., 115,al., Cell 10, 681 (1978) oder von Broome, S. und Gillen. W., Proc. Nat. Acad. Sci. USA. 75,2746 (1978) beschrieben ist
EMI11.3
PATENTANSPRÜCHE 1. Verfahren zur Herstellung von menschlichem Proinsulin, dadurch gekennzeichnet, dass ein Mikroorganismus, der mit einem Produktexprcssionsvektor transformiert wurde, der durch Einsatz einer für menschliches Proinsulin der Sequenz B-C-A (worin A und B die A-und B-Ketten von menschlichem Insulin und C eine Peptidsequenz darstellen) codierenden DNA in einen Transfervektor hergestellt wurde, sodass die Proinsulin-Sequenz unter der Kontrolle einer zur Bewirkung ihrer Expression befähigten DNA-Sequenz steht, unter Bedingungen gezüchtet wird, die zur Expression der für menschliches Proinsulin codierenden Sequenz geeignet sind, und dass das menschliche Proinsulin der Sequenz B-C-A aus dem Lysat oder Kulturmedium dieses Mikroorganismus gewonnen wird.