<Desc/Clms Page number 1>
Die vorliegende Erfindung betrifft ein Verfahren zur Herstellung von Humaninsulin.
Insulin ist ein Hormon, das vor allem von den B-Zellen des Pankreas produziert wird. Zur Zeit ist die Verwendung des Hormons bei der Behandlung von Diabetes allgemein bekannt. Obwohl Schlachthäuser Rinderund Schweinepankreas als Insulinquelle in grösserer Menge liefern, kann es zu einem Engpass in der Versorgung mit diesem Hormon kommen, wenn die Zahl der Diabetiker weltweit zunimmt. Überdies zeigen manche Diabetiker eine allergische Reaktion auf Rinder- und Schweineinsulin mit schädlichen Folgen. Es wird zither mit Nachdruck angestrebt, menschliches Insulin in ausreichender Menge zu erzeugen, um den Weltbedarf decken zu können.
Insulin besteht aus zwei Polypcptidketten, bekannt als A und B Ketten, die miteinander durch Disulfidbrücken verbunden sind. Die A Kette besteht aus 21 Aminosäuren und die B Kette aus 30 Aminosäuren. Die Ketten werden nicht unmittelbar in vivo synthetisiert, leiten sich jedoch von einem unmittelbaren Prccurscr ab, genannt
EMI1.1
die, dass es lediglich für die Bildung der dreidimensionalen Struktur des Moleküls dient Die Aminosäuresequenz für das menschliche Proinsulin, bestimmt nach üblichen Techniken, ist in Tabelle 1 wiedergegeben. In dieser Tabelle entspricht der B Kette die Aminosäurefolge 1-30, dem C-Peptid die Aminosäurefolge 31-65 und der A Kette die Aminosäurefolge 66. 86.
Tabeltc I
EMI1.2
<tb>
<tb> 1 <SEP> 10 <SEP>
<tb> NH2-Phe-Val-Asn-Gln-His-Leu-Cys-Gly-Ser-His-Leu-Val-Glu-
<tb> 20
<tb> Ala-Lcu-Tyr-Leu-Val-Cys-Gly-Glu-Arg-Gly-Phc-Phc-Try-Thr-
<tb> 30 <SEP> 40
<tb> Pro-Lys-Thr-Arg-Arg-Glu-Ala-Glu-Asp-Leu-Gln-Val-Gly-Gln-
<tb> 50
<tb> Val-Glu-Lcu-Gly-Gly-Gly-Pro-Gly-Ala-Gly-Ser-Leu-Gln-Pro-
<tb> 60
<tb> Leu-Ala-Lcu-Glu-Gly-Ser-Lcu-Gln-Lys-Arg-Gly-lle-Val-Glu-
<tb> 70 <SEP> 80
<tb> Gln-Cys-Cys-Thr-Ser-ne-Cys-Scr-Leu-Tyr-Gln-Leu-Glu-Asn-
<tb> 86
<tb> Try-Cys-Asn
<tb>
Die chemische Synthese dieser Sequenz von 86 Aminosäuren ist zwar möglich, aber dennoch nach üblichen Techniken schwierig.
In den B-ZeUen des Pankreas ist das Anfangs-Translationsprodukt nicht das Proinsulin selbst, sondern ein Pre-proinsulin, das mehr als 20 zusätzliche Aminosäuren an der endständigen Aminogruppe des Proinsulins enthält. Siehe Cahn. S. J. et al., Proc. Nat. Acad. Sci. USA 73,1964 (1976) und Lomedico, P. T. et al., Nucl. Acid. Res. 3,381 (1976). Die zusätzliche Aminosäuresequenz wird das Signalpeptid genannt. Im menschlichen Pre-proinsulin (siehe Fig. 2) hat das Signalpeptid 24 Aminosäuren und die Sequenz ist -24-20-10
EMI1.3
dieser Phase abgespalten. Siehe Blobel, G. et al., J. Cell. Biol. 67, 835 (1975).
In einigen Fällen weiss man, dass die Signalpeptide für den Transport eukaryotischer Proteine durch die Zellwände verantwortlich sind. In einem zollfreien System wurde ein spezifisches Spaltcnzym beobachtet, das die
EMI1.4
Neuerliche Fortschritte in der Biochemie und der Technologie für die Rekombination der DNA haben es möglich gemacht, spezifische Proteine unter kontrollierten Bedingungen, unabhängig von dem höheren Organismus, von welchem sie normalerweise isoliert werden, zu synthetisieren. Solche biochemische Syntheseverfahren verwenden Enzyme und subzellulare Komponenten des Protein-Synthesemechanismus der lebenden Zelle, entweder in vitro, in zellfreie Systemen, oder in vivo, in Mikroorganismen.
In jedem Fall ist das Schlüsselelement der Einsatz einer Desoxyribonucleinsäure (DNA) mit einer spezifischen Sequenz, welche die Information enthalt, um die gewünschte Aminosäuresequenz festzulegen. So eine spezifische DNA wird hier als Gen bezeichnet. Die Codierungsbeziehung wird hier kurz beschrieben, wobei eine Desoxynucleotidsequenz
<Desc/Clms Page number 2>
verwendet wird, um die Aminosäuresequenz eines Proteins zu spezifizieren, und arbeitet nach einer fundamentalen Folge von Prinzipien, von denen das ganze Reich lebender Organismen durchdrungen ist.
Ein geklontes Gen kann verwendet werden, um die Aminosäuresequenz von Proteinen, die in vitro synthetisiert wurden, zu spezifizieren. Protein-Synthesesysteme, von DNA gesteuert, sind in der Fachwelt gut bekannt, siehe Zubay, G., Ann. Rev. Genetics 7,267 (1973). Wcitcrs kann einsträngige DNA induziert werden, um als messenger RNA in vitro zu wirken, was in einer exakten Translation der DNA-Sequenz resultiert (Salas, J. et p. l., J. Biol. Chem. 243, 1012 (1968). Andere in der Fachwelt gut bekannte Techniken können in Kombination mit den oben angeführten Verfahren verwendet werden, um die Ausbeute zu erhöhen.
Weiterentwicklungen in der Rckombinationstcchnik für DNA haben es möglich gemacht, spezifische Gene oder deren Teile aus höheren Organismen, sowohl weiblichen als auch männlichen, zu isolieren und die Gene oder
EMI2.1
welches das Gen oder dessen Fragment codiert, mag es ein Enzym, ein Hormon, ein Antigen, ein Antikörper oder deren Teile sein. Der Mikroorganismus geht mit dieser Fähigkeit in seiner Nachkommenschaft auf, sodass tatsächlich die Übertragung einen neuen Stamm mit der beschriebenen Fähigkeit zum Ergebnis hat. Siehe
EMI2.2
Eine grundlegende Tatsache, der die Anwendung dieser Technologie für praktische Zwecke unterliegt, ist die, dass die DNA aller lebender Organismen, von Mikroben bis zum Menschen, chemisch ähnlich ist, wenn sie aus den selben vier Nucleotiden zusammengesetzt ist.
Die signifikanten Unterschiede liegen in den Sequenzen dieser Nucleotide im polymeren DNA Molekül. Die Nucleotidsequenzen werden verwendet, um die
EMI2.3
In der Beschreibung verwendete Abkürzungen werden in Tabelle 2 wiedergegeben.
Tabelle 2
EMI2.4
<tb>
<tb> DNA-Dssoxyribonucleinesäure <SEP> A-Adenin <SEP>
<tb> RNA <SEP> -Ribonucleinsäure <SEP> T <SEP> -Thymin
<tb> CDNA-komplimentNre <SEP> DNA <SEP> G-Guanin <SEP>
<tb> (enzymatisch <SEP> synthesiert <SEP> C <SEP> - <SEP> Cytosin <SEP>
<tb> aus <SEP> einer <SEP> mRNA <SEP> Sequenz) <SEP> U. <SEP> Uracil <SEP>
<tb> mRNA-messenger <SEP> RNA <SEP> ATP-Adenosintriphosphat <SEP>
<tb> dATP <SEP> -Desoxyadenosintriphosphat <SEP> TTP <SEP> -Thymidintriphosphat
<tb> dATP <SEP> -Desoxyadenosintriphosphat <SEP> EDTA <SEP> -ÄthylendiamintetradCTP <SEP> -Desoxycytidintriphosphat <SEP> essigsäure
<tb>
Die Codierungsbezichungen zwischen der Nucleoüdsequenz in der DNS und der Aminosäuresequenz im Protein sind allgemein bekannt als genetischer Code. wie er in Tabelle 3 gezeigt ist.
Tabelle 3 genetischer Code
EMI2.5
<tb>
<tb> Phenylalanin <SEP> (Phe) <SEP> TTK <SEP> Hisüdin <SEP> (His) <SEP> CAK
<tb> Lcucin <SEP> (Lcu) <SEP> XTY <SEP> G) <SEP> utamin <SEP> (G <SEP> ! <SEP> n) <SEP> CAJ
<tb> Isolcucin <SEP> (lle) <SEP> ATM <SEP> Asparagin <SEP> (Asn) <SEP> AAK
<tb> Methionin <SEP> (Met) <SEP> ATG <SEP> Lysin <SEP> (Lys) <SEP> AAJ
<tb> Valin <SEP> (Val) <SEP> GTL <SEP> Asparaginsäure <SEP> (Asp) <SEP> GAK
<tb> Scrin <SEP> (Scr) <SEP> QRS <SEP> Glutaminosaure <SEP> (Glu) <SEP> GAJ
<tb> Prolin <SEP> (Pro) <SEP> CCL <SEP> Cystein <SEP> (Cys) <SEP> TGK
<tb> Threonin <SEP> (Thr) <SEP> ACL <SEP> Tryptophan <SEP> (Try) <SEP> TGG
<tb> Alanin <SEP> (Ala) <SEP> GCL <SEP> Arginin <SEP> (Arg) <SEP> WGZ
<tb> Tyrosin <SEP> (Tyr) <SEP> TAK <SEP> Glycin <SEP> (Gly)
<SEP> GGL
<tb> Tennin21ion <SEP> Signal <SEP> TAJ
<tb> Termination <SEP> Signal <SEP> TGA
<tb>
Schlüssel: Jedes Desoxynucleotidtriplett aus 3 Buchstaben entspricht einem TrinucleoLid der mRNA mit einem S'-Ende links und einem 3'-Ende rechts. Alle DNA-Sequenzen. wie sie hier wiedergegeben sind, weisen
EMI2.6
<Desc/Clms Page number 3>
Buchstaben stehen für Purin- oder Pyrimidinbasen, die die Desoxynucleotidscquenz bilden.
A = Adenin J=AodcrG G = Guanin K = T oder C C-Cytosin L = A, T, C oder G T = Thymin M A, C oder T
X = T oder C. wenn Y A oder G ist X = C, wenn Y C oder T ist
Y = A, G, C oder T, wenn X C ist
Y = A oder G. wenn X T ist
W = C oder A, wenn Z A oder G ist
W = C, wenn Z C oder T ist
Z = A, G, C oder T, wenn W C ist
Z = A oder G, wenn W A ist QR = TC, wenn S A, G, C oder T ist QR-AG, wenn S T oder C ist S = A. G, C oder T. wenn QR TC ist S = T oder C. wenn QR AG ist
EMI3.1
der genetischen Nachricht herangezogen werden, zu bezeichnen.
Viele Techniken zur Rekombination der DNA verwenden zwei Klassen von Verbindungen, Transfervektoren
EMI3.2
eigeneangewendet wird für jede autonome Replikations-DNA-Einheit, die in einer mikrobiellen Zelle gefunden werden kann, anders als das Genom der Wirtszelle selbst. Ein Plasmid ist genetisch nicht verbunden mit dem Chromosom der Wirtszelle. Plasmid-DNA existieren als doppelsträngige Ringstrukturen allgemein in der Grössenordnung einiger Millionen Daltons Molekulargewicht, obwohl einige grösser sind als 108 Daltons
EMI3.3
Transfcrsektor-DNA ist üblicherweise abtrennbar von der Wirtszcllen-DNA auf Grund des riesigen Unterschiedes in der Grösse zwischen ihnen.
Die Transfervektoren tragen die genetische Information, was sie zur Replikation innerhalb der Wirtszelle befähigt, in den meisten Fällen unabhängig von der Geschwindigkeit der Teilung der Wirtszelle. Einige Plasmide haben die Eigenschaften, dass ihre Replikationsgcschwindigkeit dadurch kontrolliert werden kann, dass man die Wachstumsbedingungen variiert. Durch geeignete Techniken kann der Ring der Plasmid-DNA geöffnet werden, ein Fragment einer heterologen DNA eingeführt und der Ring wieder geschlossen werden unter Bildung eines vergrösserten Moleküls, das das eingesetzte DNA-Segment enthalt.
Bakteriophage DNA kann ein Segment einer heterologen DNA tragen, das anstelle eines bestimmten nicht essentiellen Phasen-Gens eingesetzt isL In beiden Fällen dient der Transfervektor als Träger oder Vektor für ein eingesetztes Fragment der heterologen DNA.
Der Transfer ist begleitet von einem Prozess, den man als Transformation kennt. Während der Transformation bauen die bakteriellen Zellen, vermischt mit Plasmid-DNA. vollständige Plasmidmoleküle in die Zellen ein.
Obwohl die Mechanismen des Verfahrens im Dunkeln bleiben, ist es möglich, das Verhältnis der bakteriellen Zellen, die die Fahigkeit haben, Plasmid-DNA aufzunehmen und, nachdem sie transformiert wurden. durch gewisse empirisch bestimmte Behandlungen zu maximieren. Hat einmal die Zelle ein Plasmid einverleibt, so unterliegt letzteres der Replikation in der Zelle und die Plasmid-Rcpliken werden bei der Zellteilung auf die Tochterzellen verteilt. Jede genetische Information, wie sie in der Nucleotidsequenz der Plasmid-DNA enthalten ist, kann grundsaztlich in der Wirtszelle übersetzt werden. Es ist typisch, dass die transformierte Wirtszelle dafür bekannt ist, dass sie den dem Plasmid innewohnenden Charakter erwirbt, wie beispielsweise die Resistenz
EMI3.4
übertragen.
Jedes vorgegebene Plasmid kann in Menge hergestellt werden durch Vermehrung einer reinen Zellkultur, die das Plasmid enthält, und Isolierung der Plasmid-DNA daraus.
Restnktionscndonucleasen sind hydrolytische Enzyme mit der Fähigkeit, die lagespezifische Spaltung der
<Desc/Clms Page number 4>
DNA Moleküle zu katalysieren. Die Stelle, an der die Restriktionsendonuclease wirkt, ist bestimmt durch das Vorhandensein einer spezifischen Nucleotidsequenz. Eine solche Sequenz bezeichnet man als Kennlagen für die Restriktionsendonuclease. Restriktionsendonucleasen aus verschiedenen Quellen wurden isoliert und anhand der Nucleotidsequenz ihrer Kennlagen bestimmt. Einige Restriktionsendonucleasen hydrolysieren die Phosphatdiesterbindungen beider Stränge an demselben Punkt, unter Bildung von stumpfen Enden. Andere
EMI4.1
Rc & ionen einzelner Strange an jedem Ende des gespaltenen Moleküls bilden.
Solche einzelsträngige Enden sind selbstkomplementJ1r, daher kohäsiv, und können verwendet werden, um die hydrolysierte DNA wieder zu verknüpfen. Da jede DNA, die gegenüber der Spaltung durch so ein Enzym empfindlich ist, die selbe Kennlage enthalten muss, werden die selben kohäsiven Enden hergestellt, sodass es möglich ist, heterologe Sequenzen der
EMI4.2
Rev. Biochem., 4,jedes Segment der DNA gekuppelt werden mit einem anderen Segment einfach durch Anfügen des verwendeten Restriktionsoligonuclcotids an die Enden des Moleküls und Unterwerfung des Produktes einer hydrolytischen Behandlung durch die verwendete Restriktionsendonucleasc, dabei bilden sich die erforderlichen kohäsiven Enden. Siehe Heyneker, H. L. et al.. Nature 263. 748 (1976) und Scheller, R.
H., et al., Science 196, 177 (1977). Ein wichtiges Merkmal der Verteilung der Kennlagen der Rcstriktionscndonuc ! ease ist die Tatsache, dass sie wahllos verteilt sind mit Rücksicht auf den Abtastrahmen. In der Folge kann die Spaltung durch die Restriktionsendonuclease zwischen benachbarten Codons oder innerhalb der Codons vor sich gehen.
Mehrere allgemeine Methoden für die Spaltung der DNA oder der Modifikation der Endsequenz stehen zur Verfügung. Eine Vielzahl nicht spezifischer Endonucleasen können verwendet werden, um die DNA an den Rändern zu spalten, wie sie hier diskutiert werden. Die Endsequenzen können durch die Bildung von Oligonuclootidschwanzen der dA an einem Ende und dT an dem anderen Ende oder dG und dC modifiziert werden, um Lagen für die Verknüpfung zu erzeugen, ohne dass man spezifische Bindegliedsequenzen benötigt. Der Ausdruck "Übersetzung" wird verwendet, um die Tatsache festzuhalten, dass ein Organismus selten wenn je zu einem beliebigen Zeitpunkt Gebrauch macht von allen seinen genetischen Fähigkeiten, mit denen er ausgestattet ist.
Gerade bei relativ einfachen Organismen, wie Bakterien, werden viele Proteine, welche die Zelle synthetisieren kann, nicht synthetisiert, obwohl sie unter den gegebenen Umweltbedingungen synthetisiert
EMI4.3
wird.
Die Methoden, durch welche die Genübersetzung in E. coli kontrolliert wird, sind allgemein bekannt als ein Ergebnis weitreichende Studien über einen Zeitraum von 20 Jahren ; siehe allgemein Hayes, W., The Genetics of Bacteria and their Viruses, 2. Auflage. John Willey & Sons, Inc., New York (1968), 3. Auflage, Benjamin, Menlo Park, Califomia (1976). Diese Studien haben gebracht, dass manche Gene, üblicherweise solche, die Proteine mit ähnlichen Funktionen in der Zelle codieren, als Einheit in kontinuierlicher Sequenz aneinander haften. Diese Einheit wird Operon genannt. Sämtliche Gene in dem Operon werden transkribiert, in der selben Richtung beginnend mit den Codcns, die N-terminale Aminosäure des ersten Proteins in der Sequenz codieren, und in Fortsetzung zu dem C-terminalen Ende des letzten Proteins in dem Operon.
Am Anfang des Operons in Nähe zu dem N-terminalen Amonisäurccodon existiert ein Bereich der DNA, genannt die Kontrollregion, die eine Vielzahl von Kontrollelementen, einschliessend den Operator, Promotor und Sequenzen für Lagen der ribosomen Bindung, enthalten. Die Funktion dieser Lagen ist so, dass sie die Übersetzung solcher Gene unter ihrer Kontrolle gestatten, entsprechend den Bedürfnissen des Organismus. Beispielsweise werden Gene, die Enzyme codieren, welche ausschliesslich für die Nutzbarmachung der Lactose benötigt werden, normalerweise nicht merkbar übersetzt, bis Lactose oder ein Analoges davon tatsächlich in dem Medium vorhanden ist.
Die regionalen Kontrollfunktionen, die für die Übersetzung des Ablaufs vorhanden sein müssen, sind die Initiierung der
EMI4.4
die N-terminaleTranslationsfunktionen richtig lokalisiert sein muss.
Es wurde gezeigt, dass Gene, die normalerweise kein Teil eines gegebenen Operons sind, in ein solches eingeführt und von ihm kontrolliert werden können. Die klassische Demonstration wurde durch Jacob, F., et al., J. Mol. Biol. 13, 704 (1965) gemacht. In diesem Versuch wurden Gene, die Enzyme für die Purinbiosynthese codieren, in eine Region transferiert, die durch das Lactoseoperon kontrolliert ist. Die Übersetzung des Enzyms
<Desc/Clms Page number 5>
für die Purinbiosynthese wurde dann als unterdrückt in Abwesenheit von Lactose oder einem Analogen beobachtet und dieses reagiert nicht auf Umgebungssignale, die normalerweise die Übersetzung regulieren.
Zusätzlich zu der Operatorregion, die die Initiierung der Transkription der Gene abwärts von ihr reguliert, ist bekannt, dass Codons existieren, welche als Haltesignale fungieren, indem sie das C-terminale Ende des gegebenen Proteins anzeigen. Siehe Tabelle 3. Solche Codons sind bekannt als Endsignale und "Nonsens-Codons", da sie normalerweise für keine Aminosäure den Code bilden.
Ausschaltung des Endsignals zwischen den strukturellen Genen eines Operons bewirkt ein verschmolzenes Gen, was zu einer Synthese eines chimären Proteins aus zwei Aminosäurcsequenzcn, codiert durch benachbarte Gene und verknüpft durch eine Peptidbindung, führen könnte, dass solche chimären Proteine synthetisiert werden, wenn Gene verschmelzen, wurde durch Benzer, S., und
EMI5.1
Gen für weitere Manipulationen, Modifikationen und Transfers auf andere Vektoren oder andere Stellen in den selben Vektor bereitgestellt.
Die Übersetzung wird durch Transferierung des geklonten Gens in geeigneter Orientierung und in einem Abtastrahmen in einen Kontrollbereich erhalten, sodass das Ablesen von dem prokaryotischen Gen die Synthese
EMI5.2
Hilfe einer Technologie für die Rekombination von DNS erzeugt wird, erfordert vorerst das Klonen eines Säugetiergens. Einmal geklont, kann das Gen in Menge hergestellt, weiters durch chemische oder enzymatische Verfahren modifiziert und auf ein Übcrsetzungsplasmid übertragen werden.
Das geklonte Gen eignet sich ebenso für die Isolierung verwandter Gene oder, wenn ein Fragment geklont ist, für die Isolierung des vollständigen Gens, indem das geklonte Gen als Hybridisierungssonde verwendet wird Weiters eignet sich das geklonte Gen zu Überprüfung der Identität oder Homologie von selbständigen Isolaten derselben oder verwandter Gene durch Hybridisierung. Wegen der Natur des genetischen Codes steuert das geklonte Gen die Produktion nur der Aminosäuresequenz, für welches es als Code dient, und keine andere, wenn es in den geeigneten Abtastrahmen translatien wird.
Einige Arbeiten zur Isolierung und Reinigung von Ratten-Proinsulin wurden durchgcführt. Ullrich, A. et al., supra, und Villa-Komaroff, L. et al., supra beschreiben die Isolierung und Reinigung von Ratten-Proinsulin-Gen und ein Verfahren zum Transferieren dieses Gens auf einen Mikroorganismus und dessen Replikation. Ullrich et al. fanden einige Rekombinations-Plasmide, die die Codesequenz für Proinsulin, die 3'-nicht translatierte Region und einen Teil des Prepeptids enthielten. Die Übersetzung der Ratten-DNA, die den Code für die Insulinsequenz enthält, wird in der GB-PS 2 301 434 B geoffenbart.
Villa-Komaroff et al. entdeckten ein rekombiniertes Plasmid, das die Codesequenz für Aminosäuren 4-86 von Proinsulin enthalt. Diese Proinsulin-Sequenz wurde von Aminosäuren 24-182 der Penicillinase (Beta-Laktamase) durch die Codesequenz für sechs Glyzine abgetrennt. Die Codesequenz für das Penicillinase-Proinsulin wurde übersetzt, um ein erschmolzenes Protein zu bilden. Diese Artikel beschreiben einige der grundlegenden Verfahren, die auf die Technologie für rekombinierte DNA angewandt werden. Sie beschreiben jedoch nicht die Isolierung und Reinigung des menschnlichen Pre-proinsulinGens oder menschlichen Proinsulin-Gens.
Crea, R. et al., Proc. NaLAcad. Sci USA 75, 5765 (1978) haben einen abweichenden Weg eingeschlagen, um menschliches Insulin zu isolieren. Er besteht in der chemischen Synthese der Codesequenz für 1. ) der A Kette und 2. ) der B Kette des menschlichen Insulins unter Verwendung von Codons, begünstigt durch E. coli. Diese beiden Sequenzen können in Plasmide, welche übersetzt werden können, um A und B Ketten zu bilden, eingesetzt werden. Menschliches Insulin könnte dann durch Bildung der richtigen Disulfidbindungen zwischen den beiden Proteinen erzeugt werden.
Das geklonte Gen für menschliches Pre-proinsulin lässt sich in einer Vielzahl von Wegen verwenden. Die
EMI5.3
<Desc/Clms Page number 6>
EMI6.1
beschrieben sind, zu erhalten.
Das geklonte Pre-proinsulin-Gen kann in einer Vielzahl von Techniken für die Herstellur, g von Preproinsulin eingesetzt werden. Pre-proinsulin selbst eignet sich, weil es durch bekannte enzym'arische und chemische Methoden in Proinsulin übergeführt werden kann. Beispielsweise ist es möglich, das Prepeptid durch ein lösliches enzymatisches Präparat, wie von Blobel, G. et al., beschrieben, das spezifisch für die Abtrennung von Signalpeptiden ist, abzutrennen. Das geklonte Proinsulin-Gen lässt sich ebenfalls in einer Vielzahl von Techniken für die Herstellung von Proinsulin verwenden. Das Proinsulin, erzeugt von einem Gen, ist selbst nützlich, da es in Insulin durch bekannte enzymatische oder chemische Methoden umgewandelt werden kann.
Siehe Kemmber, W., et al., J. Biol. Chem. 242, 6786 (1971).
Die vorliegende Erfindung betrifft nun ein Verfahren zur Herstellung von Humaninsulin, das dadurch gekennzeichnet ist. dass ein Mikroorganismus, der mit einem Produktexpressionsvektor transformiert wurde, der durch Einsatz einer für menschliches Proinsulin der Sequenz B-C-A (worin A und B die A- und B-Ketten von
EMI6.2
Sequenz steht, unter Bedingungen gezüchtet wird, die zur Expression der für menschliches Proinsulin codierenden Sequenz geeignet sind, dass das menschliche Proinsulin der Sequenz B-C-A aus dem Lysat oder Kulturmedium dieses Mikroorganismus gewonnen wird, worauf die Sulfhydrylgruppcn der A- und B-Peptide des so gewonnenen menschlichen Proinsulins oxidiert werden, um Disulfidbrücken zwischen den A- und B-Peptiden zu bilden, und anschliessend das C-Peptid durch enzym-katalysierte Hydrolyse,
die für die das C-Peptid mit den A- und BPeptiden verbindenden Bindungen spezifisch ist, herausgeschnitten wird.
Bevorzugt wird bei diesem Verfahren der Produktexpressionsvektor durch ein Verfahren hergestellt, das
EMI6.3
DNA mit einem 5'-Ende spezifisches Nucleaseenzym katalysiert wird, hergestellt wird und dass die so gewonnene, für menschliches Proinsulin codierende Desoxynucleotidsequenz mit einem durch Spaltung eines Transfervektors mit einem Restriktionsenzym hergestellten DNA-Molekül umgesetzt wird.
EMI6.4
TAG ist und j für eine ganze Zahl von 1 bis 100 steht.
Wie hier gezeigt, wurden eine cDNA mit der Basensequenz, die für menschliches Pre-proinsulin codiert, und eine cDNA mit der Basensequenz, die für menschliches Proinsulin codiert, geklont. Die Struktur dieser geklonten cDNAs wurde durch Analyse der Nucleotid-Sequenz festgestellt.
Die ursprüngliche Quelle für genetisches Material war Insulinoma, ein Insulin produzierender Tumor.
Messenger-RNA wurde aus den Zellen isoliert.
DNA, die komplementär zu der isolierten messenger RNA (cDNA) ist, wurde unter Verwendung reverser Transkriptase in zwei Reaktionszyklen synthetisiert, um doppelsträngige cDNA zu erzeugen. Die ungespaltene, heterogene, doppelsträngige cDNA wurde behandelt, um an jedem Ende eine spezifische BindegliedOligonucleotidsequenz zu erhalten, was das Einführen in eine Lage von gleicher Restriktions-Spezifität auf einem Transfervektor erleichtert.
Für das Klonen wurde ein Transfervektor mit guten Selektions- und stabilen Replikationseigenschaften ausgesucht. Die behandelte cDNA wurde in einen Transfervektor an der vorbestimmten Stelle bei der VektorDNA eingeführt, um einen rekombinieren Transfervektor nach einer der gängigen verfügbaren Techniken zu
EMI6.5
Stelle ausgesucht. EinzelneInsulinsequenzen ergibt, wurden in grösseren individuellen Kulturen gezüchtet, um die Transfervektor-DNA zu isolieren und zu analysieren. Geeignete Klone wurden zur genauen Identifizierung der Nucleotidsequenz des geklonten Pre-proinsulin-oder Proinsulin-Gens und für den Transfer auf geeignete Cbersetzungsplasmide gesammelt.
<Desc/Clms Page number 7>
Der vollständige strukturelle codierende Teil des menschlichen Insulin-Gens wurde, wie hier beschrieben, geklont, einschliesslich eines Teiles der nicht translatiertcn 5'-Region, der gesamten Peptidsequenz, der gesamten codierenden Sequenz für B-, C- und A-Peptide und des gesamten 3 nicht translatierten Bereichs. Die Auswahl der Wirtszelle bewirkt, welche Teile des geklonten Gens verwendet werden. Die gesamte codierende Preproinsulinsequenz eignet sich für die Transformierung bestimmter Spezies höherer eukaryolischer Zellen, da die Presequenz als ein einzelnes Peptid wirkt und die Abscheidung des Peptids von der Zelle fördert.
Ausserdem katalysieren solche eukaryotische Zell-Linien, die dem Signalpeptid entsprechen, die spezifische Abtrennung der Presequenz während des Transports des Proteins durch die Zellenmembran hindurch. Solche Zellen können ausserdem die Fähigkeit besitzen, das Übcrsetzungsprodukt durch Ablösen des C-Proteins nach der katalytischen Bildung der richtigen Disulfidbindungen herauszulösen.
In prokaryotischen Wirtszcllen wird die Verwendung der Codiersequenz für Proinsulin gegenwärtig bevorzugt.
Die Stufe der Konvertierung von Proinsulin in Insulin wird im Detail unter Einsatz in der Fachwelt gut bekannter Techniken durchgeführt. Zwei Arten der Übersetzung sind bereits bekannt, beide schliessen die Einführung der Codesequenz des Proinsulins in eine Region der Transfervektor-DNS ein, deren Übersetzung durch einen prokaryotischen Promotor kontrolliert wurde. In einigen Fällen sind ein Teil des prokaryotischen strukturellen Gens und die Promotorkontrolle zwischengeschaltet, sodass das Übcrsetzungsprodukt ein Fusionsprotein mit seinem N-terminalen Teil, aus dem N-terminals" Teil des prokaryotischen Proteins zusammengesetzt, und sein C-endständiger Teil die geklonte Sequenz, in diesem Fall das Proinsulin ist.
Die Übersetzung des Proinsulins als ein menschliches Insulin hat den Vorteil, dass das Fusionsprotein in der
EMI7.1
stabilerdass es speziell gespalten werden muss, um das gewünschte Produkt zu erhalten. In dem Fall von Proinsulin kennt man Techniken, welche die Aminosäuresequenz des Proteins ausnützen, um ein Fusionsprotein spezifisch zu spalten, wie in Beispiel 2 beschrieben.
Die geklonte Codiersequenz kann auch direkt in der prokaryotischen Zelle durch Einführen der Sequenz direkt neben einem Promotor übersetzt werden. Der Vorteil in diesem Fall liegt darin, dass die spezifische Spaltung unnötig isL Der grundlegende Nachteil ist, dass eine weitere Reinigung erforderlich ist
Die Übersetzung des in E. coli eingesetzten Säugetier-Gens wurde durch Einsetzen nahe des lac-, trp-und des Beta-Laktamase Promotors erhalten. Der lac-Promotor wird benötigt, weil seine Genetik gut charakterisiert ist. Es gibt zwei mögliche Stellen für das Einsetzen, nämlich kurze und lange prokaryotische Leitstellen für das Fusionsprotein. Eine Viehlzahl genetischer Varianten ist verfügbar, die verschiedene Gehalte des endogenen
EMI7.2
Die vorliegende Erfindung macht sich den Vorteil der Funktion des C-Peptides von Proinsulin zunutze, nämlich die spontane Faltung von Proinsulin zu erleichtern, um die A und B Ketten zueinander in die richtige Konfiguration zu bringen, sodass die Sulfhydrylgruppen richtig paarweise angeordnet und die korrekten Disulfidbrücken gebildet werden, wie sie bei natürlichem Insulin gefunden werden. Vergleiche der CPeptidsequenzen verschiedener Spezien zeigen, dass die C-Peptidscquenzen im Laufe der Evolution nicht gut konserviert wurden.
Daher sind viele Substitutionen der Aminosäuresequenz in dem C-Peptid möglich.
EMI7.3
<Desc/Clms Page number 8>
EMI8.1
erläutert.Gcldontes menschliches Pre-proinsulin-Gen :
Das menschliche Insulin-Gen wurde aus RNA, die aus menschlicher Insulinoma unter Verwendung eines Verfahrens, beschrieben von Ullrich, et al., zur Isolierung von RNA aus Inselzellen geklont. Die RNA, erhalten als Pellet nach Zentrifugieren in 5, 7 M CsCI, enthaltend 100 mM EDTA, wurde ohne weitere Fraktionierung als Basis für die DNA-Synthese unter Verwendung von Umkehr-Trsnskriptase und SI Nuclease, wie beschrieben von UI1rich, et al., eingesetzt. Annähernd 40 ng doppelstrangige cDNA wurde aus 130 tum unfraktioniener RNA hergestellt.
Die unfraktionierte cDNA wurde mit tenninaler Transfers in Anwesenheit von dCTP behandelt, um OligoC Schwänze an den 3'-Termini der cDNA Moleküle zu bilden. Ähnlich wurde der Plasmid-Transfervektor pBR- 322 mit der Restnktions-Endonuclease Pst 1 gespalten und mit terminaler Tnmsferase in Anwesenheit von dGTP behandelt, um Oligo-dG Schwänze in 3'-Tennini der linearen Plasmid-DNA zu bilden. Die so behandelte
EMI8.2
wurde transformiert mit der Plasmid-DNA, die die Einfügungen enthalt. Es wurden 525 Tetracyclin-resistente Transformanten erhalten. Diese wurden für die Insulinsequenzen durch in situ Kolonie-Hybridisation, im wesentlichen wie beschrieben durch Gruenstein und Hogness, Proc. Nat. Acad. Sci.
USA 72, 3961 (1975)
EMI8.3
a1.) wurde als Hybridisationsuntersuchung verwendet, nachdem die Ratten-cDNA durch "nick" Translation unter Verwendung von DNS Polymerase I markiert wurde. Da die Aminosäuresequenzen von menschlichem Insulin und dem der Ratte weitgehend ähnlich sind, (Insulin, 92 % Homologie ; Proinsulin, 83 % Homologie) war es vorauszusehen, dass die geklonte cDNA aus der Ratte kreuzweise mit menschlichen Insulin-Sequenzen unter reduzierten Bedingungen, wie einschlägig bekannt, hybridisieren würde. Durch Autoradiographie wurde gezeigt, dass zwei von den mit dem geklonten Pre-proinsulin I-Versuch aus der Ratte hybridisierten 525 Kolonien aus der Reihe fielen. Beide Kolonien waren Ampicillin-sensitiv.
Die Plasmide, isoliert aus den Kolonien, waren annähernd 250 bp und 500 bp länger als pBR-322 selbst. Das grössere Plasmid wurde als pcHI-I bezeichnet.
Die Nucleotidsequenz des eingesetzten cDNA Fragments von pcHI-1 wurde durch die Methode nach Maxam und Gilbert, Proc. NaLAcad. Sci. USA 74, 650 (1977) bestimmt. Ein schematisches Diagramm der Einfügung ist in Fig. I gezeigt. Die vollständige Codierregion für menschliches Pre-proinsulin war gemeinsam mit einem Teil der 5'-nicht translatierten Region, der gesamten 3'-nicht translatierten Region und einem Teil der 3'-Poly dA Region in der Einfügung vorhanden. Die Restriktionslagen, wie sie zur Spaltung der Einfügung verwendet werden, um die Sequenz zu bilden, sind ebenfalls in Fig. l gezeigt, gemeinsam mit der Richtung der Sequenzbildung in jedem Fragment und den Regionen der Überlappung.
Die mRNA-Sequenz, abgeleitet von der CDN-Sequenz und die Aminosäuresequenz, hergeleitet von einem der Abtastrahmen, ist in Fig. 2 gezeigt. Die Primärstruktur des menschlichen Proinsulins, bestimmt auf diese Weise, stimmt präzise damit überein, was durch frühere Versuche zur Aminosäure-Sequcnzbindung erhalten wurde (Dayhoff, M. D., Atlas of Protein Sequence and Structure, 5, Supp. 2, pp. 127-130 (1976) und Supp. 3, pp. 150- 151 (1978). Die Aminosäuren der Proinsulin-codierenden Sequenz sind mit 1-86, die der Presequenz mit-24 bis- 1 numeriert. Fig. 2 zeigt weiters die Stellen bestimmter Restriktionslagen für den Aufbau des Proinsulin-Gens aus der pcHI-I Einfügung.
Es versteht sich, dass die cDNA-Sequenz des Codierstranges der peHI-I-Einfügung dieselbe ist wie in Fig. 2 gezeigt, ausser dass Tymin für Uracil gesetzt ist. Grosse Menge von pcHI-1 und anderen Plasmiden werden durch Transfonnierung von E. coli HB-101 damit hergestellt. Der HB-101 Strang dient daher als geeigneter Win zum Erhalt und zur Replikation von Plasmiden mit geklonten Einfügungen, wie hier beschrieben.
Beisciel 2
Aufbau des Proinsulin-Transfervektors :
Die Insertions-DNA (insert) von pcHI-I enthält die vollständige Codiersequenz für menschliches Preproinsulin. Für bestimmte Anwendungen, beispielsweise den Transfer auf andere Spezies von eukaryotischen
EMI8.4
Protein ergibt. Nach der neueren Situation ist der Aufbau einer Codiersequenz für Proinsulin von Vorteil, da es schnell zu aktivem Insulin in vitro unter Verwendung gut bekannter Techniken umgewandelt wird. Siehe
<Desc/Clms Page number 9>
Kemmler, E., et al.. J. Biol. Chem. 242, 6786 (1971). Hier werden drei alternative Methoden für den Aufbau einer Proinsulin-Codiersequenz beschrieben.
Ein Plasmid-Transfervektor, enthaltend pBR-322 mit einer eingesetzten Proinsulin-Codiersequcnz, ist als pcHP-1 bezeichnet.
EMI9.1
Lagen bei der natürlichen Sequenz sind in Fig. 2 gezeigt.
Synthetische Proinsulin-DNA wird mit Alu I-Endonuclease behandelt, um zwei Fragmente von 43 bp und
EMI9.2
;Spaltung der Single-Lage in dem Codon für Aminosäure Nr. 14.
Die Spaltfragmente des synthetischen Gens und der 375 bp Single-Lage der DNA-Einfügung sind durch eine stumpfendige Bindung (blunt-end ligation) verknüpft. Eine korrekte Verknüpfung des 43 bp synthetischen Fragments mit dem 375 bp DNA-Fragment wird maximal dadurch erreicht, dass letztere in einem molaren Überschuss vorhanden ist. Die Möglichkeit zur unkorrekten Verknüpfung werden dadurch herabgesetzt, dass die synthetischen Fragmente einzelsträngige vorstehende Enden aufweisen, die nicht komplementär mit denen des 375 bp cDNS Fragments sind.
EMI9.3
Bindcglied-Oligonucleoudc eingesetzt werden.
Die Übersetzung führt zu einem Fusionsprotein, das an seinem Methioninrest durch Behandlung mit Cyanogenbromid abgespalten werden kann, um Proinsulin zu erhalten. Proinsulin wird nach der Methode von Kemmler, et al., in Insulin umgewandelt.
B. Die DNA-Einfügung von pcHI-1 hat eine Hha l-Lage in der Sequenz, der Codierung von Aminosäuren-
EMI9.4
Lage am 5'Ende der Einfügung. Es ist daher möglich, eine Sequenz, die die gesamte Codiersequenz für Proinsulin und eine 22 bp Region von pBR-322 DNA durch Behandlung von pcHI-1 mit Hha-l Endonucleasc zu
EMI9.5
Die vorhandene Presequenz kann spezifisch zum N-terminalen Phenylalanin-Codon von Aminosäure Nr. 1 durch drei Zyklen von T4 Polymerase-Abbau abgebaut werden. Zyklus 1 läuft in Anwesenheit von TTP ab, was den Abbau entgegengesetzt dem A des Glyzincodons in der Aminosäurestellung-7 begrenzt. Zyklus 2 läuft ab in Anwesenheit von DCTP, was den Abbau entgegen dem G der Codonposiûon. 5 (Asp) begrenzt. Zyklus 3 läuft ab in Anwesenheit von dATP, welche den Abau entgegen dem T, welches das erste Nucleotid der Position 1 von Proinsulin ist, begrenzt.
EMI9.6
<Desc/Clms Page number 10>
EMI10.1
<Desc/Clms Page number 11>
C) durchgeführtAbtastrahmen als korrekt bekannt ist, beträgt die Häufigkeit der Übersetzungsklone etwa SO %.
Beispiel 3
EMI11.1
erfolgen.
In so einem Fall wird das Protein, das durch die Einfügung codiert ist, direkt synthetisiert. Die beiden
EMI11.2
funktionellen Eigenschaften, wieeingesetzten Codiersequenz durch den allgemeinen Wunsch nach spezifischer Entfernung des Wirtsantciles des Fusionsproteins kompliziert. Diese wird durch bekannte Techniken, wie in den Beispielen 2A und 2B beschrieben, zu Ende geführt Die direkte Synthese des gewünschten Proteins beugt dem Bedarf nach spezifischer Spaltung vor, schliesst aber generell die Möglichkeit der Exkretion von der Wirtszclle aus.
Es wurden Übersetzungsplasmide entwickelt, bei denen die Übersetzung durch den 12C-Promotor (Itakura, K.
EMI11.3
et al., Science 205, 602 (I979)) ; und durch den B-Laktamase Promotor kontrolliert wird.
Die Übertragung wird durch Messung eines Produktes ermittelt, das zur immunochemischen Bindung mit einem Anti-Insulin Antikörper oder Anti-Proinsulin Antikörper fähig ist. Es wurden radioimmunologische Proben verwendet, in welchen der Antikörper radioaktiv markiert und die Paare : Antigen-Antikörper durch eine Preparation von in der Wänne abgetöteten Staphylococcus aureus C ausgefüllt wurden. (Siehe Morgan und
EMI11.4
J.lmmunol., 115,al., Cell 10, 681 (1978) oder von Broome, S. und Gilbert, W., Proc. Nat. Acad. Sci. USA, 75, 2746 (1978) beschrieben ist.
EMI11.5
Minizellen produzierendem E. coli Stamm P 678-54 als Wirt.
Radioaktiv markierte Aminosäuren werden in Minizellen-Proteine eingebaut, Vergleichsstränge transformiert mit Übersctzungs-Transfervektoren mit und ohne eingesetzter Proinsulin-Codiersequenz. Die Proteine werden durch SDS-Acrylamid-Gel-Elektrophorese fraktioniert und die Proteinpositionen autoradiographisch ermittelt Die Übersetzung von Proinsulin ist durch die Anwesenheit eines markierten Proteinbandes angezeigt, das nur in Minizellen, transformiert durch das
EMI11.6
Messung des Molekulargewichts des übersetzten Proteins ein und stimmt mit der bekannten Länge des eingesetzten Gens und des N-terminalen prokaryotischen Teils überein.
Die Entfernung des prokaryotischen Teils und die Überführung von Proinsulin in Insulin in vitro wird durch bekannte Verfahrensweisen, wie hier beschrieben, durchgeführt.
**WARNUNG** Ende DESC Feld kannt Anfang CLMS uberlappen**.