DD255359A5 - Verfahren zur bestimmung eines spezifischen einzelstraengigen polynuclebtids unbekannter sequenz - Google Patents

Verfahren zur bestimmung eines spezifischen einzelstraengigen polynuclebtids unbekannter sequenz Download PDF

Info

Publication number
DD255359A5
DD255359A5 DD30037687A DD30037687A DD255359A5 DD 255359 A5 DD255359 A5 DD 255359A5 DD 30037687 A DD30037687 A DD 30037687A DD 30037687 A DD30037687 A DD 30037687A DD 255359 A5 DD255359 A5 DD 255359A5
Authority
DD
German Democratic Republic
Prior art keywords
dna
probes
sequence
hybridization
erythropoietin
Prior art date
Application number
DD30037687A
Other languages
English (en)
Inventor
Fu-Kuen Lin
Original Assignee
Kirin-Amgen Inc.,Us
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kirin-Amgen Inc.,Us filed Critical Kirin-Amgen Inc.,Us
Publication of DD255359A5 publication Critical patent/DD255359A5/de

Links

Abstract

Verfahren zur Bestimmung eines spezifischen einzelstraengigen Polynucleotids unbekannter Sequenz in einer heterogenen zellulaeren oder viralen Probe einschliesslich multipler einzelstraengiger Polynucleotide, gekennzeichnet dadurch, dass (a) ein Gemisch markierter einzelstraengiger Polynucleotidsonden mit gleichmaessig variierenden Sequenzen der Basen hergestellt wird, wobei jede der Sonden potentiell einer Sequenz von Basen komplementaer ist, die zu dem zu bestimmenden Polynucleotid das vermeintlich nur einmal existierende Exemplar ist; (b) die Probe auf ein festes Substrat fixiert wird; (c) das Substrat mit der darauf fixierten Probe behandelt wird, um eine weitere Bindung von Polynucleotiden darauf abzuschwaechen, ausgenommen durch Hybridisierung zu Polynucleotiden in der Probe; (d) das behandelte Substrat mit der darauf fixierten Probe fluechtig mit dem genannten Gemisch markierter Sonden unter Bedingungen in Beruehrung gebracht wird, die nur die Hybridisierung zwischen vollstaendig komplementaeren Polynucleotiden erleichtern; und (e) das spezifische Polynucleotid ueber die Beobachtung des Auftretens einer Hybridisierungsreaktion zwischen ihm und einer vollstaendig komplementaeren Sonde aus dem Gemisch der markierten Sonden bestimmt wird.

Description

Hierzu 4 Seiten Zeichnungen
Anwendungsgebiet der Erfindung
Die Erfindung betrifft ein Verfahren zur Herstellung eines Polypeptids. Allgemein bezieht sich die Erfindung auf die Manipulation genetischer Materialien, insbesondere auf rekombinante Verfahren, die die Herstellung von Polypeptiden ermöglichen, die teilweise oder insgesamt die primäre strukturelle Anordnung aufweisen und/oder eine oder mehrere der biologischen Eigenschaften natürlich vorkommenden Erythropoietins.
Charakteristik der bekannten technischen Lösungen
A. Manipulation von genetischen Materialien
Genetische Materialien können weitgehend als jene chemischen Substanzen definiert werden, die für die Herstellung von Zellbestandteilen und Viren programmieren und diese Vorgänge lenken und die Reaktion von Zellen und Viren ausrichten. Eine langkettige polymere Substanz, die als Desoxyribonucleinsäure (DNA) bekannt ist, enthält das genetische Material aller lebenden Zellen und Viren, mit Ausnahme bestimmter Viren, die durch die Rebonucleinsäuren (RNA) programmiert werden. Die wiederkehrenden Einheiten in DNA-Polymeren sind vier unterschiedliche Nucleotide, wobei jedes von ihnen entweder aus einem Purin (Adenin oder Guanin) oder einem Pyrimidin (Thymin oder Cytosin) besteht, gefunden an einen Desoxyribosezucker, an den eine Phosphatgruppe angefügt ist. Die Anfügung von Nucleotiden in linearer Form erfolgt über die Fusion 5'-Phosphates eines Nucleotidsan die 3'-Hydroxy-Gruppe eines anderen. Funktionelle DNA tritt in Form stabiler doppelsträngiger Zusammenlagerungen einzelsträngiger Nucleotide auf (bekannt als Desoxyoligonucleotide), wobei sich diese Zusammenlagerungen durch Wasserstoffbindung zwischen Purin- und Pyrimidinbasen ergeben (z. B. „komplementäre" Zusammenlagerungen, die entweder zwischen Adenin [A] und Thymin [T] oder Guanin [G] und Cytosin [C] bestehen). Durch Übereinkommen werden die Nucleotide durch die Namen ihrer konstitutionellen Purin- oder Pyrimidinbasen bezeichnet, und die komplementären Zusammenlagerungen der Nucleotide in der doppelsträngigen DNA (z. B. -A-T und G-C) werden als „Basenpaare" bezeichnet. Ribonucleinsäure ist ein Polynucleotid, bestehend aus Adenin, Guanin, Cytosin und Uracil (U) anstelle von Thymin, gebunden an Ribose und eine Phosphatgruppe.
Zusammengefaßt wird die programmierende Funktion der DNA im allgemeinen durch einen Prozeß bewirkt, bei dem spezifische DNA-Nucleotidsequenzen (Gene) in relativ instabile Boten-RNA (mRNA)-Polymere „transcribiert" werden. Die mRNA dient umgekehrt als eine Schablone für die Bildung struktureller, regulierender und katalytischer Proteine aus Aminosäuren. Zu diesem mRNA-„Translations"prozeß gehören die Operationen kleiner RNA-Stränge (tRNA), die einzelne Aminosäuren am mRNA-Strang entlang transportieren und ausrichten, um die Bildung von Polypeptiden in einwandfreier Aminosäurefolge zu ermöglichen. Die mRNA-„Botschaft", abgeleitet aus der DNA und die Basis für die tRNA-Unterstützung bildend und die Orientierung jeder gegebenen der zwanzig Aminosäuren für die Polypeptid-„Expression", liegt in Form von Dreifach-„Lodons" vor — aufeinanderfolgende Gruppierungen der drei Nucleotidbasen. In diesem Sinne ist die Bildung eines Proteins die letzte Form der „Expression" der programmierten genetischen Botschaft, die in der Nucleotidsequenz eines Gens vorliegt. „Promotor"-DNA-Sequenzen gehen üblicherweise einem Gen in einem DNA-Polymeren, „voraus" und sehen eine Stelle für die Initiierung der Transskription in mRNA vor. „Regulator"-DNA-Sequenzen, auch üblicherweise oberhalb (upstream) des (z.B. vorausgehenden) Gens in ein einem gegebenen DNA-Polymeren, binden Proteine, die die Frequenz (oder Rate) der Transkriptionsinitiierung bestimmen.
Gemeinsam als „Promotor/Regulator"- oder „Steuerungs"-DNA-Sequenz bezeichnet, arbeiten diese Sequenzen, die einem ausgewählten Gen (oder eine Reihe von Genen) in einem funktionellen DNA-Polymeren vorausgehen, zusammen, um zu bestimmen, ob die Transskription (und eventuell Expression) eines Gens stattfindet. DNA-Sequenzen, die einem Gen in einem DNA-Polymeren „folgen" und ein Signal für die Beendigung der Transkription in mRNA vorsehen, werden als Transkriptions„terminator"-Sequenzen bezeichnet.
Brennpunkt mikrobiologischer Verfahren war im letzten Jahrzehnt der Versuch zur Herstellung industriell und pharmazeutisch bedeutsamer Substanzen unter Verwendung von Organismen, die entweder anfänglich keine genetisch codierte Information hinsichtlich des gewünschten Produktes in ihrer DNA enthielten oder (im Falle menschlicher Zellen in Kultur) gewöhnlich kein chromosomales Gen mit entsprechenden Gehalten exprimieren. Vereinfacht dargestellt, wird ein Gen, das die Struktur eines gewünschten Polypeptidproduktes spezifiziert, entweder aus einem „Spender" („Donor")-organismus isoliert oder chemisch synthetisiert und dann stabil in einen anderen Organismus eingeführt, der vorzugsweise ein selbstreplizierender, vielzelliger Organismus wie Bakterien-, Hefe- oder Säugetierzellen in Kultur ist. Wenn dies einmal erfolgt ist, wird der vorhandene Mechanismus für die Genexpression in den „transformierten" oder „transferierten" mikrowellen Wirtszellen dazu benutzt, das gewünschte Produkt zu konstruieren, unter Verwendung der exogenen DNA als eine Schablone für die Transkription von mRNA, die dann in eine kontinuierliche Sequenz von Aminosäureresten translatiert wird.
Aus dem Stand der Technik gibt eine zahlreiche Patent- und Literaturpublikation zu „rekombinanter DNA"-Technik hinsichtlich Isolierung, Synthese, Reinigung und Amplifizierung genetischer Materialien zur Verwendung bei der Transformation ausgewählter Wirtsorganismen. So betrifft beispielsweise die US-PS 4237224 (Cohen et al.) die Transformation einzelliger Wirtsorganismen mit „Hybrid"-viraler oder ringförmiger Plasmid-DNA, wozu ausgewählte exogene DNA-Sequenzen gehören. Zu den Verfahrensweisen des Cohen-Patents gehört die Herstellung eines Transformationsvektors durch enzymatisches Schneiden viraler oder ringförmiger Plasmid-DNA, um lineare DNA-Stränge zu bilden. Ausgewählte fremde („exogene" oder „heterologe") DNA-Stränge, zu denen üblicherweise Sequenzen, die für das gewünschte Produkt codieren, gehören, werden in linearer Form durch die Verwendung ähnlicher Enzyme hergestellt. Die lineare virale oder Plasmid-DNA wird mit der fremden DNA in Anwesenheit ligierender Enzyme inkubiert, die in der Lage sind, einen Wiederherstellungsprozeß zu bewirken, und es werden „Hybrid"-Vektoren gebildet, zu denen das ausgewählte exogene DNA-Segment gehört', „gespleißt" in das virale oder kreisförmige DNA-Plasmid.
Die Transformation von kompatiblen einzelligen Wirtsorganismen mit dem Hybridvektor führt zur Bildung von vervielfachten Kopien der exogenen DNA in der Wirtszellenpopulation. In vielen Fällen ist das erwünschte Ergebnis einfach die Amplifizierung der Fremd-DNA, und das gewonnene „Produkt" ist die DNA. Kürzlich wurde darüber berichtet, daß das Endziel der Transformation die Expression durch die Wirtszellen der exogenen DNA in Form einer Synthese im Großmaßstab von isolierbaren Mengen kommerziell bedeutender, dafür codierender Protein- oder Polypeptidfragmente durch die Fremd-DNA ist, siehe auch z. B. US-PS 4264731 (Shine), 4273875 (Manis), 4293652 (Cohen) und EP-OS 093619, veröffentlicht am 9. November 1983.
Die Entwicklung spezifischer DNA-Sequenzen für das Spleißen in DNA-Vektoren erreicht man über eine Vielzahl von Techniken, abhängig im großen Maße vom Grad der „Fremdheit" des „Donors" zum vorgesehenen Wirt und der Größe des im Wirt zu exprimierenden Polypeptids. Zur Gefahr der Über-Vereinfachung kann festgestellt werden, daß drei alternative prinzipielle Methoden eingesetzt werden können: (1) die „Isolierung" derdoppelsträngigen DNA-Sequenz aus der genomischen DNA des Donors; (2) die chemische Herstellung einer DNA-Sequenz, die einen Code für ein Polypeptid von Interesse aufweist; und (3) die in vitro-Synthese einer doppelsträngigen DNA-Sequenz durch enzymatische „reverse Transskription" von mRNA, die aus Donorzellen isoliert worden ist. Die letztgenannten Methoden, zu denen die Bildung eines DNA-„Komplements" von mRNA gehört, werden allgemein als „cDNA"-Methoden bezeichnet.
Die Herstellung von DNA-Sequenzen wurde kürzlich als Methode der Wahl bezeichnet, wenn die gesamte Sequenz der Aminosäurereste des gewünschten Polypeptidproduktes bekannt ist. DNA-Herstellungsverfahren von der ebenfalls zugeeigneten, anhängigen US-Patentanmeldung Nr. 483481 von Alton et al. (eingereicht am 15. April 1983 und korrespondierend zu PCT US83/00605, veröffentlicht am 24. November 1983 als WO 83/04053 sehen, beispielsweise weiterführende Mittel vor zur Erreichung solcher höchst wünschenswerter Ergebnisse wie: Vorsehen von alternierenden Codons, die kürzlich in Genen gefunden wurden, die in hohem Maße in den für die Expression ausgewählten Wirtsorganismen exprimiert werden (z. B. Vorsehen von Hefe- oder Ecoli-„Vorzugs"codons! Vermeiden der Anwesenheit untranslatierter „Intron"-Sequenzen (üblicherweise in menschlichen genomischen DNA-Sequenzen und mRNA-Transskripten davon), die nicht leicht durch procaryotische Wirtszellen verarbeitet werden; Vermeiden der Expression unerwünschter „Ieader"-Popypeptidsequenzen, die üblicherweise dafür codieren, durch genomische DNA- und cDNA-Sequenzen, jedoch letztens nicht leicht von dem interessierenden Polypeptid durch bakterielle oder Hefe-Wirtszellen abgespalten werden; Vorsehen einer leichten Insertion der DNA in geeignete Expressionsvektoren in Zusammenlagerung mit gewünschten Promoter/Regulator- und Terminator-Sequenzen; und Vorsehen einer leichten Konstruktion von Genen, die für Polypeptidfragmente codieren und Analoge der gewünschten Polypeptide.
• -3- 255 3B9
Wenn die gesamte Sequenz der Aminosäurereste der gewünschten Polypeptide nicht bekannt ist, ist die direkte Herstellung der DNA-Sequenzen nicht möglich, und die Isolierung von DNA-Sequenzen, die für das Polypeptid codieren, durch eine cDNA-Methode wird die Methode der Wahl, ungeachtet der potentiellen Rückgänge im Spielraum der Gruppe von Expressionsvektoren, die in der Lage sind, einen hohen Grad der mikrowellen Expression, über die oben berichtet wurde, zu verwirklichen. Zu den Standardverfahren zur Isolierung von interessierenden cDNA-Sequenzen gehört die Bereitung von Plasmid-geborenen cDNA-„Bibliotheken", abgeleitet von reverser Transskription von mRNA, reich an Donorzellen, ausgewählt als verantwortlich für einen hohen Grad an Expression von Genen (z. B. Bibliotheken von cDNA, abgeleitet von Hypophysenzellen, die relativ große Mengen an Wachstumshormonprodukten exprimieren. ;
Wo wesentliche Mengen der Aminosäuresequenzen des Polypeptids bekannt sind, können markierte, einzelsträngige DNA-Sondierungssequenzen eingesetzt werden, die eine vermutlich in der „Target"-cDNA vorhandene Sequenz duplizieren, in DNA/DNA-Hybridisierungsverfahren eingesetzt werden, die auf klinierten Kopien der cDNA durchgeführt werden, die in eine einzelsträngige Form abgebaut worden waren (siehe allgemein die Offenbarung und die Diskussion des Standes der Technik in der US-PS 4394443 von Weissman et al. und die kürzlich erfolgte Demonstration der Verwendung von langen Oligonucleotidhybridisierungssonden, die von Wallace et al. in Nuc. Acids Res. 6, S. 3543-3557 [1979] und Reyes et al. in P.N.A.S. [USA], 79, S.3270-3274 [1982] und Jaye et al in Nuc. Acids Res. 11, S. 2325-2335 [1983] berichtet wurden. Siehe auch US-PA 4358535 [Falkow et al.], die sich auf die DNA/DNA-Hybridisierungsverfahren zur Bewirkung der Diagnose bezieht; veröffentlichte Europäische Patentanmeldungen Nr.0070685 und 0070687, die die leicht-emittierenden Markierungen an einzelsträngigen Polynucleotidsonden betreffen; Davis et al. „A Manual for Genetic Engineering, Advanced Bacterial Genetics" [Handbuch der Gentechnik, Fortschritte bakterieller genetischer Methoden], Cold Spring Harbor Laboratory, Cold Spring Harbor, N. Y. [1980], Seiten 55-58 und 174-176, betreffend die Kolonie- und Plaque-Hybridisierungstechniken; sowie New England Nuclear [Boston, Mass.] Broschüren für „Gene Screen" Hybridisierungs-Transfermembranmaterialien mit Anweisungen für den Transfer und die Hybridisierung von DNA und RNA, Katalog Nr. NEF-972).
Zu den bedeutendsten Fortschritten der letzten Zeit bei Hybridisierungsverfahren für das Screening rekombinanter Klone gehört die Verwendung markierter gemischter synthetischer Oligonucleotidsonden, von denen jede potentiell das vollständige Gegenstück einer spezifischen DNA-Sequenz in der Hybridisierungsprobe einschließlich eines heterogenen Gemisches einzelsträngiger DNA's oder RNA's ist. Diese Verfahrensweisen wurden als besonders nützlich bei der Feststellung von cDNA-Klonen bestätigt, die aus solchen Quellen stammten, die extrem niedrige Mengen an mRNA-Sequenzen für die interessierenden Polypeptide zulassen. Zusammengefaßt, die Verwendung von scharfen Hybridisierungsbedingungen, die auf das Vermeiden nichtspezifischer Bindungen gerichtet ist, kann z. B. für die autoradiografische Sichtbarmachung eines spezifischen cDNA-Klons für den Fall der Hybridisierung der Target-DNA zu dieser einzelnen Sonde innerhalb des Gemisches, das deren vollständiges Gagenstück ist, gestatten. Siehe dazu allgemein Wallace et al., Nucl. Acids Res. 9, S. 879-897 (1981); Suggs et al., P.N.A.S. (USA), 78 S. 6613-6617 (1981); Choo et al.. Nature, 299, S. 178-180 (1982); Kurachi et al., P.N.A.S. (USA), 79, S. 6461-6464 (1982); Ohkubo et al., P.N.A.S. (USA) 80, S.2196-2200 (1983); und Kornblihtt et al., P.N.A.S. (USA) 80, S. 3218-3222 (1983). Allgemein wurden die gemischten Sondenverfahren von Wallace et al. (1981), s. o. von verschiedenen Forschern erweitert bis zu dem Punkt, wo zuverlässige Ergebnisse vermutlich erhalten wurden in einer cDNA-Klonisolierung unter Einsatz eines 32teiligen gemischten „Pools" von 16-Basen-langen (16-mer) Oligonucleotidsonden von gleichmäßigen, verschiedenen DNA-Sequenzen zusammen mit einem einzelnen 11-mer, um eineZwei-Stellen„positive"-Bestätigung der Anwesenheit von interessierender cDNAzu bewirken. Siehe dazu Singer-Sam et al., P.N.A.S. (USA), 80, S.802-806 (1983).
Die Verwendung von genomischen DNA-Isolaten ist die letzte übliche der drei obengenannten Methoden zur Entwicklung spezieller DNA-Sequenzen für den Einsatz in rekombinanten Verfahren. Dies ist insbesondere richtig auf dem Gebiet der rekombinanten Verfahren, die auf die Sicherung der mikrowellen Expression von Säugetierpolypeptiden gerichtet ist und wird prinzipiell der Komplexizität Säugetier-genomischer DNA gerecht. Während somit zuverlässige Verfahrensweisen für die Entwicklung phagengeborener Bibliotheken genomischer DNA des Menschen und anderer Säugetierspezies entstehen (siehe z. B. Lawn et al.. Cell 15, S. 1157-1174 [1978] hinsichtlich von Verfahren zur Erzeugung einer Human-Genbibliothek, bezeichnet als „Maniatis-Bibliothek"; Kam et al., P.N.A.S. [USA] 77, S. 5172-5176 [1980] hinsichtlich einer Human-Genbibliothek, basierend auf alternativem Restriktionsendonuclease-Fragmentierungsverfahren; und Blattner et al. Science, 196, S. 161-169 [1977], wo die Konstruktion einer Rinder-Genbibliothek beschrieben wird), gibt es relativ wenig erfolgreiche Versuche, bei der Verwendung von Hybridisierungsverfahren zur Isolierung genomischer DNA beim Fehlen umfassender Vorkenntnisse zu Aminosäure- oder DNA-Sequenzen.
Als ein Beispiel berichten Fiddesetal., J. Mol. and Appl. Genetics, 1, S. 3-18 [1981] über die erfolgreiche Isolierung eines Gens, das für die alpha-Untereinheit des menschlichen Hypophysenglycoproteinhormons aus der Maniatis-Bibliothek codiert, durch Verwendung einer Sonde mit „voller Länge", eines vollständigen 621-Basenpaar-Fragments einer vorher isolierten cDNA-Sequenz für die alpha-Untereinheit.
Als ein weiteres Beispiel berichten das et al., P.N.A.S. (USA), 80, S. 1531-1535 (1983) über die Isolierung von menschlichen genomischen Klonen für Human-HLA-DR unter Verwendung eines synthetischen Oligonucleotids mit 175 Basenpaaren. Schließlich berichten Anderson et al., P.N.A.S. (USA), 80, S. 6838-6842 (1983) über die Isolierung eines genomischen Klons für einen Rinderpankreatischen Trypsininhibitor (BPTI) unter Verwendung einer Einzelsonde mit 86 Basenpaaren in der Länge und konstruiert entsprechend der bekannten Aminosäuresequenz des BPTI. Die Autoren beobachten eine Determinierung geringer Aussichten für die Isolierung von mRNA, die geeignet ist für die Synthese einer cDNA-Bibliothek, wegen scheinbar geringer Gehalte an mRNA in anfänglich „targetiertem" Ohrspeicheldrüsen- und Lungengewebsmaterial und lenken dann die Erfolgsaussichten auf die Sondierung einer Gen-Bibliothek unter Verwendung eines Gemisches markierter Sonden mit der Feststellung:
— „Allgemeiner, es wurden Mischsequenz-Oligodesoxynaucleotidsonden verwendet, um Proteingene unbekannter Sequenz aus cDNA-Bibliotheken zu isolieren. Derartige Sonden sind normalerweise Gemische von 8-32 Oligonucleotiden, 14-17 Nucletiden in der Länge, die jede mögliche Codonkombination für eine geringe Streckung (5-6 Reste) der Aminosäuresequenz repräsentieren. Unter strengen Hybridisierungsbedingungen, die nichtkorrekte Basenpaarsonden benachteiligen, sind diese Sonden in der Lage, den Platz spezifischer Gensequenzen in Klonbibliotheken nieder — bis mittelmäßiger Komplexität festzustellen. Dessen ungeachtet weisen Mischsonden wegen ihrer kurzen Länge und Heterogenität oft nicht die Spezifität auf, die für sondierende Sequenzen als Komplex als ein Säugetier-Genom erforderlich
ist. Dies macht ein derartiges Verfahren ungeeignet zur Isolierung von Säugetier-Proteingenen, wenn die entsprechenden mRNA's nicht erhältlich sind."
(Ende des Zitats).
Somit besteht weiterhin ein Bedürfnis, für verbesserte Methoden, die eine schnelle und wirksame Isolierung von cDNA-Klonen in Fällen bewirken, wo nur wenig von der Aminosäuresequenz des dafür codierenden Polypeptids bekannt ist und wo „angereichertes" Gewebematerial von mRNA nicht leicht für den Einsatz bei der Konstruktion von cDNA-Bibliotheken erhältlich ist. Derartige verbesserte Methoden wurden insbesondere dann nützlich sein, wenn sie zur Isolierung von Säugetiergenomischen Klonen einsetzbar wären, wo nur zerstreute Informationen erhältlich sind hinsichtlich der Aminosäuresequenzen der dafür codierenden Polypeptide durch die gesuchten Gene
B. Erythropoietin als ein Polypeptid von Interesse
Erythropoese, die Produktion roter Blutzellen, läuft kontinuierlich während des menschlichen Lebens ab, um den Zellabbau auszugleichen. Die Erythrozytenbildung ist ein sehr genau gesteuerter physiologischer Mechanismus, die es ermöglicht, daß eine ausreichende Anzahl roter Blgtzellen im Blut zur Versorgung des Gewebes mit Sauerstoff verfügbar ist, jedoch nicht so viele, daß die Zellen die Zirkulation behindern würden. Die Bildung von roten Blutzellen erfolgt im Rückenmark und wird von dem Hormon Erythropoietin gesteuert.
Erythropoietin, ein saures Glycoprotein von ungefähr 34000 Dalton Molekülmasse, kann in drei Formen auftreten: α, ßund asialo. Die a- und /3-Formen unterscheiden sich geringfügig in den Carbohydratkomponenten, haben aber die gleiche Wirksamkeit, biologische Aktivität und Molekülmasse. Die asialo-Form ist eine a- oder /3-Form bei der das terminale Carbohydrat (Sialsäure) entfernt ist. Erythropoietin ist in sehr geringen Konzentrationen im Plasma vorhanden, wenn sich der Körper in einem gesunden Zustand befindet, wobei das Gewebe ausreichend Sauerstoff über die Vorhandene Anzahl Erythrozyten hält. Diese normale geringe Konzentration reicht aus, den Ersatz der roten Blutzellen zu stimulieren, die normalerweise durch Alterung ausfallen. .
Die Menge an Erythropoietin im Kreislauf steigt unter den Bedingungen von Gewebesauerstoffmangel (Hypoxie), wenn der Sauerstofftransport durch die Blutzellen im Blutkreislauf verringert ist. Hypoxie kann hervorgerufen werden durch Verlust großer Mengen an Blut infolge Hämorrhagie, Zerstörung roter Blutzellen durch Überdosis an Strahlung, Verminderung der Sauerstoffaufnahme in großen Höhen oder durch längere Bewußtlosigkeit oder durch verschiedene Formen der Anämie. Als Erwiderung auf den das Gewebe erleidenden hypoxischen Stress erhöht das Erythropoietin die Produktion roter Blutzellen durch Stimulierung der Umwandlung einfacher Precursor-Zellen im Rückenmark in Proerythroblasten, die später reifen, Hämoglobin synthetisieren und in den Blutkreislauf als rote Blutzellen freigesetzt werden. Wenn die Anzahl der roten Blutzellen im Kreislauf höher als für die normalen Sauerstofferfordernisse des Gewebes benötigt ist, wird das Erythropoietin im Kreislauf verringert. Siehe dazu allgemein. Testa et al., Exp. Hematol., 8 (Suppl.8), 144-152 (1980); Tong et al., J. Biol. Chem., 256 (24), 12666-12672 (1981); Goldwasser, J. Cell. Physiol., 110 (Suppl.1), 133-135 (1982); Finch, Blood, 60 (6), 1241-1246 (1982); Sytowski et al., Expt. Hematol., 8 (Supp.8), 52-64 (1980); Naughton, Ann. CHn. Lab. Sei., 13 (5), 432-438 (1983); Weiss et al., Am. J. vet. Res., 44 (10), 1832-1835 (1983); Lappin et al., Esp. Hematol. 11 (7),661-666 (1983); Bacin et al.,Ann. N. Y. Acad.Sci.,414,66-72 (1983); Murphy et al., Acta Haematologica Japonica,46 (7), 1380-1396 (1983); Dessypris et al., Brit. J. Haematol., 56,295-306 (1984); und Emmanoul et al.. Am. J. Physiol., 247 (1 Pt2), F168-76 (1984).
Da Erythropoietin im Prozeß der roten Blutzellenbildung wesentlich ist, weist das Hormon eine potentiell nützliche Application sowohl bei der Diagnose als auch der Behandlung von Blutkrankheiten auf, die durch eine niedrige oder gestörte rote Blutzellenproduktion gekennzeichnet sind. Siehe dazu allgemein Pennathur-Dasetal., Blood, 63(5), 1168-71 (1984) und Haddy, am. Jour. Ped. Hematol./Oncol, 4,191-196 (1982), die sich auf Erythroproietin für mögliche Therapien der Sichelzellen, anämie beziehen, und Eschbach et al., J. Clin. Invest., 74(2), S. 434-441 (1984), die ein therapeutisches Regime für urämische Schafe beschreiben, basierend auf invivo-Reaktionen auf Erythropietinreichen Plasmainfusionen, und einer vorgeschlagenen Dosis von 10 Einheiten EPO/kg pro Tag für 15 bis 40 Tage als Korrektiv einer Anämie des mit chronischem Nierenversagen verbundenen Typs. Siehe auch Krane, Henry Ford Hosp., Med., 31 (3) 177-181 (1983)
Kürzlich wurde eingeschätzt, daß die Erhältlichkeit von Erythropoietin in Mengen die Anämiebehandlung von
1600000 Menschen allein in den Vereinigten Staaten erlauben würde. Siehez.B. Morrison „Bioprocessing in Space an
Overview" Seite 557-571 in The world Biotech Report 1984, Bd.2: USA (Online Publications, New York, N. Y. 1984). Kürzliche Studien haben eine Basis für die Planung der Wirksamkeit der Erythropoietintherapie in einer Vielzahl von Krankheitszuständen, Krankheiten und Zuständen hämatologischer Unregelmäßigkeit erbracht:
Vedovato, et al., Acta. Haematol. 71, 211-213 (1984) (beta-Thalassämie); Vichinsky, et al., J. Pediatr., 105 (1), 15-21 (1984) (zystische Fibröse); Cotes, et al., Brit. J. Obstet. Gyneacol., 90 (4), 304-311 (1983) (Schwangerschaft, Menstruationsbeschwerden); Hage, et al., Acta. Pediatr. Scand., 72,827-831 (1983) (frühe Anämie der Frühreife); Claus-Walker, et al.. Arch. Phys. Med. Rehabil., 65,370-374 (1984) (Rückenmarkverletzung) Dunn, et al., Eur. J. Appl. Physiol., 52,178-182 (1984) (Raumflug); Miller, et al., Brit. J. Haematol., 52,545-590 (akuter Blutverlust); Udupa, et al., J. Lab. Clin. Med., 103 (4), 574-580 und 581-588 (1984); und Lipschitz, et al., Blood, 63 (3),502-509 (1983) (Alterung); und Dainiak, et al.,Cancer, 51 (6), 1101-1106 (1983) und Schwartz, et al., Otolaryngol., 109,269-272 (1983) (verschiedene neoplastische Krankheitsstadien begleitet durch abnorme Erythropoiesie).
Frühere Versuche zur Gewinnung von Erythropoietin in guter Ausbeute aus Plasma oder Urin verliefen relativ erfolglos. Es sind komplizierte und umständliche Laborverfahren erforderlich, die im allgemeinen zur Gewinnung nur sehr geringer Mengen unreiner und instabiler Erythropoietin enthaltender Extrakte führten.
Anfängliche Versuche zur Isolierung von Erythropoietin aus Urin erbrachten instabile, biologisch inaktive Zubereitungen des Hormons. Die US-PS 3865801 beschreibt ein Verfahren zur Stabilisierung der biologischen Aktivität einer Rohsubstanz, die aus Urin gewonnenes Erythropoietin enthält. Das resultierende Rohpräparat, das Erythropoietin enthält, erhält scheinbar 90% der Erythropoietinaktivität zurück und ist stabil.
Ein anderes Reinigungsverfahren von Human-Erythropoietin aus Urin von Patienten mit aplastischer Anämie wird von Miyake et al., in J. Biol. Chem., Bd. 252, Nr. 15 (10. August 1977) S. 5558-5564 beschrieben. Zu dem siebenstufigen Verfahren gehört lonenaustauschchromatographie, Ethanolfällung, Gelfiltration und Adsorptionschromatografie, wobei als Ausbeuten ein reines Erythropoietinpräparat mit einer Potenz von 70400 Einheiten/mg Protein mit 21 % Ausbeute erhalten wird.
Die US-PS 4397840 (Takezawa et al.) beschreibt Verfahren zur Herstellung „eines Erythropoietinproduktes" aus Urinproben gesunder Menschen mit schwachbasischen Ionenaustauschern und sagt aus, daß das erhaltene Produkt niederer Molekülmasse „keine inhibitorischen Effekte gegen Erythropoietin aufweist".
Die GB-PS 2 085887 (Sugitomo et al.), veröffentlicht am 6. Mai 1982, beschreibt ein Verfahren zur Herstellung von Hybfid-Humanlymphoblastoiden Zellen und berichtet über Produnktionsmengen im Bereich von 3 bis 420 Einheiten Erythropoietin pro ml Zellsuspension (verteilt in den Kulturen nach der Säugetierwirtsvermehrung, die bis zu 107 Zellen pro ml enthielt(en). Beiden besten Ergebnissen, von denen behauptet wurde, daß man sie erreichte, konnte die Herstellungsrate von Erythropoietin auf 40 bis 4000 Einheiten/106 Zellen/48 Stunden in vitro-Kultur, die dem Zelltransfer aus in vivo-Vermehrungssystemen folgten, berechnet werden. (Siehe auch die analoge US-PS 4377 513). Es wurden zahlreiche Vorschläge unterbreitet zur Isolierung von Erythropoietin aus Gewebe, einschließlich neoplastischen Zellen, die Ausbeuten waren jedoch sehr gering. Siehe z. B. Jelkman, et βΙ.,Έχρΐ. Hematol., 11 (7), 581-588 (1983Y Tambourin, et al., P. N. A. S. (USA), 80,6269-6273 (1983); Katsucka, et al., Gann, 74, 534-541 (1983); Hagiwara et al., Blood, 63 (4), 828-835 (1984); und Choppin, et al., Blood 64(2), 341-347 (1984). Zu anderen eingesetzten Isolierungsverfahren, um gereinigtes Erythropoietin zu erhalten, gehören immunologische Verfahrensweisen. Ein gegen Erythropoietin gerichteter polyklonaler, aus Serum herrührender Antikörper wurde durch Injizieren eines Tieres, vorzugsweise einer Ratte oder eines Kaninchens, mit Human-Erythropoietin entwickelt. Das injizierte Human-Erythropoietin wird durch das Immunsystem des Tieres als fremde Antigensubstanz erkannt und löst die Produktion von Antikörpern gegen das Antigen aus. Unterschiedliche Zellen, die auf die Stimulierung durch die Antigensubstanz reagieren, produzieren und setzen Antikörper in den Kreislauf frei, die sich von denen anderer reagierender Zellen geringfügig unterscheiden. Die Antikörperaktivität bleibt im Serum des Tieres erhalten, wenn das Blut extrahiert wird. Während ungereinigte Serum- oder Antikörperzubereitungen, gereinigt als eine Serum-lmmunoglobulinG-Fraktion, dann in Assays verwendet werden können, um Human-Erythropoietin zu bestimmen und mit ihm einen Komplex bilden zu können, weisen die Materialien einen wesentlichen Nachteil auf. Dieser Serum-Antikörper, zusammengesetzt aus all den unterschiedlichen, durch einzelne Zellen produzierten Antikörpern, ist von Natur aus polyklonal und wird mit Komponenten in Rohextrakten Komplexe bilden, anders als Erythropoietin allein.
Für den Hintergrund der vorliegenden Erfindung von Interesse sind auch kürzlich bekanntgewordene Fortschritte auf dem Gebiet hinsichtlich der Entwicklung kontinuierlicher Zellkulturen, die in der Lage sind, eine einzige Art von Antikörpern zu bilden, die spezifisch immunologisch reaktiv mit einer einzigen antigen Bestimmungsgröße eines ausgewählten Antigens ist. Siehe allgemein Chisholm, High Technology, Bd.3, Nr. 1, 57-63 (1983).
Es wurden Versuche unternommen, ZeIIfusions-und Hybridisierungstechniken anzuwenden, um „monoklonale" Antikörper bei der Isolierung und quantitativen Bestimmung von Human-Erythropoietin absonderten, in Kurzform durch Lee-Huang, Abstract No.1463, Fed. Proa, 41, 520 (1982). Als ein weiteres Beispiel erschien eine detaillierte Beschreibung der Herstellung und Verwendung mondklonaler Anti-Erythorpoietin-Antikörper durch Weiss et al., P. N. A. S. (USA) 9, 5465-5469 (1982). Siehe durch Sasaki, Biomed. Biochim. Acta., 42/11 (12), 5202-5206 (1983); Yanagawa, et al., Blood 64 (2), 357-364 (1984), Yanagawa, et al., J. Biol. Chem., 259 (5), 2707-2710 (1984); und US-PS 4465624.
Für den Hintergrund der Erfindung sind ebenso von Interesse Berichte über die immunologische Aktivität synthetischer Peptide die die in natürlich vorkommenden Proteinen, Glycoproteinen und Nucleoproteinen vorhandenen Aminosäuresequenzen im wesentlichen verdoppeln. Insbesondere Polypeptide mit relativ geringer Molekülmasse haben gezeigt, daß sie an Immunreaktionen teilnehmen, die in Dauer und Umfang den Immunreaktionen physiologisch bedeutender Proteine, wie virale Antikörper, Polypeptidhormone und ähnliche ähneln. Zu den Immunreaktionen derartiger Polypeptide gehört auch die Provozierung der Bildung spezifischer Antikörper in immunologisch aktiven Tieren. Siehe z.B. Lemeret al., Cell, 23,309-310 (1981); Ross, et al.. Nature, 294, 654-656 (1981); Walter, et al., P.M. A.S. (USA), 77, 5197-5200 (1980); Lerner, et al: P.N.A.S. (USA), 78,3403-3407 (1981); Walter et al., P. N. A.S. (USA), 78,4882-4886 (1981); Wong, et al., P. N. A.S. (USA), 78,7412-7416 (1981); Green, et al., Cell, 28,477-487 (1982); Nigg, et al., P. N. A. S. (USA), 79, 5322-5326 (1982); Baron, et al., Cell, 28, 395-404 (1982); Dreesman, et al., Nature, 295,158-160 (1982); und Lerner, Scientific American, 248, No. 2,66-74 (1983). Siehe auch Kaiser, et al., Science, 223, pp. 249-255 (1984) bezüglich biologischer und immunologischer Aktivitäten synthetischer Peptide, die die sekundären Strukturen der Peptidhormone annähernd teilen, nicht jedoch deren primäre strukturelle Anordnung. Die oben genannten Studien beziehen sich natürlich auf Aminosäuresequenzen von Proteinen, die sich von Erythropoietin unterscheiden, einer Substanz, für die keine wesentliche Aminosäuresequenz bisher beschrieben worden ist. In der anhängigen US-Patentanmeldung Nr.463724, an der Miteigentum besteht, eingereicht am 4. Februar 1983 durch J. Egrie, veröffentlicht am 22. August 1984 als EP-OS 0116446 wird eine Maus-Maus-Hybridoma-Zellinie (ATCC HB 8209) beschrieben, die einen hoch spezifischen, monoklonalen, Anti-Erythropoietin-Antikörper produziert, der auch spezifisch immunoreaktiv mit einem Polypeptid ist, das aus der folgenden Sequenz von Aminosäuren besteht: NHa-Ala-Pro-Pro-Arg-Leu-lle-Cys-Asp-Ser-Arg-Val-Leu-Glu-Arg-Tyr-Leu-Leu-Glu-Ala-Lys-COOH.
Die Polypeptidsequenz ist eine, die den ersten zwanzig Aminosäureresten reifen Human-Erythropoietins zuzuschreiben ist, die nachdem Verfahren von Miyakeetal., J. Biol. chem. 252,5558-5564 (1977) isoliert wurden, und für die eine Aminosäureanalyse mittels Gasphasensequenzer (Applied Biosystems, Inc.) durchgeführt wurde nach der Verfahrensweise von Hewick, M. et al., J. Biol. Chem., 256,7990-7997 (1981). Siehe auch Sue et al., Proc. Nat. Acad. Sei. (USA), 80, S.3651-3655 (1983) betreffend die Entwicklung polyklonaler Antikörper gegen ein synthetisches 26-mer, basierend auf einer unterschiedlichen Aminosäuresequenz und Sytowski et al., J. Immunol. Methods, 69, S. 181-186 (1984).
Während polygonale und monoklonale Antikörper, wie oben beschrieben, zu sehr nützlichen Produkten für den Einsatz in Immunoassays zur Bestimmung und mengenmäßigen Erfassung von Erythropoietin führen und bei der Affinitätsreinigung von Erythropoietin verwendbar ist, erscheint es unwahrscheinlich, daß diese Materialien leicht zur großtechnischen Isolierung größerer Mengen Erythropoietin aus Säugetiermaterial eingesetzt werden können, die ausreichend sind für weitere Analysen, klinische Untersuchungen und eine potentiell weitreichende therapeutische Verwendung der Substanz bei der Behandlung von beispielsweise chronischen Nierenerkrankungen, wobei krankes Gewebe nicht in der Lage ist, die Produktion von Erythropoietin aufrechtzuerhalten. Es besteht daher in der Wissenschaft die Auffassung, daß die besten Aussichten zur vollständigen Kennzeichnung von Säugetier-Erythropoietin und Bereitstellung großer Mengen davon zur potentiellen diagnostischen und klinischen Verwendung darin bestehen, erfolgreich die rekombinanten Verfahren einzusetzen, um eine großtechnische mikrobielle Synthese der Verbindung zu ermöglichen.
Während es so erscheint, daß bei der versuchten Isolierung von DNA-Sequenzen, die für Human- und andere Säugetierarten-Erythropoietin kodieren, wesentliche Fortschritte gemacht wurden, scheint dies doch nicht so erfolgreich gewesen zu sein. Dies liegt prinzipiell an dem Mangel an Gewebematerial, insbesondere menschlichem Gewebematerial, das mRNA-angereichert ist, und das gestatten würde, eine cDNA-Bibliothek aufzubauen, aus der eine für Erythropoietin codierende DNA-Sequenz durch Standardverfahren isoliert werden könnte. Darüber hinaus ist über die fortlaufende Sequenz der Aminosäurereste des Erythropoietins so wenig bekannt, daß es nicht möglich ist, beispielsweise lange Polynucleotidsonden zu konstruieren, die in der Lage sind, zuverlässig bei dem DNA/DNA-Hybridisierungsscreening von cDNA und insbesondere genomischen DNA-Bibliotheken eingesetzt zu werden.
Als Erläuterung dafür sei genannt, daß die 20-Aminosäuresequenz, die zur Erzeugung des oben genannten monoklonalen Antikörpers verwendet wurde, produziert durch ATCC Nr. HB 8209, keine Konstruktion einer zweifelsfreien 60-Basenpaar-Oligonucleotidsonde in der von Anderson et al., ebenda, beschriebenen Weise. Es wird eingeschätzt, daß das Humangen für Erythropoietin als ein „Einzelkopie-Gen" (single copy gen) innerhalb des menschlichen Genoms erscheint und in jedem Fall das für Human-Erythropoietin codierende genetische Material wahrscheinlich aus weniger als 0,00005% der gesamten menschlichen genomischen DNA besteht, die in einer Gen-Bibliothek vorhanden sein würde. ' ·
Bis heute sind die erfolgreichsten der in der Literatur bekannt gewordenen Versuche mit Rekombinanten verwandten Verfahren zur Bereitstellung von DNA-Sequenzen für die Verwendung bei der mikrowellen Expression isolierbarer Mengen von Säugetier-Erythropoietin weit vor dem Ziel stehengeblieben. Als Beispiel berichtet Farber et al., Exp. Hematol. 11, Supp. 14, Abstract 101 (1983) über die Extraktion von mRNAaus Nierengewebe von Phenylhydrazin-behandelten Pavianen und die Injizierung von mRNA in Xenopus laevis-Eizellen mit dem eher flüchtigen Ergebnis der in vitro Produktion eines Gemisches von „Translationsproduktion", das unter anderem biologische Eigenschaften von Erythropoietin entfaltete. In der jüngsten Zeit berichteten Farber et al., Blood, 62, Nr. 5, Suppl. Nr. 1, Abstract 392 auf Seite 122 a (1983) über die in vitro-Translation von Humannieren-mRNA durch Frosch-Eizellen. Es wurde geschätzt, daß das resultierende Translationsproduktgemisch in der Größenordnung von 220 (Millieinheiten) (mU) eines Translationsproduktes mit der Aktivität von Erythropoietin pro Mikrogramm injizierte mRNA enthielt. Während sich solche Gehalte bei der in vitro-Translation exogener mRNA als ziemlich niedrig bestätigten (verglichen mit den schon früher bekannt gewordenen Gehalten der Pavian-mRNA-Translation in das gesuchte Produkt), wurde geglaubt, daß die Ergebnisse die menschliche Niere als Ort der Erythropoietinexpression bestätigen und die Konstruktion einer angereicherten Humannieren-cDNA-Bibliothek gestatten würden, aus der das gewünschte Gen isoliert werden könnte, (siehe auch Farber, Clin. Res., 31 [4], 769A [1983]). Seit Einreichen der US-Patentanmeldungen Nr. 561024 und 582185 ist ein einziger Bericht zur Klonierung und Expression erschienen, in dem behauptet wird, Human-Erythropoietin-cDNA in E. coli erhalten zu haben. Dabei wurden eine Anzahl von" cDNA-Klonen in E. coli-Plasmide insertiert, und es wurden jS-Lactamase-Fusionsprodukte festgestellt, die sich immunreaktiv mit einem monoklonalen Antikörper zu einem unspezifizierten „Epitop" von Human-Erythropoietin verhielten. Siehe Lee-Huang, Proc. Nat. Acad. Sei. (USA), 81, Ss. 2708-2712 (1984).
Ziel der Erfassung
Durch die Erfindung wird ein verbessertes Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz zur Verfügung gestellt.
Darlegung des Wesens der Erfindung
Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz zur Verfügung zu stellen.
Gegenstand der Erfindung ist ein Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz in einer heterogenen zellulären oder viralen Probe einschließlich multipler einzelsträngiger Polynucleotide, gekennzeichnet dadurch, daß
(a) ein Gemisch markierter einzelsträngiger Polynucleotidsonden mit gleichmäßig variierenden Sequenzen der Basen hergestellt wird, wobei jede der Sonden potentiell einer Sequenz von Basen komplementär ist, die zu dem zu bestimmenden Polynucleotid das vermeintlich nur einmal existierende Exemplar ist;
(b) die Probe auf ein festes Substrat fixiert wird;
(c) das Substrat mit der darauf fixierten Probe behandelt wird, um eine weitere Bindung von Polynucleotiden darauf abzuschwächen, ausgenommen durch Hybridisierung zu Polynucleotiden in der Probe;
(d) das behandeltes Substrat mit der darauf fixierten Probe flüchtig mit dem genannten Gemisch markierter Sonden unter Bedingungen in Berührung gebracht wird, die nur die Hybridisierung zwischen vollständig komplementären Polynucleotiden erleichtern; und
(e) das spezifische Polynucleotid über die Beobachtung des Auftretens einer Hybridisierungsreaktion zwischen ihm und einer vollständig komplementären Sonde aus dem Gemisch der markierten Sonden bestimmt wird.
Die vorliegende Erfindung erläutern klonierte DNA-Sequenzen vom Affen oder Menschen und auf geeignete Weise daraus abgeleitete Polypeptidsequenzen, die die primäre Strukturanordnung von Erythropoietinen mit ihrem entsprechenden Ursprung vom Affen oder Menschen darstellen.
Unter Darstellung der Sequenz der Aminosäurereste von Erythropoietin sieht die vorliegende Erfindung die totale und/oder partielle Herstellung von DNA-Sequenzen vor, die für Erythropoietin codieren und die solch vorteilhafte Charakteristika wie Einbeziehung von für die Expression „bevorzugten" Codons durch Nicht-Säugetierwirte, mit der Maßgabe, daß Stellen für das Schneiden durch Restriktionsendonuclease-Enzyme vorgesehen sind und der weiteren Maßgabe von zusätzlichen Anfangs-, End- oder Zwischen-DNA-Sequenzen, die die Konstruktion leicht exprimierbarer Vektoren erleichtern. Dementsprechend betrifft die vorliegende Erfindung die Herstellung (und Entwicklung durch Stellen-spezifische Mutagenese von cDNA und genomischer DNA) von DNA-Sequenzen, die für die mikrobielle Expression von Polypeptidanalogen oder Derivaten von Erythropoietin
codieren, die sich von natürlich vorkommenden Formen durch Identität oder Ort der Anordnung eines oder mehrerer Arninosäurereste unterscheiden (d. i. Deletierungsanaloga, die weniger als alle der für EPO spezifizierenden Reste enthalten und/oder Substitutionsanaloge, worin einer oder mehrere der spezifizierten Reste durch andere Reste ersetzt ist und/oder Additionsanaloga, worin einer oder mehrere Aminosäurereste an einen terminalen oder medialen Teil des Polypeptids angefügt ist); und die an einigen oder allen Eigenschaften natürlich vorkommender Formen teilhaben.
Die neuen. DNA-Sequenzen der Erfindung enthalten alle für eine sichere Expression in procaryotischeVi oder eucaryotischen Wirtszellen von Polypeptidprodukten erforderlichen Sequenzen, die«zumindest einen Teil der primären Strukturanordnung aufweisen sowie eine oder mehrere der biologischen Eigenschaften von Erythropoietin, von denen umfaßt werden: (a); die in den Tabellen V und Vl aufgeführten DNA-Sequenzen oder deren Komplementärstränge;
(b) DNA-Sequenzen, die (unter Hybridisierungsbedingungen, wie sie hier erläutert werden oder strengeren Bedingungen) zu DNA-Sequenzen, wie sie unter (a) definiert sind, hybridisieren, oder zu Fragmenten davon; und
(c) DNA-Sequenzen, die allerdings unter Degenerierung des genetischen Codes zu unter (a) und (b) definierten DNA-Sequenzen hybridisieren würden. Speziell vom Teil (b) umfaßt sind genomische DNA-Sequenzen, die allelische Variatenformen von Affen- aderHuman-Erythropoietin verschlüsseln und/oder andere Säugetierarten von Erythropoietin decodieren. Speziell vom Teil (c) umfaßt sind hergestellte DNA-Sequenzen, die EPO, EPO-Fragmente und EPO-Analoge verschlüsseln, deren DNA-Sequenzen Condonsenthalten können, die die Translation von Boten-RNAin Nicht-Wirbeltierwirten erleichtern.
Weiterhin der vorliegenden Erfindung zuzuordnen ist die Klasse von Polypeptiden, die für Teil des DNA-Komplements zum oberen Strang der Human-genomischen DNA-Sequenz von Tabelle Vl codieren, d.i. „komplementär umgekehrte Proteine", wie sievorrTramontano et al.. Nucleic Acids Research, 12, S. 5049-5059 (1984).
Die erfindungsgemäßen Polypeptidprodukte können „markiert" werden durch kovalente Bindung an eine bestimmbare Markersubstanz (z. B. radiomarkiert mit 125I), um zu Reagentien zu gelangen, die bei der Ermittlung und mengenmäßigen Bestimmung von Erythropoietin in festem Gewebe und flüssigen Proben wie Blut oder Urin von Nutzen sind. Die erfindungsgemäßen DNA-Produkte können auch mit bestimmbaren Markern (wie Radiomarkern und Nicht-Isotopenmarkem wie Biotin) markiert und bei DN A-Hybridisierungsverfahren eingesetzt werden, um die Erythropoietin-Genposition und/oder die Genposition irgendeiner verwandten Genfa'milie aus der Human-, Affen- und anderen Säugetierspezies-Chromosomenkarte zu orten. Sie können auch zum Herausfinden von Erythropoietin-Genunstimmigkeiten an Hand des DNA-Gehalts verwendet werden und als Genmarker zur Identifizierung benachbarter Gene und deren Unstimmigkeiten.
Wie hier anschließend im Detail beschrieben wird, bringt die vorliegende Erfindung signifikante Verbesserungen bei den Bestimmungsverfahren eines speziellen einzelsträngigen Polynucleotide unbekannter Sequenz in einer heterogenen zellulären oder viralen Probe mit sich, die multipler einzelsträngiger Polynucleotide enthält, wobei
(a) ein Gemisch markierter, einzelsträngiger Nucieotidsonden mit gleichmäßig variierenden Basensequenzen hergestellt wird, wobei jede dieser Sonden potentiell spezifisch komplementär zu einer Sequenz von Basen ist, die in dem zu bestimmenden. Polynucleotid vermutlich nur einmal existierend ist, (b), die Probe auf einem festen Substrat fixiert ist,
(c), das Substrat mit der darauf fixierenden Probe behandelt wird, um die weitere Bindung von Polynucleotiden daran zu verhindern, ausgenommen mittels Hybridisierung an Polynucleotide in der Probe, (d)- das behandelte Substrat mit der darauf fixierten Probe flüchtig mit dem genannten Gemisch markierter Sonden unter solchen Bedingungen in Kontakt gebracht wird, die die Hybridisierung nur zwischen vollständig komplementären Polynucleotiden erleichtern, und
(e) das spezifische Polynucleotid durch Beobachten des Ablaufens einer Hybridisierungsreaktion zwischen diesem und einer vollständig komplementären Sonde innerhalb des Gemisches markierter Sonden bestimmt wird, was durch Vorhandensein einer höheren Dichte von markiertem Material auf dem Substrat amOrt des spezifischen Polynucleotide bewiesen wird, im Vergleich zu einer Hintergrund-Dichte am markierten Material, die sich aus der nichtspezifischen Bindung markierter Sonden an das Substrat ergibt.
Die Verfahren sind insbesondere effektiv bei Situationen, die die Verwendung von 64,128,256,512,1024 oder mehr gemischten Polynucleotidsonden mit einer Länge von 17 bis 20 Basen bei DNA/DNA- oder RNA/RNA- oder DNA/RNA-Hybridisierungen erfordern.
Wie weiter unten ausgeführt wird, haben die oben genannten verbesserten Verfahren die Erkennung von cDNA-Klonen gestattet, die für Erythropoietin mit Ursprung von Affenspezies codieren, innerhalb einer Bibliothek, die aus anämischer AffennierenzellmRNA hergestellt wurde. Insbesondere wurde ein Gemisch von 128 gleichmäßig variierten 20-mer-Sonden basierend auf einer Ämthosäuresequenzinformation, die von sequenzierenden Fraktionen von Human-Erythropoietin abgeleitet wurde, in Koloniehybridisierungsverfahren eingesetzt, um sieben „positive" Erythropoietin-cDNA-Klone innerhalb einer Gesamtmenge von 200000 Kolonien zu identifizieren. Noch bemerkenswerter ist, daß der praktische Einsatz der verbesserten _ erfindungsgemäßen Verfahren die schnelle Isolierung von drei positiven Klonen gestattet, und zwar über ein Screening von T 500000 Phagenplaques, die eine Human-Genbibliothek darstellen. Dies wurde erreicht durch Verwendung des oben genannten Gemisches von 128 20-mer-Sonden zusammen mit einem zweiten Satz von 128 17-mer-Sonden, basierend auf einer Aminosäureanalyse einer unterschiedlichen fortlaufenden Sequenz von Human-Erythropoietin. Dieoben genannten erläuternden Verfahren bilden den ersten bekannten Fall der Verwendung multipler gemischter Oligonucleotidsonden bei DNA/DNA-Hybridisierungsverfahren, die auf die Isolierung von Säugetiergenomklonen gerichtet sind, und den ersten bekannten Fall der Verwendung eines Gemisches von mehr als 32 Oligonucleotidsonden bei der Isolierung voncDNA-Klonen. Für den Fachmann ergeben sich zahlreiche Aspekte und Vorteile der Erfindung durch die folgende detaillierte Beschreibung, in der auch praktische Seiten der Erfindung in ihren gegenwärtig bevorzugten Ausführungsformen erläutert werden.
Erfindungsgemäß wurden DNA-Sequenzen isoliert und bestimmt, die einen Teil oder die gesamte Polypeptid-Sequenz von Human- und Affenspezies-Erythropoietin (anschließend teilweise als „EPO" bezeichnet) verschlüsseln. Weiterhin wurde die vom Affen oder Menschen stammende DNA zum Subjekt eucaryotischer und procaryotischer Expression gemacht, wobei isolierbare Mengen an Polypeptiden entstehen, die biologische (z.B. immunologische) Eigenschaften von natürlich vorkommenden EPO zeigen sowie sowohl in vivo- als auch in vitro-biologische Aktivitäten von EPO.
Die DNA aus Affenspezies wurde aus einer cDNA-Bibliothek isoliert, die mit einer mRNA konstruiert worden war, die aus Affennierengewebe in einem auf chemischem Wege ausgelösten anämischen Zustand gewonnen wurde, und deren Serum . nach immunologischer Bestimmung hohe Anteile EPO enthielt, verglichen mit normalem Affenserum. Die Isolierung der gewünschten cDNÄ-Klone, die DNA verschlüsselnde EPO enthielten, erreichte man unter Einsatz von DNA/DNA-Koloniehybridisierung durch Verwendung eines Pools von 128 gemischten, radiomarkierten 20-mer-Oligonucleotidsonden unter Einbeziehung des Schnellscreenings von 200000 Kolonien. Das Muster der Oligonucleotidsonden wurde auf Aminosäuresequenzinformation stationiert, die durch enzymatische Fragmentierungen und Sequenzieren einer kleinen Human-EPO-Probe gewonnen wurden.
Die DNA von Menschen wurde aus einer humangenomischen DNA-Bibliothek isoliert. Die Isolierung von Klonen, die EPO-verschlüsselnde DNA enthielten, wurde durch DNA/DNA-Plaquehybridisierung erreicht unter Verwendung des oben angeführten Pools von 128 gemischten 20-mer-Oligonucleotidsonden und einem zweiten Pool von 128 radiomarkierten 17-mer-Sonden, deren Sequenzen auf Aminosäuresequenzinformationen stationiert sind, die man aus einem unterschiedlichen enzymatischen Human-EPO-Fragment erhielt.
Positive Kolonien und Plaques wurden mittels Didesoxy-Sequenzieren klonaler DNA unter Verwendung eines Teilsatzes von 16 Sequenzen innerhalb des Pools von 20-mer-Sonden auf Richtigkeit nachgeprüft, und ausgewählte Klone wurden einer Nucleotid-Sequenzanalyse unterworfen, die die Herleitung primärer Strukturübereinstimmung der damit verschlüsselten EPO-Polypeptide zuließ. Die hergeleiteten Polypeptidsequenzen zeigten einen hohen Grad an Homologie zueinander und zu einer durch Aminosäureanalyse von Human-EPO-Fragmenten erzeugten Partialsequenz.
Ein selektierter positiver Affen-cDNA-Klon und ein selektierter positiver Human-Genklon wurden jeweils in einen „Zubringer"-(„shuttle") DNA-Vektor insertiert, der in E. coli amplifiziert und dazu verwendet wurde, Säugetierzellen in Kultur zu transferieren. Kultiviertes Wachstum transferierter Wirtszellen führte zu Präparationen des Überstehenden des Kulturmediums, die mehr als 300OmE EPO pro ml Kulturflüssigkeit enthielten.
Ausführungsbeispiel
Die folgenden Beispiele dienen der Erläuterung der Erfindung und sind speziell auf Verfahren gerichtet, die vorher zur Erkennung von EPO verschlüsselenden Affen-cDNA-Klonen und humangenomischen Klonen durchgeführt wurden, auf Verfahren, die in einer solchen Erkennung führen und auf das Sequenzieren.
Insbesondere Beispiel 1 ist auf das Aminosäuresequenzieren von Human-EPO-Fragmenten gerichtet und auf die Konstruktion von Gemischen radiomarkierter Sonden, die auf den Ergebnissen dieses Sequenzierens basieren. Beispiel 2 ist allgemein auf Verfahren gerichtet, zu denen die Erkennung von positiven Affen-cDNA-Klonen gehört und erbringt eine Information zur Behandlung des Tieres und zur vorläufigen Radioimmunoassay-(RIA)-analyse tierischer Seren. Beispiel 3 ist gerichtet auf die Herstellung der cDNA-Bibliothek, das Kolonie-Hybridisierungsscreening und die Überprüfung der positiven Klone auf Richtigkeit, das DNA-Sequenzieren eines positiven cDNA-Klons und die Erzeugung einer primären Stm kturübereinstimmungs(Aminosäuresequenz)-lnform ation des Affen-EPO-Polypeptids. Beispiel 4 ist auf Verfahren gerichtet, die die Erkennung positiver humangenomischer Klone betreffen und zu einer Information über die Herkunft der Gen-Bibliothek, über Plaquehybridisierungsverfahren und die Überprüfung auf Richtigkeit positiver Klone führen. Beispiel 5 ist auf das DNA-Sequenzieren eines positiven genomischen Klons und die Erzeugung einer Aminosäuresequenzinformation des Human-EPO-Polypeptids gerichtet, einschließlich eines Vergleichs dieser mit der Affen-EPO-Sequenzinformation.
Beispiel 1
A. Human-EPO-Fragment-Aminosäuresequenzieren
Human-EPO wurde aus Urin isoliert und einem tryptischen Abbau unterworfen, was zur Entwicklung und Isolierung von 17 getrennten Fragmenten in Mengen von annähernd 100 bis 150 Picomolen führte.
Den Fragmenten wurden willkürlich Nummern zugeordnet, und sie wurden auf Aminosäuresequenzen durch Mikrosequenzanalyse unter Verwendung eines Gasphasensequenzers (Applied Biosystems) analysiert, wobei man die in Tabelle I dargestellte Sequenzinformation erhielt. Es wurden darin Einzelbuchstabencodes verwendet, und „X" bezeichnet einen Rest, der nicht genauer weiter bestimmt wurde.
Tabelle I
Fragment No. Ergebnis Sequenzanalyse
T4a A-P-P-R
T4b G-K-L-K
T 9 · A-L-G-A-Q-K
T13 V-L-E-R
T16 A-V-S-G-L-R
T18 L-F-R
T21 K-L-F-R
T 25 Y-L-L-E-A-K
T 26 a L-I-C-D-S-R
T 26 b L-Y-T-G-E-A-C-R
T 27 T-I-T-A-D-T-F-R
T 28 E-A-I-S-P-P-D-A-A-M-A-A-P-L-R
T 30 E-A-E-X-I-T-T-G-X-A-E-H-X-S-L-N-E-X-I-T-V-P
T 31 V-Y-S-N-F-L-R
T 33 ' S-L-T-T-L-L-R
T 35 V-N-F-Y-A-W-K
T 38 G-Q-A-L-L-V-X-S-S-Q-P-W-E-P-L-Q-L-H-V-D-K
B. Muster und Konstruktion von Oligonucleotidsondengemischen
Die in Tabelle I aufgeführten Aminosäuresequenzen wurden im Zusammenhang mit der Degenerierung des genetischen Codes dahingehend nochmals überprüft, ob die Mischsondenverfahren auf DNA/DNA-Hybridisierungsverfahren in cDNA- und/oder genomischen DNA-Bibliotheken angewandt werden können. Diese Analyse zeigte, daß innerhalb des Fragmentes Nr.T35 eine Serie von 7 Aminosäureresten (Val-Asn-Phe-Tyr-Ala-Trp-Lys) existierte, die einzig und allein dadurch gekennzeichnet werden kann, daß sie durch eine von 128 möglichen DNA-Sequenzen, die 20 Basenpaare überspannt, verschlüsselt wird. Ein erster Satz von 128 20-mer-Oligonucleotiden wurde somit durch Standard-Phosphoamiditverfahren (siehe z. B. Beaucage et al., Tetrahedron Letters,22, S. 1859-1862 (1981) auf festen Träger entsprechend der in Tabelle Il aufgeführten Sequenz synthetisiert.
Tabelle Il Rest — VaI Asn Phe Tyr AIa Trp Lys
3' CAA TTG AAG ATG CGA ACC TT- 5
T A A A T
G G
C C
Die weitere Analyse zeigte, daß innerhalb des Fragments T38 eine Serie von 6 Aminosäureresten (Gln-Pro-Trp-Glu-Pro-Leu) auf der Basis existierte, von der aus man einen Pool von 128Misch-Oligonucleotid-17-mer-Sonden herstellen konnte, wie unten in Tabelle III aufgeführt sind.
Tabelle III Rest GIn Pro Trp GIu Pro Leu
3' GTT GGA ACC CTT GGA GA- 5
C T C T kA
G G
C C
Die Oligonucleotidsonden wurden am 5'-Ende mit Gamma-32-p-ATP, 7 500-8000ci/mmol (ICN) unter Verwendung von T4-Polynucleotidkinase (NEN) markiert. .
Beispiel 2 A. Affenbehandlungsverfahren und RIA-Analyse
Weibliche Cynomolgus-Affen Macaca fascicularias (2,5-3kg), eineinhalb bis zwei Jahre alt) wurden subkutan mit einer pH7-Lösung von Phenylhydrazinhydrochlorid bei einer Dosis von 12,5 mg/kg am ersten, dritten und fünften Tag behandelt. Vor jeder Injektion wurde der Hämatokritwert beobachtet. Am siebenten Tag oder zu dem Zeitpunkt, wo der Hämatokritspiegel unter 25% des Anfangswertes fiel, wurden Serum und Nieren nach Verabreichung von 25 mg/kg Dosen Ketaminhydrochlorid entnommen. Die entnommenen Materialien wurden unmittelbar danach in flüssigem Stickstoff eingefroren und bei -700C gelagert.
B. RIA für EPO
Es wurden Radioimmunoassäys zur quantitativen Bestimmung von EPO in Proben nach den folgenden Verfahrensweisen durchgeführt:
Ein Erythropoietin-Standard oder eine unbekannte Probe wurde zusammen mit Antiserum für 2 Stunden bei 37°C inkubiert. Nach der zweistündigen Inkubierung wurden die Proberöhrchen in Eis gekühlt, 125l-markiertes Erythropoietin hinzugegeben und die Röhrchen bei 0°C für wenigstens 15 weitere Stunden inkubiert. Jedes Assayröhrchen enthielt 500μΙ Inkubationsgemisch, bestehend aus 50 μΙ verdünnten Immunseren, lOOOOcpm 125l-Erythropoietin, δμΙΤ^βγΙοΙ und 0 ^β250μΙ entweder des EPO-Standards oder der unbekannten Probe, wobei mit 0,1 % BSA enthaltendem PBS das restliche Volumen erbracht wurde. Das verwendete Antiserum war das zweite Testblut eines mit 1%igem Reinpräparat von Humanurin-Erythropoietin immunisierten Kaninchens. Die Endverdünnung des Antiserums bei der Assay wurde so eingestellt, daß das Antikörper-gebundene 125I-EPO 10—20% der Eingangs-Gesamtcounts überschritt. Allgemein entsprach dies einer Endverdünnung des Antiserums von 1:50000 bis 1:100000.
Das Antikörper-gebundene 125l-Erythropoietin wurde durch Zusatz von 150μ^βρί! A gefällt. Nach einer 40minütigen Inkubation wurden die Proben zentrifugiert und die Pellets zweimal mit 0,75ml lOmMTris-HCI von pH8,2, die 0,15 M NaCI, 2 mM EDTA und 0,05% Triton x-100 enthielt, gewaschen. Die gewaschenen Pellets wurden in einem Gammazähler gezählt, um den Prozentsatz der 125l-Erythropoietinbindung zu bestimmen. Die durch Prä-Immunseren gebundenen Counts wurden von allen Gesamtwerten abgezogen zwecks Korrektur der nicht-spezifischen Fällung. Der Erythropoietingehalt der unbekannten Proben wurde durch Vergleich mit der Standardkurve ermittelt.
Das oben genannte Verfahren wurde auf im Teil A(s.c) erhaltenes Affenserum angewandt und ebenso auf das unbehandelte Affenserum. Normale Serumspiegel wurden geprüft und zeigten annähernd 36mE/ml, während behandeltes Affenserum von 1 000 bis 1700mE/ml enthielt.
Beispiel 3 A. Konstruktion der Äffen-cDNA-Bibliothek
Aus normalen und anämischen Affennieren wurde Boten-RNA isoliert mit Hilfe des Guanidin-Thiocyanatverfahrens von Chirgwin et al., Biochemistry, 18, S. 5294 (1979), und die Poly (A)+mRNA wurde durch zwei Durchläufe der Oligo(dT)-Zellulose-Säulenchromatografie gereinigt, beschrieben bei „Maniatis" et al., „Molecular Cloning, A Laboratory Manual", S. 197-198 Cold Springs Harbor Laboratory, Cold Springs, Harbor, N. Y., 1982). Die cDNA-Bibliothek wurde gemäß einer Modifikation der allgemeinen Verfahrensweisen von Okayama et al., Mol. and Cell. Biol., 2, S. 161-170 (1982) konstruiert. Die Schlüsselmerkmale der gegenwärtig bevorzugten Verfahren sind die folgenden:
(1) pUC8 wurde als alleiniger Vektor verwendet, geschnitten mit Pst I und dann mit einem Schwanzstück von OligodT von 60 bis 80 Basen in der Länge versehen;
(2) Hinc Il-Verdauung wurde eingesetzt, um das Oligo dT-Schwanzstück vom einen Ende des Vektors zu entfernen;
(3) die erste Strangsynthese und das Versehen von Oligo dG mit einem Schwanzstück erfolgte nach dem veröffentlichten Verfahren
(4) es wurde mit einer Bann HI-Verdauung gearbeitet, um den Oligo dG-Schwanz von einem Ende des Vektors zu entfernen; und
(5) Ersatz des RNA-Stranges durch DNA in Anwesenheit von zwei Linkern (GATCTAAAGACCGTCCCCCCCC und ACGGTCTTTA) in einem dreifachen molaren Überschuß über den mit den Oligo dG-Schwänzstück versehenen Vektor.
B. Koloniehybridisierungsverfahren für das Screenen der Affen-cDNA-Bibliothek
Transformierte E. coli wurde bei einer Dichte von 9000 Kolonien pro 10 x 10cm Platte auf Nährmediumplatten ausgebracht, die 50 Mikrogramm/ml Ampicillin enthielten. Gene-Screen-Filter (New England Nuclear Catalog Nr. NEF-972) wurden auf einer BHI-CAM-Platte vorbenetzt (Bacto Hirn-Herz-Infusion 37g/l, Casaminosäuren 2g/l und.Agar 15g/l, mit 500 Mikrogramm/ml Chloramphenicol) und dazu verwendet, die Kolonien von der Platte abzuheben. Die Kolonien wurden im gleichen Medium 12 Stunden wachsen gelassen, um die Plasmidkopieanzahl zu amplifizieren. Die amplifizierten Kolonien (Kolonieseite oben) wurden durch reihenweises Auflegen der Filter über 2 Stücke Whatman 3 MM-Papier behandelt, gesättigt mit jeweils den folgenden Lösungen:
(1) 50mMGIucose —25 mMTris-HCI (pH 8,0) — 1OmM EDTA (pH 8,0) für fünf Minuten;
(2) 0,5M NaOH für zehn Minuten; und
(3) 1,0MTris-HCI(pH7,5) für drei Minuten
Die Filter wurden anschließend im Vakuum bei 8OT für zwei Stunden luftgetrocknet.
Durch Behandlung mit einer Lösung, die 50 Mikrogramm/ml des Proteaseenzyms in Puffer K [0,1 M Tris-HCI (pH 8,0)—0,15 NaCI
— 1OmM EDTA (pH 8,2)—0,2% SDS] wurden die Filter danach dem Protease K-Abbau unterworfen. Jedem Filter wurden speziell 5ml der Lösung hinzugesetzt, und man ließ den Abbau bei 550C über 30 Minuten vorsieh gehen. Danach wurde die Lösung entfernt.
Die Filter wurden dann mit 4ml eine Prä-Hybridisierungspuffers (5 χ SSPE — 0,5% SDS —100 Mikrogramm/ml SS E. coli-DNÄ
— 5 χ BFP) behandelt. Die Prä-Hybridisierungsbehandlung erfolgte bei 550C, im allgemeinen über 4 Stunden oder langer. Danach wurde der Prä-Hybridisierungspuffer entfernt.
Das Hybridisierungsverfahren wurde auf folgende Weise durchgeführt. Zu jedem Filter wurden 3 ml Hybridisierungspuffer (5 χ SSPE — 0,5% SDS —100 Mikrogramm/ml Hefe-tRNA), der 0,025 Picomole jeder der 128 Sondensequenzen von Tabelle Il enthielt (das Gesamtgemisch wurde als EPV-Gemisch bezeichnet), gegeben, und die Filter wurden 20 Stunden bei 48°C gehalten. Diese Temperatur lag um 2°C niedriger als die niedrigste der berechneten Dissoziationstemperaturen (Td), die für eine beliebige der Sonden berechnet worden war.
Nach der Hybridisierung wurden die Filter dreimal für zehn Minuten auf einem Schüttler mit 6 x SSC — 0,1% SDS bei Zimmertemperatur gewaschen sowie zwei — bis dreimal mit 6 x SSC — 1%SDS bei der Hybridisierungstemperatur (48°C) gewaschen. Die Autoradiografie der Filter zeigte sieben positive Klone unter 200000 gescreenten Kolonien. Die Initialsequenzanalyse eines der vermeintlichen Affen-cDNA-Klone (als Klon 83 bezeichnet) erfolgte aus Gründen der Überprüfung auf Richtigkeit durch eine Modifikation der Verfahrensweise von Wallace et al., Gene, 16, S.21-26 (1981). Dabei wurde die Plasmid-DNA des Affen-cDNA-Klons 83 linearisiert durch Abbau mit Eco Rl und durch Erhitzen im siedenden Wasserbad denaturiert. Die Nucleotidsequenz wurde mittels des Didesoxy-Verfahrens von Sanger et al., P. IM. A. S (USA), 74, S. 5463-5467 (1977) bestimmt. Ein Teilsatz des EPV-Gemisches der Sonden, bestehend aus 16 Sequenzen, wurde als Primer für die Sequenzierungsreaktionen verwendet.
C. Sequenzieren von Affen-EPO-cDNA
Die Nucleotid-Sequenzanalysedes Klons 83 wurde mittels des Verfahrens von Messing, Methods in Enzymology, 101, S.20-78 (1983) durchgeführt. Aus Tabelle IV ist eine vorläufige Restriktionsmappenanalyse des annähernd 1 600 Basenpaar-Eco Rl/Hind lll-klonierten Fragments des Klons 83 zu entnehmen. Die annähernden Ortungen der Restriktionsendonuclease-enzym-Erkennungsstellen erfolgten mit Hilfe der Anzahl von Basen 3'zur EcoRI-Stelleam 5'-Endedes Fragments. Das Nucleotidsequenzieren erfolgte durch Sequenzen der individuellen Restriktionsfragmente mit der Absicht, überlappende Fragmente anzupassen. Beispielsweise bestimmte die Analyse der Nucleotide in einem Restriktionsfragment die Überlappung der Sequenzinformation C113 (Sau bei —111 /Sma I bei ~324), und das reverse Ordersequenzieren eines Fragments C73 (AIu I bei~424/BstEllbei~203.
Tabelle IV
Restriktionsenzym-Erkennungsstelle Ungefähre(r) Ort(e)
EcoRI 1
Sau3A 111
Smal 180
BsTEII , ' 203
Smal 324
Kpnl 371
Fortsetzung der Tabelle IV
Restriktionsenzym-Erkennungsstelle Ungefähre(r) Ort(e)
Rsal 372
AIuI 424
Pstl 426
AIuI 430
Hpal 466
AIuI 546
Pstl . 601
Pvull 604
AIuI 605
AIuI 782
AIuI 788
Rsal 792
Pstl — 807
AIuI 841
AIuI 927
Ncol 946
Sau3A 1014
AIuI 1072
AIuI 1115
AIuI 1223
Pstl 1301
Rsal 1343
AIuI 1384
Hindlll 1449
AIuI 1450
Hindlll 1585
Das Sequenzieren von annähernd 1342 Basenpaaren (innerhalb der von der Sau 3A-Stelle 3' bis zur Eco Rl-Stelle und der Hind Ill-Stelle überspannten Region) und die Analyse der Ableseraster gestattete die Aufstellung der DNA- und Aminosäuresequenziformationen, die in der Tabelle V enthalten sind. Inder Tabelle wurde der vermutliche Anfangsaminosäurerest des Aminoterminais der reifen EPO (auf Richtigkeit überprüft durch Korrelation der vorher genannten Sequenzanalyse von zwanzig Aminoterminairesten) mit der Ziffer +1 bezeichnet. Die Anwesenheit eines Methioninspezifizierenden ATG-Codos (bezeichnet als -27) „oberhalb" (upstream) des anfänglichen Aminoterminal-Alaninrestes als des ersten Restes, der für die Aminosäuresequenz des reifen Proteins bezeichnet ist, zeigt die Wahrscheinlichkeit an, daß EPO anfänglich im Cytoplasma in einer Precursorform exprimiert wurde mit einer 27 Aminosäuren-„leader"-Region, die vor dem Eintritt des reifen EPO in den Kreislauf herausgeschnitten wird. Potentielle Glykosylierungsstellen innerhalb des Polypeptids sind durch Sternchen gekennzeichnet. Die geschätzte Molekülmasse der translatierten Region betrug 21117 Daltonsund die Molekülmasse der 165 Reste des Polypeptids, das reifes Affen-EPO bildete, wurde mit 18236 Daltons bestimmt.
Tabelle V Translation von Affen-EPO cDNA
Sau 3 A
CCCGGTGTGGTCACCGCGCGCCTAGGTCGCTGAG
-27 -20
Met GIy VaI His GIu Cys Pro AIa Trp
GGACCCCGGCCAGGCGCGGAGATG GGG GTG CAC GAA TGT CCT GCC TGG
-10
Leu Trp Leu Leu Leu Ser Leu VaI Ser Leu Pro Leu GIy Leu Pro
CTG TGG CTT CTC CTG TCT CTC GTG TCG CTC CCT CTG GGC CTC CCA
-1 +1
VaI Pro GIy AIa Pro Pro Arg Leu He Cys Asp Ser Arg VaI Leu
GTC CCG GGC GCC CCA CCA CGC CTC ATC TGT GAC AGC CGA GTC CTG
20
GIu Arg Tyr Leu Leu GIu AIa Lys GIu Ala GIu Asn VaI Thr Met
GAG AGG TAC CTC TTG GAG GCC AAG GAG GCC GAG AAT GTC ACG ATG 30
GIy Cys Ser GIu Ser Cys Ser Leu Asn GIu Asn lie Thr VaI Pro
GGC TGT TCC GAA AGC TGC AGC TTG AAT GAG AAT ATC ACC GTC CCA
50
Asp Thr Lys VaI Asn Phe Tyr AIa Trp Lys Arg Met GIu VaI GIy
GAC ACC AAA GTT AAC TTC TAT GCC TGG AAG AGG ATG GAG GTC GGG
60 70 : '
Gin Gin Ala VaI GIu VaI Trp Gin GIy Leu AIa Leu Leu Ser GIu
CAG CAG GCT GTA GAA GTC TGG CAG GGC CTG GCC CTG CTC TCA GAA
80
Ala VaI Leu Arg GIy Gin Ala VaI Leu AIa Asn Ser Ser GIn Pro
GCT GTC CTG CGG GGC CAG GCC GTG TTG GCC AAC TCT TCC CAG CCT
90 100
Phe GIu Pro Leu GIn Leu His Met Asp Lys Ala He Ser GIy Leu
TTC GAG CCC CTG CAG CTG CAC ATG GAT AAA GCC ATC AGT GGC CTT
110
Arg Ser Me Thr Thr Leu Leu Arg AIa Leu GIy Ala Gin GIu AIa
CGC AGC ATC ACC ACT CTG CTT CGG GCG CTG GGA GCC CAG GAA GCC
120 130
He Ser Leu Pro Asp Ala AIa Ser Ala AIa Pro Leu Arg Thr He
ATC TCC CTC CCA GAT GCG GCC TCG GCT GCT CCA CTC CGA ACC ATC
140
Thr Ala Asp Thr Phe Cys Lys Leu Phe Arg VaI Tyr Ser Asn Phe
ACT GCT GAC ACT TTC TGC AAA CTC TTC CGA GTC TAC TCC AAT TTC
150 160
Leu Arg GIy Lys Leu Lys Leu Tyr Thr GIy GIu AIa Cys Arg Arg
CTC CGG GGA AAG CTG AAG CTG TAC ACG GGG GAG GCC TGC AGG AGA
165
GIy Asp Arg OP GGG GAC AGA TGA CCAGGTGCGTCCAGCTGGGCACATCCACCACCTCCCTCACCAACACTGCCTGTGCCACACCCTCCC
GAGAGCAGCTTTAAACTCAGGAGCAGAGACAATGCAGGGAAAACACCTGAGCTCACTCGGCCACCTGCAAAAGATGCAGGA CACGCTTTGGAGGCAATTTACCTG I I GCACCTACCATCAGGGACAGGATGACTGGAGAACTTAGGTGGCAAGCTGTGACTT CTCAAGGCCTCACGGGCACTCCCTTGGTGGCAAGAGCCCCCTTGACACTGAGAGAATATTTTGCAATCTGCAGCAGGAAAAATTA CGGACAGGTTTTGGAGGTTGGAGGGTACTTGACAGGTGTGTGGGGAAGCAGGGCGGTAGGGGTGGAGCTGGGATGCGAGT GAGAACCGTGAAGACAGGATGGGGGCTGGCCTCTGGTTCTCGTGGGGTCCAAGCTT
Hindill
Die Polypeptidsequenz von Tabelle V kann auf analytischem Wege leicht auf das Vorhandensein hydrophiler Bereiche und/oder sekundärer übereinstimmender Charakteristika überprüft werden die potentiell hoch immunogene Bereiche anzeigen, z. B. durch die Methoden von Hopp et al., P.N. A.S. (USA), 78, S.3824-3828 (1981) und Kyte et al., J. Mol. Biol. 157, S. 105-132 (1982) und/oder Chou et al., Biochem., 13, S. 222-245 (1974) und Advances in Enzymology, 47, S. 45-47 (1978). Die Computergestützte Analyse nach der Methode von Hopp et al. ist über ein Programm möglich, das als PEP Reference Section 6.7 bezeichnet wird und über Intelligenetics, Inc. 124 University Avenue, PaIo Alto, Californien, erhältlich ist.
Beispiel 4
A. Human-Genbibliothek
Eine Ch4A Phagen-geborene menschliche fötale Leber-Genbibliothek, hergestellt nach den Verfahren von Lawn et al., Cell, 18, S. 533-543 (1979), wurde erhalten und zur Verwendung in einer Plaque-Hybridisierungsassay bereitgestellt.
B. Plaque-Hybridisierungsverfahren zum Screening einer Human-Genbibliothek
Phagenteilchen wurden lysiert und die DNA's auf Filtern fixiert (50000 Plaques pro Filter) nach den Verfahrensweisen von Woo, Methods in Enzymology, 68, S. 389-395 (1979), ausgenommen für die Verwendung von Gene-Screene Plus-Filter (New England Nuclear Catalog Nr.NEF-976) und NZYAM-Platten (NaCI, 5g; MgCI2-OH20,2g; NZ-Amin A, 10g; Hefeextrakt, 5g; Casaminosäuren, 2g; Maltose, 2g; und Agar, 15g/l).
Die luftgetrockneten Filter wurden für eine Stunde bei 800C wärmebehandelt und im Anschluß daran mit Proteinase K wie in Beispiel 3, Teil B, abgebaut. Die Prä-Hybridisierung wurde mit 1 M NaCI — 1 % SDS-Puffer bei 550C über 4 Stunden oder mehr durchgeführt, wonach der Puffer entfernt wurde. Hybridisierungs- und Nachhybridisierungswaschungen wurden wie in Beispiel 3, Teil B beschrieben, durchgeführt. Sowohl das Gemisch von als EPV bezeichneten 128 20-mer-Sonden als auch das Gemisch van 12817-mer-Sonden aus Tabelle Hl (bezeichnet als EPQ-Gemisch) wurde eingesetzt. Die Hybridisierung wurde bei 480C unter Verwendung des EPV-Sondengemisches durchgeführt. Die EPQ-Sondergemisch-Hybridisierung wurde bei 460C durchgeführt —-4 Grad unterhalb der niedrigsten berechneten Td für Bestandteile des Gemisches. Die Entfernung der Hybridisierungssonde für die Rehybridisierung erfolgte durch Kochen mit 1 χ SSC-0,1% SDS für zwei Minuten. Die Autoradiografie der Filter zeigte drei positive Klone (mit beiden Sondengemischen reaktionsfähig) von 1500000 gescreenten Phagenplaques. Die Überprüfung auf Richtigkeit der positiven Klone als EPO-verschlüsseind erhielt man über DNA-Sequenzieren und elektronenmikrografische Sichtbarmachung der Heteroduplex-Bildung mit der Affen-cdNA von Beispiel 3. Dieses Verfahren gab auch über multiple Introns in der genomischen DNA-Sequenz Aufschluß.
Beispiel 5
Es wurde eine Nucleotid-Sequenzanalyse eines der positiven Klone (bezeichnet als AhE 1) durchgeführt. Die erhaltenen Ergebnisse sind in Tabelle Vl aufgeführt.
Tabelle VI
AAGCTTCTGGGCTTCCAGACCCAGCTACTTTGCGGAACTCAGCAACCCAGGCATCTCTGAGTCTCCGCCCAAGACCGGGATGCC
ggacagccgccctctcctctaggcccgtggggctggccctgcaccgccgagcttcccgggatgaggxx
-27 -24
Met GIy VaI His
CCCGGTGACCGGCGCGCCCCAAGTCGCTGAGGGACCCCGGCCAAGCGCGGAG ATG GGG GTG CAC G · GTGAGTACTCGCGGGCTGGGCGCTCCCGGCGGCCGGGTTCCTGTTTGAGCGGGGATTTAGCGCCCCGGCTATTGGCCAAGAGG tggctgggttcaaggaccggcgacttgtcaaggaccccggaagggggaggggggtggggcagcctccacgtgccgcgggga
CTGTGCAGTTGTGTCGTTGTCAGTGTCTCG I. S. TTGCACACGCACAGATCAATAAGCCAGAGGCAGCACCTGAGTGCTTGCATG
GTTGGGACAG GCCTGACTCT
GIy GGC -23 GIu AA Cys TGT Pro CCT -20 AIa GCC
Leu CTG GIu GAG Leu CTC Pro CCA VaI GTC Leu CTG
Leu CTG Arg AGG Tyr TAC Leu CTC Leu TTG
Me ATC
χ Asn
Cys TGT
CAGCCTGGCTATCTGTTCTAG -10
Leu Ser -Leu Pro CTG TCG CTC CCT
10
Asp Ser Arg VaI GAC AGC CGA GTC
26 Th r ACG
CACTTG GTTTG G G GTGGAGTTG G GAAG CTAG ACACTG CCCCCCTACATAAG AATAAGTCTGGTG GCCCCAAACCATACCTG AAA CTAGGCAAGGAGCAAAGCCAGCAGATCCTACGCCTGTGGGCCAGGG
Trp Leu Trp Leu Leu Leu Ser
GCC TGG CTG TGG CTT CTC CTG TCC
-1 +1
GIy AIa Pro Pro Arg Leu
GGC GCC CCA CCA CGC CTC
20
GIu Ala Lys GIu Ala GIu
Leu CTG
GAG GCC AAG GAG GCC GAG AAT ATC
27 30
Thr GIy Cys Ala GIu CCAGAGCCTTCAGGGACCCTTGACTCCCCGGGCTGTGTGCATTTCAG ACG GGC TGT GCT GAA
40 χ
His Cys Ser Leu Asn GIu - Asn He Thr VaI Pro Asp Thr Lys VaI Asn Phe Tyr CAC TGC AGC TTG AAT GAG AAT ATC ACT GTC CCA GAC ACC AAA GTT AAT TTC TAT 50 55
AIa Trp Lys Arg Met GIu GCC TGG AAG AGG ATG GAG GTGAGTTCCI I I I I I I I Il I I I I ICCTTTCTmTGGAGAATCTCATTTGCGAGCCTGAT
CCCCATCTCACAAACATTTAAAAAAATTAGTCAG GTGAAGTG GTGCATG GTG GTAGTCCCAG ATATTTGG AAG GCTG AG GCGGG AGGATCGCTTGAGCCCAGGAATTTGAGGCTGCAGTGAGCTGTGATCACACCACTGCACTCCAGCCTCAGTGACAGAGTGAGGCC
AG G GTGACATG G GTCAG CTCG ACTCCCAG AGTCCACTCCCTGTAG
56 VaI
GIy Gin GIn
60 AIa
VaI GIu VaI Trp Gin GIy Leu AIa
70 Leu Leu
Ser GIu AIa
GTC GGG CAG CAG GCC GTA GAA GTC TGG CAG GGC CTG GCC CTG CTG TCG GAA GCT
80
90
Leu Arg GIy Gin AIa Leu Leu VaI Asn Ser Ser GIn Pro Trp GIu Pro Leu GTC CTG CGG GGC CAG GCC CTG TTG GTC AAC TCT TCC CAG CCG TGG GAG CCC CTG
100
GIn Leu His VaI Asp Lys Ala VaI Ser GIy Leu Arg Ser Leu Thr Thr Leu Leu CAG CTG CAT GTG GAT AAA GCC GTC AGT GGC CTT CGC AGC CTC ACC ACT CTG CTT 110 115
Arg AIa Leu GIy Ala GIn
CGG GCT CTG GGA GCC CAG GTGAGTAGGAGCGGACACTTCTGCTTGCCCTTTCTGTAAGAAGGGGAGAAGGGTC TTGCTAAGGAGTACAGGAACTGTCCGTATTCCTTCCCTTTCTGTGGCACTGCAGCGACCTCCT
116 120
Lys GIu Ala He Ser Pro Pro Asp Ala Ala Ser Ala AIa GTTTTCTCCTTGGCAG AAG GAA GCC ATC TCC CCT CCA GAT GCG GCC TCA GCT GCT
130 140
Pro Leu Arg Thr He Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg VaI Tyr Ser
CCA CTC CGA ACA ATC ACT GCT GAC ACT TTC CGC AAA CTC TTC CGA GTC TAC TCC
150 160
Asn Phe Leu Arg GIy Lys Leu Lys Leu Tyr Thr GIy GIu AIa Cys Arg Thr GIy
AAT TTC CTC CGG GGA AAG CTG AAG CTG TAC ACA GGG GAG GCC TGC AGG ACA GGG
Asp - Arg OP
GAC" AGA TGA CCAGGTGTGTCCACCTGGGCATATCCACCACCTCCCTCACCAACATTGCTTGTGCCACACCCTCCCCCGCCA
CGCTTTGGAGGCGATTTACCTGTTTTCGCACCTACCATCAGGGACAGGATGACCTGGAGAACTTAGGTGGCAAGCTGTGACTTCT GGGCTGGCCTCTGGCTCTCATGGGGTCCAAGTTTTGTGTATTCTCACCTATTGACAGACTGAAACACAATATGAC
In Tabelle Vl bezeichnet die anfängliche fortlaufende DNA-Sequenz einen Kopfstrang von 620 Basen, in dem offensichtlich eine untranslatierte Sequenz unmittelbar einem translatierten Teil des Human-EPO-Gens vorausgeht. Insbesondere erscheint es so, daß die Sequenz das 5'Ende des Gens umfaßt, das zu einer translatierten DNA-Region überleitet, die für die ersten vier Aminosäuren (-27 bis —24) einer Führungssequenz („Pre-Sequenz") codiert. Vier Basenpaare in der Sequenz vor der die den Anfang der Führungssequenz verschlüsselt, wurden nicht genau bestimmt und sind daher als „X" bezeichnet worden. Es folgt dann ein Intron von etwa 639 Basenpaaren (439 Basenpaare davon wurden sequenziert und die restlichen 200 Basenpaare davon wurden als „I.S." bezeichnet) und unmittelbar davor ein Codon für Glutamin, das als Rest -23 des translatierten Polypeptids bezeichnet wurde. Die unmittelbar folgende Exonsequenz wird als codierend für Aminosäurereste durch einen Alaninrest angesehen (bezeichnet als der + 1-Rest der Aminosäuresequenz von reifem Human-EPO) zu dem Codon, das Threonin an Position +26 spezifiert, wonach ein zweites Intron folgt, das aus 256 Basen besteht, wie sie spezifisch bezeichnet sind. Diesem Intron folgt eine Exonsequenz für die Aminosäurereste 27 bis 55 und danach beginnt ein 612 Basenpaare enthaltendes drittes Intron.
Das anschließende Exon codiert für die Reste 56 bis 115 das Human-EPO und dann beginnt ein viertes Intron von 134 Basen, wie aufgeführt. Dem vierten Intron folgt ein Exon, das für die Reste Nr. 116 bis 166 codiert und ein Stopcodon (TGA). Schließlich wird eine Sequenz von 568 Basenpaaren identifiziert, worin eine untranslatierte 3'-Region des Human-EPO-Gens erscheint, zwei Basenpaare, von denen („X") bisher noch nicht genau sequentiert worden ist.
Tabelle Vl dient somit zur Ermittlung der Strukturübereinstimmung (Aminosäuresequenz) von reifem Human-EPO, das 166 spezifische Aminosäurereste enthält (geschätzte Molmasse = 18399). Außerdem erscheint in der Tabelle die DNA-Sequenz, die für eine Führungssequenz mit 27 Resten zusammen mit 5'- und 3'-DNA-Sequenzen codiert, die für Promoter/Operatorfunktionen des Humangen-Operons signifikant sein können.
Stellen für die potentielle Glycosylierung des reifen Human-EPO-Polypeptids sind in der Tabelle durch Sternchen bezeichnet. Es sollte beachtet werden, daß die spezifische Aminosäuresequenz von Tabelle Vl wahrscheinlich jene einer natürlich auftretenden allelischen Form von Human-Erythropoietin bildet. Diese Position wird durch die Ergebnisse der fortlaufenden Bemühungen beim Sequenzieren von Urinisolation von Human-Erythoropoietin gestützt, das dazu führte, daß man eine bedeutende Anzahl von Erythropoietinmolekülen darin herausfand, die ein Methionin am Rest 126 gegenüber einem Serin aufwiesen, wie in der Tabelle gezeigt.
Die folgende Tabelle VII erläutert den Grad der Polypeptidsequenz-Homologie zwischen Human- und affen-EPO. In der oberen fortlaufenden Reihe der Tabelle wurden Einzelbuchstabenbezeichnungen verwendet, um die hergeleiteten, translatierten Polypeptidsequenzen von Human-EPO darzustellen, beginnend mit dem Rest -27, und die untere fortlaufende Reihe zeigt die hergeleitete Polypeptidsequenz von Affen-EPO, beginnend mit dem als Nummer -27 bezeichneten Rest. Sternchen zeigen die Sequenzhomologien an. Es sollte festgehalten werden, daß die hergeleiteten Human- und Affen-EPO-Sequenzen einen „zusätzlichen" Lysin(K)-rest an der (Human-)Position 116 aufweisen. Ein Vergleich mit Tabelle Vl zeigt, daß dieser Rest am Rande einer vermutlichen mRNA-Spleißverbindung in der genomischen Sequenz auftritt. Das Vorhandensein des Lysinrestes in der Human-Polypeptidsequenz wurde darüber hinaus durch Sequenzieren eines cDNA-Humansequenzklons überprüft, hergestellt aus mRNA, die aus COS-1 Zellen isoliert worden waren, die mit der humangenomischen DNA von Beispiel 7 (siehe unten) transformiert wurden.
Tabelle VII Vergleich von Human- und Affen-EPO-Polypeptiden
-20 -10 +1 10 20 30 40
Human MGVHECPAWLWLLLSLLSLPLGLPVLGAPPRLICDSRVLERYLLEAKEAENITTGCAEHCSLNENITVPDTK
XXXXXXXXXXXXXXXX XXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX XXXXXX X XXXXXXXXXXXXX
Affen MGVHECPAWLWLLLSLVSLPLGLPVPGAPPRLICDSRVLERYLLEAKEAENVTMGCSESCSLNENITVPDTK
50 60 70 80 90 100 110
Human VNFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQALLVNSSQPWEPLQLHVDKAVSGLRSLTTLLRALGAQKE
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX X XXXXX XXXXXX XXX XXXXX XXXXXXXXXX X
Tabelle VIl (Fortsetzung)
Affen VNFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQAVLANSSQPFEPLQLHMDKAISGLRSITTLLRALGAQ-E
120 130 140 150 160
Human AISPPDAASAAPLRTITADTFRKLFRVYSNFLRGKLKLYTGEACRTGDR
XXX XXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX XXX
Affen AISLPDAASAAPLRTITADTFCKLFRVYSNFLRGKLKLYTGEACRRGDR
Ein Vergleich der Aktivität der rekombinanten Affen- und Human-EPO-Materialien gegen einen Standard einer natürlich auftretenden Human-EPO und die Ergebnisse sind in grafischer Form in Fig. 1 aufgeführt. Kurz zusammengefaßt offenbarten die Ergebnisse erwartetermaßen, daß das rekombinante Affen-EPO signifikant mit Anti-Human-EPO-Antikörper konkurrierte, obgleich es nicht in der Lage war, die Bindung unter den Testbedingungen vollständig zu inhibieren. Der höchste Inhibiemngsprozentsatzfür rekombinante Human-EPO lag allerdings nahe etwa bei dem des Human-EPO-Standards. Die parallele Lage der Dosisreaktioriskurven deutet auf immunologische Identität der gemeinsamen Sequenzen (Epitope) hin.
Beispiel 11
Das vorliegende Beispiel betrifft die gesamte Herstellung durch Zusammenstellung der Nucleotidbasen von zwei strukturellen Genen, die die Human-EPO-sequenz von Tabelle Vl verschlüsseln und schließt entsprechend „bevorzugte" Codons für die Expression in E.coli- und Hefe(s.cevevisiae)zellen ein.
Beschrieben wird auch die Konstruktion von Genen, die Analoge von Human-EPO verschlüsseln. Kurz zusammengefaßt entsprach der Ablauf dem in der bereits vorher genannten Literaturstelle von Alton et al., (WO 83/04053). Die Gene wurden für eine anfängliche Zusammenstellung der Komponenten-Oligonucleotide in mehrfachen Verdoppelungen gestaltet, die der Reihe nach in drei getrennte Abschnitte (section) vereinigt wurden. Diese Sectionen wurden für eine fertige Amplifizierung gestaltet, und nach Entfernung aus dem Amplifizierungssystem konnten sie sequentiell oder durch eine mehrfache Fragmentligation in einem geeigneten Expressionsvektor vereinigt werden.
Die folgenden Tabellen VIII bis XIV erläutern die Gestaltung und Vereinigung eines hergestellten Gens, dasein Human-EPO-Translationsprodukt verschlüsselt, dem eine beliebige Führungs- oder Presequenz fehlt, zu dem jedoch ein anfänglicher Methioninrest an Position -1 gehört. Darüber hinaus gehören zu dem Gen in seinem wesentlichen Teil E. coli-Präferenzcodons, und die Konstruktion wurde daher als das „ECEPO"-Gen bezeichnet.
Tabelle VIII ECEPOSECTION 1 OLIGONUCLEOTIDES
1. AATTCTAGAAACCATGAG G GTAATAAAATA
2. CCATTATTTTATTACCCTCATGGTTTCTAG
3. ATGGCTCCGCCGCGTCTGATCTGCGAC
4. CTCGAGTCGCAGATCAGACGCGGCGGAG
5. TCGAGAGTTCTGGAACGTTACCTGCTG
6. CTTCCAGCAGGTAACGTTCCAGAACT
7. GAAGCTAAAGAAGCTGAAAACATC
8. GTGGTGATGTTTTCAGCTTCTTTAG
9. ACCACTGGTTGTGCTGAACACTGTTC
10. CAAAGAACAGTGTTCAGCACAACCA
11. TTTGAACGAAAACATTACGGTACCG
12. GATCCGGTACCGTAATGTTTTCGTT
Tabelle IX ECEPO SECTION 1
Xfral
EcoRI 1
AATTCTAG AAACCATGAG GGTAATAAAA TjJaTGGCTCC GCCGCGTCTG GATC TTTGGTACTC CCATTATTTT ATTÄÜ^GAGG CGGCGCAGAC
2 i
ATCTGCCACJT-CGAGAGfTCT GGAACGTTAC CTGCTCJgAAG CTAAAGAAGC TAGACGCTGA GCTCJTCAAGA CCTTGCAATG GACGACÜTt17| GATTTCTTCG
TGAAAACATC. Iaccactggtt gtgctgaaca ctgttcjtttg aacgaHaca
ACTTTTGTAG TGGTOACCAA CACGACTTGT GACAAGAAACI TTGCTTTTGT 8 r 10 '
Kpnl BamHI TTACGGTACC G AATGCCATGG CCTAG 12
Tabelle X ECEPO SECTION 2 OLIGONUCLEOTIDES
1. AAT^CGGTACCAGACACCAAGGT
2. GTTAACCTTGGTGTCTGGTACCG
3. TAACTTCTACGCTTGGAAACGTAT
4. TTCCATACGTTTCCAAGCGTAGAA
5. GGAAGTTGGTCAACAAGCAGTTGAAGT
6. CCAAACTTCAACTGCTTGTTGACCAAC
7. TTGGCAGGGTCTGGCACTGCTGAGCG
8. GCCTCGCTCAGCAGTGCCAGACCCTG
9. AGGCTGTACTGCGTGGCCAGGCA
10. GCAGTGCCTGGCCACGCAGTACA
11. CTGCTGGTAAACTCCTCTCAGCCGT
12. TTCCCACGGCTGAGAGGAGTTTACCA
13. GGGAACCGCTGCAGCTGCATGTTGAC
14. GCTTTGTCAACATGCAGCTGCAGCGG
15. AAAGCAGTATCTGGCCTGAGATCTG
16. GATCCAGATCTCAGGCCAGATACT
Tabelle XI ECEPO SECTION 2
EcoRI Kpnl 1 _
A ATTCGGTACC AGACACCAAG GaJTAACTTCT ACGCTTGGAA ACGTAThGAA GCCATGG TCTGTGGTTC CAATfGiAAGA TGCGAACCTT TGCATAüUH!
g ± '
GTTGGTCAAC AAGCAGTTGA AGtJpTGGCAG GGTGTGGCAC TGCTGAGCCJA CAACCAGTTG TTCGTCAACT TCAAÄCCjGTC COAGACCGTG ACGACTCGCT 6 ^
^J H J
GGCTGTACTG CGTGGCCAGG C4CTGCTGGT AAACTCCTCT CAGCCGOjGGG
CCCJACATGAC GCACCGGTCC GTGACGIACCA TTTGAGGAGA GTCGGCACCC IO
13 15 BgIII BamHI
MCCGCTGCA GCTGCATGTT gac(aaagcag tatctggcct gagatctg
TÖTgGCGACGT CGACGTACAA CTGTTTCGJTC ATAGACCGGA CTCTAGACCTAC
Tabelle XII ECEPO SECTION 3
1. GATCCAGATCTCTGACTACTCTGC
2. ACGCAGCAGAGTAGTCAGAGATCTG
3. TGCGTGCTCTGGGTGCACAGAAAGAGG
4. GATAGCCTCTTTCTGTGCACCCAGAGC
5. CTATCTCTCCGCCGGATGCTGCATCT
6. CAGCAGATGCAGCATCCGGCGGAGA
7. GCTGCACCGCTGCGTACCATCACTG
8. ATCAGCAGTGATGGTACGCAGCGGTG
9. CTGATACCTTCCGCAAACTGTTTCG
10. ATACACGAAACAGTTTGCGGAAGGT
11. TGTATACTCTAACTTCCTGCGTGGTA
12. CAGTTTACCACGCAGGAAGTTAGAGT
13. AACTGAAACTGTATACTGGCGAAGC
14. GGCATGCTTCGCCAGTATACAGTTT
15. ATGCCGTACTGGTGACCGCTAATAG
16. TCGACTATTAGCGGTCACCAGTAC
Tabelle XlIl ECEPO SECTION 3
BamHI BgIII GA TCCAGATCTCTG GTCTAGAGAC
ACTACfCTGC ITGCGTGCTCT GGGTGCACAG AAAGAGQCTA-TCTCTCCGCC TGATGAGACG ACGC^)CGAGA CCCACGTGTC TTTCTCCGAT AGjAGAGGCGG
L. 1,1
GGATGCTGCA TCTDCTGCAC CGCTGCGTAC CATCACTGPT GATACCTTCC CCTACGACGT AGACGlÜfeTG GCGACGCATG GTAGTGACGA CMGGAAGG . · 6 8
11 ,
GCAAACTGTT TCGDGTAT1AC TCTAÄCTTCC TGCGTGGTAIA ACTGAAACTG CGTTTGACAiI AGCACATaItG AGATTGAAGG ACGCACCATT TGAOJTTTGAC
12
. 15 Sail
TATACTGGCG AAGCJATGCCG TACTGGTGAC CGCTAATAG ATATGACCGC TTCGTACΰφ ATGACCACTG GCGATTATC AGCT
u . Ü
Tabelle XIV ECEPO GENE
Xbal ~1 .]
MetAla
CTAG AAACCATGAG GGTAATAAAA TAATGGCTCC GCCGCGTCTG
TTTGGTACTC CCATTATTTT ATTACCGAGG CGGCGCAGAC
ATCTGCGACT CGAGAGTTCT GGAACGTTAC CTGCTGGAAG CTAAAGAAGC
TAGACGCTGA GCTCTCAAGA CCTTGCAATG GACGACCTTC GATTTCTTCG
TGAAAACATC ACCACTGGTT GTGCTGAACA CTGTTCTTTG AACGAAAACA
ACTTTTGTAG TGGTGACCAA CACGACTTGT GACAAGAAAC TTGCTTTTGT
TTACGGTACC AGACACCAAG GTTAACTTCT ACGCTTGGAA ACGTATGGAA
AATGCCATGG TCTGTGGTTC CAATTGAAGA TGCGAACCTT TGCATACCTT
GTTGGTCAAC AAGCAGTTGA AGTTTGGCAG GGTCTGGCAC TGCTGAGCGA
CAACCAGTTG TTCGTCAACT TCAAACCGTC CCAGACCGTG ACGACTCGCT
GGCTGTACTG CGTGGCCAGG CACTGCTGGT AAACTCCTCT CAGCCGTGGG
CCGACATGAC GCACCGGTCC GTGACGACCA TTTGAGGAGA GTCGGCACCC
AACCGCTGCA GCTGCATGTT GACAAAGCAG TATCTGGCCT GAGATCTCTG
TTGGCGACGT CGACGTACAA CTGTTTCGTC ATAGACCGGA CTCTAGAGAC
ACTACTCTGC TGCGTGCTCT GGGTGCACAG AAAGAGGCTA TCTCTCCGCC
TGATGAGACG ACGCACGAGA CCCACGTGTC TTTCTCCGAT AGAGAGGCGG
GCATGCTGCA TCTGCTGCAC CGCTGCGTAC CATCACTGCT GATACCTTCC
CCTACGACGT AGACGACGTG GCGACGCATG GTAGTGACGA CTATGGAAGG
GCAAACTGH TCGTGTATAC TCTAACTTCC TGCGTGGTAA ACTGAAACTG CGTTTGACAA AGCACATATG AGATTGAAGG ACGCACCATT TGACTTTGAC
Sal I
TATACTGGCG AAGCATGCCG TACTGGTGAC CGCTAATAG ATATGACCGC TTCGTACGGC ATGACCACTG GCGATTATCA GCT
Im Detail sind aus Tabelle VIII Oligonucleotide zu entnehmen, die dazu eingesetzt wurden, die Section 1 des ECEPO-Gens zu erzeugen, das die Aminoterminalreste menschlichen Polypeptids verschlüsselt. Oligonucleotide wurden zu Doppelungen vereinigt (1 und 2,3 und 4 usw.), und die Doppelungen wurden dann ligiert, um zu der ECEPO Section 1 wie in Tabelle IX zu gelangen. Bemerkt werden muß, daß zu der vereinigten Section terminale einzelsträngige EcoRI- und BamHI-Enden gehören, daß „stromabwärts" des einzelsträngigen EcoRI-Endes eineXbal-Restriktionsenzym-Erkennungsstelle ist; und daß „stromaufwärts" von einzelsträngigem BamHI-Ende eine Kpml-Erkennungsstelle ist. Section 1 konnte leicht unter Verwendung des M13 Phagenvektors amplifiziert werden, der zur Überprüfung der Sequenz der Section eingesetzt wurde: Einige Schwierigkeiten traten auf beim Isolieren der Section als Xbal/Kpnl-Fragment aus RF DNA, in E. coii erzeugt, wahrscheinlich, wegen der Methylierung der Kpnl-Erkennungsstellenbasen innerhalb des Wirtes. Es wurde daher einzelsträngige Phagen-DNA isoliert und in die doppelsträngige Form in vitro übersetzt mittels Primerverlängerung (extension), und das gewünschte doppelsträngige Fragment wurde danach leicht isoliert.
Die ECEPO-Gensectionen 2 und 3 (Tabellen Xl und XIII) wurden in ähnlicher Weise aus den Oligonucleotiden derTabellen X und XII konstruiert. Jede Section wurde in dem M13 Vektor amplifiziert, der für die Sequenzüberprüfung auf Richtigkeit eingesetzt wurde, und wurde aus Phagen DNA isoliert.
Wie aus Tabelle Xl ersichtlich, wurde die ECEPO-Section 2 mit einzelsträngigen EcoRI- und BamHI-Enden konstruiert und konnte als ein Kpnl/Bglll-Fragment isoliert werden. In ähnlicher Weise wurde die ECEPO-Section 3 mit einzelsträngigen BamHI-und Sall-Enden hergestellt und konnte aus Phagen RF DNA als ein BgI H-SaI I-Fragment isoliert werden. Die auf diese Weise hergestellten drei Sectionen konnten leicht zu einerfortlaufenden DNA-Sequenz vereinigt werden (Tabelle XIV), die das gesamte menschliche EPO-Polypeptid mit einem Aminoterminal-Methionincodon (ATG) für den E. coli-Translationsbeginn verschlüsselt.
Weiterhin ist zu vermerken, daß sich „stromaufwärts" vom anfänglichen ATG eine Serie von Basenpaaren befindet, die die Ribosomenbindungsstellensequenz des hoch exprimierten OMP-f-Gensvon E.coli dupliziert.
Um das ECEPO zu tragen, kann ein beliebiger geeigneter Expressionsvektor eingesetzt werden. Der besondere Vektor, der für die Expression des ECEPO-Gens als das „temperaturempfindliche" Plasmid pCFM536 — ein Derivat des Plasmids pCFM414 (ATCC 40076)—gewählt wurde, ist in der noch anhängigen US-Patentanmeldung Nr. 636727 eingereicht am 6. August 1964 von Charles F. Morris beschrieben.
Insbesondere wurde pCFM 536 mit Xbal und Hindlll abgebaut; das große Fragment wurde isoliert und in einer zweiteiligen Ligierung mit dem ECEPO-Gen eingesetzt. Sectionen 1 (Xbal/Kpnl), 2 (Kpml/Bgl III) und 3 (BgI Il/Sal I) wurden vorher in korrekter Weise in M13 vereinigt, und das EPO-Gen wurde daraus isoliert als ein einzelnes Xba I/Hind HI-Fragment.
Zu diesem Fragment gehörte ein Teil des Polylinkersausdem M13 und mp9 Phagen, der die Sal I bis Hind HI-Stellen darin überspannte. Die Steuerung der Expression im erhaltenen Expressionsplasmid p536 erfolgte mittels eines Lambda-PL-Promotors, der selbst von dem Cn857-Repressor-Gen (wie vom E.coli Stamm K12 Htrp vorgesehen) gesteuert wurde.
Das hergestellte obige ECEPO-Gen konnte auf verschiedene Weise modifiziert werden, um Erythropoietin-Analoge zu verschlüsseln, wie [Asn2, des Pro2 bis llee] hEPO und [His7] hEPO, wie unten beschrieben.
A. [Asn2, des Pro2 bis He6] hEPO
Das Plasmid 53 b, das das ECEPO-hergestellte Gen von Tabelle XIV als ein Xbal- bis Hind Ill-Insert trug, wurde mit Hind IH und Xho I abgebaut. Letztere Endonuclease schneidet das ECEPO-Gen an einer einzigen 6-Basenpaare-Erkennungsstelle, die die letzte Base_des Asp8verschlüsselnden Codons bis zur zweiten Base des Arg'°-Codons überspannt.
Eine Xba I/Xho l-„Linker"sequenz wurde hergestellt, die die folgenden Sequenzen enthielt:
Xbal Met + 1 2 7 δ 9
5'-CTAG ATG AIa Asn Cys Asp Xhol
3'-TAC GCT AAT TGC GAC-3'
CGA TTA ACG 'CTG AGCT-5'
Der Xbal/Xhoi-Linker und das Xho I/Hind Ill-ECEPO-Gensequenzfragment wurde in das große Fragment insertiert, das man aus dem Xbal- und Hind Ill-Abbau des Plasmids pCFM 526 — einem Derivat des Plasmids pCFM 414 (ARCC 40076) — erhielt, wie in der noch anhängigen US-Patentanmeldung Nr.636727, eingereicht am 6.August 1984 von Charles F.Morris beschrieben, um eine Plasmid-geborene DNA-Sequenz zu erzeugen, die die E. coli-Expression der Met^-Form des gewünschten Analogen verschlüsselt.
B. [His7]hEPO
Das Plasmid 536 wurde mit Hind III und Xho 1 wie im Teil A oben abgebaut. Ein Xba I/Xho I-Linker wurde hergestellt, der die folgende Sequenz hatte:
9Xhol
AGCT-5'
Der Linker und das Xhol/Hind Ill-ECEPO-Sequenzfragment wurde dann in pCFM526 insertiert, um eine Plasmid-gebotene DNA-Sequenz zu erzeugen, die die E. coli-Expression der Met^-Form des gewünschten Analoges verschlüsselt.
Xbal Met + 1 2 3 4 CJl CJ) 7 δ
ATG Ala Pro Pro Arg Leu He His Asp
5'-CTAG GCT CCG CCA CGT CTG ATC CAT CAC-3'
3'-TAC CGA GGC GGT GCA GAC TAG GTA CTG
Die Konstruktion eines hergestellten Gens („SCEPO") einschließlich der Hefepräferenzcodons ist in den folgenden Tabellen XV bis XXI beschrieben. Wie beim ECEPO-Gen gehört zu der gesamten Konstruktion dießildung von drei Sätzen Oligonucleotide (Tabellen XV, XVII und XIX) die in Doppelungen formiert wurden und zu Sectionen vereinigt wurden (Tabellen XVI, XVIII und XX). Es ist festzuhalten, daß die Synthese teilweise erleichtert wurde durch Verwendung von einigen suboptimalen Codons, sowohl bei der SCEPO- als auch ECEPO-Konstruktion, d. h. die Oligonucleotide 7-12 der Section 1 beider Gene waren identisch, ebenso die Oligonucleotide 1-6 der Section 2 in jedem Gen.
Tabelle XV SCEPO SECTION I OLIGONUCLEOTIDE
1. AATTCAAGCTTGGATAAAAGAGCT
2. GTGGAGCTCTTTTATCCAAGCTTG
3. CCACCAAGATTGATCTGTGACTC
4. TCTCGAGTCACAGATCAATCTTG
5. GAGAGTTTTGGAAAGATACTTGTTG
6. CTTCCAACAAGTATCTTTCCAAAAC
7. GAAGCTAAAGAAGCTGAAAACATC
8. GTGGTGATGTTTTCAGCTTCTTTAG
9. ACCACTGGTTGTGCTGAACACTGTTC
10. CAAAGAACAGTGTTCAGCACAACCA
11. TTTGAACGAAAACATTACGGTACCG
12. GATCCGGTACCGTAATGTTTTCGTT
Tabelle XVI SCEPO SECTION 1
EcoRI Hind III 1
CTtca aScTjtggata gt tggaacgtat
AAAGAGCJCC ACCAAGATTG ATCTGTGACT (JgaGAGTTTT TTTCTCGAGG TGpTTCTAAC TAGACACTGA GCTCqCAAAA
5,1
GGAAAGATAC TTGTTdGAAG CTAAAGAAGC TGAAAACATC ACCACTGGTT CCTTTCTATG AACAACCTTC] GATTTCTTCG ACTTTTGTAG TGGTqACCAA
9 H Kpnl BaEiHI
GTGCTGAlCA CTGTTCjTTTGiUCGAAAACA TTACGGTACC G CACGACTTGT GäCAAGAAAC TTGCTTTTGT AATGCCATGG CCTAG
12
Tabelle XVII SCEPO SECTION 2 OLIGONUCLEOTIDE
1. AATTCGGTACCAGACACCAAGGT
2. GTTAACCTTGGTGTCTGGTACCG
3. TAACTTCTACGCTTGGAAACGTAT
4. TTCCATACGTTTCCAAGCGTAGAA
5. GGAAGTTGGTCAACAAGCAGTTGAAGT
6. CCAAACTTCAACTGCTTGTTGACCAAC
7. TTGGCAAGGTTTGGCCTTGTTATCTG
8. GCTTCAGATAACAAGGCCAAACCTTG
9. AAGCTGTTTTGAGAGGTCAAGCCT
10. AACAAGGCTTGACCTCTCAAAACA
11. TGTTGGTTAACTCTTCTCAACCATGGG
12. TGGTTCCCATGGTTGAGAAGAGTTAACC
13. AACCATTGCAATTGCACGTCGAT
14. CTTTATCGACGTGCAATTGCAA
15. AAAGCCGTCTCTGGTTTGAGATCTG
16. GATCCAGATCTCAAACCAGAGACGG
Tabelle XVlIl SCEPO SECTION 2
Kpnl EcoRI 1
aTTTCGGTACC AGACACCAAG tlCCATGG TCTGTGGTTC
1 j
gtttaacttcl1 acgcttggaa acgtaqjggaa gttggtcaac aagctgttga
caattgila.ga tgcgaacctt tgcatacctti caaccagttg ttcgacaact r ' £
7 ü
AGOJTTGGCAA GGTTTGGC CT TGTTATCTgIa AGCTGTTTTG AGAGGTCAAG TCAAACCfcTT CCAAACCGGA ACAATAGACT TC(3ACAAAAC TCTCCAGTTC
10
ι 11 , H
CCOJTGTTGGT TMCTCTTCT CAACCATGGG jAACCATTGCA ATTGCACGTC GGAÄSUICCA ATTGAGAAGA GTTGGTACCC TTGGTiAACGT TAACGTGCAG
r IA
. 15 BgIII BamEl
GAOJAAAGCCg TCTCTGGTTT GAGATCTG
CTATTTqGGC AGAGACCAAA CTCTAGACCTA G r 16
Tabelle XIX SCEPOSECTIONSOLIGONUCLEOTIDES
1. GATCCAGATCTTTGACTACTTTGTT
2. TCTCAACAAAGTAGTCAAAGATCTG
3. GAGAGCTTTGGGTGCTCAAAAGGAAG
4. ATGGCTTCCTTTTGAGCACCCAAAGC
5. CCATTTCCCCACCAGACGCTGCTT
6. GCAGAAGCAGCGTCTGGTGGGGAA
7. CTGCCGCTCCATTGAGAACCATC
8. CAGTGATGGTTCTCAATGGAGCG
9. ACTGCTGATACCTTCAGAAAGTT
10. GAATAACTTTCTGAAG GTATCAG
11. ATTCAGAGTTTACTCCAACTTCT
12. CTCAAGAAGTTGGAGTAAACTCT
13. TGAGAGGTAAATTGAAGTTGTACAC
14. ACCGGTGTACAACTTCAATTTACCT
15. CGGTGAAGCCTGTAGAACTGGT
16. CTGTCACCAGTTCTACAGGCTTC
17. GACAGATAAGCCCGACTGATAA
18. GTTGTTATCAGTCGGGCTTAT
19. CAACAGTGTAGATGTAACAAAG
20. TCGACTTTGTTACATCTACACT
Tabelle XX SCEPO SECTION 3
BamHI BgIII 1 ,
CAGATCTTTG ACTACTTTGT TjGAGAGCTTT GTCTAGAAAC TGäTGAAACA ACTCφGAAA 2
GGGTGCTCAA AAGGAACJCCA ^TTCCCUACC AGACGCTGCT TCTGCCGCTC
cccACGAGTT ttccttcggt Iaaggggtgg tctgcgacga agacggcgag 4 ' £
7 9
cattgagaac catcJactgct gataccttca gaaagttLtt cagagtttac
GTAACTCTTG GTAGTGAC1GA CTATGGAAGT CTTTCAATAA GfECTCAAATG 8 10' f
13
TCCAACTTCT ItGAGAGGTAA ATTGAAGTTG TACACJCGGTG AAGCCTGTAG AGGTTGAAGA ACTCJTCCATT TAACTTCAAC ATGTGGCCijC TTCGGACATC
14 . 16 _
17
JA.
AACTGGJGAC AGATiUGCCC GACTGATAisb AACAGTGTAG TTGACCACTG TCJTATTCGGG CTGACTATTG TTqTCACATC
18
Sail
ATGTAACAAA G TACATTGTTT CAGCT 20
Tabelle XXI SCEPO GEN
-1 +1
Hindlll ArgAla
AGCTTGGATA AAAGAGCTCC ACCAAGATTG ATCTGTGACT CGAGAGTTTT
ACCTAT TTTCTCGAGG TGGTTCTAAC TAGACACTGA GCTCTCAAA
GGAAAGATAC TTGTTGGAAG CTAAAGAAGC TGAAAACATC ACCACTGGTT
CCTTTCTATG AACAACCTTC GATTTCTTCG ACTTTTGTAG TGGTGACCAA
GTGCTGAACA CTGTTCTTTG AACGAAAACA TTACGGTACC AGACACCAAG
CACGACTTGT GACAAGAAAC TTGCTTTTGT AATGCCATGG TCTGTGGTTC
GTTAACTTCT ACGCTTGGAA ACGTATGGAA GTTGGTCAAC AAGCTGTTGA
CAATTGAAGA TGCGAACCTT TGCATACCTT CAACCAGTTG TTCGACAACT
AGTTTGGCAA GGTTTGGCCT TGTTATCTGA AGCTGTTTTG AGAGGTCAAG
TCAAACCGTT CCAAACCGGA ACAATAGACT TCGACAAAAC TCTCCAGTTC
CCTTGTTGGT TAACTCTTCT CAACCATGGG AACCATTGCA ATTGCACGTC
GGAACAACCA ATTGAGAAGA GTTGGTACCC TTGGTAACGT TAACGTGCAG
GATAAAGCCG TCTCTGGTTT GAGATCTTTG ACTACTTTGT TGAGAGCTTT
CTATTTCGGC AGAGACCAAA CTCTAGAAAC TGATGAAACA ACTCTCGAAA
GGGTGCTCAA AAGGAAGCCA TTTCCCCACC AGACGCTGCT TCTGCCGCTC
CCCACGAGTT TTCCTTCGGT AAAGGGGTGG TCTGCGACGA AGACGGCGAG
CATTGAGAAC CATCACTGCT GATACCTTCA GAAAGTTATT CAGAGTTTAC
GTAACTCTTG GTAGTGACGA CTATGGAAGT CTTTCAATAA GTCTCAAATG
Tabelle XXI (Fortsetzung)
-1+1
Hindlll Arg Al a
TCCAACTTCT TGAGAGGTAA ATTGAAGTTG TACACCGGTG AAGCCTGTAG AGGTTGAAGA ACTCTCCATT TAACTTCAAC ATGTGGCCAC TTCGGACATC
AACTGGTGAC AGATAAGCCC GACTGATAAC AACAGTGTAG
TTGACCACTG TCTATTCGGG CTGACTATTG TTGTCACATC "*'
Sail
ATGTAACAAA G TACATTGTTT CAGCT
Die vereinigten SCEPO-Sectionen wurden in M13 sequenziert, und die Sectionen 1,2 und 3 waren aus dem Phagen als Hind III/ Kpnl-, Kpnl/Bglll- und Bglll/Sal !-Fragmente isolierbar.
Das gegenwärtig bevorzugteste Expressionssystem für SCEPO-Genprodukte ist ein Skretionssystem, basierend auf einer S. cerevisiae-a-Faktor-sekretion.wiein der anhängigen US-Patentanmeldung Nr.487753, eingereicht am 22. April 1983 von Grant A. Bitter, veröffentlicht am 31. Oktober 1984 als Europäische Patentanmeldung 0123294, beschrieben. Kurz zusammengefaßt gehören zu dem System Konstruktionen, worin DNA, die die Führungssequenz des Hefe-a-Faktor-Genproduktes verschlüsselt, unmittelbar 5' zur codierenden Region des zu exprimierenden exogenen Gens angeordnet ist. Als ein Ergebnis enthält das translatierte Genprodukt eine Führungs- oder Signalsequenz, die „wegbehandelt" (processed off) wird durch ein endogenes Hefeenzym im Verlauf der Sekretion des verbliebenen Produktes. Da bei der Konstruktion mit dem a-Faktor-Translationsbeginn (ATG)-codon gearbeitet wurde, war es nicht erforderlich, ein solches Codon an der-1-Position des SCEPO-Gens einzubauen. Wie aus Tabelle XXI entnommen werden kann, geht der Alanin (+1) verschlüsselnden Sequenz eine Linkersequenz voraus, die eine direkte Insertion in ein Plasmid gestattet, enthaltend die DNA für die ersten 80 Reste der α-Faktorführungssequenz, die dem α-Faktor-Promoterfolgt. Zu der speziell bevorzugten Konstruktion für die SCEPO-Genexpression gehört eine vierteilige Ligierung unter Einschluß des oben genannten SCEPO-Section-Fragmentes und des großen Fragmentes des HindIll/Sal !-Abbaus des ' Plasmids paC3. Aus dem erhaltenen paC3/SCEPO wurden der a-Faktorpromotor und die Führungssequenz und das SCEPO-Gen isoliert durch Abbau mit Bam Hl und ligiert in das Barn Hl-abgebaute Plasmid pYE, um zu dem Expressionsplasmid pYE/SCEPO zu gelangen.
Es sollte bei Betrachtung der Beispiele deutlich geworden sein, daß zahlreiche außerordentlich wertvolle Produkte und Verfahrensweisen durch die vorliegende Erfindung in ihren vielen Aspekten hervorgebracht wurden.
Nach einem weiteren Aspekt der vorliegenden Erfindung sind die hier beschriebenen klonierten DNA-Sequenzen, die Human- und Affen-EPO-Polypeptide verschlüsseln, bemerkenswert wertvoll für die darin enthaltenen Informationen hinsichtlich der Aminosäuresequenz von Säugetier-Erythropoietin, die bis heute nicht zu erhalten waren, abgesehen von Teilen aus analytischen Verfahren von Isolaten natürlich auftretender Produkte. Die DNA-Sequenzen sind auch bemerkenswert wertvoll als Produkte, die dazu eingesetzt werden können, die mikrobielle Synthese von Erythropoietin im großen Maße zu beschreiben mittels einer Vielzahl rekombinanter Techniken. Andererseits sind die durch die vorliegende Erfindung vorgesehenen DNA-Sequenzen nützlich für die Erzeugung neuer und nutzbringender viraler und ringförmiger Plasmid-DNA-Vektoren, neuer und nutzbringender transformierter und transferierter mikrobieller procaryotischer und eucaryotischer Wirtszellen (einschließlich bakterieller und Hefezellen sowie in Kultur gewachsener Säugetierzellen sowie neuer und nutzbringender Verfahren des kultivierten Wachstums solcher mikrobieller Wirtszellen, die zur Expression von EPO- und EPO-Produkten in der Lage sind.
Die erfindungsgemäßen DNA-Sequenzen sind auch bemerkenswert geeignete Materialien für den Einsatz als markierte Sonden bei der Isolierung von EPO und verwandter Protein-verschlüsselnder cDNA- und genomischer DNA-Sequenzen von anderen Säugetieren als den hier speziell erläuterten Menschen und Affenarten. Der Gehalt, bis zu dem die erfindungsgemäßen DNA-Sequenzen bei dem unterschiedlichen alternativen Verfahren zur Prokinsynthese eingesetzt werden (z. B. in Insektenzellen) oder bei der genetischen Therapie von Menschen oder anderen Säugetieren kann noch nicht berechnet werden. Es ist zu erwarten, daß die erfindungsgemäßen DNA-Sequenzen bei der Entwicklung transgenischer Säugetierarten nutzbringend sein können, die als eucaryotische „Wirte" zur Herstellung von Erythropoietin und Erythropoietinprodukten in Mengen dienen können. Siehe allgemein Polmiter et al., Science, 222 (4625), 809-814 (1983).
Unter diesem Gesichtspunkt ist klar nicht beabsichtigt, daß die erläuternden Beispiele den Schutzumfang der vorliegenden Erfindung einschränken, und für den Fachmann sind zahlreiche Modifikationen und Variationen denkbar. Als ein Beispiel: Während zu den DNA-Sequenzen, die durch die erläuternden Beispiele gehören, da diese Anmeldung Aminosäuresequenzinformationen vorsieht, die zur Herstellung der DNA-Sequenz wesentlich sind, umfaßt die Erfindung auch solche hergestellten DNA-Sequenzen, wie sie infolge des Wissens um die EPO-Aminosäuresequenzen konstruiert werden können. Diese können für EPO codieren (wie im Beispiel 12), ebenso wie für EPO-Fragmente und kEPO-Polypeptidanaloge(d. i. „EPO-Produkte"), die eine oder mehrere der biologischen Eigenschaften von natürlich auftretendem EPO aufweisen, andere jedoch nicht (oder die andere in unterschiedlichem Grad besitzen).
Die durch die vorliegende Erfindung offengelegten DNA-Sequenzen umfassen somit alle DNA-Sequenzen, die für eine sichere Expression eines Polypeptidproduktes in einer procaryotischen oder eucaryotischen Wirtszelle geeignet sind, wobei dieses Produkt wenigstens einen Teil der primären strukturellen Anordnung und eine oder mehrere der biologischen Eigenschaften von Erythropoietin aufweist und unter folgenden ausgewählt ist:
(a) den in den Tabellen V und Vl aufgeführten DNA-Sequenzen;
(b) DNA-Sequenzen, die zu den unter (a) aufgeführten oder deren Fragmenten hybridisieren; und
(c) DNA-Sequenzen, die, allerdings unter Degenerierung des genetischen Codes, zu den unter (a) und (b) definierten DNA-Sequenzen hybridisieren. In diesem Zusammenhang ist es zum Beispiel bemerkenswert, daß zu erwarten ist, daß existierende allelische Affen- und Human-EPO-Gensequenzen und die Gensequenzen anderer Säugetierarten zu Sequenzen der Tabellen V und Vl oder zu Fragmenten davon hybridisieren. Darüber hinaus wurden auch — allerdings unter Degenerierung des genetischen
Codes — die SCEPO — und ECEPO-Gene und die hergestellten oder mutierten cDNA- oder genomischen DNA-Sequenzen, die verschiedene EPO-Fragmente und -analoge verschlüsseln, ebenfalls zu den oben genannten DNA-Sequenzen hybridisieren. Derartige Hybridisierungen könnten leicht unter den hier beschriebenen Hybridisierungsbedingungen durchgeführt werden im Hinblick auf die anfängliche Isolierung der Affen-und Human-EPO verschlüsselnden DNA oder schärferen Bedingungen, um die Hintergrundhybridisierung gewünschtenfalls zu verringern.
Erfindungsgemäße verbesserte Hybridisierungsmethodologien, die erläuternd auf die obigen DNA/DNA-Hybridisierungsscreenings angewandt wurden, sind gleichfalls auf RNA/RNA- und RNA/DN Α-Screening anwendbar. Mischsondentechniken, wie sie hier erläutert wurden, bestehen allgemein aus einer Anzahl von Verbesserungen bei Hybridisierungsmethoden, die schnellere und zuverlässigere Polynucleotidisolierungen gestatten. Zu diesen vielen einzelnen Verfahrensverbesserungen gehören:
verbesserte Kolonieübertragungs- und -erhaltungsverfahren; Verwendung von Filtern auf Nylinbasis wie Gene-Screen und Gene-Screen-Plus, um mit demselben Filtern ein Re-Sondieren zu gestatten und die Filter wiederholt verwenden zu können. Anwendung neuerProteasebehandlungen [z.B.Taubetal., Anal. Biochem., 126,S.222-230(1982)]; Verwendung von sehr geringen Einzelkonzentrationen (im Bereich von 0,025 picomol) einer größeren Anzahl von Mischsonden (z.B. die über 32 liegenden Zahlen); und Durchführung von Hybridisierungs- und Nachhybridisierungsschritten unter strengen Temperaturen, die in der Nähe (d. i. innerhalb 40C und vorzugsweise innerhalb 2°C entfernt von) der niedrigsten berechneten Dissoziätionstemperatur einer beliebigen der eingesetzten Mischsonden liegt. Die Verbesserungen führen gemeinsam zu Ergebnissen, die von vornherein nicht zu erwarten gewesen sind. Verstärkt wird dies durch die Tatsache unterstrichen, daß Mischsondenverfahren mit der vierfachen Zahl der Sonden, über die je bisher als erfolgreich eingesetzt in gleichen cDNA-Screens von Boten-RNA-spezies relativ geringer Menge berichtet wurde, erfolgreich für die Isolierung eines einzelnen Gens in einer Genbibliothek unter Screenen von 1500000 Phagenplaques angewandt wurden. Dies wurde erreicht im wesentlichen entgegen der von Anderson et al., siehe oben, publizierten Auffassung, daß Mischsondenscreeningverfahren ...für die Isolierung von Säugetierproteingenen untunlich sind, wenn die entsprechenden RNA's nicht erhältlich sind. Die in der vorangegangenen Beschreibung, in den folgenden Patentansprüchen und/oder in den dazugehörigen Zeichnungen offenbarten Merkmale können sowohl getrennt voneinander als auch in Kombination Grundlage für die Realisierung der Erfindung in ihren diversen Formen sein.

Claims (4)

    Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz in einer heterogenen zellulären oder viralen Probe einschließlich multipler einzelsträngiger Polynucleotide, gekennzeichnet dadurch, daß « (a) ein Gemisch markierter einzelsträngiger Polynucleotidsonden mit gleichmäßig variierenden Sequenzen der Basen hergestellt wird, wobei jede der Sonden potentiell einer Sequenz von Basen komplementär ist, die zu dem zu bestimmenden Polynucleotid das vermeintlich nur einmal existierende Exemplar ist; (b) die Probe auf ein festes Substrat fixiert wird; (c) das Substrat mit der darauf fixierten Probe behandelt wird, um eine weitere Bindung von Polynucleotiden darauf abzuschwächen, ausgenommen durch Hybridisierung zu Polynucleotiden in der Probe; (d) das behandelte Substrat mit der darauf fixierten Probe flüchtig mit dem genannten Gemisch markierter Sonden unter Bedingungen in Berührung gebracht wird, die nur die Hybridisierung zwischen vollständig komplementären Polynucelotiden erleichtern; und (e) das spezifische Polynucleotid über die Beobachtung des Auftretens einer Hybridisierungsreaktion zwischen ihm und einer vollständig komplementären Sonde aus dem Gemisch der markierten Sonden bestimmt wird, was durch das Auftreten einer höheren Dichte des markierten Materials auf dem Substrat am Ort des spezifischen Polynucleotide im Vergleich zu einer Hintergrunddichte an markiertem Material, die sich aus dem nichtspezifischen Binden markierter Sonden an das Substrat ergibt, angezeigt wird, wobei die Verbesserung darin besteht, daß die Verwendung von 32 Mischsonden im Überschuß erfolgt und eines oder mehrere der folgenden Merkmale auftreten.
  1. (1) Einsatzeines Papiers auf Nylonbasis als festes Substrat;
  2. (2) Behandlung mit einer Protease in Stufe (c);
  3. (3) Einsatz individuell markierter Sondenkonzentrationen von annähernd 0,025Picomol; und
  4. (4) Einsatz als einer der Hybridisierungsbedingungen in Stufe (d) strenge Temperaturen, die nahe bei . 4°C von der niedrigsten berechneten Td irgendeiner der verwendeten Sonden liegen.
DD30037687A 1984-09-28 1987-03-02 Verfahren zur bestimmung eines spezifischen einzelstraengigen polynuclebtids unbekannter sequenz DD255359A5 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US65584184A 1984-09-28 1984-09-28

Publications (1)

Publication Number Publication Date
DD255359A5 true DD255359A5 (de) 1988-03-30

Family

ID=24630601

Family Applications (1)

Application Number Title Priority Date Filing Date
DD30037687A DD255359A5 (de) 1984-09-28 1987-03-02 Verfahren zur bestimmung eines spezifischen einzelstraengigen polynuclebtids unbekannter sequenz

Country Status (3)

Country Link
DD (1) DD255359A5 (de)
LT (1) LT4012B (de)
UA (1) UA54363C2 (de)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US439443A (en) 1890-10-28 Back-band buckle
US483451A (en) 1892-09-27 Waterproof composition
US4264731A (en) 1977-05-27 1981-04-28 The Regents Of The University Of California DNA Joining method
US4273875A (en) 1979-03-05 1981-06-16 The Upjohn Company Plasmid and process of isolating same
US4293652A (en) 1979-05-25 1981-10-06 Cetus Corporation Method for synthesizing DNA sequentially
CA1180647A (en) 1981-07-17 1985-01-08 Cavit Akin Light-emitting polynucleotide hybridization diagnostic method
EP0071685A3 (de) 1981-08-12 1983-06-15 Olaf Soot Verfahren und Vorrichtung zum Handhaben von Kernbrennstoffelementen
IL68561A (en) 1982-05-05 1991-01-31 Genentech Inc Preparation of polypeptide with human tissue plasminogen activator function,processes for making it,and dna and transformed cell intermediates thereof
US6936694B1 (en) 1982-05-06 2005-08-30 Intermune, Inc. Manufacture and expression of large structural genes

Also Published As

Publication number Publication date
LTIP1836A (en) 1995-08-25
LT4012B (en) 1996-08-26
UA54363C2 (uk) 2003-03-17

Similar Documents

Publication Publication Date Title
US4703008A (en) DNA sequences encoding erythropoietin
DE69034171T2 (de) Rekombinanter Proteaseinhibitor des Alzheimer-Amyloid-Proteins
US5441868A (en) Production of recombinant erythropoietin
US5547933A (en) Production of erythropoietin
EP0409113B1 (de) Muteine des menschlichen Erythropoetins, ihre Herstellung und ihre Verwendung
DE3111405C2 (de)
EP0986644B1 (de) Herstellung von erythropoietin durch endogene genaktivierung mit viralen promotoren
DD212982A5 (de) Verfahren zur herstellung von rinder-wachstumshormon-aehnlichen polypeptiden
CH681080A5 (de)
DE2848052A1 (de) Synthetische dna und verfahren zu ihrer herstellung
DE2848053A1 (de) Synthetische dna und verfahren zu ihrer herstellung
DE2848051A1 (de) Synthetische dna und verfahren zu ihrer herstellung
DD297188A5 (de) Gm-csf und il-3 umfassende fusionsproteine
DD219505A5 (de) Verfahren zur herstellung von schweine-wachstumshormonaehnlichen polypeptiden
AT389892B (de) Dna-sequenz mit einem gen, das fuer human-interleukin-2 codiert
DD202045A5 (de) Verfahren zum klonieren einer deoxynucleotidsequenz
DE69233155T2 (de) Insulinartigen wachstumsfaktor bindendes protein
DD255359A5 (de) Verfahren zur bestimmung eines spezifischen einzelstraengigen polynuclebtids unbekannter sequenz
DD251786A5 (de) Verfahren zur Herstellung eines Polypeptids
RU2261276C2 (ru) Выделенная молекула днк, кодирующая эритропоэтин человека, (варианты), экспрессирующий плазмидный или вирусный днк-вектор, гликопротеид эритропоэтин (варианты) и способ его получения, фармацевтическая композиция (варианты), линия клеток млекопитающего (варианты)
CA1341607C (en) Production of erythropoietin
DD257271A1 (de) Verfahren zur herstellung von menschlichem wachstumshormon (somatotropin)
AU4252400A (en) Production of erythropoietin
SK279959B6 (sk) Sekvencia dna, plazmid, vektor, hostiteľská bunka,
DD251788A5 (de) Verfahren zur Herstellung eines menschlichen cDNA-Klons

Legal Events

Date Code Title Description
IF04 In force in the year 2004

Expiry date: 20050620