DD255359A5 - METHOD FOR DETERMINING A SPECIFIC SINGLE-TERM POLYNUCLEBIDE OF UNKNOWN SEQUENCE - Google Patents

METHOD FOR DETERMINING A SPECIFIC SINGLE-TERM POLYNUCLEBIDE OF UNKNOWN SEQUENCE Download PDF

Info

Publication number
DD255359A5
DD255359A5 DD30037687A DD30037687A DD255359A5 DD 255359 A5 DD255359 A5 DD 255359A5 DD 30037687 A DD30037687 A DD 30037687A DD 30037687 A DD30037687 A DD 30037687A DD 255359 A5 DD255359 A5 DD 255359A5
Authority
DD
German Democratic Republic
Prior art keywords
dna
probes
sequence
hybridization
erythropoietin
Prior art date
Application number
DD30037687A
Other languages
German (de)
Inventor
Fu-Kuen Lin
Original Assignee
Kirin-Amgen Inc.,Us
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kirin-Amgen Inc.,Us filed Critical Kirin-Amgen Inc.,Us
Publication of DD255359A5 publication Critical patent/DD255359A5/en

Links

Abstract

Verfahren zur Bestimmung eines spezifischen einzelstraengigen Polynucleotids unbekannter Sequenz in einer heterogenen zellulaeren oder viralen Probe einschliesslich multipler einzelstraengiger Polynucleotide, gekennzeichnet dadurch, dass (a) ein Gemisch markierter einzelstraengiger Polynucleotidsonden mit gleichmaessig variierenden Sequenzen der Basen hergestellt wird, wobei jede der Sonden potentiell einer Sequenz von Basen komplementaer ist, die zu dem zu bestimmenden Polynucleotid das vermeintlich nur einmal existierende Exemplar ist; (b) die Probe auf ein festes Substrat fixiert wird; (c) das Substrat mit der darauf fixierten Probe behandelt wird, um eine weitere Bindung von Polynucleotiden darauf abzuschwaechen, ausgenommen durch Hybridisierung zu Polynucleotiden in der Probe; (d) das behandelte Substrat mit der darauf fixierten Probe fluechtig mit dem genannten Gemisch markierter Sonden unter Bedingungen in Beruehrung gebracht wird, die nur die Hybridisierung zwischen vollstaendig komplementaeren Polynucleotiden erleichtern; und (e) das spezifische Polynucleotid ueber die Beobachtung des Auftretens einer Hybridisierungsreaktion zwischen ihm und einer vollstaendig komplementaeren Sonde aus dem Gemisch der markierten Sonden bestimmt wird.A method for the determination of a specific single-stranded polynucleotide of unknown sequence in a heterogeneous cellular or viral sample including multiple single-stranded polynucleotides, characterized in that (a) a mixture of labeled single-stranded polynucleotide probes with equally varying sequences of the bases is prepared, each of the probes potentially forming a sequence of Bases is complementary, which is the alleged only once existing copy to the polynucleotide to be determined; (b) fixing the sample on a solid substrate; (c) treating the substrate with the sample fixed thereon to attenuate further binding of polynucleotides thereto, except by hybridization to polynucleotides in the sample; (d) contacting the treated substrate with the sample fixed thereon in a volatile manner with said mixture of labeled probes under conditions which only facilitate hybridization between fully complementary polynucleotides; and (e) determining the specific polynucleotide by observing the occurrence of a hybridization reaction between it and a completely complementary probe from the mixture of labeled probes.

Description

Hierzu 4 Seiten ZeichnungenFor this 4 pages drawings

Anwendungsgebiet der ErfindungField of application of the invention

Die Erfindung betrifft ein Verfahren zur Herstellung eines Polypeptids. Allgemein bezieht sich die Erfindung auf die Manipulation genetischer Materialien, insbesondere auf rekombinante Verfahren, die die Herstellung von Polypeptiden ermöglichen, die teilweise oder insgesamt die primäre strukturelle Anordnung aufweisen und/oder eine oder mehrere der biologischen Eigenschaften natürlich vorkommenden Erythropoietins.The invention relates to a method for producing a polypeptide. In general, the invention relates to the manipulation of genetic materials, in particular to recombinant methods that enable the production of polypeptides that have partial or total primary structural organization and / or one or more of the biological properties of naturally occurring erythropoietin.

Charakteristik der bekannten technischen LösungenCharacteristic of the known technical solutions

A. Manipulation von genetischen MaterialienA. Manipulation of genetic materials

Genetische Materialien können weitgehend als jene chemischen Substanzen definiert werden, die für die Herstellung von Zellbestandteilen und Viren programmieren und diese Vorgänge lenken und die Reaktion von Zellen und Viren ausrichten. Eine langkettige polymere Substanz, die als Desoxyribonucleinsäure (DNA) bekannt ist, enthält das genetische Material aller lebenden Zellen und Viren, mit Ausnahme bestimmter Viren, die durch die Rebonucleinsäuren (RNA) programmiert werden. Die wiederkehrenden Einheiten in DNA-Polymeren sind vier unterschiedliche Nucleotide, wobei jedes von ihnen entweder aus einem Purin (Adenin oder Guanin) oder einem Pyrimidin (Thymin oder Cytosin) besteht, gefunden an einen Desoxyribosezucker, an den eine Phosphatgruppe angefügt ist. Die Anfügung von Nucleotiden in linearer Form erfolgt über die Fusion 5'-Phosphates eines Nucleotidsan die 3'-Hydroxy-Gruppe eines anderen. Funktionelle DNA tritt in Form stabiler doppelsträngiger Zusammenlagerungen einzelsträngiger Nucleotide auf (bekannt als Desoxyoligonucleotide), wobei sich diese Zusammenlagerungen durch Wasserstoffbindung zwischen Purin- und Pyrimidinbasen ergeben (z. B. „komplementäre" Zusammenlagerungen, die entweder zwischen Adenin [A] und Thymin [T] oder Guanin [G] und Cytosin [C] bestehen). Durch Übereinkommen werden die Nucleotide durch die Namen ihrer konstitutionellen Purin- oder Pyrimidinbasen bezeichnet, und die komplementären Zusammenlagerungen der Nucleotide in der doppelsträngigen DNA (z. B. -A-T und G-C) werden als „Basenpaare" bezeichnet. Ribonucleinsäure ist ein Polynucleotid, bestehend aus Adenin, Guanin, Cytosin und Uracil (U) anstelle von Thymin, gebunden an Ribose und eine Phosphatgruppe.Genetic materials can be broadly defined as those chemical substances that program and direct the production of cellular components and viruses, and direct the response of cells and viruses. A long-chain polymeric substance known as deoxyribonucleic acid (DNA) contains the genetic material of all living cells and viruses, with the exception of certain viruses programmed by the Rebonucleic Acids (RNA). The repeating units in DNA polymers are four different nucleotides, each of which consists of either a purine (adenine or guanine) or a pyrimidine (thymine or cytosine) found on a deoxyribose sugar to which a phosphate group is attached. The attachment of nucleotides in linear form is via the fusion of 5'-phosphates of one nucleotide to the 3'-hydroxy group of another. Functional DNA occurs in the form of stable double-stranded assemblies of single-stranded nucleotides (known as deoxyoligonucleotides) resulting from hydrogen bonding between purine and pyrimidine bases (eg, "complementary" assemblages found between either adenine [A] and thymine [T By convention, the nucleotides are designated by the names of their constitutional purine or pyrimidine bases, and the complementary aggregations of the nucleotides in the double-stranded DNA (eg, -AT and GC). are called "base pairs". Ribonucleic acid is a polynucleotide consisting of adenine, guanine, cytosine and uracil (U) instead of thymine attached to ribose and a phosphate group.

Zusammengefaßt wird die programmierende Funktion der DNA im allgemeinen durch einen Prozeß bewirkt, bei dem spezifische DNA-Nucleotidsequenzen (Gene) in relativ instabile Boten-RNA (mRNA)-Polymere „transcribiert" werden. Die mRNA dient umgekehrt als eine Schablone für die Bildung struktureller, regulierender und katalytischer Proteine aus Aminosäuren. Zu diesem mRNA-„Translations"prozeß gehören die Operationen kleiner RNA-Stränge (tRNA), die einzelne Aminosäuren am mRNA-Strang entlang transportieren und ausrichten, um die Bildung von Polypeptiden in einwandfreier Aminosäurefolge zu ermöglichen. Die mRNA-„Botschaft", abgeleitet aus der DNA und die Basis für die tRNA-Unterstützung bildend und die Orientierung jeder gegebenen der zwanzig Aminosäuren für die Polypeptid-„Expression", liegt in Form von Dreifach-„Lodons" vor — aufeinanderfolgende Gruppierungen der drei Nucleotidbasen. In diesem Sinne ist die Bildung eines Proteins die letzte Form der „Expression" der programmierten genetischen Botschaft, die in der Nucleotidsequenz eines Gens vorliegt. „Promotor"-DNA-Sequenzen gehen üblicherweise einem Gen in einem DNA-Polymeren, „voraus" und sehen eine Stelle für die Initiierung der Transskription in mRNA vor. „Regulator"-DNA-Sequenzen, auch üblicherweise oberhalb (upstream) des (z.B. vorausgehenden) Gens in ein einem gegebenen DNA-Polymeren, binden Proteine, die die Frequenz (oder Rate) der Transkriptionsinitiierung bestimmen.In summary, the programming function of DNA is generally accomplished by a process in which specific DNA nucleotide sequences (genes) are "transcribed" into relatively unstable messenger RNA (mRNA) polymers, conversely, which serves as a template for the formation of structural amino acid regulatory and catalytic proteins. This mRNA "translation" process involves the operation of small RNA strands (tRNA) that transport and align single amino acids along the mRNA strand to allow the formation of polypeptides in proper amino acid sequence. The mRNA "message", derived from the DNA and forming the basis for tRNA support and the orientation of any given one of the twenty amino acids for polypeptide "expression", is in the form of triple "lodons" - successive moieties of the three nucleotide bases In this sense, the formation of a protein is the last form of "expression" of the programmed genetic message present in the nucleotide sequence of a gene. "Promoter" DNA sequences usually "precede" a gene in a DNA polymer and provide a site for initiation of transcription into mRNA. "Regulator" DNA sequences, also usually upstream of the (e.g., precursor) gene in a given DNA polymer, bind proteins that determine the rate (or rate) of transcription initiation.

Gemeinsam als „Promotor/Regulator"- oder „Steuerungs"-DNA-Sequenz bezeichnet, arbeiten diese Sequenzen, die einem ausgewählten Gen (oder eine Reihe von Genen) in einem funktionellen DNA-Polymeren vorausgehen, zusammen, um zu bestimmen, ob die Transskription (und eventuell Expression) eines Gens stattfindet. DNA-Sequenzen, die einem Gen in einem DNA-Polymeren „folgen" und ein Signal für die Beendigung der Transkription in mRNA vorsehen, werden als Transkriptions„terminator"-Sequenzen bezeichnet.Commonly referred to as a "promoter / regulator" or "control" DNA sequence, these sequences, which precede a selected gene (or set of genes) in a functional DNA polymer, work together to determine whether transcription (and eventually expression) of a gene takes place. DNA sequences "following" a gene in a DNA polymer and providing a signal for cessation of transcription into mRNA are referred to as transcriptional terminator sequences.

Brennpunkt mikrobiologischer Verfahren war im letzten Jahrzehnt der Versuch zur Herstellung industriell und pharmazeutisch bedeutsamer Substanzen unter Verwendung von Organismen, die entweder anfänglich keine genetisch codierte Information hinsichtlich des gewünschten Produktes in ihrer DNA enthielten oder (im Falle menschlicher Zellen in Kultur) gewöhnlich kein chromosomales Gen mit entsprechenden Gehalten exprimieren. Vereinfacht dargestellt, wird ein Gen, das die Struktur eines gewünschten Polypeptidproduktes spezifiziert, entweder aus einem „Spender" („Donor")-organismus isoliert oder chemisch synthetisiert und dann stabil in einen anderen Organismus eingeführt, der vorzugsweise ein selbstreplizierender, vielzelliger Organismus wie Bakterien-, Hefe- oder Säugetierzellen in Kultur ist. Wenn dies einmal erfolgt ist, wird der vorhandene Mechanismus für die Genexpression in den „transformierten" oder „transferierten" mikrowellen Wirtszellen dazu benutzt, das gewünschte Produkt zu konstruieren, unter Verwendung der exogenen DNA als eine Schablone für die Transkription von mRNA, die dann in eine kontinuierliche Sequenz von Aminosäureresten translatiert wird.The focus of microbiological processes in the last decade has been the attempt to produce industrially and pharmaceutically significant substances using organisms which either initially did not contain genetically encoded information regarding the desired product in their DNA or (in the case of human cells in culture) usually no chromosomal gene express corresponding levels. Simplified, a gene that specifies the structure of a desired polypeptide product is either isolated from a "donor" organism or chemically synthesized and then stably introduced into another organism, preferably a self-replicating, multicellular organism such as bacteria , Yeast or mammalian cells in culture. Once this has been done, the existing mechanism for gene expression in the "transformed" or "transferred" microwell host cells is used to construct the desired product using the exogenous DNA as a template for the transcription of mRNA which is then expressed in a continuous sequence of amino acid residues is translated.

Aus dem Stand der Technik gibt eine zahlreiche Patent- und Literaturpublikation zu „rekombinanter DNA"-Technik hinsichtlich Isolierung, Synthese, Reinigung und Amplifizierung genetischer Materialien zur Verwendung bei der Transformation ausgewählter Wirtsorganismen. So betrifft beispielsweise die US-PS 4237224 (Cohen et al.) die Transformation einzelliger Wirtsorganismen mit „Hybrid"-viraler oder ringförmiger Plasmid-DNA, wozu ausgewählte exogene DNA-Sequenzen gehören. Zu den Verfahrensweisen des Cohen-Patents gehört die Herstellung eines Transformationsvektors durch enzymatisches Schneiden viraler oder ringförmiger Plasmid-DNA, um lineare DNA-Stränge zu bilden. Ausgewählte fremde („exogene" oder „heterologe") DNA-Stränge, zu denen üblicherweise Sequenzen, die für das gewünschte Produkt codieren, gehören, werden in linearer Form durch die Verwendung ähnlicher Enzyme hergestellt. Die lineare virale oder Plasmid-DNA wird mit der fremden DNA in Anwesenheit ligierender Enzyme inkubiert, die in der Lage sind, einen Wiederherstellungsprozeß zu bewirken, und es werden „Hybrid"-Vektoren gebildet, zu denen das ausgewählte exogene DNA-Segment gehört', „gespleißt" in das virale oder kreisförmige DNA-Plasmid.A number of patent and literary publications on recombinant DNA technology for the isolation, synthesis, purification, and amplification of genetic materials for use in the transformation of selected host organisms are in the art, for example, U.S. Patent 4,237,224 (Cohen et al. ) the transformation of unicellular host organisms with "hybrid" viral or circular plasmid DNA, including selected exogenous DNA sequences. Among the procedures of the Cohen patent is the preparation of a transformation vector by enzymatic cutting of viral or circular plasmid DNA to form linear DNA strands. Selected foreign ("exogenous" or "heterologous") DNA strands, which usually include sequences encoding the desired product, are prepared in linear form through the use of similar enzymes. The linear viral or plasmid DNA is incubated with the foreign DNA in the presence of ligating enzymes capable of effecting a recovery process, and "hybrid" vectors are formed, including the selected exogenous DNA segment, "Spliced" into the viral or circular DNA plasmid.

Die Transformation von kompatiblen einzelligen Wirtsorganismen mit dem Hybridvektor führt zur Bildung von vervielfachten Kopien der exogenen DNA in der Wirtszellenpopulation. In vielen Fällen ist das erwünschte Ergebnis einfach die Amplifizierung der Fremd-DNA, und das gewonnene „Produkt" ist die DNA. Kürzlich wurde darüber berichtet, daß das Endziel der Transformation die Expression durch die Wirtszellen der exogenen DNA in Form einer Synthese im Großmaßstab von isolierbaren Mengen kommerziell bedeutender, dafür codierender Protein- oder Polypeptidfragmente durch die Fremd-DNA ist, siehe auch z. B. US-PS 4264731 (Shine), 4273875 (Manis), 4293652 (Cohen) und EP-OS 093619, veröffentlicht am 9. November 1983.Transformation of compatible unicellular host organisms with the hybrid vector results in the production of replicated copies of the exogenous DNA in the host cell population. In many cases, the desired result is simply the amplification of the foreign DNA, and the recovered "product" is the DNA. It has recently been reported that the ultimate goal of the transformation is the expression by the host cells of the exogenous DNA in the form of a large-scale synthesis of isolatable amounts of commercially significant, coding therefor protein or polypeptide fragments by the foreign DNA, see also, for example, US Patent 4264731 (Shine), 4273875 (Manis), 4293652 (Cohen) and EP-OS 093619, published on 9 November 1983.

Die Entwicklung spezifischer DNA-Sequenzen für das Spleißen in DNA-Vektoren erreicht man über eine Vielzahl von Techniken, abhängig im großen Maße vom Grad der „Fremdheit" des „Donors" zum vorgesehenen Wirt und der Größe des im Wirt zu exprimierenden Polypeptids. Zur Gefahr der Über-Vereinfachung kann festgestellt werden, daß drei alternative prinzipielle Methoden eingesetzt werden können: (1) die „Isolierung" derdoppelsträngigen DNA-Sequenz aus der genomischen DNA des Donors; (2) die chemische Herstellung einer DNA-Sequenz, die einen Code für ein Polypeptid von Interesse aufweist; und (3) die in vitro-Synthese einer doppelsträngigen DNA-Sequenz durch enzymatische „reverse Transskription" von mRNA, die aus Donorzellen isoliert worden ist. Die letztgenannten Methoden, zu denen die Bildung eines DNA-„Komplements" von mRNA gehört, werden allgemein als „cDNA"-Methoden bezeichnet.The development of specific DNA sequences for splicing into DNA vectors is accomplished via a variety of techniques, largely depending on the degree of "foreignness" of the "donor" to the intended host and the size of the polypeptide to be expressed in the host. On the danger of over-simplification, it can be stated that three alternative principal methods can be used: (1) the "isolation" of the double-stranded DNA sequence from the genomic DNA of the donor; (2) the chemical production of a DNA sequence containing a And (3) the in vitro synthesis of a double-stranded DNA sequence by enzymatic "reverse transcription" of mRNA isolated from donor cells. The latter methods, which include the formation of a DNA "complement" of mRNA, are commonly referred to as "cDNA" methods.

Die Herstellung von DNA-Sequenzen wurde kürzlich als Methode der Wahl bezeichnet, wenn die gesamte Sequenz der Aminosäurereste des gewünschten Polypeptidproduktes bekannt ist. DNA-Herstellungsverfahren von der ebenfalls zugeeigneten, anhängigen US-Patentanmeldung Nr. 483481 von Alton et al. (eingereicht am 15. April 1983 und korrespondierend zu PCT US83/00605, veröffentlicht am 24. November 1983 als WO 83/04053 sehen, beispielsweise weiterführende Mittel vor zur Erreichung solcher höchst wünschenswerter Ergebnisse wie: Vorsehen von alternierenden Codons, die kürzlich in Genen gefunden wurden, die in hohem Maße in den für die Expression ausgewählten Wirtsorganismen exprimiert werden (z. B. Vorsehen von Hefe- oder Ecoli-„Vorzugs"codons! Vermeiden der Anwesenheit untranslatierter „Intron"-Sequenzen (üblicherweise in menschlichen genomischen DNA-Sequenzen und mRNA-Transskripten davon), die nicht leicht durch procaryotische Wirtszellen verarbeitet werden; Vermeiden der Expression unerwünschter „Ieader"-Popypeptidsequenzen, die üblicherweise dafür codieren, durch genomische DNA- und cDNA-Sequenzen, jedoch letztens nicht leicht von dem interessierenden Polypeptid durch bakterielle oder Hefe-Wirtszellen abgespalten werden; Vorsehen einer leichten Insertion der DNA in geeignete Expressionsvektoren in Zusammenlagerung mit gewünschten Promoter/Regulator- und Terminator-Sequenzen; und Vorsehen einer leichten Konstruktion von Genen, die für Polypeptidfragmente codieren und Analoge der gewünschten Polypeptide.The production of DNA sequences has recently been termed the method of choice when the entire sequence of amino acid residues of the desired polypeptide product is known. DNA production method of the co-pending, co-pending U.S. Patent Application No. 483481 to Alton et al. (filed on April 15, 1983 and corresponding to PCT US83 / 00605, published November 24, 1983 as WO 83/04053 see, for example, further means of achieving such highly desirable results as: providing alternating codons recently found in genes Avoiding the presence of untranslated "intron" sequences (commonly found in human genomic DNA sequences and, for example, in human genomic DNA sequences, which are highly expressed in the host organisms selected for expression (e.g., provision of yeast or ecoli "preferred" codons) mRNA transcripts thereof) that are not readily processed by procaryotic host cells; avoiding the expression of unwanted "leader" polypeptide sequences, which are commonly encoded by genomic DNA and cDNA sequences, but not recently readily by the bacterial or polypeptide of interest Cleaved from yeast host cells, providing a slight insertion of the D NA into suitable expression vectors in association with desired promoter / regulator and terminator sequences; and providing a lightweight construction of genes encoding polypeptide fragments and analogs of the desired polypeptides.

• -3- 255 3B9• -3- 255 3B9

Wenn die gesamte Sequenz der Aminosäurereste der gewünschten Polypeptide nicht bekannt ist, ist die direkte Herstellung der DNA-Sequenzen nicht möglich, und die Isolierung von DNA-Sequenzen, die für das Polypeptid codieren, durch eine cDNA-Methode wird die Methode der Wahl, ungeachtet der potentiellen Rückgänge im Spielraum der Gruppe von Expressionsvektoren, die in der Lage sind, einen hohen Grad der mikrowellen Expression, über die oben berichtet wurde, zu verwirklichen. Zu den Standardverfahren zur Isolierung von interessierenden cDNA-Sequenzen gehört die Bereitung von Plasmid-geborenen cDNA-„Bibliotheken", abgeleitet von reverser Transskription von mRNA, reich an Donorzellen, ausgewählt als verantwortlich für einen hohen Grad an Expression von Genen (z. B. Bibliotheken von cDNA, abgeleitet von Hypophysenzellen, die relativ große Mengen an Wachstumshormonprodukten exprimieren. ;If the entire sequence of amino acid residues of the desired polypeptides is not known, direct production of the DNA sequences is not possible, and the isolation of DNA sequences encoding the polypeptide by a cDNA method becomes the method of choice, regardless the potential decreases in scope of the set of expression vectors capable of realizing a high level of microwave expression reported above. Standard methods for isolating cDNA sequences of interest include the preparation of plasmid-derived cDNA "libraries" derived from reverse transcription of mRNA rich in donor cells selected to be responsible for a high level of expression of genes (e.g. Libraries of cDNA derived from pituitary cells expressing relatively large amounts of growth hormone products.

Wo wesentliche Mengen der Aminosäuresequenzen des Polypeptids bekannt sind, können markierte, einzelsträngige DNA-Sondierungssequenzen eingesetzt werden, die eine vermutlich in der „Target"-cDNA vorhandene Sequenz duplizieren, in DNA/DNA-Hybridisierungsverfahren eingesetzt werden, die auf klinierten Kopien der cDNA durchgeführt werden, die in eine einzelsträngige Form abgebaut worden waren (siehe allgemein die Offenbarung und die Diskussion des Standes der Technik in der US-PS 4394443 von Weissman et al. und die kürzlich erfolgte Demonstration der Verwendung von langen Oligonucleotidhybridisierungssonden, die von Wallace et al. in Nuc. Acids Res. 6, S. 3543-3557 [1979] und Reyes et al. in P.N.A.S. [USA], 79, S.3270-3274 [1982] und Jaye et al in Nuc. Acids Res. 11, S. 2325-2335 [1983] berichtet wurden. Siehe auch US-PA 4358535 [Falkow et al.], die sich auf die DNA/DNA-Hybridisierungsverfahren zur Bewirkung der Diagnose bezieht; veröffentlichte Europäische Patentanmeldungen Nr.0070685 und 0070687, die die leicht-emittierenden Markierungen an einzelsträngigen Polynucleotidsonden betreffen; Davis et al. „A Manual for Genetic Engineering, Advanced Bacterial Genetics" [Handbuch der Gentechnik, Fortschritte bakterieller genetischer Methoden], Cold Spring Harbor Laboratory, Cold Spring Harbor, N. Y. [1980], Seiten 55-58 und 174-176, betreffend die Kolonie- und Plaque-Hybridisierungstechniken; sowie New England Nuclear [Boston, Mass.] Broschüren für „Gene Screen" Hybridisierungs-Transfermembranmaterialien mit Anweisungen für den Transfer und die Hybridisierung von DNA und RNA, Katalog Nr. NEF-972).Where substantial amounts of the amino acid sequences of the polypeptide are known, labeled single-stranded DNA probing sequences can be used which duplicate a sequence presumably present in the "target" cDNA in DNA / DNA hybridization procedures performed on cloned copies of the cDNA which have been degraded into a single-stranded form (see in general the disclosure and discussion of prior art in Weissman et al., U.S. Patent 4,344,443, and the recent demonstration of the use of long oligonucleotide hybridization probes described by Wallace et al. in Nuc. Acids Res. 6, pp. 3543-3557 [1979] and Reyes et al., in PNAS [USA], 79, pp. 3270-3274 [1982] and Jaye et al in Nuc. Acids Res. 11, p See, also, U.S. Patent No. 4,358,535 [Falkow et al.], Which relates to DNA / DNA hybridization methods for effecting diagnosis; Published European Patent Applications No. 2325-2335 [1983]. 0070685 and 0070687 concerning the light-emitting labels on single-stranded polynucleotide probes; Davis et al. "A Manual for Genetic Engineering, Advanced Bacterial Genetics", Cold Spring Harbor Laboratory, Cold Spring Harbor, NY [1980], pages 55-58 and 174-176, for colony and blood Plaque hybridization techniques; and New England Nuclear [Boston, Mass.] Brochures for "Gene Screen" hybridization transfer membrane materials with instructions for the transfer and hybridization of DNA and RNA, Catalog No. NEF-972).

Zu den bedeutendsten Fortschritten der letzten Zeit bei Hybridisierungsverfahren für das Screening rekombinanter Klone gehört die Verwendung markierter gemischter synthetischer Oligonucleotidsonden, von denen jede potentiell das vollständige Gegenstück einer spezifischen DNA-Sequenz in der Hybridisierungsprobe einschließlich eines heterogenen Gemisches einzelsträngiger DNA's oder RNA's ist. Diese Verfahrensweisen wurden als besonders nützlich bei der Feststellung von cDNA-Klonen bestätigt, die aus solchen Quellen stammten, die extrem niedrige Mengen an mRNA-Sequenzen für die interessierenden Polypeptide zulassen. Zusammengefaßt, die Verwendung von scharfen Hybridisierungsbedingungen, die auf das Vermeiden nichtspezifischer Bindungen gerichtet ist, kann z. B. für die autoradiografische Sichtbarmachung eines spezifischen cDNA-Klons für den Fall der Hybridisierung der Target-DNA zu dieser einzelnen Sonde innerhalb des Gemisches, das deren vollständiges Gagenstück ist, gestatten. Siehe dazu allgemein Wallace et al., Nucl. Acids Res. 9, S. 879-897 (1981); Suggs et al., P.N.A.S. (USA), 78 S. 6613-6617 (1981); Choo et al.. Nature, 299, S. 178-180 (1982); Kurachi et al., P.N.A.S. (USA), 79, S. 6461-6464 (1982); Ohkubo et al., P.N.A.S. (USA) 80, S.2196-2200 (1983); und Kornblihtt et al., P.N.A.S. (USA) 80, S. 3218-3222 (1983). Allgemein wurden die gemischten Sondenverfahren von Wallace et al. (1981), s. o. von verschiedenen Forschern erweitert bis zu dem Punkt, wo zuverlässige Ergebnisse vermutlich erhalten wurden in einer cDNA-Klonisolierung unter Einsatz eines 32teiligen gemischten „Pools" von 16-Basen-langen (16-mer) Oligonucleotidsonden von gleichmäßigen, verschiedenen DNA-Sequenzen zusammen mit einem einzelnen 11-mer, um eineZwei-Stellen„positive"-Bestätigung der Anwesenheit von interessierender cDNAzu bewirken. Siehe dazu Singer-Sam et al., P.N.A.S. (USA), 80, S.802-806 (1983).Among the most significant recent advances in hybridization methods for the screening of recombinant clones is the use of labeled mixed synthetic oligonucleotide probes, each of which is potentially the full complement of a specific DNA sequence in the hybridization probe, including a heterogeneous mixture of single-stranded DNA's or RNA's. These procedures have been found to be particularly useful in detecting cDNA clones derived from such sources as to allow extremely low levels of mRNA sequences for the polypeptides of interest. In summary, the use of harsh hybridization conditions directed to the avoidance of non-specific binding may e.g. For example, for the autoradiographic visualization of a specific cDNA clone in the case of hybridization of the target DNA to this single probe within the mixture which is its complete gag. See generally, Wallace et al., Nucl. Acids Res. 9, pp. 879-897 (1981); Suggs et al., P.N.A.S. (USA), 78 pp. 6613-6617 (1981); Choo et al., Nature, 299, p. 178-180 (1982); Kurachi et al., P.N.A.S. (USA), 79, pp. 6461-6464 (1982); Ohkubo et al., P.N.A.S. (USA) 80, p.2196-2200 (1983); and Kornbluth et al., P.N.A.S. (USA) 80, pp. 3218-3222 (1983). Generally, the mixed probe methods of Wallace et al. (1981), p. o. by various investigators expanded to the point where reliable results were presumably obtained in cDNA clone isolation using a 32-part mixed pool of 16-base-long (16-mer) oligonucleotide probes of uniform, distinct DNA sequences with a single 11-mer to effect a two-site "positive" confirmation of the presence of cDNA of interest. See Singer-Sam et al., P.N.A.S. (USA), 80, p.802-806 (1983).

Die Verwendung von genomischen DNA-Isolaten ist die letzte übliche der drei obengenannten Methoden zur Entwicklung spezieller DNA-Sequenzen für den Einsatz in rekombinanten Verfahren. Dies ist insbesondere richtig auf dem Gebiet der rekombinanten Verfahren, die auf die Sicherung der mikrowellen Expression von Säugetierpolypeptiden gerichtet ist und wird prinzipiell der Komplexizität Säugetier-genomischer DNA gerecht. Während somit zuverlässige Verfahrensweisen für die Entwicklung phagengeborener Bibliotheken genomischer DNA des Menschen und anderer Säugetierspezies entstehen (siehe z. B. Lawn et al.. Cell 15, S. 1157-1174 [1978] hinsichtlich von Verfahren zur Erzeugung einer Human-Genbibliothek, bezeichnet als „Maniatis-Bibliothek"; Kam et al., P.N.A.S. [USA] 77, S. 5172-5176 [1980] hinsichtlich einer Human-Genbibliothek, basierend auf alternativem Restriktionsendonuclease-Fragmentierungsverfahren; und Blattner et al. Science, 196, S. 161-169 [1977], wo die Konstruktion einer Rinder-Genbibliothek beschrieben wird), gibt es relativ wenig erfolgreiche Versuche, bei der Verwendung von Hybridisierungsverfahren zur Isolierung genomischer DNA beim Fehlen umfassender Vorkenntnisse zu Aminosäure- oder DNA-Sequenzen.The use of genomic DNA isolates is the last common of the three above-mentioned methods for the development of specific DNA sequences for use in recombinant methods. This is particularly true in the field of recombinant methods directed to securing microwell expression of mammalian polypeptides and, in principle, does justice to the complexity of mammalian genomic DNA. Thus, while providing reliable procedures for the development of phage-born libraries of human and other mammalian genomic DNA (see, for example, Lawn et al., Cell 15, pp. 1157-1174 [1978] for methods for generating a human gene library Kam et al., PNAS [USA] 77, pp. 5172-5176 [1980] for a human gene library based on alternative restriction endonuclease fragmentation method; and Blattner et al., Science, 196, p. 161-169 [1977], which describes the construction of a bovine gene library), there are relatively few successful attempts to use hybridization techniques to isolate genomic DNA in the absence of extensive prior knowledge of amino acid or DNA sequences.

Als ein Beispiel berichten Fiddesetal., J. Mol. and Appl. Genetics, 1, S. 3-18 [1981] über die erfolgreiche Isolierung eines Gens, das für die alpha-Untereinheit des menschlichen Hypophysenglycoproteinhormons aus der Maniatis-Bibliothek codiert, durch Verwendung einer Sonde mit „voller Länge", eines vollständigen 621-Basenpaar-Fragments einer vorher isolierten cDNA-Sequenz für die alpha-Untereinheit.As an example, Fiddesetal., J. Mol. And Appl. Genetics, 1, pp. 3-18 [1981] reported the successful isolation of a gene encoding the human hypophyseglycoprotein hormone alpha subunit from the Maniatis library by using a full-length probe, a full 621 base pair Fragments of a previously isolated alpha subunit cDNA sequence.

Als ein weiteres Beispiel berichten das et al., P.N.A.S. (USA), 80, S. 1531-1535 (1983) über die Isolierung von menschlichen genomischen Klonen für Human-HLA-DR unter Verwendung eines synthetischen Oligonucleotids mit 175 Basenpaaren. Schließlich berichten Anderson et al., P.N.A.S. (USA), 80, S. 6838-6842 (1983) über die Isolierung eines genomischen Klons für einen Rinderpankreatischen Trypsininhibitor (BPTI) unter Verwendung einer Einzelsonde mit 86 Basenpaaren in der Länge und konstruiert entsprechend der bekannten Aminosäuresequenz des BPTI. Die Autoren beobachten eine Determinierung geringer Aussichten für die Isolierung von mRNA, die geeignet ist für die Synthese einer cDNA-Bibliothek, wegen scheinbar geringer Gehalte an mRNA in anfänglich „targetiertem" Ohrspeicheldrüsen- und Lungengewebsmaterial und lenken dann die Erfolgsaussichten auf die Sondierung einer Gen-Bibliothek unter Verwendung eines Gemisches markierter Sonden mit der Feststellung:As another example, et al., P.N.A.S. (USA), 80, pp. 1531-1535 (1983) for the isolation of human genomic clones for human HLA-DR using a 175 base pair synthetic oligonucleotide. Finally, Anderson et al., P.N.A.S. (USA), 80, pp. 6838-6842 (1983) for the isolation of a genomic clone for a bovine pancreatic trypsin inhibitor (BPTI) using a single probe of 86 base pairs in length and constructed according to the known amino acid sequence of BPTI. The authors observe a determination of low prospects for the isolation of mRNA suitable for the synthesis of a cDNA library, because of apparently low levels of mRNA in initially "targeted" parotid gland and lung tissue, and then direct the chances of success to probing a gene mRNA. Library using a mixture of labeled probes with the statement:

— „Allgemeiner, es wurden Mischsequenz-Oligodesoxynaucleotidsonden verwendet, um Proteingene unbekannter Sequenz aus cDNA-Bibliotheken zu isolieren. Derartige Sonden sind normalerweise Gemische von 8-32 Oligonucleotiden, 14-17 Nucletiden in der Länge, die jede mögliche Codonkombination für eine geringe Streckung (5-6 Reste) der Aminosäuresequenz repräsentieren. Unter strengen Hybridisierungsbedingungen, die nichtkorrekte Basenpaarsonden benachteiligen, sind diese Sonden in der Lage, den Platz spezifischer Gensequenzen in Klonbibliotheken nieder — bis mittelmäßiger Komplexität festzustellen. Dessen ungeachtet weisen Mischsonden wegen ihrer kurzen Länge und Heterogenität oft nicht die Spezifität auf, die für sondierende Sequenzen als Komplex als ein Säugetier-Genom erforderlich- "More generally, mixed sequence oligodeoxynucleotide probes were used to isolate protein genes of unknown sequence from cDNA libraries. Such probes are usually mixtures of 8-32 oligonucleotides, 14-17 nucleotides in length, representing any possible codon combination for a small stretch (5-6 residues) of the amino acid sequence. Under severe hybridization conditions that penalize non-correct base pair probes, these probes are capable of detecting the location of specific gene sequences in low to moderate complexity clone libraries. Nevertheless, because of their short length and heterogeneity, mixing probes often do not have the specificity required for probing sequences as a complex as a mammalian genome

ist. Dies macht ein derartiges Verfahren ungeeignet zur Isolierung von Säugetier-Proteingenen, wenn die entsprechenden mRNA's nicht erhältlich sind."is. This makes such a method unsuitable for isolation of mammalian protein genes if the corresponding mRNAs are not available. "

(Ende des Zitats).(End of quote).

Somit besteht weiterhin ein Bedürfnis, für verbesserte Methoden, die eine schnelle und wirksame Isolierung von cDNA-Klonen in Fällen bewirken, wo nur wenig von der Aminosäuresequenz des dafür codierenden Polypeptids bekannt ist und wo „angereichertes" Gewebematerial von mRNA nicht leicht für den Einsatz bei der Konstruktion von cDNA-Bibliotheken erhältlich ist. Derartige verbesserte Methoden wurden insbesondere dann nützlich sein, wenn sie zur Isolierung von Säugetiergenomischen Klonen einsetzbar wären, wo nur zerstreute Informationen erhältlich sind hinsichtlich der Aminosäuresequenzen der dafür codierenden Polypeptide durch die gesuchten GeneThus, there continues to be a need for improved methods that provide rapid and efficient isolation of cDNA clones in cases where little is known about the amino acid sequence of the polypeptide coding therefor and where "enriched" tissue material of mRNA is not readily available for use Such improved methods would be particularly useful if they were to be useful for the isolation of mammalian genomic clones where only dispersed information is available on the amino acid sequences of the polypeptides coding therefor by the genes of interest

B. Erythropoietin als ein Polypeptid von Interesse B. Erythropoietin as a polypeptide of interest

Erythropoese, die Produktion roter Blutzellen, läuft kontinuierlich während des menschlichen Lebens ab, um den Zellabbau auszugleichen. Die Erythrozytenbildung ist ein sehr genau gesteuerter physiologischer Mechanismus, die es ermöglicht, daß eine ausreichende Anzahl roter Blgtzellen im Blut zur Versorgung des Gewebes mit Sauerstoff verfügbar ist, jedoch nicht so viele, daß die Zellen die Zirkulation behindern würden. Die Bildung von roten Blutzellen erfolgt im Rückenmark und wird von dem Hormon Erythropoietin gesteuert.Erythropoiesis, the production of red blood cells, occurs continuously during human life to compensate for cell degeneration. The erythrocyte formation is a very well-controlled physiological mechanism that allows a sufficient number of red blood cells to be available in the blood to supply the tissue with oxygen, but not so much that the cells would hinder circulation. The formation of red blood cells takes place in the spinal cord and is controlled by the hormone erythropoietin.

Erythropoietin, ein saures Glycoprotein von ungefähr 34000 Dalton Molekülmasse, kann in drei Formen auftreten: α, ßund asialo. Die a- und /3-Formen unterscheiden sich geringfügig in den Carbohydratkomponenten, haben aber die gleiche Wirksamkeit, biologische Aktivität und Molekülmasse. Die asialo-Form ist eine a- oder /3-Form bei der das terminale Carbohydrat (Sialsäure) entfernt ist. Erythropoietin ist in sehr geringen Konzentrationen im Plasma vorhanden, wenn sich der Körper in einem gesunden Zustand befindet, wobei das Gewebe ausreichend Sauerstoff über die Vorhandene Anzahl Erythrozyten hält. Diese normale geringe Konzentration reicht aus, den Ersatz der roten Blutzellen zu stimulieren, die normalerweise durch Alterung ausfallen. .Erythropoietin, an acidic glycoprotein of about 34,000 daltons in molecular weight, can exist in three forms: α, β, and asialo. The a and / or 3 forms differ slightly in the carbohydrate components but have the same efficacy, biological activity and molecular mass. The asialo form is an a- or / 3-form in which the terminal carbohydrate (sialic acid) is removed. Erythropoietin is present in very low concentrations in the plasma when the body is in a healthy state, with the tissue retaining sufficient oxygen over the existing number of erythrocytes. This normal low concentration is sufficient to stimulate the replacement of red blood cells, which usually precipitate through aging. ,

Die Menge an Erythropoietin im Kreislauf steigt unter den Bedingungen von Gewebesauerstoffmangel (Hypoxie), wenn der Sauerstofftransport durch die Blutzellen im Blutkreislauf verringert ist. Hypoxie kann hervorgerufen werden durch Verlust großer Mengen an Blut infolge Hämorrhagie, Zerstörung roter Blutzellen durch Überdosis an Strahlung, Verminderung der Sauerstoffaufnahme in großen Höhen oder durch längere Bewußtlosigkeit oder durch verschiedene Formen der Anämie. Als Erwiderung auf den das Gewebe erleidenden hypoxischen Stress erhöht das Erythropoietin die Produktion roter Blutzellen durch Stimulierung der Umwandlung einfacher Precursor-Zellen im Rückenmark in Proerythroblasten, die später reifen, Hämoglobin synthetisieren und in den Blutkreislauf als rote Blutzellen freigesetzt werden. Wenn die Anzahl der roten Blutzellen im Kreislauf höher als für die normalen Sauerstofferfordernisse des Gewebes benötigt ist, wird das Erythropoietin im Kreislauf verringert. Siehe dazu allgemein. Testa et al., Exp. Hematol., 8 (Suppl.8), 144-152 (1980); Tong et al., J. Biol. Chem., 256 (24), 12666-12672 (1981); Goldwasser, J. Cell. Physiol., 110 (Suppl.1), 133-135 (1982); Finch, Blood, 60 (6), 1241-1246 (1982); Sytowski et al., Expt. Hematol., 8 (Supp.8), 52-64 (1980); Naughton, Ann. CHn. Lab. Sei., 13 (5), 432-438 (1983); Weiss et al., Am. J. vet. Res., 44 (10), 1832-1835 (1983); Lappin et al., Esp. Hematol. 11 (7),661-666 (1983); Bacin et al.,Ann. N. Y. Acad.Sci.,414,66-72 (1983); Murphy et al., Acta Haematologica Japonica,46 (7), 1380-1396 (1983); Dessypris et al., Brit. J. Haematol., 56,295-306 (1984); und Emmanoul et al.. Am. J. Physiol., 247 (1 Pt2), F168-76 (1984).The amount of erythropoietin in the circulation increases under the conditions of tissue oxygen deficiency (hypoxia) when oxygen transport through the blood cells in the bloodstream is reduced. Hypoxia can be caused by loss of large quantities of blood due to hemorrhage, destruction of red blood cells by overdose of radiation, reduction of high levels of oxygen intake or prolonged unconsciousness, or by various forms of anemia. In response to tissue hypoxic stress, erythropoietin increases red blood cell production by stimulating the conversion of simple precursor cells in the spinal cord into pro-erythroblasts that later mature, synthesize hemoglobin, and are released into the bloodstream as red blood cells. If the number of red blood cells in the circulation is higher than required for the normal oxygen requirements of the tissue, the erythropoietin is reduced in the circulation. See in general. Testa et al., Exp. Hematol., 8 (Suppl.8), 144-152 (1980); Tong et al., J. Biol. Chem., 256 (24), 12666-12672 (1981); Gold Water, J. Cell. Physiol., 110 (Suppl.1), 133-135 (1982); Finch, Blood, 60 (6), 1241-1246 (1982); Sytowski et al., Expt. Hematol., 8 (Supp.8), 52-64 (1980); Naughton, Ann. CHn. Lab. Sci., 13 (5), 432-438 (1983); Weiss et al., Am. J. vet. Res., 44 (10), 1832-1835 (1983); Lappin et al., Esp. Hematol. 11 (7), 661-666 (1983); Bacin et al., Ann. N.Y. Acad. Sci., 414, 66-72 (1983); Murphy et al., Acta Haematologica Japonica, 46 (7), 1380-1396 (1983); Dessypris et al., Brit. J. Haematol., 56, 295-306 (1984); and Emmanoul et al. J. Physiol., 247 (1 Pt2), F168-76 (1984).

Da Erythropoietin im Prozeß der roten Blutzellenbildung wesentlich ist, weist das Hormon eine potentiell nützliche Application sowohl bei der Diagnose als auch der Behandlung von Blutkrankheiten auf, die durch eine niedrige oder gestörte rote Blutzellenproduktion gekennzeichnet sind. Siehe dazu allgemein Pennathur-Dasetal., Blood, 63(5), 1168-71 (1984) und Haddy, am. Jour. Ped. Hematol./Oncol, 4,191-196 (1982), die sich auf Erythroproietin für mögliche Therapien der Sichelzellen, anämie beziehen, und Eschbach et al., J. Clin. Invest., 74(2), S. 434-441 (1984), die ein therapeutisches Regime für urämische Schafe beschreiben, basierend auf invivo-Reaktionen auf Erythropietinreichen Plasmainfusionen, und einer vorgeschlagenen Dosis von 10 Einheiten EPO/kg pro Tag für 15 bis 40 Tage als Korrektiv einer Anämie des mit chronischem Nierenversagen verbundenen Typs. Siehe auch Krane, Henry Ford Hosp., Med., 31 (3) 177-181 (1983)Since erythropoietin is essential in the process of red blood cell formation, the hormone has a potentially useful application in both the diagnosis and treatment of blood disorders characterized by low or defective red blood cell production. See generally Pennathur-Dasetal., Blood, 63 (5), 1168-71 (1984) and Haddy, at Jour. Ped. Hematol./Oncol. 4,191-196 (1982), which relates to erythroproietin for possible sickle cell anemia therapies, and Eschbach et al., J. Clin. Invest., 74 (2), pp. 434-441 (1984) describing a therapeutic regimen for uremic sheep based on in vivo responses to erythropietin-rich plasma infusions, and a proposed dose of 10 units EPO / kg per day for 15 to 40 days as a corrective of anemia associated with chronic renal failure. See also Cranes, Henry Ford Hosp., Med., 31 (3) 177-181 (1983)

Kürzlich wurde eingeschätzt, daß die Erhältlichkeit von Erythropoietin in Mengen die Anämiebehandlung von Recently, it has been estimated that the availability of erythropoietin in amounts is the anemia treatment of

1600000 Menschen allein in den Vereinigten Staaten erlauben würde. Siehez.B. Morrison „Bioprocessing in Space an1600000 people alone in the United States would allow. See e.g.. Morrison "Bioprocessing in Space

Overview" Seite 557-571 in The world Biotech Report 1984, Bd.2: USA (Online Publications, New York, N. Y. 1984). Kürzliche Studien haben eine Basis für die Planung der Wirksamkeit der Erythropoietintherapie in einer Vielzahl von Krankheitszuständen, Krankheiten und Zuständen hämatologischer Unregelmäßigkeit erbracht:Overview "pages 557-571 in The World Biotech Report 1984, Vol.2: USA (Online Publications, New York, NY 1984) Recent studies have provided a basis for planning the efficacy of erythropoietin therapy in a variety of disease states, diseases and conditions haematological irregularity:

Vedovato, et al., Acta. Haematol. 71, 211-213 (1984) (beta-Thalassämie); Vichinsky, et al., J. Pediatr., 105 (1), 15-21 (1984) (zystische Fibröse); Cotes, et al., Brit. J. Obstet. Gyneacol., 90 (4), 304-311 (1983) (Schwangerschaft, Menstruationsbeschwerden); Hage, et al., Acta. Pediatr. Scand., 72,827-831 (1983) (frühe Anämie der Frühreife); Claus-Walker, et al.. Arch. Phys. Med. Rehabil., 65,370-374 (1984) (Rückenmarkverletzung) Dunn, et al., Eur. J. Appl. Physiol., 52,178-182 (1984) (Raumflug); Miller, et al., Brit. J. Haematol., 52,545-590 (akuter Blutverlust); Udupa, et al., J. Lab. Clin. Med., 103 (4), 574-580 und 581-588 (1984); und Lipschitz, et al., Blood, 63 (3),502-509 (1983) (Alterung); und Dainiak, et al.,Cancer, 51 (6), 1101-1106 (1983) und Schwartz, et al., Otolaryngol., 109,269-272 (1983) (verschiedene neoplastische Krankheitsstadien begleitet durch abnorme Erythropoiesie).Vedovato, et al., Acta. Haematol. 71, 211-213 (1984) (beta-thalassemia); Vichinsky, et al., J. Pediatr., 105 (1), 15-21 (1984) (cystic fibrosis); Cotes, et al., Brit. J. Obstet. Gyneacol., 90 (4), 304-311 (1983) (pregnancy, menstrual cramps); Hage, et al., Acta. Pediatr. Scand., 72, 827-831 (1983) (early anemia of prematurity); Claus-Walker, et al. Arch. Phys. Med. Rehabil., 65, 373-374 (1984) (spinal cord injury) Dunn, et al., Eur. J. Appl. Physiol., 52, 178-182 (1984) (spaceflight); Miller, et al., Brit. J. Haematol., 52, 455-590 (acute blood loss); Udupa, et al., J. Lab. Clin. Med., 103 (4), 574-580 and 581-588 (1984); and Lipschitz, et al., Blood, 63 (3), 502-509 (1983) (aging); and Dainiak, et al., Cancer, 51 (6), 1101-1106 (1983) and Schwartz, et al., Otolaryngol., 109, 269-272 (1983) (various neoplastic disease states accompanied by abnormal erythropoiesia).

Frühere Versuche zur Gewinnung von Erythropoietin in guter Ausbeute aus Plasma oder Urin verliefen relativ erfolglos. Es sind komplizierte und umständliche Laborverfahren erforderlich, die im allgemeinen zur Gewinnung nur sehr geringer Mengen unreiner und instabiler Erythropoietin enthaltender Extrakte führten.Previous attempts to recover erythropoietin in good yield from plasma or urine have been relatively unsuccessful. There are complicated and cumbersome laboratory procedures required, which generally resulted in the recovery of only very small amounts of impure and unstable erythropoietin containing extracts.

Anfängliche Versuche zur Isolierung von Erythropoietin aus Urin erbrachten instabile, biologisch inaktive Zubereitungen des Hormons. Die US-PS 3865801 beschreibt ein Verfahren zur Stabilisierung der biologischen Aktivität einer Rohsubstanz, die aus Urin gewonnenes Erythropoietin enthält. Das resultierende Rohpräparat, das Erythropoietin enthält, erhält scheinbar 90% der Erythropoietinaktivität zurück und ist stabil.Initial attempts to isolate erythropoietin from urine have produced unstable, biologically inactive preparations of the hormone. US Pat. No. 3,865,801 describes a method for stabilizing the biological activity of a crude substance containing urine-derived erythropoietin. The resulting crude preparation containing erythropoietin apparently retains 90% of the erythropoietin activity and is stable.

Ein anderes Reinigungsverfahren von Human-Erythropoietin aus Urin von Patienten mit aplastischer Anämie wird von Miyake et al., in J. Biol. Chem., Bd. 252, Nr. 15 (10. August 1977) S. 5558-5564 beschrieben. Zu dem siebenstufigen Verfahren gehört lonenaustauschchromatographie, Ethanolfällung, Gelfiltration und Adsorptionschromatografie, wobei als Ausbeuten ein reines Erythropoietinpräparat mit einer Potenz von 70400 Einheiten/mg Protein mit 21 % Ausbeute erhalten wird.Another method of purifying human erythropoietin from urine of patients with aplastic anemia is described by Miyake et al., J. Biol. Chem., Vol. 252, No. 15 (August 10, 1977), pp. 5558-5564. The seven-step procedure involves ion exchange chromatography, ethanol precipitation, gel filtration, and adsorption chromatography, yielding a pure erythropoietin preparation with a potency of 70,400 units / mg protein in 21% yield.

Die US-PS 4397840 (Takezawa et al.) beschreibt Verfahren zur Herstellung „eines Erythropoietinproduktes" aus Urinproben gesunder Menschen mit schwachbasischen Ionenaustauschern und sagt aus, daß das erhaltene Produkt niederer Molekülmasse „keine inhibitorischen Effekte gegen Erythropoietin aufweist".U.S. Patent No. 4,379,840 (Takezawa et al.) Describes methods for making "an erythropoietin product" from urine samples of healthy humans with weakly basic ion exchangers and states that the resulting low molecular weight product "has no inhibitory effects against erythropoietin."

Die GB-PS 2 085887 (Sugitomo et al.), veröffentlicht am 6. Mai 1982, beschreibt ein Verfahren zur Herstellung von Hybfid-Humanlymphoblastoiden Zellen und berichtet über Produnktionsmengen im Bereich von 3 bis 420 Einheiten Erythropoietin pro ml Zellsuspension (verteilt in den Kulturen nach der Säugetierwirtsvermehrung, die bis zu 107 Zellen pro ml enthielt(en). Beiden besten Ergebnissen, von denen behauptet wurde, daß man sie erreichte, konnte die Herstellungsrate von Erythropoietin auf 40 bis 4000 Einheiten/106 Zellen/48 Stunden in vitro-Kultur, die dem Zelltransfer aus in vivo-Vermehrungssystemen folgten, berechnet werden. (Siehe auch die analoge US-PS 4377 513). Es wurden zahlreiche Vorschläge unterbreitet zur Isolierung von Erythropoietin aus Gewebe, einschließlich neoplastischen Zellen, die Ausbeuten waren jedoch sehr gering. Siehe z. B. Jelkman, et βΙ.,Έχρΐ. Hematol., 11 (7), 581-588 (1983Y Tambourin, et al., P. N. A. S. (USA), 80,6269-6273 (1983); Katsucka, et al., Gann, 74, 534-541 (1983); Hagiwara et al., Blood, 63 (4), 828-835 (1984); und Choppin, et al., Blood 64(2), 341-347 (1984). Zu anderen eingesetzten Isolierungsverfahren, um gereinigtes Erythropoietin zu erhalten, gehören immunologische Verfahrensweisen. Ein gegen Erythropoietin gerichteter polyklonaler, aus Serum herrührender Antikörper wurde durch Injizieren eines Tieres, vorzugsweise einer Ratte oder eines Kaninchens, mit Human-Erythropoietin entwickelt. Das injizierte Human-Erythropoietin wird durch das Immunsystem des Tieres als fremde Antigensubstanz erkannt und löst die Produktion von Antikörpern gegen das Antigen aus. Unterschiedliche Zellen, die auf die Stimulierung durch die Antigensubstanz reagieren, produzieren und setzen Antikörper in den Kreislauf frei, die sich von denen anderer reagierender Zellen geringfügig unterscheiden. Die Antikörperaktivität bleibt im Serum des Tieres erhalten, wenn das Blut extrahiert wird. Während ungereinigte Serum- oder Antikörperzubereitungen, gereinigt als eine Serum-lmmunoglobulinG-Fraktion, dann in Assays verwendet werden können, um Human-Erythropoietin zu bestimmen und mit ihm einen Komplex bilden zu können, weisen die Materialien einen wesentlichen Nachteil auf. Dieser Serum-Antikörper, zusammengesetzt aus all den unterschiedlichen, durch einzelne Zellen produzierten Antikörpern, ist von Natur aus polyklonal und wird mit Komponenten in Rohextrakten Komplexe bilden, anders als Erythropoietin allein.GB 2,085,887 (Sugitomo et al.), Published May 6, 1982, describes a method for producing Hybfid human lymphoblastoid cells and reports prodrugs in the range of 3 to 420 units of erythropoietin per ml of cell suspension (distributed in the cultures After mammalian host propagation containing up to 10 7 cells per ml, the best results reported to reach them were the production rate of erythropoietin at 40 to 4000 units / 10 6 cells / 48 hours in vitro (See also U.S. Patent No. 4,377,513.) Numerous proposals have been made for the isolation of tissue erythropoietin, including neoplastic cells, but the yields were very low See, for example, Jelkman, et βΙ, Έχρΐ, Hematol., 11 (7), 581-588 (1983 Y Tambourin, et al., PNAS (USA), 80, 6269-6273 (1983); Katsucka, et al., Gann, 74, 534-541 (1983); Hagiwara et al., Blood, 63 (4), 828-835 (1984); and Choppin, et al., Blood 64 (2), 341-347 (1984). Other isolation methods used to obtain purified erythropoietin include immunological procedures. An anti-erythropoietin-directed polyclonal serum-derived antibody was developed by injecting an animal, preferably a rat or rabbit, with human erythropoietin. The injected human erythropoietin is recognized by the animal's immune system as a foreign antigenic substance and triggers the production of antibodies to the antigen. Different cells that respond to stimulation by the antigenic substance produce and release antibodies that are slightly different from those of other reacting cells. The antibody activity is retained in the animal's serum when the blood is extracted. While crude serum or antibody preparations purified as a serum immunoglobulin G fraction can then be used in assays to detect and complex with human erythropoietin, the materials have a significant drawback. This serum antibody, composed of all the different antibodies produced by single cells, is polyclonal in nature and will complex with components in crude extracts, unlike erythropoietin alone.

Für den Hintergrund der vorliegenden Erfindung von Interesse sind auch kürzlich bekanntgewordene Fortschritte auf dem Gebiet hinsichtlich der Entwicklung kontinuierlicher Zellkulturen, die in der Lage sind, eine einzige Art von Antikörpern zu bilden, die spezifisch immunologisch reaktiv mit einer einzigen antigen Bestimmungsgröße eines ausgewählten Antigens ist. Siehe allgemein Chisholm, High Technology, Bd.3, Nr. 1, 57-63 (1983).Also of interest to the background of the present invention are recent advances in the field of developing continuous cell cultures capable of producing a single type of antibody that is specifically immunologically reactive with a single antigenic determinant of a selected antigen. See, generally, Chisholm, High Technology, Vol.3, No. 1, 57-63 (1983).

Es wurden Versuche unternommen, ZeIIfusions-und Hybridisierungstechniken anzuwenden, um „monoklonale" Antikörper bei der Isolierung und quantitativen Bestimmung von Human-Erythropoietin absonderten, in Kurzform durch Lee-Huang, Abstract No.1463, Fed. Proa, 41, 520 (1982). Als ein weiteres Beispiel erschien eine detaillierte Beschreibung der Herstellung und Verwendung mondklonaler Anti-Erythorpoietin-Antikörper durch Weiss et al., P. N. A. S. (USA) 9, 5465-5469 (1982). Siehe durch Sasaki, Biomed. Biochim. Acta., 42/11 (12), 5202-5206 (1983); Yanagawa, et al., Blood 64 (2), 357-364 (1984), Yanagawa, et al., J. Biol. Chem., 259 (5), 2707-2710 (1984); und US-PS 4465624.Attempts have been made to use cell fusion and hybridization techniques to secrete "monoclonal" antibodies in the isolation and quantification of human erythropoietin, in short Lee-Huang, Abstract No.1463, Fed Proa, 41, 520 (1982). As a further example, a detailed description of the preparation and use of anti-erythropoietin moonclonal antibodies has been published by Weiss et al., PNAS (USA) 9, 5465-5469 (1982) See, Sasaki, Biomed., Biochim, Acta., 42 / 11 (12), 5202-5206 (1983), Yanagawa, et al., Blood 64 (2), 357-364 (1984), Yanagawa, et al., J. Biol. Chem., 259 (5), 2707-2710 (1984); and U.S. Patent 4,465,624.

Für den Hintergrund der Erfindung sind ebenso von Interesse Berichte über die immunologische Aktivität synthetischer Peptide die die in natürlich vorkommenden Proteinen, Glycoproteinen und Nucleoproteinen vorhandenen Aminosäuresequenzen im wesentlichen verdoppeln. Insbesondere Polypeptide mit relativ geringer Molekülmasse haben gezeigt, daß sie an Immunreaktionen teilnehmen, die in Dauer und Umfang den Immunreaktionen physiologisch bedeutender Proteine, wie virale Antikörper, Polypeptidhormone und ähnliche ähneln. Zu den Immunreaktionen derartiger Polypeptide gehört auch die Provozierung der Bildung spezifischer Antikörper in immunologisch aktiven Tieren. Siehe z.B. Lemeret al., Cell, 23,309-310 (1981); Ross, et al.. Nature, 294, 654-656 (1981); Walter, et al., P.M. A.S. (USA), 77, 5197-5200 (1980); Lerner, et al: P.N.A.S. (USA), 78,3403-3407 (1981); Walter et al., P. N. A.S. (USA), 78,4882-4886 (1981); Wong, et al., P. N. A.S. (USA), 78,7412-7416 (1981); Green, et al., Cell, 28,477-487 (1982); Nigg, et al., P. N. A. S. (USA), 79, 5322-5326 (1982); Baron, et al., Cell, 28, 395-404 (1982); Dreesman, et al., Nature, 295,158-160 (1982); und Lerner, Scientific American, 248, No. 2,66-74 (1983). Siehe auch Kaiser, et al., Science, 223, pp. 249-255 (1984) bezüglich biologischer und immunologischer Aktivitäten synthetischer Peptide, die die sekundären Strukturen der Peptidhormone annähernd teilen, nicht jedoch deren primäre strukturelle Anordnung. Die oben genannten Studien beziehen sich natürlich auf Aminosäuresequenzen von Proteinen, die sich von Erythropoietin unterscheiden, einer Substanz, für die keine wesentliche Aminosäuresequenz bisher beschrieben worden ist. In der anhängigen US-Patentanmeldung Nr.463724, an der Miteigentum besteht, eingereicht am 4. Februar 1983 durch J. Egrie, veröffentlicht am 22. August 1984 als EP-OS 0116446 wird eine Maus-Maus-Hybridoma-Zellinie (ATCC HB 8209) beschrieben, die einen hoch spezifischen, monoklonalen, Anti-Erythropoietin-Antikörper produziert, der auch spezifisch immunoreaktiv mit einem Polypeptid ist, das aus der folgenden Sequenz von Aminosäuren besteht: NHa-Ala-Pro-Pro-Arg-Leu-lle-Cys-Asp-Ser-Arg-Val-Leu-Glu-Arg-Tyr-Leu-Leu-Glu-Ala-Lys-COOH.Also of interest for the background of the invention are reports of the immunological activity of synthetic peptides which substantially double the amino acid sequences present in naturally occurring proteins, glycoproteins and nucleoproteins. In particular, relatively low molecular weight polypeptides have been shown to participate in immune responses that are similar in duration and extent to the immune responses of physiologically important proteins, such as viral antibodies, polypeptide hormones, and the like. Immune responses of such polypeptides also include provoking the formation of specific antibodies in immunologically active animals. See, e.g. Lemer et al., Cell, 23, 309-310 (1981); Ross, et al., Nature, 294, 654-656 (1981); Walter, et al., P.M. A.S. (USA), 77, 5197-5200 (1980); Lerner, et al .: P.N.A.S. (USA), 78, 3403-3407 (1981); Walter et al., P.N. (USA), 78, 48882-4886 (1981); Wong, et al., P.N. (USA), 78, 7412-7416 (1981); Green, et al., Cell, 28, 477-487 (1982); Nigg, et al., P.N.A.S. (USA), 79, 5322-5326 (1982); Baron, et al., Cell, 28, 395-404 (1982); Dreesman, et al., Nature, 295, 158-160 (1982); and Lerner, Scientific American, 248, no. 2,66-74 (1983). See also Kaiser, et al., Science, 223, pp. 249-255 (1984) for biological and immunological activities of synthetic peptides that approximately share the secondary structures of the peptide hormones but not their primary structural arrangement. The above studies, of course, relate to amino acid sequences of proteins other than erythropoietin, a substance for which no essential amino acid sequence has been previously described. In co-owned U.S. Patent Application No. 467244, filed on February 4, 1983 by J. Egrie, published August 22, 1984, EP-OS 0116446 discloses a mouse-mouse hybridoma cell line (ATCC HB 8209 ) which produces a highly specific, monoclonal, anti-erythropoietin antibody that is also specifically immunoreactive with a polypeptide consisting of the following sequence of amino acids: NHa-Ala-Pro-Pro-Arg-Leu-Ile-Cys Asp-Ser-Arg-Val-Leu-Glu-Arg-Tyr-Leu-Leu-Glu-Ala-Lys-COOH.

Die Polypeptidsequenz ist eine, die den ersten zwanzig Aminosäureresten reifen Human-Erythropoietins zuzuschreiben ist, die nachdem Verfahren von Miyakeetal., J. Biol. chem. 252,5558-5564 (1977) isoliert wurden, und für die eine Aminosäureanalyse mittels Gasphasensequenzer (Applied Biosystems, Inc.) durchgeführt wurde nach der Verfahrensweise von Hewick, M. et al., J. Biol. Chem., 256,7990-7997 (1981). Siehe auch Sue et al., Proc. Nat. Acad. Sei. (USA), 80, S.3651-3655 (1983) betreffend die Entwicklung polyklonaler Antikörper gegen ein synthetisches 26-mer, basierend auf einer unterschiedlichen Aminosäuresequenz und Sytowski et al., J. Immunol. Methods, 69, S. 181-186 (1984).The polypeptide sequence is one attributable to the first twenty amino acid residues of mature human erythropoietin prepared by the method of Miyakeetal., J. Biol. Chem. 252, 5558-5564 (1977) and for which amino acid analysis was performed by gas-phase sequencer (Applied Biosystems, Inc.) according to the procedure of Hewick, M. et al., J. Biol. Chem., 256, 7990- 7997 (1981). See also Sue et al., Proc. Nat. Acad. Be. (USA), 80, p.3651-3655 (1983) regarding the development of polyclonal antibodies to a synthetic 26-mer based on a different amino acid sequence, and Sytowski et al., J. Immunol. Methods, 69, p. 181-186 (1984).

Während polygonale und monoklonale Antikörper, wie oben beschrieben, zu sehr nützlichen Produkten für den Einsatz in Immunoassays zur Bestimmung und mengenmäßigen Erfassung von Erythropoietin führen und bei der Affinitätsreinigung von Erythropoietin verwendbar ist, erscheint es unwahrscheinlich, daß diese Materialien leicht zur großtechnischen Isolierung größerer Mengen Erythropoietin aus Säugetiermaterial eingesetzt werden können, die ausreichend sind für weitere Analysen, klinische Untersuchungen und eine potentiell weitreichende therapeutische Verwendung der Substanz bei der Behandlung von beispielsweise chronischen Nierenerkrankungen, wobei krankes Gewebe nicht in der Lage ist, die Produktion von Erythropoietin aufrechtzuerhalten. Es besteht daher in der Wissenschaft die Auffassung, daß die besten Aussichten zur vollständigen Kennzeichnung von Säugetier-Erythropoietin und Bereitstellung großer Mengen davon zur potentiellen diagnostischen und klinischen Verwendung darin bestehen, erfolgreich die rekombinanten Verfahren einzusetzen, um eine großtechnische mikrobielle Synthese der Verbindung zu ermöglichen.While polygonal and monoclonal antibodies, as described above, lead to very useful products for use in immunoassays for the determination and quantification of erythropoietin and are useful in the affinity purification of erythropoietin, it seems unlikely that these materials will readily isolate larger quantities of erythropoietin on a large scale can be used from mammalian material sufficient for further analysis, clinical investigation, and potentially far-reaching therapeutic use of the substance in the treatment of, for example, chronic kidney disease where diseased tissue is unable to sustain the production of erythropoietin. It is therefore believed in the art that the best prospects for fully labeling mammalian erythropoietin and providing it with large amounts for potential diagnostic and clinical use is to successfully use the recombinant techniques to allow for large scale microbial synthesis of the compound.

Während es so erscheint, daß bei der versuchten Isolierung von DNA-Sequenzen, die für Human- und andere Säugetierarten-Erythropoietin kodieren, wesentliche Fortschritte gemacht wurden, scheint dies doch nicht so erfolgreich gewesen zu sein. Dies liegt prinzipiell an dem Mangel an Gewebematerial, insbesondere menschlichem Gewebematerial, das mRNA-angereichert ist, und das gestatten würde, eine cDNA-Bibliothek aufzubauen, aus der eine für Erythropoietin codierende DNA-Sequenz durch Standardverfahren isoliert werden könnte. Darüber hinaus ist über die fortlaufende Sequenz der Aminosäurereste des Erythropoietins so wenig bekannt, daß es nicht möglich ist, beispielsweise lange Polynucleotidsonden zu konstruieren, die in der Lage sind, zuverlässig bei dem DNA/DNA-Hybridisierungsscreening von cDNA und insbesondere genomischen DNA-Bibliotheken eingesetzt zu werden.While it appears that substantial progress has been made in attempting to isolate DNA sequences encoding human and other mammalian species erythropoietin, it does not appear to have been so successful. This is principally due to the lack of tissue material, particularly human tissue material, which is mRNA-enriched and would allow to construct a cDNA library from which an erythropoietin-encoding DNA sequence could be isolated by standard techniques. In addition, the sequence of amino acid residues of erythropoietin is so little known that it is not possible, for example, to construct long polynucleotide probes capable of reliable use in DNA / DNA hybridization screening of cDNA and in particular genomic DNA libraries to become.

Als Erläuterung dafür sei genannt, daß die 20-Aminosäuresequenz, die zur Erzeugung des oben genannten monoklonalen Antikörpers verwendet wurde, produziert durch ATCC Nr. HB 8209, keine Konstruktion einer zweifelsfreien 60-Basenpaar-Oligonucleotidsonde in der von Anderson et al., ebenda, beschriebenen Weise. Es wird eingeschätzt, daß das Humangen für Erythropoietin als ein „Einzelkopie-Gen" (single copy gen) innerhalb des menschlichen Genoms erscheint und in jedem Fall das für Human-Erythropoietin codierende genetische Material wahrscheinlich aus weniger als 0,00005% der gesamten menschlichen genomischen DNA besteht, die in einer Gen-Bibliothek vorhanden sein würde. ' ·By way of illustration, the 20 amino acid sequence used to produce the above-mentioned monoclonal antibody produced by ATCC No. HB 8209, no construction of a unambiguous 60 base pair oligonucleotide probe as described by Anderson et al., Ibid. described way. It is estimated that humanity for erythropoietin appears as a "single copy gene" within the human genome and, in any event, the genetic material encoding human erythropoietin is likely to be less than 0.00005% of the total human genomic DNA that would be present in a gene library.

Bis heute sind die erfolgreichsten der in der Literatur bekannt gewordenen Versuche mit Rekombinanten verwandten Verfahren zur Bereitstellung von DNA-Sequenzen für die Verwendung bei der mikrowellen Expression isolierbarer Mengen von Säugetier-Erythropoietin weit vor dem Ziel stehengeblieben. Als Beispiel berichtet Farber et al., Exp. Hematol. 11, Supp. 14, Abstract 101 (1983) über die Extraktion von mRNAaus Nierengewebe von Phenylhydrazin-behandelten Pavianen und die Injizierung von mRNA in Xenopus laevis-Eizellen mit dem eher flüchtigen Ergebnis der in vitro Produktion eines Gemisches von „Translationsproduktion", das unter anderem biologische Eigenschaften von Erythropoietin entfaltete. In der jüngsten Zeit berichteten Farber et al., Blood, 62, Nr. 5, Suppl. Nr. 1, Abstract 392 auf Seite 122 a (1983) über die in vitro-Translation von Humannieren-mRNA durch Frosch-Eizellen. Es wurde geschätzt, daß das resultierende Translationsproduktgemisch in der Größenordnung von 220 (Millieinheiten) (mU) eines Translationsproduktes mit der Aktivität von Erythropoietin pro Mikrogramm injizierte mRNA enthielt. Während sich solche Gehalte bei der in vitro-Translation exogener mRNA als ziemlich niedrig bestätigten (verglichen mit den schon früher bekannt gewordenen Gehalten der Pavian-mRNA-Translation in das gesuchte Produkt), wurde geglaubt, daß die Ergebnisse die menschliche Niere als Ort der Erythropoietinexpression bestätigen und die Konstruktion einer angereicherten Humannieren-cDNA-Bibliothek gestatten würden, aus der das gewünschte Gen isoliert werden könnte, (siehe auch Farber, Clin. Res., 31 [4], 769A [1983]). Seit Einreichen der US-Patentanmeldungen Nr. 561024 und 582185 ist ein einziger Bericht zur Klonierung und Expression erschienen, in dem behauptet wird, Human-Erythropoietin-cDNA in E. coli erhalten zu haben. Dabei wurden eine Anzahl von" cDNA-Klonen in E. coli-Plasmide insertiert, und es wurden jS-Lactamase-Fusionsprodukte festgestellt, die sich immunreaktiv mit einem monoklonalen Antikörper zu einem unspezifizierten „Epitop" von Human-Erythropoietin verhielten. Siehe Lee-Huang, Proc. Nat. Acad. Sei. (USA), 81, Ss. 2708-2712 (1984).To date, the most successful of the literature-based attempts at recombinant-related methods of providing DNA sequences for use in microwell expression of isolatable amounts of mammalian erythropoietin have come to a head. As an example, Farber et al., Exp. Hematol. 11, Supp. 14, Abstract 101 (1983) on the extraction of mRNA from kidney tissue from phenylhydrazine-treated baboons and the injection of mRNA into Xenopus laevis oocytes with the rather volatile result of the in vitro production of a mixture of "translation production", including biological properties of Recently, Farber et al., Blood, 62, No. 5, Suppl. No. 1, Abstract 392 at page 122a (1983) reported the in vitro translation of human mRNA frog egg cell mRNA It was estimated that the resulting translation product mixture contained on the order of 220 (milliunits) (mU) of a translation product with the activity of erythropoietin per microgram of injected mRNA, while those levels were confirmed to be rather low by the in vitro translation of exogenous mRNA ( compared with the previously disclosed levels of baboon mRNA translation into the product sought) was ge believes that the results would confirm the human kidney as the site of erythropoietin expression and would permit the construction of an enriched human kidney cDNA library from which the desired gene could be isolated (see also Farber, Clin. Res., 31 [4], 769A [1983]). Since filing US Patent Application Nos. 561024 and 582185, a single report on cloning and expression has appeared, claiming to have obtained human erythropoietin cDNA in E. coli. A number of cDNA clones were inserted into E. coli plasmids and jS-lactamase fusion products were identified that were immunoreactive with a monoclonal antibody to an unspecified "epitope" of human erythropoietin. See Lee-Huang, Proc. Nat. Acad. Be. (USA), 81, Ss. 2708-2712 (1984).

Ziel der ErfassungTarget of capture

Durch die Erfindung wird ein verbessertes Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz zur Verfügung gestellt.The invention provides an improved method for the determination of a specific single-stranded polynucleotide of unknown sequence.

Darlegung des Wesens der ErfindungExplanation of the essence of the invention

Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz zur Verfügung zu stellen.The invention has for its object to provide a method for the determination of a specific single-stranded polynucleotides unknown sequence available.

Gegenstand der Erfindung ist ein Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz in einer heterogenen zellulären oder viralen Probe einschließlich multipler einzelsträngiger Polynucleotide, gekennzeichnet dadurch, daßThe invention relates to a method for the determination of a specific single-stranded polynucleotides of unknown sequence in a heterogeneous cellular or viral sample including multiple single-stranded polynucleotides, characterized in that

(a) ein Gemisch markierter einzelsträngiger Polynucleotidsonden mit gleichmäßig variierenden Sequenzen der Basen hergestellt wird, wobei jede der Sonden potentiell einer Sequenz von Basen komplementär ist, die zu dem zu bestimmenden Polynucleotid das vermeintlich nur einmal existierende Exemplar ist;(a) preparing a mixture of labeled single-stranded polynucleotide probes having uniformly varying sequences of the bases, each of said probes being potentially complementary to a sequence of bases which is said to be single-copy to the polynucleotide to be determined;

(b) die Probe auf ein festes Substrat fixiert wird;(b) fixing the sample on a solid substrate;

(c) das Substrat mit der darauf fixierten Probe behandelt wird, um eine weitere Bindung von Polynucleotiden darauf abzuschwächen, ausgenommen durch Hybridisierung zu Polynucleotiden in der Probe;(c) treating the substrate with the sample fixed thereon to attenuate further binding of polynucleotides thereto, except by hybridization to polynucleotides in the sample;

(d) das behandeltes Substrat mit der darauf fixierten Probe flüchtig mit dem genannten Gemisch markierter Sonden unter Bedingungen in Berührung gebracht wird, die nur die Hybridisierung zwischen vollständig komplementären Polynucleotiden erleichtern; und(d) the treated substrate, with the sample fixed thereto, is made to be in volatile contact with said mixture of labeled probes under conditions which only facilitate hybridization between fully complementary polynucleotides; and

(e) das spezifische Polynucleotid über die Beobachtung des Auftretens einer Hybridisierungsreaktion zwischen ihm und einer vollständig komplementären Sonde aus dem Gemisch der markierten Sonden bestimmt wird.(e) determining the specific polynucleotide by observing the occurrence of a hybridization reaction between it and a fully complementary probe from the mixture of labeled probes.

Die vorliegende Erfindung erläutern klonierte DNA-Sequenzen vom Affen oder Menschen und auf geeignete Weise daraus abgeleitete Polypeptidsequenzen, die die primäre Strukturanordnung von Erythropoietinen mit ihrem entsprechenden Ursprung vom Affen oder Menschen darstellen.The present invention illustrates monkey or human cloned DNA sequences and polypeptide sequences appropriately derived therefrom which are the primary structural arrangement of erythropoietins of their corresponding monkey or human origin.

Unter Darstellung der Sequenz der Aminosäurereste von Erythropoietin sieht die vorliegende Erfindung die totale und/oder partielle Herstellung von DNA-Sequenzen vor, die für Erythropoietin codieren und die solch vorteilhafte Charakteristika wie Einbeziehung von für die Expression „bevorzugten" Codons durch Nicht-Säugetierwirte, mit der Maßgabe, daß Stellen für das Schneiden durch Restriktionsendonuclease-Enzyme vorgesehen sind und der weiteren Maßgabe von zusätzlichen Anfangs-, End- oder Zwischen-DNA-Sequenzen, die die Konstruktion leicht exprimierbarer Vektoren erleichtern. Dementsprechend betrifft die vorliegende Erfindung die Herstellung (und Entwicklung durch Stellen-spezifische Mutagenese von cDNA und genomischer DNA) von DNA-Sequenzen, die für die mikrobielle Expression von Polypeptidanalogen oder Derivaten von ErythropoietinPresenting the sequence of the amino acid residues of erythropoietin, the present invention contemplates the total and / or partial production of DNA sequences encoding erythropoietin and having such beneficial characteristics as including non-mammalian hosts for "preferred" codons for expression provided that sites are provided for cleavage by restriction endonuclease enzymes, and the further provision of additional initial, terminal or intermediate DNA sequences that facilitate the construction of easily expressible vectors Accordingly, the present invention relates to the preparation (and development by site-specific mutagenesis of cDNA and genomic DNA) of DNA sequences encoding microbial expression of polypeptide analogues or derivatives of erythropoietin

codieren, die sich von natürlich vorkommenden Formen durch Identität oder Ort der Anordnung eines oder mehrerer Arninosäurereste unterscheiden (d. i. Deletierungsanaloga, die weniger als alle der für EPO spezifizierenden Reste enthalten und/oder Substitutionsanaloge, worin einer oder mehrere der spezifizierten Reste durch andere Reste ersetzt ist und/oder Additionsanaloga, worin einer oder mehrere Aminosäurereste an einen terminalen oder medialen Teil des Polypeptids angefügt ist); und die an einigen oder allen Eigenschaften natürlich vorkommender Formen teilhaben.which differ from naturally occurring forms by the identity or location of the arrangement of one or more arnino acid residues (i.e., deletion analogs containing less than all of the EPO-specifying residues and / or substitution analogues wherein one or more of the specified residues is replaced by other residues and / or addition analogs wherein one or more amino acid residues are attached to a terminal or medial portion of the polypeptide); and participate in some or all of the properties of naturally occurring forms.

Die neuen. DNA-Sequenzen der Erfindung enthalten alle für eine sichere Expression in procaryotischeVi oder eucaryotischen Wirtszellen von Polypeptidprodukten erforderlichen Sequenzen, die«zumindest einen Teil der primären Strukturanordnung aufweisen sowie eine oder mehrere der biologischen Eigenschaften von Erythropoietin, von denen umfaßt werden: (a); die in den Tabellen V und Vl aufgeführten DNA-Sequenzen oder deren Komplementärstränge;The new. DNA sequences of the invention contain all sequences necessary for safe expression in procaryotic Vi or eucaryotic host cells of polypeptide products which "comprise at least part of the primary structural arrangement and one or more of the biological properties of erythropoietin comprising: (a); the DNA sequences listed in Tables V and VI or their complementary strands;

(b) DNA-Sequenzen, die (unter Hybridisierungsbedingungen, wie sie hier erläutert werden oder strengeren Bedingungen) zu DNA-Sequenzen, wie sie unter (a) definiert sind, hybridisieren, oder zu Fragmenten davon; und(b) DNA sequences that hybridize (under hybridization conditions, as discussed herein or more stringent conditions) to DNA sequences as defined under (a), or to fragments thereof; and

(c) DNA-Sequenzen, die allerdings unter Degenerierung des genetischen Codes zu unter (a) und (b) definierten DNA-Sequenzen hybridisieren würden. Speziell vom Teil (b) umfaßt sind genomische DNA-Sequenzen, die allelische Variatenformen von Affen- aderHuman-Erythropoietin verschlüsseln und/oder andere Säugetierarten von Erythropoietin decodieren. Speziell vom Teil (c) umfaßt sind hergestellte DNA-Sequenzen, die EPO, EPO-Fragmente und EPO-Analoge verschlüsseln, deren DNA-Sequenzen Condonsenthalten können, die die Translation von Boten-RNAin Nicht-Wirbeltierwirten erleichtern.(c) DNA sequences which, however, would hybridize with the degeneracy of the genetic code to (a) and (b) defined DNA sequences. Specifically included in part (b) are genomic DNA sequences that encode allelic variant forms of adenovirus human erythropoietin and / or decode other mammalian species of erythropoietin. Specifically included in part (c) are prepared DNA sequences that encode EPO, EPO fragments and EPO analogs whose DNA sequences may contain condons that facilitate the translation of messenger RNA into non-vertebrate hosts.

Weiterhin der vorliegenden Erfindung zuzuordnen ist die Klasse von Polypeptiden, die für Teil des DNA-Komplements zum oberen Strang der Human-genomischen DNA-Sequenz von Tabelle Vl codieren, d.i. „komplementär umgekehrte Proteine", wie sievorrTramontano et al.. Nucleic Acids Research, 12, S. 5049-5059 (1984). Further assignable to the present invention is the class of polypeptides encoding part of the DNA complement to the upper strand of the human genomic DNA sequence of Table VI, i. "Complementary reverse proteins" as described previously by Tramontano et al. Nucleic Acids Research, 12, pp. 5049-5059 (1984).

Die erfindungsgemäßen Polypeptidprodukte können „markiert" werden durch kovalente Bindung an eine bestimmbare Markersubstanz (z. B. radiomarkiert mit 125I), um zu Reagentien zu gelangen, die bei der Ermittlung und mengenmäßigen Bestimmung von Erythropoietin in festem Gewebe und flüssigen Proben wie Blut oder Urin von Nutzen sind. Die erfindungsgemäßen DNA-Produkte können auch mit bestimmbaren Markern (wie Radiomarkern und Nicht-Isotopenmarkem wie Biotin) markiert und bei DN A-Hybridisierungsverfahren eingesetzt werden, um die Erythropoietin-Genposition und/oder die Genposition irgendeiner verwandten Genfa'milie aus der Human-, Affen- und anderen Säugetierspezies-Chromosomenkarte zu orten. Sie können auch zum Herausfinden von Erythropoietin-Genunstimmigkeiten an Hand des DNA-Gehalts verwendet werden und als Genmarker zur Identifizierung benachbarter Gene und deren Unstimmigkeiten.The polypeptide products of the present invention can be "labeled" by covalent attachment to a detectable marker (e.g., radiolabeled with 125 I) to yield reagents used in the detection and quantification of erythropoietin in solid tissue and fluid samples such as blood or urine The DNA products of the present invention may also be labeled with detectable markers (such as radiotranslucent and non-isotopic markers such as biotin) and used in DN A hybridization procedures to determine the erythropoietin gene position and / or gene position of any related gene They can also be used to detect erythropoietin gene deficiencies based on DNA content and as a gene marker to identify adjacent genes and their inconsistencies.

Wie hier anschließend im Detail beschrieben wird, bringt die vorliegende Erfindung signifikante Verbesserungen bei den Bestimmungsverfahren eines speziellen einzelsträngigen Polynucleotide unbekannter Sequenz in einer heterogenen zellulären oder viralen Probe mit sich, die multipler einzelsträngiger Polynucleotide enthält, wobeiAs will be described in detail hereinafter, the present invention involves significant improvements in the detection methods of a particular single-stranded polynucleotide of unknown sequence in a heterogeneous cellular or viral sample containing multiple single-stranded polynucleotides, wherein

(a) ein Gemisch markierter, einzelsträngiger Nucieotidsonden mit gleichmäßig variierenden Basensequenzen hergestellt wird, wobei jede dieser Sonden potentiell spezifisch komplementär zu einer Sequenz von Basen ist, die in dem zu bestimmenden. Polynucleotid vermutlich nur einmal existierend ist, (b), die Probe auf einem festen Substrat fixiert ist,(a) preparing a mixture of labeled, single-stranded nucleotide probes having uniformly varying base sequences, each of said probes being potentially specifically complementary to a sequence of bases to be determined in the one or more sequences. Polynucleotide is believed to exist only once, (b) the sample is fixed on a solid substrate,

(c), das Substrat mit der darauf fixierenden Probe behandelt wird, um die weitere Bindung von Polynucleotiden daran zu verhindern, ausgenommen mittels Hybridisierung an Polynucleotide in der Probe, (d)- das behandelte Substrat mit der darauf fixierten Probe flüchtig mit dem genannten Gemisch markierter Sonden unter solchen Bedingungen in Kontakt gebracht wird, die die Hybridisierung nur zwischen vollständig komplementären Polynucleotiden erleichtern, und(c) treating the substrate with the sample thereon to prevent further binding of polynucleotides thereto, except by hybridization to polynucleotides in the sample; (d) - the treated substrate with the sample fixed thereon is volatile with said mixture labeled probes are contacted under conditions which facilitate hybridization only between fully complementary polynucleotides, and

(e) das spezifische Polynucleotid durch Beobachten des Ablaufens einer Hybridisierungsreaktion zwischen diesem und einer vollständig komplementären Sonde innerhalb des Gemisches markierter Sonden bestimmt wird, was durch Vorhandensein einer höheren Dichte von markiertem Material auf dem Substrat amOrt des spezifischen Polynucleotide bewiesen wird, im Vergleich zu einer Hintergrund-Dichte am markierten Material, die sich aus der nichtspezifischen Bindung markierter Sonden an das Substrat ergibt.(e) the specific polynucleotide is determined by observing the course of a hybridization reaction between it and a fully complementary probe within the mixture of labeled probes, as evidenced by the presence of a higher density of labeled material on the substrate at the site of the specific polynucleotide, as compared to one Background density of the labeled material resulting from nonspecific binding of labeled probes to the substrate.

Die Verfahren sind insbesondere effektiv bei Situationen, die die Verwendung von 64,128,256,512,1024 oder mehr gemischten Polynucleotidsonden mit einer Länge von 17 bis 20 Basen bei DNA/DNA- oder RNA/RNA- oder DNA/RNA-Hybridisierungen erfordern.The methods are particularly effective in situations requiring the use of 64,128,256,512,1024 or more mixed polynucleotide probes of 17 to 20 bases in length in DNA / DNA or RNA / RNA or DNA / RNA hybridizations.

Wie weiter unten ausgeführt wird, haben die oben genannten verbesserten Verfahren die Erkennung von cDNA-Klonen gestattet, die für Erythropoietin mit Ursprung von Affenspezies codieren, innerhalb einer Bibliothek, die aus anämischer AffennierenzellmRNA hergestellt wurde. Insbesondere wurde ein Gemisch von 128 gleichmäßig variierten 20-mer-Sonden basierend auf einer Ämthosäuresequenzinformation, die von sequenzierenden Fraktionen von Human-Erythropoietin abgeleitet wurde, in Koloniehybridisierungsverfahren eingesetzt, um sieben „positive" Erythropoietin-cDNA-Klone innerhalb einer Gesamtmenge von 200000 Kolonien zu identifizieren. Noch bemerkenswerter ist, daß der praktische Einsatz der verbesserten _ erfindungsgemäßen Verfahren die schnelle Isolierung von drei positiven Klonen gestattet, und zwar über ein Screening von T 500000 Phagenplaques, die eine Human-Genbibliothek darstellen. Dies wurde erreicht durch Verwendung des oben genannten Gemisches von 128 20-mer-Sonden zusammen mit einem zweiten Satz von 128 17-mer-Sonden, basierend auf einer Aminosäureanalyse einer unterschiedlichen fortlaufenden Sequenz von Human-Erythropoietin. Dieoben genannten erläuternden Verfahren bilden den ersten bekannten Fall der Verwendung multipler gemischter Oligonucleotidsonden bei DNA/DNA-Hybridisierungsverfahren, die auf die Isolierung von Säugetiergenomklonen gerichtet sind, und den ersten bekannten Fall der Verwendung eines Gemisches von mehr als 32 Oligonucleotidsonden bei der Isolierung voncDNA-Klonen. Für den Fachmann ergeben sich zahlreiche Aspekte und Vorteile der Erfindung durch die folgende detaillierte Beschreibung, in der auch praktische Seiten der Erfindung in ihren gegenwärtig bevorzugten Ausführungsformen erläutert werden.As discussed below, the above improved methods have permitted the recognition of cDNA clones encoding erythropoietin originating from monkey species within a library made from monkey kidney anemic cell mRNA. In particular, a mixture of 128 evenly varied 20-mer probes based on ammocytic sequence information derived from sequencing fractions of human erythropoietin was used in colony hybridization procedures to add seven "positive" erythropoietin cDNA clones within a total of 200,000 colonies More notably, the practical use of the improved methods of the present invention allows the rapid isolation of three positive clones by screening T 500,000 phage plaques representing a human gene library This was achieved using the above mixture of 128 20-mer probes along with a second set of 128 17-mer probes based on an amino acid analysis of a different contiguous sequence of human erythropoietin The above-mentioned illustrative methods constitute the first known case of using multiple mixed oil oligonucleotide probes in DNA / DNA hybridization methods directed to the isolation of mammalian genome clones, and the first known case of using a mixture of more than 32 oligonucleotide probes in the isolation of cDNA clones. Numerous aspects and advantages of the invention will become apparent to those skilled in the art from the following detailed description, in which practical aspects of the invention will be elucidated in its presently preferred embodiments.

Erfindungsgemäß wurden DNA-Sequenzen isoliert und bestimmt, die einen Teil oder die gesamte Polypeptid-Sequenz von Human- und Affenspezies-Erythropoietin (anschließend teilweise als „EPO" bezeichnet) verschlüsseln. Weiterhin wurde die vom Affen oder Menschen stammende DNA zum Subjekt eucaryotischer und procaryotischer Expression gemacht, wobei isolierbare Mengen an Polypeptiden entstehen, die biologische (z.B. immunologische) Eigenschaften von natürlich vorkommenden EPO zeigen sowie sowohl in vivo- als auch in vitro-biologische Aktivitäten von EPO.In accordance with the present invention, DNA sequences encoding some or all of the polypeptide sequence of human and monkey species erythropoietin (hereinafter sometimes referred to as "EPO") have been isolated and further characterized, the monkey or human DNA has become eucaryotic and procaryotic Expression, resulting in isolatable amounts of polypeptides that show biological (eg immunological) properties of naturally occurring EPO and both in vivo and in vitro biological activities of EPO.

Die DNA aus Affenspezies wurde aus einer cDNA-Bibliothek isoliert, die mit einer mRNA konstruiert worden war, die aus Affennierengewebe in einem auf chemischem Wege ausgelösten anämischen Zustand gewonnen wurde, und deren Serum . nach immunologischer Bestimmung hohe Anteile EPO enthielt, verglichen mit normalem Affenserum. Die Isolierung der gewünschten cDNÄ-Klone, die DNA verschlüsselnde EPO enthielten, erreichte man unter Einsatz von DNA/DNA-Koloniehybridisierung durch Verwendung eines Pools von 128 gemischten, radiomarkierten 20-mer-Oligonucleotidsonden unter Einbeziehung des Schnellscreenings von 200000 Kolonien. Das Muster der Oligonucleotidsonden wurde auf Aminosäuresequenzinformation stationiert, die durch enzymatische Fragmentierungen und Sequenzieren einer kleinen Human-EPO-Probe gewonnen wurden.The monkey species DNA was isolated from a cDNA library constructed with mRNA obtained from monkey kidney tissue in a chemically induced anemic state and its serum. after immunological determination contained high levels of EPO compared to normal monkey serum. Isolation of the desired cDNA clones containing DNA-encoding EPO was achieved using DNA / DNA colony hybridization using a pool of 128 mixed radiolabelled 20-mer oligonucleotide probes involving rapid screening of 200,000 colonies. The pattern of oligonucleotide probes was stationed on amino acid sequence information obtained by enzymatic fragmentation and sequencing of a small human EPO sample.

Die DNA von Menschen wurde aus einer humangenomischen DNA-Bibliothek isoliert. Die Isolierung von Klonen, die EPO-verschlüsselnde DNA enthielten, wurde durch DNA/DNA-Plaquehybridisierung erreicht unter Verwendung des oben angeführten Pools von 128 gemischten 20-mer-Oligonucleotidsonden und einem zweiten Pool von 128 radiomarkierten 17-mer-Sonden, deren Sequenzen auf Aminosäuresequenzinformationen stationiert sind, die man aus einem unterschiedlichen enzymatischen Human-EPO-Fragment erhielt.Human DNA was isolated from a human genomic DNA library. Isolation of clones containing EPO-encoding DNA was achieved by DNA / DNA plaque hybridization using the pool of 128 mixed 20-mer oligonucleotide probes listed above and a second pool of 128 radiolabelled 17-mer probes whose sequences are Amino acid sequence information obtained from a different human enzymatic EPO fragment.

Positive Kolonien und Plaques wurden mittels Didesoxy-Sequenzieren klonaler DNA unter Verwendung eines Teilsatzes von 16 Sequenzen innerhalb des Pools von 20-mer-Sonden auf Richtigkeit nachgeprüft, und ausgewählte Klone wurden einer Nucleotid-Sequenzanalyse unterworfen, die die Herleitung primärer Strukturübereinstimmung der damit verschlüsselten EPO-Polypeptide zuließ. Die hergeleiteten Polypeptidsequenzen zeigten einen hohen Grad an Homologie zueinander und zu einer durch Aminosäureanalyse von Human-EPO-Fragmenten erzeugten Partialsequenz.Positive colonies and plaques were checked for accuracy by dideoxy sequencing of clonal DNA using a subset of 16 sequences within the pool of 20-mer probes, and selected clones were subjected to nucleotide sequence analysis which determined the derivation of primary structural identity of the EPOs encoded therewith Allowed polypeptides. The deduced polypeptide sequences showed a high degree of homology to each other and to a partial sequence generated by amino acid analysis of human EPO fragments.

Ein selektierter positiver Affen-cDNA-Klon und ein selektierter positiver Human-Genklon wurden jeweils in einen „Zubringer"-(„shuttle") DNA-Vektor insertiert, der in E. coli amplifiziert und dazu verwendet wurde, Säugetierzellen in Kultur zu transferieren. Kultiviertes Wachstum transferierter Wirtszellen führte zu Präparationen des Überstehenden des Kulturmediums, die mehr als 300OmE EPO pro ml Kulturflüssigkeit enthielten.A selected positive monkey cDNA clone and a selected positive human gene clone were each inserted into a "shuttle" DNA vector amplified in E. coli and used to culture mammalian cells. Cultured growth of transferred host cells resulted in preparations of the culture medium supernatant containing more than 300 oM EPO per ml of culture fluid.

Ausführungsbeispielembodiment

Die folgenden Beispiele dienen der Erläuterung der Erfindung und sind speziell auf Verfahren gerichtet, die vorher zur Erkennung von EPO verschlüsselenden Affen-cDNA-Klonen und humangenomischen Klonen durchgeführt wurden, auf Verfahren, die in einer solchen Erkennung führen und auf das Sequenzieren.The following examples are illustrative of the invention and are specifically directed to methods previously performed for the recognition of EPO-encoding monkey cDNA clones and human genomic clones, to methods resulting in such recognition, and to sequencing.

Insbesondere Beispiel 1 ist auf das Aminosäuresequenzieren von Human-EPO-Fragmenten gerichtet und auf die Konstruktion von Gemischen radiomarkierter Sonden, die auf den Ergebnissen dieses Sequenzierens basieren. Beispiel 2 ist allgemein auf Verfahren gerichtet, zu denen die Erkennung von positiven Affen-cDNA-Klonen gehört und erbringt eine Information zur Behandlung des Tieres und zur vorläufigen Radioimmunoassay-(RIA)-analyse tierischer Seren. Beispiel 3 ist gerichtet auf die Herstellung der cDNA-Bibliothek, das Kolonie-Hybridisierungsscreening und die Überprüfung der positiven Klone auf Richtigkeit, das DNA-Sequenzieren eines positiven cDNA-Klons und die Erzeugung einer primären Stm kturübereinstimmungs(Aminosäuresequenz)-lnform ation des Affen-EPO-Polypeptids. Beispiel 4 ist auf Verfahren gerichtet, die die Erkennung positiver humangenomischer Klone betreffen und zu einer Information über die Herkunft der Gen-Bibliothek, über Plaquehybridisierungsverfahren und die Überprüfung auf Richtigkeit positiver Klone führen. Beispiel 5 ist auf das DNA-Sequenzieren eines positiven genomischen Klons und die Erzeugung einer Aminosäuresequenzinformation des Human-EPO-Polypeptids gerichtet, einschließlich eines Vergleichs dieser mit der Affen-EPO-Sequenzinformation.Specifically, Example 1 is directed to the amino acid sequencing of human EPO fragments and the construction of mixtures of radiolabeled probes based on the results of this sequencing. Example 2 is generally directed to methods involving the detection of positive monkey cDNA clones and provides information for treating the animal and preliminary radioimmunoassay (RIA) analysis of animal sera. Example 3 is directed to preparation of the cDNA library, colony hybridization screening and verification of positive clones for correctness, DNA sequencing of a positive cDNA clone, and generation of a primary stem m match (amino acid sequence) information of the monkey. EPO polypeptide. Example 4 is directed to methods relating to the recognition of positive human genomic clones leading to information on the origin of the gene library, about plaque hybridization methods, and checking for the correctness of positive clones. Example 5 is directed to the DNA sequencing of a positive genomic clone and the generation of amino acid sequence information of the human EPO polypeptide, including a comparison of these with the monkey EPO sequence information.

Beispiel 1example 1

A. Human-EPO-Fragment-AminosäuresequenzierenA. Human EPO Fragment Amino Acid Sequencing

Human-EPO wurde aus Urin isoliert und einem tryptischen Abbau unterworfen, was zur Entwicklung und Isolierung von 17 getrennten Fragmenten in Mengen von annähernd 100 bis 150 Picomolen führte.Human EPO was isolated from urine and subjected to tryptic degradation resulting in the development and isolation of 17 separate fragments in amounts of approximately 100 to 150 picomoles.

Den Fragmenten wurden willkürlich Nummern zugeordnet, und sie wurden auf Aminosäuresequenzen durch Mikrosequenzanalyse unter Verwendung eines Gasphasensequenzers (Applied Biosystems) analysiert, wobei man die in Tabelle I dargestellte Sequenzinformation erhielt. Es wurden darin Einzelbuchstabencodes verwendet, und „X" bezeichnet einen Rest, der nicht genauer weiter bestimmt wurde.The fragments were arbitrarily assigned numbers and analyzed for amino acid sequences by microsequence analysis using a gas phase sequencer (Applied Biosystems) to obtain the sequence information shown in Table I. Single-letter codes were used therein, and "X" denotes a remainder that was not further specified.

Tabelle ITable I

Fragment No. Ergebnis SequenzanalyseFragment No. Result sequence analysis

T4a A-P-P-RT4a A-P-P-R

T4b G-K-L-KT4b G-K-L-K

T 9 · A-L-G-A-Q-KT 9 · A-L-G-A-Q-K

T13 V-L-E-RT13 V-L-E-R

T16 A-V-S-G-L-RT16 A-V-S-G-L-R

T18 L-F-RT18 L-F-R

T21 K-L-F-RT21 K-L-F-R

T 25 Y-L-L-E-A-KT25 Y-L-L-E-A-K

T 26 a L-I-C-D-S-RT26 a L-I-C-D-S-R

T 26 b L-Y-T-G-E-A-C-RT26b L-Y-T-G-E-A-C-R

T 27 T-I-T-A-D-T-F-RT 27 T-I-T-A-D-T-F-R

T 28 E-A-I-S-P-P-D-A-A-M-A-A-P-L-RT28 E-A-I-S-P-P-D-A-A-M-A-A-P-L-R

T 30 E-A-E-X-I-T-T-G-X-A-E-H-X-S-L-N-E-X-I-T-V-PT30 E-A-E-X-I-T-T-G-X-A-E-H-X-S-L-N-E-X-I-T-V-P

T 31 V-Y-S-N-F-L-RT31 V-Y-S-N-F-L-R

T 33 ' S-L-T-T-L-L-RT33 'S-L-T-T-L-L-R

T 35 V-N-F-Y-A-W-KT 35 V-N-F-Y-A-W-K

T 38 G-Q-A-L-L-V-X-S-S-Q-P-W-E-P-L-Q-L-H-V-D-KT38 G-Q-A-L-L-V-X-S-S-Q-P-W-E-P-L-Q-L-H-V-D-K

B. Muster und Konstruktion von OligonucleotidsondengemischenB. Pattern and Construction of Oligonucleotide Probe Mixtures

Die in Tabelle I aufgeführten Aminosäuresequenzen wurden im Zusammenhang mit der Degenerierung des genetischen Codes dahingehend nochmals überprüft, ob die Mischsondenverfahren auf DNA/DNA-Hybridisierungsverfahren in cDNA- und/oder genomischen DNA-Bibliotheken angewandt werden können. Diese Analyse zeigte, daß innerhalb des Fragmentes Nr.T35 eine Serie von 7 Aminosäureresten (Val-Asn-Phe-Tyr-Ala-Trp-Lys) existierte, die einzig und allein dadurch gekennzeichnet werden kann, daß sie durch eine von 128 möglichen DNA-Sequenzen, die 20 Basenpaare überspannt, verschlüsselt wird. Ein erster Satz von 128 20-mer-Oligonucleotiden wurde somit durch Standard-Phosphoamiditverfahren (siehe z. B. Beaucage et al., Tetrahedron Letters,22, S. 1859-1862 (1981) auf festen Träger entsprechend der in Tabelle Il aufgeführten Sequenz synthetisiert.The amino acid sequences listed in Table I were re-examined in connection with the degeneracy of the genetic code as to whether the mixed probe methods can be applied to DNA / DNA hybridization methods in cDNA and / or genomic DNA libraries. This analysis showed that within fragment # T35 there existed a series of 7 amino acid residues (Val-Asn-Phe-Tyr-Ala-Trp-Lys) which can only be characterized by being one of 128 possible DNAs Sequences that spans 20 base pairs are encrypted. Thus, a first set of 128 20-mer oligonucleotides was prepared by standard phosphoamidite methods (see, for example, Beaucage et al., Tetrahedron Letters, 22, pp. 1859-1862 (1981) on a solid support according to the sequence listed in Table II synthesized.

Tabelle IlTable II Restrest — VaI- VaI AsnAsn PhePhe TyrTyr AIaAla TrpTrp LysLys 3'3 ' CAACAA TTGTTG AAGAAG ATGATG CGACGA ACCACC TT- 5TT-5 TT AA AA AA TT GG GG CC CC

Die weitere Analyse zeigte, daß innerhalb des Fragments T38 eine Serie von 6 Aminosäureresten (Gln-Pro-Trp-Glu-Pro-Leu) auf der Basis existierte, von der aus man einen Pool von 128Misch-Oligonucleotid-17-mer-Sonden herstellen konnte, wie unten in Tabelle III aufgeführt sind.Further analysis showed that within the fragment T38, there existed a series of 6 amino acid residues (Gln-Pro-Trp-Glu-Pro-Leu) based on which to prepare a pool of 128 mixed oligonucleotide 17-mer probes could be listed in Table III below.

Tabelle IIITable III Restrest GInGin ProPer TrpTrp GIuGlu ProPer LeuLeu 3'3 ' GTTGTT GGAGGA ACCACC CTTCTT GGAGGA GA- 5GA-5 CC TT CC TT kAkA GG GG CC CC

Die Oligonucleotidsonden wurden am 5'-Ende mit Gamma-32-p-ATP, 7 500-8000ci/mmol (ICN) unter Verwendung von T4-Polynucleotidkinase (NEN) markiert. .The oligonucleotide probes were labeled at the 5 'end with gamma- 32 -p-ATP, 7 500-8000 cc / mmole (ICN) using T 4 polynucleotide kinase (NEN). ,

Beispiel 2Example 2 A. Affenbehandlungsverfahren und RIA-AnalyseA. Monkey treatment procedure and RIA analysis

Weibliche Cynomolgus-Affen Macaca fascicularias (2,5-3kg), eineinhalb bis zwei Jahre alt) wurden subkutan mit einer pH7-Lösung von Phenylhydrazinhydrochlorid bei einer Dosis von 12,5 mg/kg am ersten, dritten und fünften Tag behandelt. Vor jeder Injektion wurde der Hämatokritwert beobachtet. Am siebenten Tag oder zu dem Zeitpunkt, wo der Hämatokritspiegel unter 25% des Anfangswertes fiel, wurden Serum und Nieren nach Verabreichung von 25 mg/kg Dosen Ketaminhydrochlorid entnommen. Die entnommenen Materialien wurden unmittelbar danach in flüssigem Stickstoff eingefroren und bei -700C gelagert.Female cynomolgus monkeys Macaca fascicularias (2.5-3 kg), one and a half to two years old) were treated subcutaneously with a pH7 solution of phenylhydrazine hydrochloride at a dose of 12.5 mg / kg on the first, third and fifth day. Before each injection, the hematocrit value was observed. On the seventh day, or at the time when the hematocrit level fell below 25% of the initial value, serum and kidneys were withdrawn following administration of 25 mg / kg doses of ketamine hydrochloride. The extracted materials were immediately frozen in liquid nitrogen and stored at -70 0 C.

B. RIA für EPOB. RIA for EPO

Es wurden Radioimmunoassäys zur quantitativen Bestimmung von EPO in Proben nach den folgenden Verfahrensweisen durchgeführt:Radioimmunoassays were used to quantitatively determine EPO in samples according to the following procedures:

Ein Erythropoietin-Standard oder eine unbekannte Probe wurde zusammen mit Antiserum für 2 Stunden bei 37°C inkubiert. Nach der zweistündigen Inkubierung wurden die Proberöhrchen in Eis gekühlt, 125l-markiertes Erythropoietin hinzugegeben und die Röhrchen bei 0°C für wenigstens 15 weitere Stunden inkubiert. Jedes Assayröhrchen enthielt 500μΙ Inkubationsgemisch, bestehend aus 50 μΙ verdünnten Immunseren, lOOOOcpm 125l-Erythropoietin, δμΙΤ^βγΙοΙ und 0 ^β250μΙ entweder des EPO-Standards oder der unbekannten Probe, wobei mit 0,1 % BSA enthaltendem PBS das restliche Volumen erbracht wurde. Das verwendete Antiserum war das zweite Testblut eines mit 1%igem Reinpräparat von Humanurin-Erythropoietin immunisierten Kaninchens. Die Endverdünnung des Antiserums bei der Assay wurde so eingestellt, daß das Antikörper-gebundene 125I-EPO 10—20% der Eingangs-Gesamtcounts überschritt. Allgemein entsprach dies einer Endverdünnung des Antiserums von 1:50000 bis 1:100000.An erythropoietin standard or an unknown sample was incubated with antiserum for 2 hours at 37 ° C. After the two hour incubation, the test tubes were cooled in ice, 125 L-labeled erythropoietin added and the tubes incubated at 0 ° C for at least 15 more hours. Each assay tube contained 500μΙ incubation mixture consisting of 50 μΙ diluted immune sera, lOOOOcpm 125 l erythropoietin, δμΙΤ ^ 0 ^ βγΙοΙ and β250μΙ either of the EPO standards or the unknown sample, containing 0.1% BSA PBS was achieved the remaining volume , The antiserum used was the second test blood of a rabbit immunized with 1% pure human urinary erythropoietin preparation. The final dilution of antiserum in the assay was adjusted so that the antibody-bound 125 I-EPO exceeded 10-20% of the total input counts. In general, this corresponded to a final dilution of the antiserum of 1: 50,000 to 1: 100,000.

Das Antikörper-gebundene 125l-Erythropoietin wurde durch Zusatz von 150μ^βρί! A gefällt. Nach einer 40minütigen Inkubation wurden die Proben zentrifugiert und die Pellets zweimal mit 0,75ml lOmMTris-HCI von pH8,2, die 0,15 M NaCI, 2 mM EDTA und 0,05% Triton x-100 enthielt, gewaschen. Die gewaschenen Pellets wurden in einem Gammazähler gezählt, um den Prozentsatz der 125l-Erythropoietinbindung zu bestimmen. Die durch Prä-Immunseren gebundenen Counts wurden von allen Gesamtwerten abgezogen zwecks Korrektur der nicht-spezifischen Fällung. Der Erythropoietingehalt der unbekannten Proben wurde durch Vergleich mit der Standardkurve ermittelt.The antibody-bound 125 L erythropoietin was supplemented with 150 μ ^ βρί! A likes. After a 40 minute incubation, the samples were centrifuged and the pellets washed twice with 0.75 ml 10 mM Tris-HCl pH 8.2 containing 0.15 M NaCl, 2 mM EDTA and 0.05% Triton x-100. The washed pellets were counted in a gamma counter to determine the percentage of 125 L erythropoietin binding. The counts bound by pre-immune sera were subtracted from all totals to correct nonspecific precipitation. The erythropoietin content of the unknown samples was determined by comparison with the standard curve.

Das oben genannte Verfahren wurde auf im Teil A(s.c) erhaltenes Affenserum angewandt und ebenso auf das unbehandelte Affenserum. Normale Serumspiegel wurden geprüft und zeigten annähernd 36mE/ml, während behandeltes Affenserum von 1 000 bis 1700mE/ml enthielt.The above procedure was applied to monkey serum obtained in part A (s.c.) and also to the untreated monkey serum. Normal serum levels were tested and showed approximately 36mU / ml, while treated monkey serum contained from 1000 to 1700mU / ml.

Beispiel 3Example 3 A. Konstruktion der Äffen-cDNA-BibliothekA. Construction of the Apical cDNA Library

Aus normalen und anämischen Affennieren wurde Boten-RNA isoliert mit Hilfe des Guanidin-Thiocyanatverfahrens von Chirgwin et al., Biochemistry, 18, S. 5294 (1979), und die Poly (A)+mRNA wurde durch zwei Durchläufe der Oligo(dT)-Zellulose-Säulenchromatografie gereinigt, beschrieben bei „Maniatis" et al., „Molecular Cloning, A Laboratory Manual", S. 197-198 Cold Springs Harbor Laboratory, Cold Springs, Harbor, N. Y., 1982). Die cDNA-Bibliothek wurde gemäß einer Modifikation der allgemeinen Verfahrensweisen von Okayama et al., Mol. and Cell. Biol., 2, S. 161-170 (1982) konstruiert. Die Schlüsselmerkmale der gegenwärtig bevorzugten Verfahren sind die folgenden:Messenger RNA was isolated from normal and anemic monkey kidneys using the guanidine thiocyanate method of Chirgwin et al., Biochemistry, 18, p. 5294 (1979), and the poly (A) + mRNA was separated by two passes of oligo (dT). Cellulose column chromatography purified in "Maniatis" et al., "Molecular Cloning, A Laboratory Manual", pp. 197-198 Cold Springs Harbor Laboratory, Cold Springs, Harbor, NY, 1982). The cDNA library was prepared according to a modification of the general procedures of Okayama et al., Mol. And Cell. Biol., 2, pp. 161-170 (1982). The key features of the presently preferred methods are the following:

(1) pUC8 wurde als alleiniger Vektor verwendet, geschnitten mit Pst I und dann mit einem Schwanzstück von OligodT von 60 bis 80 Basen in der Länge versehen;(1) pUC8 was used as the sole vector, cut with Pst I and then provided with a tail of OligodT of 60 to 80 bases in length;

(2) Hinc Il-Verdauung wurde eingesetzt, um das Oligo dT-Schwanzstück vom einen Ende des Vektors zu entfernen;(2) Hinc II digestion was used to remove the oligo dT tail from one end of the vector;

(3) die erste Strangsynthese und das Versehen von Oligo dG mit einem Schwanzstück erfolgte nach dem veröffentlichten Verfahren(3) the first strand synthesis and tailing of oligo dG was done according to the published procedure

(4) es wurde mit einer Bann HI-Verdauung gearbeitet, um den Oligo dG-Schwanz von einem Ende des Vektors zu entfernen; und(4) Bann HI digestion was used to remove the oligo dG tail from one end of the vector; and

(5) Ersatz des RNA-Stranges durch DNA in Anwesenheit von zwei Linkern (GATCTAAAGACCGTCCCCCCCC und ACGGTCTTTA) in einem dreifachen molaren Überschuß über den mit den Oligo dG-Schwänzstück versehenen Vektor.(5) Replacement of the RNA strand by DNA in the presence of two linkers (GATCTAAAGACCGTCCCCCCCC and ACGGTCTTTA) in a three-fold molar excess over the oligo dG tailed vector.

B. Koloniehybridisierungsverfahren für das Screenen der Affen-cDNA-BibliothekB. Colony hybridization method for screening the monkey cDNA library

Transformierte E. coli wurde bei einer Dichte von 9000 Kolonien pro 10 x 10cm Platte auf Nährmediumplatten ausgebracht, die 50 Mikrogramm/ml Ampicillin enthielten. Gene-Screen-Filter (New England Nuclear Catalog Nr. NEF-972) wurden auf einer BHI-CAM-Platte vorbenetzt (Bacto Hirn-Herz-Infusion 37g/l, Casaminosäuren 2g/l und.Agar 15g/l, mit 500 Mikrogramm/ml Chloramphenicol) und dazu verwendet, die Kolonien von der Platte abzuheben. Die Kolonien wurden im gleichen Medium 12 Stunden wachsen gelassen, um die Plasmidkopieanzahl zu amplifizieren. Die amplifizierten Kolonien (Kolonieseite oben) wurden durch reihenweises Auflegen der Filter über 2 Stücke Whatman 3 MM-Papier behandelt, gesättigt mit jeweils den folgenden Lösungen:Transformed E. coli was seeded at a density of 9000 colonies per 10 x 10 cm plate on nutrient medium plates containing 50 micrograms / ml ampicillin. Gene Screen filters (New England Nuclear Catalog No. NEF-972) were pre-wetted on a BHI-CAM plate (Bacto Brain Heart Infusion 37g / L, casamino acids 2g / L and Agar 15g / L, 500 micrograms / ml chloramphenicol) and used to lift the colonies off the plate. The colonies were grown in the same medium for 12 hours to amplify the plasmid copy number. The amplified colonies (colony side above) were treated by placing the filters in rows on 2 pieces Whatman 3 MM paper, saturated with the following solutions in each case:

(1) 50mMGIucose —25 mMTris-HCI (pH 8,0) — 1OmM EDTA (pH 8,0) für fünf Minuten;(1) 50 mM glucose-25 mM Tris-HCl (pH 8.0) - 10 mM EDTA (pH 8.0) for 5 minutes;

(2) 0,5M NaOH für zehn Minuten; und(2) 0.5M NaOH for ten minutes; and

(3) 1,0MTris-HCI(pH7,5) für drei Minuten(3) 1.0M Tris HCl (pH 7.5) for three minutes

Die Filter wurden anschließend im Vakuum bei 8OT für zwei Stunden luftgetrocknet.The filters were then air dried in vacuo at 8 TOT for two hours.

Durch Behandlung mit einer Lösung, die 50 Mikrogramm/ml des Proteaseenzyms in Puffer K [0,1 M Tris-HCI (pH 8,0)—0,15 NaCIBy treatment with a solution containing 50 micrograms / ml of protease enzyme in buffer K [0.1 M Tris-HCl (pH 8.0) -0.15 NaCl

— 1OmM EDTA (pH 8,2)—0,2% SDS] wurden die Filter danach dem Protease K-Abbau unterworfen. Jedem Filter wurden speziell 5ml der Lösung hinzugesetzt, und man ließ den Abbau bei 550C über 30 Minuten vorsieh gehen. Danach wurde die Lösung entfernt.10 μM EDTA (pH 8.2) -0.2% SDS], the filters were then subjected to protease K degradation. Each filter have been specifically added to 5ml of the solution, and allowed the reduction at 55 0 C for 30 minutes vorsieh go. Thereafter, the solution was removed.

Die Filter wurden dann mit 4ml eine Prä-Hybridisierungspuffers (5 χ SSPE — 0,5% SDS —100 Mikrogramm/ml SS E. coli-DNÄThe filters were then incubated with 4 ml of a pre-hybridization buffer (5 χ SSPE - 0.5% SDS -100 micrograms / ml SS E. coli DNÄ

— 5 χ BFP) behandelt. Die Prä-Hybridisierungsbehandlung erfolgte bei 550C, im allgemeinen über 4 Stunden oder langer. Danach wurde der Prä-Hybridisierungspuffer entfernt.- 5 χ BFP). The pre-hybridization treatment was carried out at 55 ° C., generally for 4 hours or longer. Thereafter, the pre-hybridization buffer was removed.

Das Hybridisierungsverfahren wurde auf folgende Weise durchgeführt. Zu jedem Filter wurden 3 ml Hybridisierungspuffer (5 χ SSPE — 0,5% SDS —100 Mikrogramm/ml Hefe-tRNA), der 0,025 Picomole jeder der 128 Sondensequenzen von Tabelle Il enthielt (das Gesamtgemisch wurde als EPV-Gemisch bezeichnet), gegeben, und die Filter wurden 20 Stunden bei 48°C gehalten. Diese Temperatur lag um 2°C niedriger als die niedrigste der berechneten Dissoziationstemperaturen (Td), die für eine beliebige der Sonden berechnet worden war.The hybridization procedure was performed in the following manner. To each filter was added 3 ml of hybridization buffer (5 χ SSPE - 0.5% SDS -100 micrograms / ml yeast tRNA) containing 0.025 picomoles of each of the 128 probe sequences of Table II (the total mixture was referred to as EPV mixture) and the filters were kept at 48 ° C for 20 hours. This temperature was 2 ° C lower than the lowest of the calculated dissociation temperatures (Td) calculated for any of the probes.

Nach der Hybridisierung wurden die Filter dreimal für zehn Minuten auf einem Schüttler mit 6 x SSC — 0,1% SDS bei Zimmertemperatur gewaschen sowie zwei — bis dreimal mit 6 x SSC — 1%SDS bei der Hybridisierungstemperatur (48°C) gewaschen. Die Autoradiografie der Filter zeigte sieben positive Klone unter 200000 gescreenten Kolonien. Die Initialsequenzanalyse eines der vermeintlichen Affen-cDNA-Klone (als Klon 83 bezeichnet) erfolgte aus Gründen der Überprüfung auf Richtigkeit durch eine Modifikation der Verfahrensweise von Wallace et al., Gene, 16, S.21-26 (1981). Dabei wurde die Plasmid-DNA des Affen-cDNA-Klons 83 linearisiert durch Abbau mit Eco Rl und durch Erhitzen im siedenden Wasserbad denaturiert. Die Nucleotidsequenz wurde mittels des Didesoxy-Verfahrens von Sanger et al., P. IM. A. S (USA), 74, S. 5463-5467 (1977) bestimmt. Ein Teilsatz des EPV-Gemisches der Sonden, bestehend aus 16 Sequenzen, wurde als Primer für die Sequenzierungsreaktionen verwendet.After hybridization, the filters were washed three times for ten minutes on a shaker with 6 x SSC-0.1% SDS at room temperature and washed two to three times with 6 x SSC-1% SDS at the hybridization temperature (48 ° C). Autoradiography of the filters revealed seven positive clones among 200,000 colonies screened. The initial sequence analysis of one of the putative monkey cDNA clones (designated clone 83) was made for verification purposes by a modification of the procedure of Wallace et al., Gene, 16, pp. 21-26 (1981). The plasmid DNA of the monkey cDNA clone 83 was linearized by degradation with Eco Rl and denatured by heating in a boiling water bath. The nucleotide sequence was determined by the dideoxy method of Sanger et al., P.I.M. A. S (USA), 74, p. 5463-5467 (1977). A subset of the EPV mixture of probes consisting of 16 sequences was used as a primer for the sequencing reactions.

C. Sequenzieren von Affen-EPO-cDNAC. Sequencing of monkey EPO cDNA

Die Nucleotid-Sequenzanalysedes Klons 83 wurde mittels des Verfahrens von Messing, Methods in Enzymology, 101, S.20-78 (1983) durchgeführt. Aus Tabelle IV ist eine vorläufige Restriktionsmappenanalyse des annähernd 1 600 Basenpaar-Eco Rl/Hind lll-klonierten Fragments des Klons 83 zu entnehmen. Die annähernden Ortungen der Restriktionsendonuclease-enzym-Erkennungsstellen erfolgten mit Hilfe der Anzahl von Basen 3'zur EcoRI-Stelleam 5'-Endedes Fragments. Das Nucleotidsequenzieren erfolgte durch Sequenzen der individuellen Restriktionsfragmente mit der Absicht, überlappende Fragmente anzupassen. Beispielsweise bestimmte die Analyse der Nucleotide in einem Restriktionsfragment die Überlappung der Sequenzinformation C113 (Sau bei —111 /Sma I bei ~324), und das reverse Ordersequenzieren eines Fragments C73 (AIu I bei~424/BstEllbei~203.The nucleotide sequence analysis of clone 83 was performed by the method of Messing, Methods in Enzymology, 101, p.20-78 (1983). From Table IV, a preliminary restriction analysis of the approximately 1 600 base pair Eco RI / Hind III-cloned fragment of clone 83 can be seen. Approximate localizations of restriction endonuclease enzyme recognition sites were made by the number of bases 3 'to the Eco RI site at the 5' end of the fragment. Nucleotide sequencing was performed by sequences of the individual restriction fragments with the intention of adapting overlapping fragments. For example, analysis of nucleotides in a restriction fragment determined the overlap of sequence information C113 (Sau at -111 / Sma I at ~ 324), and reverse order sequencing of fragment C73 (Alu I at ~ 424 / BstEll at ~ 203.

Tabelle IVTable IV

Restriktionsenzym-Erkennungsstelle Ungefähre(r) Ort(e)Restriction enzyme recognition site Approximate location (s)

EcoRI 1EcoRI 1

Sau3A 111Sau3A 111

Smal 180Smal 180

BsTEII , ' 203BsTEII, '203

Smal 324Smal 324

Kpnl 371Kpnl 371

Fortsetzung der Tabelle IVContinuation of Table IV

Restriktionsenzym-Erkennungsstelle Ungefähre(r) Ort(e)Restriction enzyme recognition site Approximate location (s)

Rsal 372Rsal 372

AIuI 424AIuI 424

Pstl 426Pstl 426

AIuI 430AIuI 430

Hpal 466Hpal 466

AIuI 546AIuI 546

Pstl . 601Pstl. 601

Pvull 604Pvull 604

AIuI 605AIuI 605

AIuI 782AIuI 782

AIuI 788AIuI 788

Rsal 792Rsal 792

Pstl — 807Pstl - 807

AIuI 841AIuI 841

AIuI 927AIuI 927

Ncol 946Ncol 946

Sau3A 1014Sau3A 1014

AIuI 1072AIuI 1072

AIuI 1115AIuI 1115

AIuI 1223AIuI 1223

Pstl 1301Pstl 1301

Rsal 1343Rsal 1343

AIuI 1384AIuI 1384

Hindlll 1449Hindlll 1449

AIuI 1450AIuI 1450

Hindlll 1585Hindlll 1585

Das Sequenzieren von annähernd 1342 Basenpaaren (innerhalb der von der Sau 3A-Stelle 3' bis zur Eco Rl-Stelle und der Hind Ill-Stelle überspannten Region) und die Analyse der Ableseraster gestattete die Aufstellung der DNA- und Aminosäuresequenziformationen, die in der Tabelle V enthalten sind. Inder Tabelle wurde der vermutliche Anfangsaminosäurerest des Aminoterminais der reifen EPO (auf Richtigkeit überprüft durch Korrelation der vorher genannten Sequenzanalyse von zwanzig Aminoterminairesten) mit der Ziffer +1 bezeichnet. Die Anwesenheit eines Methioninspezifizierenden ATG-Codos (bezeichnet als -27) „oberhalb" (upstream) des anfänglichen Aminoterminal-Alaninrestes als des ersten Restes, der für die Aminosäuresequenz des reifen Proteins bezeichnet ist, zeigt die Wahrscheinlichkeit an, daß EPO anfänglich im Cytoplasma in einer Precursorform exprimiert wurde mit einer 27 Aminosäuren-„leader"-Region, die vor dem Eintritt des reifen EPO in den Kreislauf herausgeschnitten wird. Potentielle Glykosylierungsstellen innerhalb des Polypeptids sind durch Sternchen gekennzeichnet. Die geschätzte Molekülmasse der translatierten Region betrug 21117 Daltonsund die Molekülmasse der 165 Reste des Polypeptids, das reifes Affen-EPO bildete, wurde mit 18236 Daltons bestimmt.Sequencing of approximately 1342 base pairs (within the region spanned by Sau 3A site 3 'to the Eco RI site and the Hind III site) and analysis of the reading frames allowed the preparation of the DNA and amino acid sequence formats shown in Table V are included. In the table, the putative initial amino acid residue of the aminoterminal mature EPO (verified by correlation of the above-mentioned sequence analysis of twenty amino terminal residues) was designated by the number +1. The presence of a methionine-specifying ATG codo (termed -27) "upstream" of the initial amino terminal alanine residue as the first residue designated for the amino acid sequence of the mature protein indicates the likelihood that EPO is initially expressed in the cytoplasm of a precursor form was expressed with a 27 amino acid leader region, which is excised before the mature EPO enters the circulation. Potential glycosylation sites within the polypeptide are indicated by asterisks. The estimated molecular mass of the translated region was 21,117 daltons, and the molecular mass of the 165 residues of the polypeptide that produced mature monkey EPO was determined to be 18,236 daltons.

Tabelle VTable V Translation von Affen-EPO cDNATranslation of monkey EPO cDNA

Sau 3 ASow 3 A

CCCGGTGTGGTCACCGCGCGCCTAGGTCGCTGAGCCCGGTGTGGTCACCGCGCGCCTAGGTCGCTGAG

-27 -20-27 -20

Met GIy VaI His GIu Cys Pro AIa TrpMet GIy VaI His GIu Cys Pro AIa Trp

GGACCCCGGCCAGGCGCGGAGATG GGG GTG CAC GAA TGT CCT GCC TGGGGACCCCGGCCAGGCGCGGAGATG GGG GTG CAC GAA TGT CCT GCC TGG

-10-10

Leu Trp Leu Leu Leu Ser Leu VaI Ser Leu Pro Leu GIy Leu ProLeu Trp Leu Leu Leu Ser Leu VaI Ser Leu Pro Leu GIy Leu Pro

CTG TGG CTT CTC CTG TCT CTC GTG TCG CTC CCT CTG GGC CTC CCACTG TGG CTT CTC CTG TCT CTC GTG TCG CTC CCT CTG GGC CTC CCA

-1 +1-1 +1

VaI Pro GIy AIa Pro Pro Arg Leu He Cys Asp Ser Arg VaI LeuVaI Pro GIy AIa Pro Pro Arg Leu He Cys Asp Ser Arg VaI Leu

GTC CCG GGC GCC CCA CCA CGC CTC ATC TGT GAC AGC CGA GTC CTGGTC CCG GGC GCC CCA CCA CGC CTC ATC TGT GAC AGC CGA GTC CTG

2020

GIu Arg Tyr Leu Leu GIu AIa Lys GIu Ala GIu Asn VaI Thr MetGIu Arg Tyr Leu Leu Giu Ala Lys Giu Ala Giu Asn VaI Thr Met

GAG AGG TAC CTC TTG GAG GCC AAG GAG GCC GAG AAT GTC ACG ATG 30GAG AGG TAC CTC TTG GAG GCC AAG GAG GCC GAG AAT GTC ACG ATG 30

GIy Cys Ser GIu Ser Cys Ser Leu Asn GIu Asn lie Thr VaI ProGly Cys Ser Glu Ser Cys Ser Leu Asn Glu Asn lie Thr VaI Pro

GGC TGT TCC GAA AGC TGC AGC TTG AAT GAG AAT ATC ACC GTC CCAGGC TGT TCC GAA AGC TGC AGC TTG AAT GAG AAT ATC ACC GTC CCA

5050

Asp Thr Lys VaI Asn Phe Tyr AIa Trp Lys Arg Met GIu VaI GIyAsp Thr Lys VaI Asn Phe Tyr AIa Trp Lys Arg Met GIu VaI GIy

GAC ACC AAA GTT AAC TTC TAT GCC TGG AAG AGG ATG GAG GTC GGGGAC ACC AAA GTT AAC TTC TAT GCC TGG AAG AGG ATG GAG GTC GGG

60 70 : '60 70: '

Gin Gin Ala VaI GIu VaI Trp Gin GIy Leu AIa Leu Leu Ser GIuGin Gin Ala VaI GIu VaI Trp Gin GIy Leu AIa Leu Leu Ser GIu

CAG CAG GCT GTA GAA GTC TGG CAG GGC CTG GCC CTG CTC TCA GAACAG CAG GCT GTA GAA GTC TGG CAG GGC CTG GCC CTG CTC TCA GAA

8080

Ala VaI Leu Arg GIy Gin Ala VaI Leu AIa Asn Ser Ser GIn ProAla VaI Leu Arg GIy Gin Ala VaI Leu AIa Asn Ser Ser GIn Pro

GCT GTC CTG CGG GGC CAG GCC GTG TTG GCC AAC TCT TCC CAG CCTGCT GTC CTG CGG GGC CAG GCC GTG TTG GCC AAC TCT TCC CAG CCT

90 10090 100

Phe GIu Pro Leu GIn Leu His Met Asp Lys Ala He Ser GIy LeuPhe GIu Pro Leu GIn Leu His Met Asp Lys Ala He Ser GIy Leu

TTC GAG CCC CTG CAG CTG CAC ATG GAT AAA GCC ATC AGT GGC CTTTTC GAG CCC CTG CAG CTG CAC ATG GAT AAA GCC ATC AGT GGC CTT

110110

Arg Ser Me Thr Thr Leu Leu Arg AIa Leu GIy Ala Gin GIu AIaArg Ser Thr Thr Leu Leu Arg AIa Leu GIy Ala Gin GIu AIa

CGC AGC ATC ACC ACT CTG CTT CGG GCG CTG GGA GCC CAG GAA GCCCGC AGC ATC ACC ACT CTG CTT CGG GCG CTG GGA GCC CAG GAA GCC

120 130120 130

He Ser Leu Pro Asp Ala AIa Ser Ala AIa Pro Leu Arg Thr HeHe Ser Leu Pro Asp Ala Ala Ser Ala Ala Pro Leu Arg Thr He

ATC TCC CTC CCA GAT GCG GCC TCG GCT GCT CCA CTC CGA ACC ATCATC TCC CTC CCA GAT GCG GCC TCG GCT GCT CCA CTC CGA ACC ATC

140140

Thr Ala Asp Thr Phe Cys Lys Leu Phe Arg VaI Tyr Ser Asn PheThr Ala Asp Thr Phe Cys Lys Leu Phe Arg VaI Tyr Ser Asn Phe

ACT GCT GAC ACT TTC TGC AAA CTC TTC CGA GTC TAC TCC AAT TTCACT GCT GAC ACT TTC TGC AAA CTC TTC CGA GTC TAC TCC AAT TTC

150 160150 160

Leu Arg GIy Lys Leu Lys Leu Tyr Thr GIy GIu AIa Cys Arg ArgLeu Arg GIy Lys Leu Lys Leu Tyr Thr GIy GIu AIa Cys Arg Arg

CTC CGG GGA AAG CTG AAG CTG TAC ACG GGG GAG GCC TGC AGG AGACTC CGG GGA AAG CTG AAG CTG TAC ACG GGG GAG GCC TGC AGG AGA

165165

GIy Asp Arg OP GGG GAC AGA TGA CCAGGTGCGTCCAGCTGGGCACATCCACCACCTCCCTCACCAACACTGCCTGTGCCACACCCTCCCGIy Asp Arg OP GGG GAC AGA TGA CCAGGTGCGTCCAGCTGGGCACATCCACCACCTCCCTCACCAACACTGCCTGTGCCACACCCTCCC

GAGAGCAGCTTTAAACTCAGGAGCAGAGACAATGCAGGGAAAACACCTGAGCTCACTCGGCCACCTGCAAAAGATGCAGGA CACGCTTTGGAGGCAATTTACCTG I I GCACCTACCATCAGGGACAGGATGACTGGAGAACTTAGGTGGCAAGCTGTGACTT CTCAAGGCCTCACGGGCACTCCCTTGGTGGCAAGAGCCCCCTTGACACTGAGAGAATATTTTGCAATCTGCAGCAGGAAAAATTA CGGACAGGTTTTGGAGGTTGGAGGGTACTTGACAGGTGTGTGGGGAAGCAGGGCGGTAGGGGTGGAGCTGGGATGCGAGT GAGAACCGTGAAGACAGGATGGGGGCTGGCCTCTGGTTCTCGTGGGGTCCAAGCTTGAGAGCAGCTTTAAACTCAGGAGCAGAGACAATGCAGGGAAAACACCTGAGCTCACTCGGCCACCTGCAAAAGATGCAGGA CACGCTTTGGAGGCAATTTACCTG I I GCACCTACCATCAGGGACAGGATGACTGGAGAACTTAGGTGGCAAGCTGTGACTT CTCAAGGCCTCACGGGCACTCCCTTGGTGGCAAGAGCCCCCTTGACACTGAGAGAATATTTTGCAATCTGCAGCAGGAAAAATTA CGGACAGGTTTTGGAGGTTGGAGGGTACTTGACAGGTGTGTGGGGAAGCAGGGCGGTAGGGGTGGAGCTGGGATGCGAGT GAGAACCGTGAAGACAGGATGGGGGCTGGCCTCTGGTTCTCGTGGGGTCCAAGCTT

HindillHind III

Die Polypeptidsequenz von Tabelle V kann auf analytischem Wege leicht auf das Vorhandensein hydrophiler Bereiche und/oder sekundärer übereinstimmender Charakteristika überprüft werden die potentiell hoch immunogene Bereiche anzeigen, z. B. durch die Methoden von Hopp et al., P.N. A.S. (USA), 78, S.3824-3828 (1981) und Kyte et al., J. Mol. Biol. 157, S. 105-132 (1982) und/oder Chou et al., Biochem., 13, S. 222-245 (1974) und Advances in Enzymology, 47, S. 45-47 (1978). Die Computergestützte Analyse nach der Methode von Hopp et al. ist über ein Programm möglich, das als PEP Reference Section 6.7 bezeichnet wird und über Intelligenetics, Inc. 124 University Avenue, PaIo Alto, Californien, erhältlich ist.The polypeptide sequence of Table V can be readily checked analytically for the presence of hydrophilic regions and / or secondary matching characteristics indicating potentially highly immunogenic regions, e.g. By the methods of Hopp et al., P.N. A.S. (USA), 78, p.3824-3828 (1981) and Kyte et al., J. Mol. Biol. 157, pp. 105-132 (1982) and / or Chou et al., Biochem., 13, p 222-245 (1974) and Advances in Enzymology, 47, pp. 45-47 (1978). Computer-aided analysis according to the method of Hopp et al. is possible via a program called PEP Reference Section 6.7, available from Intelligenetics, Inc. 124 University Avenue, Paolo Alto, California.

Beispiel 4Example 4

A. Human-GenbibliothekA. Human Gene Library

Eine Ch4A Phagen-geborene menschliche fötale Leber-Genbibliothek, hergestellt nach den Verfahren von Lawn et al., Cell, 18, S. 533-543 (1979), wurde erhalten und zur Verwendung in einer Plaque-Hybridisierungsassay bereitgestellt.A Ch4A phage-born human fetal liver gene library, prepared according to the methods of Lawn et al., Cell, 18, pp. 533-543 (1979), was obtained and provided for use in a plaque hybridization assay.

B. Plaque-Hybridisierungsverfahren zum Screening einer Human-GenbibliothekB. Plaque hybridization methods for screening a human gene library

Phagenteilchen wurden lysiert und die DNA's auf Filtern fixiert (50000 Plaques pro Filter) nach den Verfahrensweisen von Woo, Methods in Enzymology, 68, S. 389-395 (1979), ausgenommen für die Verwendung von Gene-Screene Plus-Filter (New England Nuclear Catalog Nr.NEF-976) und NZYAM-Platten (NaCI, 5g; MgCI2-OH20,2g; NZ-Amin A, 10g; Hefeextrakt, 5g; Casaminosäuren, 2g; Maltose, 2g; und Agar, 15g/l).Phage particles were lysed and the DNAs fixed on filters (50,000 plaques per filter) according to the procedures of Woo, Methods in Enzymology, 68, pp. 389-395 (1979), except for the use of Gene-Screene Plus filters (New England Nuclear Catalog No.NEF-976) and NZYAM plates (NaCl, 5g, MgCl 2 -OH 2 0.2g, NZ-Amine A, 10g, yeast extract, 5g, casamino acids, 2g, maltose, 2g, and agar, 15g / l).

Die luftgetrockneten Filter wurden für eine Stunde bei 800C wärmebehandelt und im Anschluß daran mit Proteinase K wie in Beispiel 3, Teil B, abgebaut. Die Prä-Hybridisierung wurde mit 1 M NaCI — 1 % SDS-Puffer bei 550C über 4 Stunden oder mehr durchgeführt, wonach der Puffer entfernt wurde. Hybridisierungs- und Nachhybridisierungswaschungen wurden wie in Beispiel 3, Teil B beschrieben, durchgeführt. Sowohl das Gemisch von als EPV bezeichneten 128 20-mer-Sonden als auch das Gemisch van 12817-mer-Sonden aus Tabelle Hl (bezeichnet als EPQ-Gemisch) wurde eingesetzt. Die Hybridisierung wurde bei 480C unter Verwendung des EPV-Sondengemisches durchgeführt. Die EPQ-Sondergemisch-Hybridisierung wurde bei 460C durchgeführt —-4 Grad unterhalb der niedrigsten berechneten Td für Bestandteile des Gemisches. Die Entfernung der Hybridisierungssonde für die Rehybridisierung erfolgte durch Kochen mit 1 χ SSC-0,1% SDS für zwei Minuten. Die Autoradiografie der Filter zeigte drei positive Klone (mit beiden Sondengemischen reaktionsfähig) von 1500000 gescreenten Phagenplaques. Die Überprüfung auf Richtigkeit der positiven Klone als EPO-verschlüsseind erhielt man über DNA-Sequenzieren und elektronenmikrografische Sichtbarmachung der Heteroduplex-Bildung mit der Affen-cdNA von Beispiel 3. Dieses Verfahren gab auch über multiple Introns in der genomischen DNA-Sequenz Aufschluß.The air-dried filters were heat treated at 80 ° C. for one hour and then degraded with proteinase K as in Example 3, Part B. The pre-hybridization was washed with 1 M NaCl - carried out over 4 hours or more 1% SDS buffer at 55 0 C, after which the buffer was removed. Hybridization and post-hybridization washes were performed as described in Example 3, part B. Both the mixture of 128 20-mer probes designated EPV and the mixture of 12817-mer probes from Table HI (referred to as EPQ mixture) were used. Hybridization was performed at 48 ° C. using the EPV probe mixture. The EPQ special mixture Hybridization was performed at 46 0 C performed --4 degrees below the lowest calculated Td for components of the mixture. The hybridization probe for rehybridization was removed by boiling with 1 χ SSC-0.1% SDS for two minutes. Autoradiography of the filters revealed three positive clones (reactive with both probe mixtures) of 1500000 screened phage plaques. Verification for the correctness of the positive clones as EPO occlusions were obtained by DNA sequencing and electron micrographic visualization of the heteroduplex formation with the monkey cDNA of Example 3. This procedure also revealed multiple introns in the genomic DNA sequence.

Beispiel 5Example 5

Es wurde eine Nucleotid-Sequenzanalyse eines der positiven Klone (bezeichnet als AhE 1) durchgeführt. Die erhaltenen Ergebnisse sind in Tabelle Vl aufgeführt.Nucleotide sequence analysis of one of the positive clones (designated AhE 1) was performed. The results obtained are listed in Table VI.

Tabelle VITable VI

AAGCTTCTGGGCTTCCAGACCCAGCTACTTTGCGGAACTCAGCAACCCAGGCATCTCTGAGTCTCCGCCCAAGACCGGGATGCCAAGCTTCTGGGCTTCCAGACCCAGCTACTTTGCGGAACTCAGCAACCCAGGCATCTCTGAGTCTCCGCCCAAGACCGGGATGCC

ggacagccgccctctcctctaggcccgtggggctggccctgcaccgccgagcttcccgggatgaggxxggacagccgccctctcctctaggcccgtggggctggccctgcaccgccgagcttcccgggatgaggxx

-27 -24-27 -24

Met GIy VaI HisMet GIy VaI His

CCCGGTGACCGGCGCGCCCCAAGTCGCTGAGGGACCCCGGCCAAGCGCGGAG ATG GGG GTG CAC G · GTGAGTACTCGCGGGCTGGGCGCTCCCGGCGGCCGGGTTCCTGTTTGAGCGGGGATTTAGCGCCCCGGCTATTGGCCAAGAGG tggctgggttcaaggaccggcgacttgtcaaggaccccggaagggggaggggggtggggcagcctccacgtgccgcggggaCCCGGTGACCGGCGCGCCCCAAGTCGCTGAGGGACCCCGGCCAAGCGCGGAG ATG GGG GTG CAC G · GTGAGTACTCGCGGGCTGGGCGCTCCCGGCGGCCGGGTTCCTGTTTGAGCGGGGATTTAGCGCCCCGGCTATTGGCCAAGAGG tggctgggttcaaggaccggcgacttgtcaaggaccccggaagggggaggggggtggggcagcctccacgtgccgcgggga

CTGTGCAGTTGTGTCGTTGTCAGTGTCTCG I. S. TTGCACACGCACAGATCAATAAGCCAGAGGCAGCACCTGAGTGCTTGCATGCTGTGCAGTTGTGTCGTTGTCAGTGTCTCG I.S. TTGCACACGCACAGATCAATAAGCCAGAGGCAGCACCTGAGTGCTTGCATG

GTTGGGACAG GCCTGACTCTGTTGGGACAG GCCTGACTCT

GIy GGCGIy GGC -23 GIu AA-23 GIu AA Cys TGTCys TGT Pro CCTPro CCT -20 AIa GCC-20 AIa GCC Leu CTGLeu CTG GIu GAGGIu GAG Leu CTCLeu CTC Pro CCAPro CCA VaI GTCVaI GTC Leu CTGLeu CTG Leu CTGLeu CTG Arg AGGArg AGG Tyr TACTyr TAC Leu CTCLeu CTC Leu TTGLeu TTG

Me ATCMe ATC

χ Asnχ Asn

Cys TGTCys TGT

CAGCCTGGCTATCTGTTCTAG -10CAGCCTGGCTATCTGTTCTAG -10

Leu Ser -Leu Pro CTG TCG CTC CCTLeu Ser -Leu Pro CTG TCG CTC CCT

1010

Asp Ser Arg VaI GAC AGC CGA GTCAsp Ser Arg VaI GAC AGC CGA GTC

26 Th r ACG26 Th r ACG

CACTTG GTTTG G G GTGGAGTTG G GAAG CTAG ACACTG CCCCCCTACATAAG AATAAGTCTGGTG GCCCCAAACCATACCTG AAA CTAGGCAAGGAGCAAAGCCAGCAGATCCTACGCCTGTGGGCCAGGGCACTTG GTTTG G G GTGGAGTTG G GAAG CTAG ACACTGroughTACATAAG AATAAGTCTGGTG GCCCCAAACCATACCTG AAA CTAGGCAAGGAGCAAAGCCAGCAGATCCTACGCCTGTGGGCCAGGG

Trp Leu Trp Leu Leu Leu SerTrp Leu Trp Leu Leu Leu Ser

GCC TGG CTG TGG CTT CTC CTG TCCGCC TGG CTG TGG CTT CTC CTG TCC

-1 +1-1 +1

GIy AIa Pro Pro Arg LeuGIy AIa Pro Pro Arg Leu

GGC GCC CCA CCA CGC CTCGCC GCC CCA CCA CGC CTC

2020

GIu Ala Lys GIu Ala GIuGiu Ala Lys Giu Ala Giu

Leu CTGLeu CTG

GAG GCC AAG GAG GCC GAG AAT ATCGAG GCC AAG GAG GCC GAG AAT ATC

27 3027 30

Thr GIy Cys Ala GIu CCAGAGCCTTCAGGGACCCTTGACTCCCCGGGCTGTGTGCATTTCAG ACG GGC TGT GCT GAAThr GIy Cys Ala GIu CCAGAGCCTTCAGGGACCCTTGACTCCCCGGGCTGTGTGCATTTCAG ACG GGC TGT GCT GAA

40 χ40 χ

His Cys Ser Leu Asn GIu - Asn He Thr VaI Pro Asp Thr Lys VaI Asn Phe Tyr CAC TGC AGC TTG AAT GAG AAT ATC ACT GTC CCA GAC ACC AAA GTT AAT TTC TAT 50 55His Cys Ser Leu Asn GIu - Asn He Thr VaI Pro Asp Thr Lys VaI Asn Phe Tyr CAC TGC AGC TTG AAT GAG AAT ATC ACT GTC CCA GAC ACC AAA GTT AAT TTC TAT 50 55

AIa Trp Lys Arg Met GIu GCC TGG AAG AGG ATG GAG GTGAGTTCCI I I I I I I I Il I I I I ICCTTTCTmTGGAGAATCTCATTTGCGAGCCTGATAIa Trp Lys Arg Met GIu GCC TGG AAG AGG ATG GAG GTGAGTTCCI I I I I I I I I I I I ICCTTTCTmTGGAGAATCTCATTTGCGAGCCTGAT

CCCCATCTCACAAACATTTAAAAAAATTAGTCAG GTGAAGTG GTGCATG GTG GTAGTCCCAG ATATTTGG AAG GCTG AG GCGGG AGGATCGCTTGAGCCCAGGAATTTGAGGCTGCAGTGAGCTGTGATCACACCACTGCACTCCAGCCTCAGTGACAGAGTGAGGCCCCCCATCTCACAAACATTTAAAAAATTAGTCAG GTGAAGTG GTGCATG GTG GTAGTCCCAG ATATTTGG AAG GCTG AG GCGGG AGGATCGCTTGAGCCCAGGAATTTGAGGCTGCAGTGAGCTGTGATCACACCACTGCACTCCAGCCTCAGTGACAGAGTGAGGCC

AG G GTGACATG G GTCAG CTCG ACTCCCAG AGTCCACTCCCTGTAGAG G GTGACATG G GTCAG CTCG ACTCCCAG AGTCCACTCCCTGTAG

56 VaI56 VaI

GIy Gin GInGIy Gin GIn

60 AIa60 Ala

VaI GIu VaI Trp Gin GIy Leu AIaVaI GIu VaI Trp Gin GIy Leu AIa

70 Leu Leu70 Lei Leu

Ser GIu AIaSer GIu AIa

GTC GGG CAG CAG GCC GTA GAA GTC TGG CAG GGC CTG GCC CTG CTG TCG GAA GCTGTC GGG CAG CAG GCC GTA GAA GTC TGG CAG GGC CTG GCC CTG CTG TCG GAA GCT

8080

9090

Leu Arg GIy Gin AIa Leu Leu VaI Asn Ser Ser GIn Pro Trp GIu Pro Leu GTC CTG CGG GGC CAG GCC CTG TTG GTC AAC TCT TCC CAG CCG TGG GAG CCC CTGLeu Arg GIy Gin AIa Leu Lei VaI Asn Ser Ser GIn Pro Trp GIu Pro Leu GTC CTG CGG GGC CAG GCC CTG TTG GTC AAC TCT TCC CAG CCG TGG GAG CCC CTG

100100

GIn Leu His VaI Asp Lys Ala VaI Ser GIy Leu Arg Ser Leu Thr Thr Leu Leu CAG CTG CAT GTG GAT AAA GCC GTC AGT GGC CTT CGC AGC CTC ACC ACT CTG CTT 110 115GIn Leu His VaI Asp Lys Ala VaI Ser GIy Leu Arg Ser Leu Thr Thr Leu Leu CAG CTG CAT GTG GAT AAA GCC GTC AGT GGC CTT CGC AGC CTC ACC ACT CTG CTT 110 115

Arg AIa Leu GIy Ala GInArg AIa Leu GIy Ala GIn

CGG GCT CTG GGA GCC CAG GTGAGTAGGAGCGGACACTTCTGCTTGCCCTTTCTGTAAGAAGGGGAGAAGGGTC TTGCTAAGGAGTACAGGAACTGTCCGTATTCCTTCCCTTTCTGTGGCACTGCAGCGACCTCCTCGG GCT CTG GGA GCC CAG GTGAGTAGGAGCGGACACTTCTGCTTGCCCTTTCTGTAAGAAGGGGAGAAGGGTC TTGCTAAGGAGTACAGGAACTGTCCGTATTCCTTCCCTTTCTGTGGCACTGCAGCGACCTCCT

116 120116 120

Lys GIu Ala He Ser Pro Pro Asp Ala Ala Ser Ala AIa GTTTTCTCCTTGGCAG AAG GAA GCC ATC TCC CCT CCA GAT GCG GCC TCA GCT GCTLys GIu Ala He Ser Pro Pro Asp Ala Ala Ser Ala Ala GTTTTCTCCTTGGCAG AAG GAA GCC ATC TCC CCT CCA GAT GCG GCC TCA GCT GCT

130 140130 140

Pro Leu Arg Thr He Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg VaI Tyr SerPro Leu Arg Thr Thr Thr Ala Asp Thr Phe Arg Lys Leu Phe Arg VaI Tyr Ser

CCA CTC CGA ACA ATC ACT GCT GAC ACT TTC CGC AAA CTC TTC CGA GTC TAC TCCCCA CTC CGA ACA ATC ACT GCT GAC ACT TTC CGC AAA CTC TTC CGA GTC TAC TCC

150 160150 160

Asn Phe Leu Arg GIy Lys Leu Lys Leu Tyr Thr GIy GIu AIa Cys Arg Thr GIyAsn Phe Leu Arg GIy Lys Leu Lys Leu Tyr Thr GIy GIu AIa Cys Arg Thr GIy

AAT TTC CTC CGG GGA AAG CTG AAG CTG TAC ACA GGG GAG GCC TGC AGG ACA GGGAAT TTC CTC CGG GGA AAG CTG AAG CTG TAC ACA GGG GAG GCC TGC AGG ACA GGG

Asp - Arg OPAsp - Arg OP

GAC" AGA TGA CCAGGTGTGTCCACCTGGGCATATCCACCACCTCCCTCACCAACATTGCTTGTGCCACACCCTCCCCCGCCAGAC "AGA TGA CCAGGTGTGTCCACCTGGGCATATCCACCACCTCCCTCACCAACATTGCTTGTGCCACACCCTCCCCCGCCA

CGCTTTGGAGGCGATTTACCTGTTTTCGCACCTACCATCAGGGACAGGATGACCTGGAGAACTTAGGTGGCAAGCTGTGACTTCT GGGCTGGCCTCTGGCTCTCATGGGGTCCAAGTTTTGTGTATTCTCACCTATTGACAGACTGAAACACAATATGACCGCTTTGGAGGCGATTTACCTGTTTTCGCACCTACCATCAGGGACAGGATGACCTGGAGAACTTAGGTGGCAAGCTGTGACTTCT GGGCTGGCCTCTGGCTCTCATGGGGTCCAAGTTTGTGTATTCTCACCTATTGACAGACTGAAACACAATATGAC

In Tabelle Vl bezeichnet die anfängliche fortlaufende DNA-Sequenz einen Kopfstrang von 620 Basen, in dem offensichtlich eine untranslatierte Sequenz unmittelbar einem translatierten Teil des Human-EPO-Gens vorausgeht. Insbesondere erscheint es so, daß die Sequenz das 5'Ende des Gens umfaßt, das zu einer translatierten DNA-Region überleitet, die für die ersten vier Aminosäuren (-27 bis —24) einer Führungssequenz („Pre-Sequenz") codiert. Vier Basenpaare in der Sequenz vor der die den Anfang der Führungssequenz verschlüsselt, wurden nicht genau bestimmt und sind daher als „X" bezeichnet worden. Es folgt dann ein Intron von etwa 639 Basenpaaren (439 Basenpaare davon wurden sequenziert und die restlichen 200 Basenpaare davon wurden als „I.S." bezeichnet) und unmittelbar davor ein Codon für Glutamin, das als Rest -23 des translatierten Polypeptids bezeichnet wurde. Die unmittelbar folgende Exonsequenz wird als codierend für Aminosäurereste durch einen Alaninrest angesehen (bezeichnet als der + 1-Rest der Aminosäuresequenz von reifem Human-EPO) zu dem Codon, das Threonin an Position +26 spezifiert, wonach ein zweites Intron folgt, das aus 256 Basen besteht, wie sie spezifisch bezeichnet sind. Diesem Intron folgt eine Exonsequenz für die Aminosäurereste 27 bis 55 und danach beginnt ein 612 Basenpaare enthaltendes drittes Intron.In Table VI, the initial contiguous DNA sequence designates a 620 base top strand in which an apparently untranslated sequence immediately precedes a translated portion of the human EPO gene. In particular, it appears that the sequence comprises the 5 'end of the gene which directs to a translated DNA region coding for the first four amino acids (-27 to -24) of a leader sequence ("pre-sequence") Base pairs in the sequence that encoded the beginning of the leader sequence were not accurately determined and have therefore been termed "X". This is followed by an intron of approximately 639 base pairs (439 base pairs of which were sequenced and the remaining 200 base pairs of which were termed "IS") and immediately before a codon for glutamine designated as residue -23 of the translated polypeptide Exon sequence is considered to be coding for amino acid residues by an alanine residue (referred to as the + 1 residue of the amino acid sequence of mature human EPO) to the codon that specifies threonine at position +26, followed by a second intron consisting of 256 bases. as specifically indicated, this intron is followed by an exon sequence for amino acid residues 27 to 55, and then a third intron containing 612 base pairs begins.

Das anschließende Exon codiert für die Reste 56 bis 115 das Human-EPO und dann beginnt ein viertes Intron von 134 Basen, wie aufgeführt. Dem vierten Intron folgt ein Exon, das für die Reste Nr. 116 bis 166 codiert und ein Stopcodon (TGA). Schließlich wird eine Sequenz von 568 Basenpaaren identifiziert, worin eine untranslatierte 3'-Region des Human-EPO-Gens erscheint, zwei Basenpaare, von denen („X") bisher noch nicht genau sequentiert worden ist.The subsequent exon encodes residues 56 through 115 for the human EPO and then begins a fourth intron of 134 bases as listed. The fourth intron is followed by an exon coding for residues Nos. 116 to 166 and a stop codon (TGA). Finally, a sequence of 568 base pairs is identified in which an untranslated 3 'region of the human EPO gene appears, two base pairs, of which ("X") has not yet been accurately sequenced.

Tabelle Vl dient somit zur Ermittlung der Strukturübereinstimmung (Aminosäuresequenz) von reifem Human-EPO, das 166 spezifische Aminosäurereste enthält (geschätzte Molmasse = 18399). Außerdem erscheint in der Tabelle die DNA-Sequenz, die für eine Führungssequenz mit 27 Resten zusammen mit 5'- und 3'-DNA-Sequenzen codiert, die für Promoter/Operatorfunktionen des Humangen-Operons signifikant sein können.Table VI thus serves to establish the structural match (amino acid sequence) of mature human EPO containing 166 specific amino acid residues (estimated molar mass = 18,399). In addition, the table shows the DNA sequence encoding a 27 residue leader sequence along with 5 'and 3' DNA sequences which may be significant to promoter / operator functions of the human operon.

Stellen für die potentielle Glycosylierung des reifen Human-EPO-Polypeptids sind in der Tabelle durch Sternchen bezeichnet. Es sollte beachtet werden, daß die spezifische Aminosäuresequenz von Tabelle Vl wahrscheinlich jene einer natürlich auftretenden allelischen Form von Human-Erythropoietin bildet. Diese Position wird durch die Ergebnisse der fortlaufenden Bemühungen beim Sequenzieren von Urinisolation von Human-Erythoropoietin gestützt, das dazu führte, daß man eine bedeutende Anzahl von Erythropoietinmolekülen darin herausfand, die ein Methionin am Rest 126 gegenüber einem Serin aufwiesen, wie in der Tabelle gezeigt.Sites for the potential glycosylation of the mature human EPO polypeptide are designated by asterisks in the table. It should be noted that the specific amino acid sequence of Table VI probably forms that of a naturally occurring allelic form of human erythropoietin. This position is supported by the results of ongoing urinary isolation of human erythoropoietin sequencing efforts which resulted in finding a significant number of erythropoietin molecules having a methionine at residue 126 versus a serine, as shown in the table.

Die folgende Tabelle VII erläutert den Grad der Polypeptidsequenz-Homologie zwischen Human- und affen-EPO. In der oberen fortlaufenden Reihe der Tabelle wurden Einzelbuchstabenbezeichnungen verwendet, um die hergeleiteten, translatierten Polypeptidsequenzen von Human-EPO darzustellen, beginnend mit dem Rest -27, und die untere fortlaufende Reihe zeigt die hergeleitete Polypeptidsequenz von Affen-EPO, beginnend mit dem als Nummer -27 bezeichneten Rest. Sternchen zeigen die Sequenzhomologien an. Es sollte festgehalten werden, daß die hergeleiteten Human- und Affen-EPO-Sequenzen einen „zusätzlichen" Lysin(K)-rest an der (Human-)Position 116 aufweisen. Ein Vergleich mit Tabelle Vl zeigt, daß dieser Rest am Rande einer vermutlichen mRNA-Spleißverbindung in der genomischen Sequenz auftritt. Das Vorhandensein des Lysinrestes in der Human-Polypeptidsequenz wurde darüber hinaus durch Sequenzieren eines cDNA-Humansequenzklons überprüft, hergestellt aus mRNA, die aus COS-1 Zellen isoliert worden waren, die mit der humangenomischen DNA von Beispiel 7 (siehe unten) transformiert wurden.The following Table VII illustrates the degree of polypeptide sequence homology between human and monkey EPO. Single-letter designations were used in the upper continuous row of the table to represent the deduced, translated polypeptide sequences of human EPO, starting with residue -27, and the bottom consecutive series showing the deduced polypeptide sequence from monkey EPO, starting with the number-1 polypeptide sequence. 27 denotes the rest. Asterisks indicate the sequence homologies. It should be noted that the deduced human and monkey EPO sequences have an "additional" lysine (K) residue at the (human) position 116. Comparison with Table VI shows that this residue is on the brink of a putative In addition, the presence of the lysine residue in the human polypeptide sequence was checked by sequencing a cDNA human sequence clone prepared from mRNA isolated from COS-1 cells spiked with the human genomic DNA of Example 7 (see below).

Tabelle VIITable VII Vergleich von Human- und Affen-EPO-PolypeptidenComparison of human and monkey EPO polypeptides

-20 -10 +1 10 20 30 40-20 -10 +1 10 20 30 40

Human MGVHECPAWLWLLLSLLSLPLGLPVLGAPPRLICDSRVLERYLLEAKEAENITTGCAEHCSLNENITVPDTKHuman MGVHECPAWLWLLLSLSLSLPLGLPVLGAPPRLICDSRVLERYLLEAKEAENITTGCAEHCSLNENITVPDTK

XXXXXXXXXXXXXXXX XXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX XXXXXX X XXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXX X XXXXXXXXXXXXXX

Affen MGVHECPAWLWLLLSLVSLPLGLPVPGAPPRLICDSRVLERYLLEAKEAENVTMGCSESCSLNENITVPDTKMonkeys MGVHECPAWLWLLLSLVSLPLGLPVPGAPPRLICDSRVLERYLLEAKEAENVTMGCSESCSLNENITVPDTK

50 60 70 80 90 100 11050 60 70 80 90 100 110

Human VNFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQALLVNSSQPWEPLQLHVDKAVSGLRSLTTLLRALGAQKEHuman VNFYAWKRMEVGQQEVWQGLALLSEAVLRGQALLVNSSQPWEPLQLHVDKAVSGLRSLTTLLRALGAQKE

XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX X XXXXX XXXXXX XXX XXXXX XXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX X XXXXX XXXXXX XXX XXXXX XXXXXXXXXX X

Tabelle VIl (Fortsetzung)Table VIl (continued)

Affen VNFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQAVLANSSQPFEPLQLHMDKAISGLRSITTLLRALGAQ-EMonkeys VNFYAWKRMEVGQQAVEVWQGLALLSEAVLRGQAVLANSSQPFEPLQLHMDKAISGLRSITTLLRALGAQ-E

120 130 140 150 160120 130 140 150 160

Human AISPPDAASAAPLRTITADTFRKLFRVYSNFLRGKLKLYTGEACRTGDRHuman AISPPDAASAAPLRTITADTFRKLFRVYSNFLRGKLKLYTGEACRTGDR

XXX XXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX XXXXXX XXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXX XXX

Affen AISLPDAASAAPLRTITADTFCKLFRVYSNFLRGKLKLYTGEACRRGDRMonkey AISLPDAASAAPLRTITADTFCKLFRVYSNFLRGKLKLYTGEACRRGDR

Ein Vergleich der Aktivität der rekombinanten Affen- und Human-EPO-Materialien gegen einen Standard einer natürlich auftretenden Human-EPO und die Ergebnisse sind in grafischer Form in Fig. 1 aufgeführt. Kurz zusammengefaßt offenbarten die Ergebnisse erwartetermaßen, daß das rekombinante Affen-EPO signifikant mit Anti-Human-EPO-Antikörper konkurrierte, obgleich es nicht in der Lage war, die Bindung unter den Testbedingungen vollständig zu inhibieren. Der höchste Inhibiemngsprozentsatzfür rekombinante Human-EPO lag allerdings nahe etwa bei dem des Human-EPO-Standards. Die parallele Lage der Dosisreaktioriskurven deutet auf immunologische Identität der gemeinsamen Sequenzen (Epitope) hin.A comparison of the activity of the recombinant monkey and human EPO materials against a standard of a naturally occurring human EPO and the results are shown graphically in FIG. Briefly, the results were expected to reveal that the recombinant monkey EPO competed significantly with anti-human EPO antibody, although it was unable to completely inhibit binding under the assay conditions. However, the highest inhibitory percentage for recombinant human EPO was close to that of the human EPO standard. The parallel location of the dose-response curves indicates immunological identity of the shared sequences (epitopes).

Beispiel 11Example 11

Das vorliegende Beispiel betrifft die gesamte Herstellung durch Zusammenstellung der Nucleotidbasen von zwei strukturellen Genen, die die Human-EPO-sequenz von Tabelle Vl verschlüsseln und schließt entsprechend „bevorzugte" Codons für die Expression in E.coli- und Hefe(s.cevevisiae)zellen ein.The present example relates to the overall preparation by assembling the nucleotide bases of two structural genes encoding the human EPO sequence of Table VI and correspondingly enclosing "preferred" codons for expression in E. coli and yeast (s.cevevisiae) cells on.

Beschrieben wird auch die Konstruktion von Genen, die Analoge von Human-EPO verschlüsseln. Kurz zusammengefaßt entsprach der Ablauf dem in der bereits vorher genannten Literaturstelle von Alton et al., (WO 83/04053). Die Gene wurden für eine anfängliche Zusammenstellung der Komponenten-Oligonucleotide in mehrfachen Verdoppelungen gestaltet, die der Reihe nach in drei getrennte Abschnitte (section) vereinigt wurden. Diese Sectionen wurden für eine fertige Amplifizierung gestaltet, und nach Entfernung aus dem Amplifizierungssystem konnten sie sequentiell oder durch eine mehrfache Fragmentligation in einem geeigneten Expressionsvektor vereinigt werden.Also described is the construction of genes that encode analogs of human EPO. Briefly, the procedure was as described in Alston et al., Supra (WO 83/04053). The genes were designed for an initial compilation of the component oligonucleotides in duplicate duplications, which were sequentially pooled into three separate sections. These sections were designed for ready amplification and, after removal from the amplification system, could be combined sequentially or by multiple fragment ligation into an appropriate expression vector.

Die folgenden Tabellen VIII bis XIV erläutern die Gestaltung und Vereinigung eines hergestellten Gens, dasein Human-EPO-Translationsprodukt verschlüsselt, dem eine beliebige Führungs- oder Presequenz fehlt, zu dem jedoch ein anfänglicher Methioninrest an Position -1 gehört. Darüber hinaus gehören zu dem Gen in seinem wesentlichen Teil E. coli-Präferenzcodons, und die Konstruktion wurde daher als das „ECEPO"-Gen bezeichnet.The following Tables VIII through XIV illustrate the design and assembly of a prepared gene that encodes a human EPO translation product lacking any leader or presequence, but including an initial methionine residue at position -1. In addition, the gene in its essential part includes E. coli preferential codons, and the construction has therefore been termed the "ECEPO" gene.

Tabelle VIIITable VIII ECEPOSECTION 1 OLIGONUCLEOTIDESECEPOSECTION 1 OLIGONUCLEOTIDES

1. AATTCTAGAAACCATGAG G GTAATAAAATA1. AATTCTAGAAACCATGAG G GTAATAAAATA

2. CCATTATTTTATTACCCTCATGGTTTCTAG2. CCATTATTTTATTACCCTCATGGTTTCTAG

3. ATGGCTCCGCCGCGTCTGATCTGCGAC3. ATGGCTCCGCCGCGTCTGATCTGCGAC

4. CTCGAGTCGCAGATCAGACGCGGCGGAG4. CTCGAGTCGCAGATCAGACGCGGCGGAG

5. TCGAGAGTTCTGGAACGTTACCTGCTG5. TCGAGAGTTCTGGAACGTTACCTGCTG

6. CTTCCAGCAGGTAACGTTCCAGAACT6. CTTCCAGCAGGTAACGTTCCAGAACT

7. GAAGCTAAAGAAGCTGAAAACATC7. GAAGCTAAAGAAGCTGAAAACATC

8. GTGGTGATGTTTTCAGCTTCTTTAG8. GTGGTGATGTTTTCAGCTTCTTTAG

9. ACCACTGGTTGTGCTGAACACTGTTC9. ACCACTGGTTGTGCTGAACACTGTTC

10. CAAAGAACAGTGTTCAGCACAACCA10. CAAAGAACAGTGTTCAGCACAACCA

11. TTTGAACGAAAACATTACGGTACCG11. TTTGAACGAAAACATTACGGTACCG

12. GATCCGGTACCGTAATGTTTTCGTT12. GATCCGGTACCGTAATGTTTTCGTT

Tabelle IX ECEPO SECTION 1Table IX ECEPO SECTION 1

Xfral Xfra l

EcoRI 1EcoRI 1

AATTCTAG AAACCATGAG GGTAATAAAA TjJaTGGCTCC GCCGCGTCTG GATC TTTGGTACTC CCATTATTTT ATTÄÜ^GAGG CGGCGCAGACAATTCTAG AAACCATGAG GGTAATAAAA Tj JaTGG CTCC GCCGCGTCTG GATC TTTGGTACTC CCATTATTTT ATTAG ^ GAGG CGGCGCAGAC

2 i2 i

ATCTGCCACJT-CGAGAGfTCT GGAACGTTAC CTGCTCJgAAG CTAAAGAAGC TAGACGCTGA GCTCJTCAAGA CCTTGCAATG GACGACÜTt17| GATTTCTTCGATCTGCCACJT - CGAGAGfTCT GGAACGTTAC CTGCTCJgAAG CTAAAGAAGC TAGACGCTGA GCTCJTCAAGA CCTTGCAATG GACGACUTT17 | GATTTCTTCG

TGAAAACATC. Iaccactggtt gtgctgaaca ctgttcjtttg aacgaHacaTGAAAACATC. Iaccac tggtt gtgctgaaca ctgttcjtttg aacgaHaca

ACTTTTGTAG TGGTOACCAA CACGACTTGT GACAAGAAACI TTGCTTTTGT 8 r 10 'ACTTTTGTAG TGGTOACCAA CACGACTTGT GACAAGAAACI TTGCTTTTGT 8 r 10 '

Kpnl BamHI TTACGGTACC G AATGCCATGG CCTAG 12 Kpnl BamHI TTACGGTACC G AATGCCATGG CCTAG 12

Tabelle XTable X ECEPO SECTION 2 OLIGONUCLEOTIDESECEPO SECTION 2 OLIGONUCLEOTIDES

1. AAT^CGGTACCAGACACCAAGGT1. AAT ^ CGGTACCAGACACCAAGGT

2. GTTAACCTTGGTGTCTGGTACCG2. GTTAACCTTGGTGTCTGGTACCG

3. TAACTTCTACGCTTGGAAACGTAT3. TAACTTCTACGCTTGGAAACGTAT

4. TTCCATACGTTTCCAAGCGTAGAA4. TTCCATACGTTTCCAAGCGTAGAA

5. GGAAGTTGGTCAACAAGCAGTTGAAGT5. GGAAGTTGGTCAACAAGCAGTTGAAGT

6. CCAAACTTCAACTGCTTGTTGACCAAC6. CCAAACTTCAACTGCTTGTTGACCAAC

7. TTGGCAGGGTCTGGCACTGCTGAGCG7. TTGGCAGGGTCTGGCACTGCTGAGCG

8. GCCTCGCTCAGCAGTGCCAGACCCTG8. GCCTCGCTCAGCAGTGCCAGACCCTG

9. AGGCTGTACTGCGTGGCCAGGCA9. AGGCTGTACTGCGTGGCCAGGCA

10. GCAGTGCCTGGCCACGCAGTACA10. GCAGTGCCTGGCCACGCAGTACA

11. CTGCTGGTAAACTCCTCTCAGCCGT11. CTGCTGGTAAACTCCTCTCAGCCGT

12. TTCCCACGGCTGAGAGGAGTTTACCA12. TTCCCACGGCTGAGAGGAGTTTACCA

13. GGGAACCGCTGCAGCTGCATGTTGAC13. GGGAACCGCTGCAGCTGCATGTTGAC

14. GCTTTGTCAACATGCAGCTGCAGCGG14. GCTTTGTCAACATGCAGCTGCAGCGG

15. AAAGCAGTATCTGGCCTGAGATCTG15. AAAGCAGTATCTGGCCTGAGATCTG

16. GATCCAGATCTCAGGCCAGATACT16. GATCCAGATCTCAGGCCAGATACT

Tabelle XI ECEPO SECTION 2Table XI ECEPO SECTION 2

EcoRI Kpnl 1 _ EcoR I Kpn l 1 _

A ATTCGGTACC AGACACCAAG GaJTAACTTCT ACGCTTGGAA ACGTAThGAA GCCATGG TCTGTGGTTC CAATfGiAAGA TGCGAACCTT TGCATAüUH!A ATTCGGTACC AGACACCAAG Ga JTAAC TTCT ACGCTTGGAA ACGTAThGAA GCCATGG TCTGTGGTTC CAATfGiAAGA TGCGAACCTT TGCATAuUH!

g ± ' g ± '

GTTGGTCAAC AAGCAGTTGA AGtJpTGGCAG GGTGTGGCAC TGCTGAGCCJA CAACCAGTTG TTCGTCAACT TCAAÄCCjGTC COAGACCGTG ACGACTCGCT 6 ^GTTGGTCAAC AAGCAGTTGA AGt JpTGG CAG GGTGTGGCAC TGCTGAGCCJA CAACCAGTTG TTCGTCAACT TCAAACCJGTC COAGACCGTG ACGACTCGCT 6 ^

^J H J^ J H J

GGCTGTACTG CGTGGCCAGG C4CTGCTGGT AAACTCCTCT CAGCCGOjGGG GGCTGTACTG CGTGGCCAGG C 4CTGC TGGT AAACTCCTCT CAGCCG OjGGG

CCCJACATGAC GCACCGGTCC GTGACGIACCA TTTGAGGAGA GTCGGCACCC IOCCCJACATGAC GCACCGGTCC GTGACGIACCA TTTGAGGAGA GTCGGCACCC IO

13 15 BgIII BamHI13 15 BgI II BamH I

MCCGCTGCA GCTGCATGTT gac(aaagcag tatctggcct gagatctgMCCGCTGCA GCTGCATGTT gac (aaagcag tatctggcct gagatctg

TÖTgGCGACGT CGACGTACAA CTGTTTCGJTC ATAGACCGGA CTCTAGACCTACTOTGGCGACGT CGACGTACAA CTGTTTCGJTC ATAGACCGGA CTCTAGACCTAC

Tabelle XII ECEPO SECTION 3Table XII ECEPO SECTION 3

1. GATCCAGATCTCTGACTACTCTGC1. GATCCAGATCTCTGACTACTCTGC

2. ACGCAGCAGAGTAGTCAGAGATCTG2. ACGCAGCAGAGTAGTCAGAGATCTG

3. TGCGTGCTCTGGGTGCACAGAAAGAGG3. TGCGTGCTCTGGGTGCACAGAAAGAGG

4. GATAGCCTCTTTCTGTGCACCCAGAGC4. GATAGCCTCTTTCTGTGCACCCAGAGC

5. CTATCTCTCCGCCGGATGCTGCATCT5. CTATCTCTCCGCCGGATGCTGCATCT

6. CAGCAGATGCAGCATCCGGCGGAGA6. CAGCAGATGCAGCATCCGGCGGAGA

7. GCTGCACCGCTGCGTACCATCACTG7. GCTGCACCGCTGCGTACCATCACTG

8. ATCAGCAGTGATGGTACGCAGCGGTG8. ATCAGCAGTGATGGTACGCAGCGGTG

9. CTGATACCTTCCGCAAACTGTTTCG9. CTGATACCTTCCGCAAACTGTTTCG

10. ATACACGAAACAGTTTGCGGAAGGT10. ATACACGAAACAGTTTGCGGAAGGT

11. TGTATACTCTAACTTCCTGCGTGGTA11. TGTATACTCTAACTTCCTGCGTGGTA

12. CAGTTTACCACGCAGGAAGTTAGAGT12. CAGTTTACCACGCAGGAAGTTAGAGT

13. AACTGAAACTGTATACTGGCGAAGC13. AACTGAAACTGTATACTGGCGAAGC

14. GGCATGCTTCGCCAGTATACAGTTT14. GGCATGCTTCGCCAGTATACAGTTT

15. ATGCCGTACTGGTGACCGCTAATAG15. ATGCCGTACTGGTGACCGCTAATAG

16. TCGACTATTAGCGGTCACCAGTAC16. TCGACTATTAGCGGTCACCAGTAC

Tabelle XlIl ECEPO SECTION 3Table XIII ECEPO SECTION 3

BamHI BgIII GA TCCAGATCTCTG GTCTAGAGACBamHI BglII GA TCCAGATCTCTG GTCTAGAGAC

ACTACfCTGC ITGCGTGCTCT GGGTGCACAG AAAGAGQCTA-TCTCTCCGCC TGATGAGACG ACGC^)CGAGA CCCACGTGTC TTTCTCCGAT AGjAGAGGCGGACTACfCTGC ITGCGT GCTCT GGGTGCACAG AAAGAGQCTA - TCTCTCCGCC TGATGAGACG ACGC ^) CGAGA CCCACGTGTC TTTCTCCGAT AGjAGAGGCGG

L. 1,1 L. 1.1

GGATGCTGCA TCTDCTGCAC CGCTGCGTAC CATCACTGPT GATACCTTCC CCTACGACGT AGACGlÜfeTG GCGACGCATG GTAGTGACGA CMGGAAGG . · 6 8GGATGCTGCA TC TDCTGC AC CGCTGCGTAC CATCACT GPT GATA CCTTCC CCTACGACGT AGACGlÜfeTG GCGACGCATG GTAGTGACGA CMGGAAGG. · 6 8

11 ,11,

GCAAACTGTT TCGDGTAT1AC TCTAÄCTTCC TGCGTGGTAIA ACTGAAACTG CGTTTGACAiI AGCACATaItG AGATTGAAGG ACGCACCATT TGAOJTTTGACGCAAACTGTT TCG DGTAT 1 A C TCTAÄCTTCC TGCGTGGTA IA ACTGA AACTG CGTTTGACAiI AGCACATAItG AGATTGAAGG ACGCACCATT TGAOJTTTGAC

1212

. 15 Sail, 15 sai l

TATACTGGCG AAGCJATGCCG TACTGGTGAC CGCTAATAG ATATGACCGC TTCGTACΰφ ATGACCACTG GCGATTATC AGCTTATACTGGCG AAGCJATGCCG TACTGGTGAC CGCTAATAG ATATGACCGC TTCGTACΰφ ATGACCACTG GCGATTATC AGCT

u . Üu. Ü

Tabelle XIV ECEPO GENETable XIV ECEPO GENE

Xbal ~1 .] Xbal ~ 1. ]

MetAlamETALA

CTAG AAACCATGAG GGTAATAAAA TAATGGCTCC GCCGCGTCTGCTAG AAACCATGAG GGTAATAAAA TAATGGCTCC GCCGCGTCTG

TTTGGTACTC CCATTATTTT ATTACCGAGG CGGCGCAGACTTTGGTACTC CCATTATTTT ATTACCGAGG CGGCGCAGAC

ATCTGCGACT CGAGAGTTCT GGAACGTTAC CTGCTGGAAG CTAAAGAAGCATCTGCGACT CGAGAGTTCT GGAACGTTAC CTGCTGGAAG CTAAAGAAGC

TAGACGCTGA GCTCTCAAGA CCTTGCAATG GACGACCTTC GATTTCTTCGTAGACGCTGA GCTCTCAAGA CCTTGCAATG GACGACCTTC GATTTCTTCG

TGAAAACATC ACCACTGGTT GTGCTGAACA CTGTTCTTTG AACGAAAACATGAAAACATC ACCACTGGTT GTGCTGAACA CTGTTCTTTG AACGAAAACA

ACTTTTGTAG TGGTGACCAA CACGACTTGT GACAAGAAAC TTGCTTTTGTACTTTTGTAG TGGTGACCAA CACGACTTGT GACAAGAAAC TTGCTTTTGT

TTACGGTACC AGACACCAAG GTTAACTTCT ACGCTTGGAA ACGTATGGAATTACGGTACC AGACACCAAG GTTAACTTCT ACGCTTGGAA ACGTATGGAA

AATGCCATGG TCTGTGGTTC CAATTGAAGA TGCGAACCTT TGCATACCTTAATGCCATGG TCTGTGGTTC CAATTGAAGA TGCGAACCTT TGCATACCTT

GTTGGTCAAC AAGCAGTTGA AGTTTGGCAG GGTCTGGCAC TGCTGAGCGAGTTGGTCAAC AAGCAGTTGA AGTTTGGCAG GGTCTGGCAC TGCTGAGCGA

CAACCAGTTG TTCGTCAACT TCAAACCGTC CCAGACCGTG ACGACTCGCTCAACCAGTTG TTCGTCAACT TCAAACCGTC CCAGACCGTG ACGACTCGCT

GGCTGTACTG CGTGGCCAGG CACTGCTGGT AAACTCCTCT CAGCCGTGGGGGCTGTACTG CGTGGCCAGG CACTGCTGGT AAACTCCTCT CAGCCGTGGG

CCGACATGAC GCACCGGTCC GTGACGACCA TTTGAGGAGA GTCGGCACCCCCGACATGAC GCACCGGTCC GTGACGACCA TTTGAGGAGA GTCGGCACCC

AACCGCTGCA GCTGCATGTT GACAAAGCAG TATCTGGCCT GAGATCTCTGAACCGCTGCA GCTGCATGTT GACAAAGCAG TATCTGGCCT GAGATCTCTG

TTGGCGACGT CGACGTACAA CTGTTTCGTC ATAGACCGGA CTCTAGAGACTTGGCGACGT CGACGTACAA CTGTTTCGTC ATAGACCGGA CTCTAGAGAC

ACTACTCTGC TGCGTGCTCT GGGTGCACAG AAAGAGGCTA TCTCTCCGCCACTACTCTGC TGCGTGCTCT GGGTGCACAG AAAGAGGCTA TCTCTCCGCC

TGATGAGACG ACGCACGAGA CCCACGTGTC TTTCTCCGAT AGAGAGGCGGTGATGAGACG ACGCACGAGA CCCACGTGTC TTTCTCCGAT AGAGAGGCGG

GCATGCTGCA TCTGCTGCAC CGCTGCGTAC CATCACTGCT GATACCTTCCGCATGCTGCA TCTGCTGCAC CGCTGCGTAC CATCACTGCT GATACCTTCC

CCTACGACGT AGACGACGTG GCGACGCATG GTAGTGACGA CTATGGAAGGCCTACGACGT AGACGACGTG GCGACGCATG GTAGTGACGA CTATGGAAGG

GCAAACTGH TCGTGTATAC TCTAACTTCC TGCGTGGTAA ACTGAAACTG CGTTTGACAA AGCACATATG AGATTGAAGG ACGCACCATT TGACTTTGACGCAAACTGH TCGTGTATAC TCTAACTTCC TGCGTGGTAA ACTGAAACTG CGTTTGACAA AGCACATATG AGATTGAAGG ACGCACCATT TGACTTTGAC

Sal ISal I

TATACTGGCG AAGCATGCCG TACTGGTGAC CGCTAATAG ATATGACCGC TTCGTACGGC ATGACCACTG GCGATTATCA GCTTATACTGGCG AAGCATGCCG TACTGGTGAC CGCTAATAG ATATGACCGC TTCGTACGGC ATGACCACTG GCGATTATCA GCT

Im Detail sind aus Tabelle VIII Oligonucleotide zu entnehmen, die dazu eingesetzt wurden, die Section 1 des ECEPO-Gens zu erzeugen, das die Aminoterminalreste menschlichen Polypeptids verschlüsselt. Oligonucleotide wurden zu Doppelungen vereinigt (1 und 2,3 und 4 usw.), und die Doppelungen wurden dann ligiert, um zu der ECEPO Section 1 wie in Tabelle IX zu gelangen. Bemerkt werden muß, daß zu der vereinigten Section terminale einzelsträngige EcoRI- und BamHI-Enden gehören, daß „stromabwärts" des einzelsträngigen EcoRI-Endes eineXbal-Restriktionsenzym-Erkennungsstelle ist; und daß „stromaufwärts" von einzelsträngigem BamHI-Ende eine Kpml-Erkennungsstelle ist. Section 1 konnte leicht unter Verwendung des M13 Phagenvektors amplifiziert werden, der zur Überprüfung der Sequenz der Section eingesetzt wurde: Einige Schwierigkeiten traten auf beim Isolieren der Section als Xbal/Kpnl-Fragment aus RF DNA, in E. coii erzeugt, wahrscheinlich, wegen der Methylierung der Kpnl-Erkennungsstellenbasen innerhalb des Wirtes. Es wurde daher einzelsträngige Phagen-DNA isoliert und in die doppelsträngige Form in vitro übersetzt mittels Primerverlängerung (extension), und das gewünschte doppelsträngige Fragment wurde danach leicht isoliert.In detail, Table VIII shows oligonucleotides used to generate Section 1 of the ECEPO gene, which encodes the amino terminal residues of human polypeptide. Oligonucleotides were doubled (1 and 2, 3 and 4, etc.) and the doublings were then ligated to arrive at ECEPO Section 1 as in Table IX. It should be noted that the unified section includes terminal single-stranded EcoRI and BamHI ends, that "downstream" of the single-stranded EcoRI end is an Xbal restriction enzyme recognition site, and that "upstream" of single-stranded BamHI end is a Kpml recognition site , Section 1 could be easily amplified using the M13 phage vector used to check the sequence of the section: some difficulties were encountered in isolating the section as an XbaI / KpnI fragment from RF DNA generated in E. coli, probably because of the Methylation of KpnI recognition site bases within the host. Single-stranded phage DNA was therefore isolated and translated into the double-stranded form in vitro by primer extension, and the desired double-stranded fragment was then readily isolated.

Die ECEPO-Gensectionen 2 und 3 (Tabellen Xl und XIII) wurden in ähnlicher Weise aus den Oligonucleotiden derTabellen X und XII konstruiert. Jede Section wurde in dem M13 Vektor amplifiziert, der für die Sequenzüberprüfung auf Richtigkeit eingesetzt wurde, und wurde aus Phagen DNA isoliert.ECEPO gene sections 2 and 3 (Tables XI and XIII) were similarly constructed from the oligonucleotides of Tables X and XII. Each section was amplified in the M13 vector, which was used for sequence verification for accuracy, and was isolated from phage DNA.

Wie aus Tabelle Xl ersichtlich, wurde die ECEPO-Section 2 mit einzelsträngigen EcoRI- und BamHI-Enden konstruiert und konnte als ein Kpnl/Bglll-Fragment isoliert werden. In ähnlicher Weise wurde die ECEPO-Section 3 mit einzelsträngigen BamHI-und Sall-Enden hergestellt und konnte aus Phagen RF DNA als ein BgI H-SaI I-Fragment isoliert werden. Die auf diese Weise hergestellten drei Sectionen konnten leicht zu einerfortlaufenden DNA-Sequenz vereinigt werden (Tabelle XIV), die das gesamte menschliche EPO-Polypeptid mit einem Aminoterminal-Methionincodon (ATG) für den E. coli-Translationsbeginn verschlüsselt.As can be seen from Table XI, ECEPO Section 2 was constructed with single-stranded EcoRI and BamHI ends and could be isolated as a KpnI / BglII fragment. Similarly, ECEPO Section 3 was made with single-stranded BamHI and Sall ends and could be isolated from phage RF DNA as a Bgl H-Sal I fragment. The three sections prepared in this manner could be readily pooled into a contiguous DNA sequence (Table XIV) which encodes the entire human EPO polypeptide with an amino terminal methionine codon (ATG) for E. coli translation initiation.

Weiterhin ist zu vermerken, daß sich „stromaufwärts" vom anfänglichen ATG eine Serie von Basenpaaren befindet, die die Ribosomenbindungsstellensequenz des hoch exprimierten OMP-f-Gensvon E.coli dupliziert.It is further noted that "upstream" from the initial ATG is a series of base pairs that duplicate the ribosomal binding site sequence of the highly expressed E. coli OMP f gene.

Um das ECEPO zu tragen, kann ein beliebiger geeigneter Expressionsvektor eingesetzt werden. Der besondere Vektor, der für die Expression des ECEPO-Gens als das „temperaturempfindliche" Plasmid pCFM536 — ein Derivat des Plasmids pCFM414 (ATCC 40076)—gewählt wurde, ist in der noch anhängigen US-Patentanmeldung Nr. 636727 eingereicht am 6. August 1964 von Charles F. Morris beschrieben.To carry the ECEPO, any suitable expression vector can be used. The particular vector chosen for expression of the ECEPO gene as the "temperature-sensitive" plasmid pCFM536 - a derivative of plasmid pCFM414 (ATCC 40076) is described in copending U.S. Patent Application No. 636727 filed August 6, 1964 described by Charles F. Morris.

Insbesondere wurde pCFM 536 mit Xbal und Hindlll abgebaut; das große Fragment wurde isoliert und in einer zweiteiligen Ligierung mit dem ECEPO-Gen eingesetzt. Sectionen 1 (Xbal/Kpnl), 2 (Kpml/Bgl III) und 3 (BgI Il/Sal I) wurden vorher in korrekter Weise in M13 vereinigt, und das EPO-Gen wurde daraus isoliert als ein einzelnes Xba I/Hind HI-Fragment.In particular, pCFM 536 was degraded with XbaI and HindIII; the large fragment was isolated and used in a two-part ligation with the ECEPO gene. Sections 1 (XbaI / KpnI), 2 (Kpml / Bgl III), and 3 (BglI / SalI) were previously correctly combined in M13, and the EPO gene was isolated from it as a single Xba I / Hind HI. Fragment.

Zu diesem Fragment gehörte ein Teil des Polylinkersausdem M13 und mp9 Phagen, der die Sal I bis Hind HI-Stellen darin überspannte. Die Steuerung der Expression im erhaltenen Expressionsplasmid p536 erfolgte mittels eines Lambda-PL-Promotors, der selbst von dem Cn857-Repressor-Gen (wie vom E.coli Stamm K12 Htrp vorgesehen) gesteuert wurde.To this fragment belonged a portion of the polylinker from the M13 and mp9 phage that spanned the Sal I to Hind HI sites therein. Control of expression in the resulting expression plasmid p536 was by means of a lambda P L promoter, itself controlled by the Cn 8 57 repressor gene (as provided by E. coli strain K12 Htrp).

Das hergestellte obige ECEPO-Gen konnte auf verschiedene Weise modifiziert werden, um Erythropoietin-Analoge zu verschlüsseln, wie [Asn2, des Pro2 bis llee] hEPO und [His7] hEPO, wie unten beschrieben.The above-prepared ECEPO gene could be variously modified to encode erythropoietin analogs such as [Asn 2 , Pro 2 to all e ] EPO and [His 7 ] hEPO as described below.

A. [Asn2, des Pro2 bis He6] hEPOA. [Asn 2 , Pro 2 to He 6 ] hEPO

Das Plasmid 53 b, das das ECEPO-hergestellte Gen von Tabelle XIV als ein Xbal- bis Hind Ill-Insert trug, wurde mit Hind IH und Xho I abgebaut. Letztere Endonuclease schneidet das ECEPO-Gen an einer einzigen 6-Basenpaare-Erkennungsstelle, die die letzte Base_des Asp8verschlüsselnden Codons bis zur zweiten Base des Arg'°-Codons überspannt.Plasmid 53b carrying the ECEPO-produced gene of Table XIV as an XbaI to HindII insert was digested with HindIH and XhoI. The latter endonuclease cuts the ECEPO gene at a single 6 base pair recognition site spanning the last base of the Asp 8 encoding codon to the second base of the Arg '° codon.

Eine Xba I/Xho l-„Linker"sequenz wurde hergestellt, die die folgenden Sequenzen enthielt:An Xba I / Xho I "linker" sequence was prepared containing the following sequences:

XbalXbaI Metmead + 1+ 1 22 77 δδ 99 5'-CTAG ATG5'-CTAG ATG AIaAla AsnAsn CysCys AspAsp XholXhoI 3'-TAC3'-TAC GCTGCT AATAAT TGCTGC GAC-3'GAC-3 ' CGACGA TTATTA ACGACG 'CTG AGCT-5''CTG AGCT-5'

Der Xbal/Xhoi-Linker und das Xho I/Hind Ill-ECEPO-Gensequenzfragment wurde in das große Fragment insertiert, das man aus dem Xbal- und Hind Ill-Abbau des Plasmids pCFM 526 — einem Derivat des Plasmids pCFM 414 (ARCC 40076) — erhielt, wie in der noch anhängigen US-Patentanmeldung Nr.636727, eingereicht am 6.August 1984 von Charles F.Morris beschrieben, um eine Plasmid-geborene DNA-Sequenz zu erzeugen, die die E. coli-Expression der Met^-Form des gewünschten Analogen verschlüsselt.The XbaI / XhoI linker and the XhoI / HindIIIECEPO gene sequence fragment were inserted into the large fragment obtained from XbaI and HindIl digestion of plasmid pCFM 526 - a derivative of plasmid pCFM 414 (ARCC 40076). As described in co-pending U.S. Patent Application No. 6,36727, filed August 6, 1984, by Charles F. Morris, to generate a plasmid-born DNA sequence expressing E. coli expression of Met ^. Form of the desired analog coded.

B. [His7]hEPOB. [His 7 ] hEPO

Das Plasmid 536 wurde mit Hind III und Xho 1 wie im Teil A oben abgebaut. Ein Xba I/Xho I-Linker wurde hergestellt, der die folgende Sequenz hatte:Plasmid 536 was digested with Hind III and Xho 1 as in Part A above. An Xba I / Xho I linker was prepared which had the following sequence:

9Xhol9Xhol

AGCT-5'AGCT-5 '

Der Linker und das Xhol/Hind Ill-ECEPO-Sequenzfragment wurde dann in pCFM526 insertiert, um eine Plasmid-gebotene DNA-Sequenz zu erzeugen, die die E. coli-Expression der Met^-Form des gewünschten Analoges verschlüsselt.The linker and the Xhol / Hind III ECEPO sequence fragment were then inserted into pCFM526 to generate a plasmid-supplied DNA sequence which encodes the E. coli expression of the Met ^ form of the desired analog.

XbalXbaI Metmead + 1+ 1 22 33 44 CJlCJL CJ)CJ) 77 δδ ATGATG AlaAla ProPer ProPer Argbad LeuLeu HeHe HisHis AspAsp 5'-CTAG5'-CTAG GCTGCT CCGCCG CCACCA CGTCGT CTGCTG ATCATC CATCAT CAC-3'CAC-3 ' 3'-TAC3'-TAC CGACGA GGCGGC GGTGGT GCAGCA GACGAC TAGDAY GTAGTA CTGCTG

Die Konstruktion eines hergestellten Gens („SCEPO") einschließlich der Hefepräferenzcodons ist in den folgenden Tabellen XV bis XXI beschrieben. Wie beim ECEPO-Gen gehört zu der gesamten Konstruktion dießildung von drei Sätzen Oligonucleotide (Tabellen XV, XVII und XIX) die in Doppelungen formiert wurden und zu Sectionen vereinigt wurden (Tabellen XVI, XVIII und XX). Es ist festzuhalten, daß die Synthese teilweise erleichtert wurde durch Verwendung von einigen suboptimalen Codons, sowohl bei der SCEPO- als auch ECEPO-Konstruktion, d. h. die Oligonucleotide 7-12 der Section 1 beider Gene waren identisch, ebenso die Oligonucleotide 1-6 der Section 2 in jedem Gen.The construction of a prepared gene ("SCEPO") including the yeast preference codons is described in the following Tables XV to XXI As with the ECEPO gene, the entire construction involves the formation of three sets of oligonucleotides (Tables XV, XVII and XIX) which are formed into duplicates and were combined into sections (Tables XVI, XVIII, and XX) It is noted that the synthesis has been partially facilitated by the use of some suboptimal codons, both in SCEPO and ECEPO construction, ie, oligonucleotides 7-12 of Section 1 of both genes were identical, as were Section 2- oligonucleotides 1-6 in each gene.

Tabelle XVTable XV SCEPO SECTION I OLIGONUCLEOTIDESCEPO SECTION I OLIGONUCLEOTIDE

1. AATTCAAGCTTGGATAAAAGAGCT1. AATTCAAGCTTGGATAAAAGAGCT

2. GTGGAGCTCTTTTATCCAAGCTTG2. GTGGAGCTCTTTTATCCAAGCTTG

3. CCACCAAGATTGATCTGTGACTC3. CCACCAAGATTGATCTGTGACTC

4. TCTCGAGTCACAGATCAATCTTG4. TCTCGAGTCACAGATCAATCTTG

5. GAGAGTTTTGGAAAGATACTTGTTG5. GAGAGTTTTGGAAAGATACTTGTTG

6. CTTCCAACAAGTATCTTTCCAAAAC6. CTTCCAACAAGTATCTTTCCAAAC

7. GAAGCTAAAGAAGCTGAAAACATC7. GAAGCTAAAGAAGCTGAAAACATC

8. GTGGTGATGTTTTCAGCTTCTTTAG8. GTGGTGATGTTTTCAGCTTCTTTAG

9. ACCACTGGTTGTGCTGAACACTGTTC9. ACCACTGGTTGTGCTGAACACTGTTC

10. CAAAGAACAGTGTTCAGCACAACCA10. CAAAGAACAGTGTTCAGCACAACCA

11. TTTGAACGAAAACATTACGGTACCG11. TTTGAACGAAAACATTACGGTACCG

12. GATCCGGTACCGTAATGTTTTCGTT12. GATCCGGTACCGTAATGTTTTCGTT

Tabelle XVI SCEPO SECTION 1Table XVI SCEPO SECTION 1

EcoRI Hind III 1EcoRI Hind III 1

CTtca aScTjtggata gt tggaacgtatCTtca aScTjtggata gt tggaacgtat

AAAGAGCJCC ACCAAGATTG ATCTGTGACT (JgaGAGTTTT TTTCTCGAGG TGpTTCTAAC TAGACACTGA GCTCqCAAAAAAAGAGC JCC ACC AAGATTG ATCTGTGACT ( JgaGA GTTTT TTTCTCGAGG TGpTTCTAAC TAGACACTGA GCTCqCAAAA

5,15.1

GGAAAGATAC TTGTTdGAAG CTAAAGAAGC TGAAAACATC ACCACTGGTT CCTTTCTATG AACAACCTTC] GATTTCTTCG ACTTTTGTAG TGGTqACCAAGGAAAGATAC TTGTT dGAAG CTAAAGAAGC TGAAAACATC ACCAC TGGTT CCTTTCTATG AACAACCTTC] GATTTCTTCG ACTTTTGTAG TGGTqACCAA

9 H Kpnl BaEiHI9 H Kpnl BaEiHI

GTGCTGAlCA CTGTTCjTTTGiUCGAAAACA TTACGGTACC G CACGACTTGT GäCAAGAAAC TTGCTTTTGT AATGCCATGG CCTAGGTGCTGAlCA CTGTTCjTTTGiUCGAAAACA TTACGGTACC G CACGACTTGT GäCAAGAAAC TTGCTTTTGT AATGCCATGG CCTAG

1212

Tabelle XVIITable XVII SCEPO SECTION 2 OLIGONUCLEOTIDESCEPO SECTION 2 OLIGONUCLEOTIDE

1. AATTCGGTACCAGACACCAAGGT1. AATTCGGTACCAGACACCAAGGT

2. GTTAACCTTGGTGTCTGGTACCG2. GTTAACCTTGGTGTCTGGTACCG

3. TAACTTCTACGCTTGGAAACGTAT3. TAACTTCTACGCTTGGAAACGTAT

4. TTCCATACGTTTCCAAGCGTAGAA4. TTCCATACGTTTCCAAGCGTAGAA

5. GGAAGTTGGTCAACAAGCAGTTGAAGT5. GGAAGTTGGTCAACAAGCAGTTGAAGT

6. CCAAACTTCAACTGCTTGTTGACCAAC6. CCAAACTTCAACTGCTTGTTGACCAAC

7. TTGGCAAGGTTTGGCCTTGTTATCTG7. TTGGCAAGGTTTGGCCTTGTTATCTG

8. GCTTCAGATAACAAGGCCAAACCTTG8. GCTTCAGATAACAAGGCCAAACCTTG

9. AAGCTGTTTTGAGAGGTCAAGCCT9. AAGCTGTTTTGAGAGGTCAAGCCT

10. AACAAGGCTTGACCTCTCAAAACA10. AACAAGGCTTGACCTCTCAAAACA

11. TGTTGGTTAACTCTTCTCAACCATGGG11. TGTTGGTTAACTCTTCTCAACCATGGG

12. TGGTTCCCATGGTTGAGAAGAGTTAACC12. TGGTTCCCATGGTTGAGAAGAGTTAACC

13. AACCATTGCAATTGCACGTCGAT13. AACCATTGCAATTGCACGTCGAT

14. CTTTATCGACGTGCAATTGCAA14. CTTTATCGACGTGCAATTGCAA

15. AAAGCCGTCTCTGGTTTGAGATCTG15. AAAGCCGTCTCTGGTTTGAGATCTG

16. GATCCAGATCTCAAACCAGAGACGG16. GATCCAGATCTCAAACCAGAGACGG

Tabelle XVlIl SCEPO SECTION 2Table XVII SCEPO SECTION 2

Kpnl EcoRI 1 Kpn I EcoRI 1

aTTTCGGTACC AGACACCAAG tlCCATGG TCTGTGGTTCaTTTCGGTACC AGACACCAAG tlCCATGG TCTGTGGTTC

1 j 1 year

gtttaacttcl1 acgcttggaa acgtaqjggaa gttggtcaac aagctgttgagt ttaact tcl 1 acgcttggaa acgtaq jggaa gttggtcaac aagctgttga

caattgila.ga tgcgaacctt tgcatacctti caaccagttg ttcgacaact r ' £caattgila.ga tgcgaacctt tgcatacctti caaccagttg ttcgacaact r

7 ü7 ü

AGOJTTGGCAA GGTTTGGC CT TGTTATCTgIa AGCTGTTTTG AGAGGTCAAG TCAAACCfcTT CCAAACCGGA ACAATAGACT TC(3ACAAAAC TCTCCAGTTCAG OJTTGGC AA GGTTTGGC CT TGTTATCTg Ia AGCT GTTTTG AGAGGTCAAG TCAAACCfcTT CCAAACCGGA ACAATAGACT TC (3ACAAAAC TCTCCAGTTC

1010

ι 11 , H11, H

CCOJTGTTGGT TMCTCTTCT CAACCATGGG jAACCATTGCA ATTGCACGTC GGAÄSUICCA ATTGAGAAGA GTTGGTACCC TTGGTiAACGT TAACGTGCAGCCO JTGTT GGT TMCTCTTCT CAACCATGGG jAACCA TTGCA ATTGCACGTC GGAESUICCA ATTGAGAAGA GTTGGTACCC TTGGTiAACGT TAACGTGCAG

rr IAIA

. 15 BgIII BamEl , 15 BgIII BamEl

GAOJAAAGCCg TCTCTGGTTT GAGATCTGGAO JAAAGC Cg TCTCTGGTTT GAGATCTG

CTATTTqGGC AGAGACCAAA CTCTAGACCTA G r 16CTATTTqGGC AGAGACCAAA CTCTAGACCTA G r 16

Tabelle XIX SCEPOSECTIONSOLIGONUCLEOTIDESTable XIX SCEPOSECTIONSOLIGONUCLEOTIDES

1. GATCCAGATCTTTGACTACTTTGTT1. GATCCAGATCTTTGACTACTTTGTT

2. TCTCAACAAAGTAGTCAAAGATCTG2. TCTCAACAAAGTAGTCAAAGATCTG

3. GAGAGCTTTGGGTGCTCAAAAGGAAG3. GAGAGCTTTGGGTGCTCAAAAGGAAG

4. ATGGCTTCCTTTTGAGCACCCAAAGC4. ATGGCTTCCTTTTGAGCACCCAAAGC

5. CCATTTCCCCACCAGACGCTGCTT5. CCATTTCCCCACCAGACGCTGCTT

6. GCAGAAGCAGCGTCTGGTGGGGAA6. GCAGAAGCAGCGTCTGGTGGGGAA

7. CTGCCGCTCCATTGAGAACCATC7. CTGCCGCTCCATTGAGAACCATC

8. CAGTGATGGTTCTCAATGGAGCG8. CAGTGATGGTTCTCAATGGAGCG

9. ACTGCTGATACCTTCAGAAAGTT9. ACTGCTGATACCTTCAGAAAGTT

10. GAATAACTTTCTGAAG GTATCAG10. GAATAACTTTCTGAAG GTATCAG

11. ATTCAGAGTTTACTCCAACTTCT11. ATTCAGAGTTTACTCCAACTTCT

12. CTCAAGAAGTTGGAGTAAACTCT12. CTCAAGAAGTTGGAGTAAACTCT

13. TGAGAGGTAAATTGAAGTTGTACAC13. TGAGAGGTAAATTGAAGTTGTACAC

14. ACCGGTGTACAACTTCAATTTACCT14. ACCGGTGTACAACTTCAATTTACCT

15. CGGTGAAGCCTGTAGAACTGGT15. CGGTGAAGCCTGTAGAACTGGT

16. CTGTCACCAGTTCTACAGGCTTC16. CTGTCACCAGTTCTACAGGCTTC

17. GACAGATAAGCCCGACTGATAA17. GACAGATAAGCCCGACTGATAA

18. GTTGTTATCAGTCGGGCTTAT18. GTTGTTATCAGTCGGGCTTAT

19. CAACAGTGTAGATGTAACAAAG19. CAACAGTGTAGATGTAACAAAG

20. TCGACTTTGTTACATCTACACT20. TCGACTTTGTTACATCTACACT

Tabelle XX SCEPO SECTION 3Table XX SCEPO SECTION 3

BamHI BgIII 1 ,BamHI BgIII 1,

CAGATCTTTG ACTACTTTGT TjGAGAGCTTT GTCTAGAAAC TGäTGAAACA ACTCφGAAA 2CAGATCTTTG ACTACTTTGT TjGAGAGCTTT GTCTAGAAAC TGAtGAAACA ACTCφGAAA 2

GGGTGCTCAA AAGGAACJCCA ^TTCCCUACC AGACGCTGCT TCTGCCGCTCGGGTGCTCAA AAGGAAC JCCA T TCCCUACC AGACGCTGCT T CTGC CGCTC

cccACGAGTT ttccttcggt Iaaggggtgg tctgcgacga agacggcgag 4 ' £cccACGAGTT ttccttcggt Iaaggggtgg tctgcgacga agacggcgag 4 '£

7 97 9

cattgagaac catcJactgct gataccttca gaaagttLtt cagagtttaccattgagaac catcJactgct gataccttca gaaagtt Ltt ca gagtttac

GTAACTCTTG GTAGTGAC1GA CTATGGAAGT CTTTCAATAA GfECTCAAATG 8 10' f GTAACTCTTG GTAGTGAC1GA CTATGGAAGT CTTTCAATAA GfECTCAAATG 8 10 ' f

1313

TCCAACTTCT ItGAGAGGTAA ATTGAAGTTG TACACJCGGTG AAGCCTGTAG AGGTTGAAGA ACTCJTCCATT TAACTTCAAC ATGTGGCCijC TTCGGACATCTCCAACTTCT ItGAGA GGTAA ATTGAAGTTG TACACJCGGTG AAGCCTGTAG AGGTTGAAGA ACTCJTCCATT TAACTTCAAC ATGTGGCCijC TTCGGACATC

14 . 16 _14. 16 _

1717

JA.YES.

AACTGGJGAC AGATiUGCCC GACTGATAisb AACAGTGTAG TTGACCACTG TCJTATTCGGG CTGACTATTG TTqTCACATCAACTGG JGAC AGA TiUGCCC GACTGATAis b AAC AGTGTAG TTGACCACTG TCJTATTCGGG CTGACTATTG TTqTCACATC

1818

Sail Sai l

ATGTAACAAA G TACATTGTTT CAGCT 20ATGTAACAAA G TACATTGTTT CAGCT 20

Tabelle XXI SCEPO GENTable XXI SCEPO GEN

-1 +1-1 +1

Hindlll ArgAlaHindIII ArgAla

AGCTTGGATA AAAGAGCTCC ACCAAGATTG ATCTGTGACT CGAGAGTTTTAGCTTGGATA AAAGAGCTCC ACCAAGATTG ATCTGTGACT CGAGAGTTTT

ACCTAT TTTCTCGAGG TGGTTCTAAC TAGACACTGA GCTCTCAAAACCTAT TTTCTCGAGG TGGTTCTAAC TAGACACTGA GCTCTCAAA

GGAAAGATAC TTGTTGGAAG CTAAAGAAGC TGAAAACATC ACCACTGGTTGGAAAGATAC TTGTTGGAAG CTAAAGAAGC TGAAAACATC ACCACTGGTT

CCTTTCTATG AACAACCTTC GATTTCTTCG ACTTTTGTAG TGGTGACCAACCTTTCTATG AACAACCTTC GATTTCTTCG ACTTTTGTAG TGGTGACCAA

GTGCTGAACA CTGTTCTTTG AACGAAAACA TTACGGTACC AGACACCAAGGTGCTGAACA CTGTTCTTTG AACGAAAACA TTACGGTACC AGACACCAAG

CACGACTTGT GACAAGAAAC TTGCTTTTGT AATGCCATGG TCTGTGGTTCCACGACTTGT GACAAGAAAC TTGCTTTTGT AATGCCATGG TCTGTGGTTC

GTTAACTTCT ACGCTTGGAA ACGTATGGAA GTTGGTCAAC AAGCTGTTGAGTTAACTTCT ACGCTTGGAA ACGTATGGAA GTTGGTCAAC AAGCTGTTGA

CAATTGAAGA TGCGAACCTT TGCATACCTT CAACCAGTTG TTCGACAACTCAATTGAAGA TGCGAACCTT TGCATACCTT CAACCAGTTG TTCGACAACT

AGTTTGGCAA GGTTTGGCCT TGTTATCTGA AGCTGTTTTG AGAGGTCAAGAGTTTGGCAA GGTTTGGCCT TGTTATCTGA AGCTGTTTTG AGAGGTCAAG

TCAAACCGTT CCAAACCGGA ACAATAGACT TCGACAAAAC TCTCCAGTTCTCAAACCGTT CCAAACCGGA ACAATAGACT TCGACAAAAC TCTCCAGTTC

CCTTGTTGGT TAACTCTTCT CAACCATGGG AACCATTGCA ATTGCACGTCCCTTGTTGGT TAACTCTTCT CAACCATGGG AACCATTGCA ATTGCACGTC

GGAACAACCA ATTGAGAAGA GTTGGTACCC TTGGTAACGT TAACGTGCAGGGAACAACCA ATTGAGAAGA GTTGGTACCC TTGGTAACGT TAACGTGCAG

GATAAAGCCG TCTCTGGTTT GAGATCTTTG ACTACTTTGT TGAGAGCTTTGATAAAGCCG TCTCTGGTTT GAGATCTTTG ACTACTTTGT TGAGAGCTTT

CTATTTCGGC AGAGACCAAA CTCTAGAAAC TGATGAAACA ACTCTCGAAACTATTTCGGC AGAGACCAAA CTCTAGAAAC TGATGAAACA ACTCTCGAAA

GGGTGCTCAA AAGGAAGCCA TTTCCCCACC AGACGCTGCT TCTGCCGCTCGGGTGCTCAA AAGGAAGCCA TTTCCCCACC AGACGCTGCT TCTGCCGCTC

CCCACGAGTT TTCCTTCGGT AAAGGGGTGG TCTGCGACGA AGACGGCGAGCCCACGAGTT TTCCTTCGGT AAAGGGGTGG TCTGCGACGA AGACGGCGAG

CATTGAGAAC CATCACTGCT GATACCTTCA GAAAGTTATT CAGAGTTTACCATTGAGAAC CATCACTGCT GATACCTTCA GAAAGTTATT CAGAGTTTAC

GTAACTCTTG GTAGTGACGA CTATGGAAGT CTTTCAATAA GTCTCAAATGGTAACTCTTG GTAGTGACGA CTATGGAAGT CTTTCAATAA GTCTCAAATG

Tabelle XXI (Fortsetzung)Table XXI (continued)

-1+1-1 + 1

Hindlll Arg Al aHindll Arg Al a

TCCAACTTCT TGAGAGGTAA ATTGAAGTTG TACACCGGTG AAGCCTGTAG AGGTTGAAGA ACTCTCCATT TAACTTCAAC ATGTGGCCAC TTCGGACATCTCCAACTTCT TGAGAGGTAA ATTGAAGTTG TACACCGGTG AAGCCTGTAG AGGTTGAAGA ACTCTCCATT TAACTTCAAC ATGTGGCCAC TTCGGACATC

AACTGGTGAC AGATAAGCCC GACTGATAAC AACAGTGTAGAACTGGTGAC AGATAAGCCC GACTGATAAC AACAGTGTAG

TTGACCACTG TCTATTCGGG CTGACTATTG TTGTCACATC "*'TTGACCACTG TCTATTCGGG CTGACTATTG TTGTCACATC "* '

SailSail

ATGTAACAAA G TACATTGTTT CAGCTATGTAACAAA G TACATTGTTT CAGCT

Die vereinigten SCEPO-Sectionen wurden in M13 sequenziert, und die Sectionen 1,2 und 3 waren aus dem Phagen als Hind III/ Kpnl-, Kpnl/Bglll- und Bglll/Sal !-Fragmente isolierbar.The pooled SCEPO sections were sequenced in M13 and sections 1.2 and 3 were isolatable from the phage as Hind III / KpnI, KpnI / BglII and BglII / Sal! Fragments.

Das gegenwärtig bevorzugteste Expressionssystem für SCEPO-Genprodukte ist ein Skretionssystem, basierend auf einer S. cerevisiae-a-Faktor-sekretion.wiein der anhängigen US-Patentanmeldung Nr.487753, eingereicht am 22. April 1983 von Grant A. Bitter, veröffentlicht am 31. Oktober 1984 als Europäische Patentanmeldung 0123294, beschrieben. Kurz zusammengefaßt gehören zu dem System Konstruktionen, worin DNA, die die Führungssequenz des Hefe-a-Faktor-Genproduktes verschlüsselt, unmittelbar 5' zur codierenden Region des zu exprimierenden exogenen Gens angeordnet ist. Als ein Ergebnis enthält das translatierte Genprodukt eine Führungs- oder Signalsequenz, die „wegbehandelt" (processed off) wird durch ein endogenes Hefeenzym im Verlauf der Sekretion des verbliebenen Produktes. Da bei der Konstruktion mit dem a-Faktor-Translationsbeginn (ATG)-codon gearbeitet wurde, war es nicht erforderlich, ein solches Codon an der-1-Position des SCEPO-Gens einzubauen. Wie aus Tabelle XXI entnommen werden kann, geht der Alanin (+1) verschlüsselnden Sequenz eine Linkersequenz voraus, die eine direkte Insertion in ein Plasmid gestattet, enthaltend die DNA für die ersten 80 Reste der α-Faktorführungssequenz, die dem α-Faktor-Promoterfolgt. Zu der speziell bevorzugten Konstruktion für die SCEPO-Genexpression gehört eine vierteilige Ligierung unter Einschluß des oben genannten SCEPO-Section-Fragmentes und des großen Fragmentes des HindIll/Sal !-Abbaus des ' Plasmids paC3. Aus dem erhaltenen paC3/SCEPO wurden der a-Faktorpromotor und die Führungssequenz und das SCEPO-Gen isoliert durch Abbau mit Bam Hl und ligiert in das Barn Hl-abgebaute Plasmid pYE, um zu dem Expressionsplasmid pYE/SCEPO zu gelangen.The presently most preferred expression system for SCEPO gene products is a scretion system based on S. cerevisiae α-factor secretion, as described in copending U.S. Patent Application No. 487753, filed April 22, 1983, by Grant A. Bitter, published 31 October 1984 as European Patent Application 0123294. Briefly, the system includes constructions in which DNA encoding the leader sequence of the yeast a-factor gene product is located immediately 5 'to the coding region of the exogenous gene to be expressed. As a result, the translated gene product contains a leader or signal sequence that is "processed off" by an endogenous yeast enzyme in the course of secretion of the remaining product It was not necessary to incorporate such a codon at the -1 position of the SCEPO gene As can be seen from Table XXI, the alanine (+1) coding sequence precedes a linker sequence which is a direct insertion into a Plasmid allowed containing the DNA for the first 80 residues of the α-factor leader sequence following the α-factor promoter The particularly preferred construction for SCEPO gene expression involves four-fold ligation, including the above-mentioned SCEPO-Section fragment and fragment of HindIII / SalI degradation of the plasmid paC3 From the resulting paC3 / SCEPO, the a-factor promoter and the leader sequence and isolated the SCEPO gene by digestion with Bam HI and ligated into the Barn HI-degraded plasmid pYE to arrive at the expression plasmid pYE / SCEPO.

Es sollte bei Betrachtung der Beispiele deutlich geworden sein, daß zahlreiche außerordentlich wertvolle Produkte und Verfahrensweisen durch die vorliegende Erfindung in ihren vielen Aspekten hervorgebracht wurden.It should be apparent upon consideration of the examples that numerous extraordinarily valuable products and procedures have been produced by the present invention in its many aspects.

Nach einem weiteren Aspekt der vorliegenden Erfindung sind die hier beschriebenen klonierten DNA-Sequenzen, die Human- und Affen-EPO-Polypeptide verschlüsseln, bemerkenswert wertvoll für die darin enthaltenen Informationen hinsichtlich der Aminosäuresequenz von Säugetier-Erythropoietin, die bis heute nicht zu erhalten waren, abgesehen von Teilen aus analytischen Verfahren von Isolaten natürlich auftretender Produkte. Die DNA-Sequenzen sind auch bemerkenswert wertvoll als Produkte, die dazu eingesetzt werden können, die mikrobielle Synthese von Erythropoietin im großen Maße zu beschreiben mittels einer Vielzahl rekombinanter Techniken. Andererseits sind die durch die vorliegende Erfindung vorgesehenen DNA-Sequenzen nützlich für die Erzeugung neuer und nutzbringender viraler und ringförmiger Plasmid-DNA-Vektoren, neuer und nutzbringender transformierter und transferierter mikrobieller procaryotischer und eucaryotischer Wirtszellen (einschließlich bakterieller und Hefezellen sowie in Kultur gewachsener Säugetierzellen sowie neuer und nutzbringender Verfahren des kultivierten Wachstums solcher mikrobieller Wirtszellen, die zur Expression von EPO- und EPO-Produkten in der Lage sind.In another aspect of the present invention, the cloned DNA sequences described herein encoding human and monkey EPO polypeptides are remarkably valuable for the information contained therein regarding the amino acid sequence of mammalian erythropoietin that have not been obtained to date. apart from parts of analytical procedures of isolates of naturally occurring products. The DNA sequences are also remarkably valuable as products that can be used to extensively describe the microbial synthesis of erythropoietin by a variety of recombinant techniques. On the other hand, the DNA sequences provided by the present invention are useful for the generation of novel and beneficial viral and circular plasmid DNA vectors, novel and beneficial transformed and transferred microbial procaryotic and eucaryotic host cells (including bacterial and yeast cells, and mammalian cells grown in culture, as well as novel ones and beneficial methods of cultivated growth of such microbial host cells capable of expressing EPO and EPO products.

Die erfindungsgemäßen DNA-Sequenzen sind auch bemerkenswert geeignete Materialien für den Einsatz als markierte Sonden bei der Isolierung von EPO und verwandter Protein-verschlüsselnder cDNA- und genomischer DNA-Sequenzen von anderen Säugetieren als den hier speziell erläuterten Menschen und Affenarten. Der Gehalt, bis zu dem die erfindungsgemäßen DNA-Sequenzen bei dem unterschiedlichen alternativen Verfahren zur Prokinsynthese eingesetzt werden (z. B. in Insektenzellen) oder bei der genetischen Therapie von Menschen oder anderen Säugetieren kann noch nicht berechnet werden. Es ist zu erwarten, daß die erfindungsgemäßen DNA-Sequenzen bei der Entwicklung transgenischer Säugetierarten nutzbringend sein können, die als eucaryotische „Wirte" zur Herstellung von Erythropoietin und Erythropoietinprodukten in Mengen dienen können. Siehe allgemein Polmiter et al., Science, 222 (4625), 809-814 (1983).The DNA sequences of the present invention are also remarkably suitable materials for use as labeled probes in the isolation of EPO and related protein-encoding cDNA and genomic DNA sequences from mammals other than the human and monkey species specifically discussed herein. The content to which the DNA sequences according to the invention are used in the different alternative method for the synthesis of Prokin (eg in insect cells) or in the genetic therapy of humans or other mammals can not yet be calculated. It is expected that the DNA sequences of the present invention may be useful in the development of transgenic mammalian species which may serve as eucaryotic "hosts" for the production of erythropoietin and erythropoietin products in amounts See, generally, Polmiter et al., Science, 222 (4625) , 809-814 (1983).

Unter diesem Gesichtspunkt ist klar nicht beabsichtigt, daß die erläuternden Beispiele den Schutzumfang der vorliegenden Erfindung einschränken, und für den Fachmann sind zahlreiche Modifikationen und Variationen denkbar. Als ein Beispiel: Während zu den DNA-Sequenzen, die durch die erläuternden Beispiele gehören, da diese Anmeldung Aminosäuresequenzinformationen vorsieht, die zur Herstellung der DNA-Sequenz wesentlich sind, umfaßt die Erfindung auch solche hergestellten DNA-Sequenzen, wie sie infolge des Wissens um die EPO-Aminosäuresequenzen konstruiert werden können. Diese können für EPO codieren (wie im Beispiel 12), ebenso wie für EPO-Fragmente und kEPO-Polypeptidanaloge(d. i. „EPO-Produkte"), die eine oder mehrere der biologischen Eigenschaften von natürlich auftretendem EPO aufweisen, andere jedoch nicht (oder die andere in unterschiedlichem Grad besitzen).From this point of view, it is clearly not intended that the illustrative examples limit the scope of the present invention, and numerous modifications and variations will be apparent to those skilled in the art. As an example, while to the DNA sequences pertaining to the illustrative examples, as this application provides amino acid sequence information essential to the preparation of the DNA sequence, the invention also encompasses those DNA sequences produced as recited in the wake of the art the EPO amino acid sequences can be constructed. These may encode EPO (as in Example 12), as well as EPO fragments and kEPO polypeptide analogues (ie, "EPO products") having one or more of the biological properties of naturally occurring EPO, but not others (or others in different degrees).

Die durch die vorliegende Erfindung offengelegten DNA-Sequenzen umfassen somit alle DNA-Sequenzen, die für eine sichere Expression eines Polypeptidproduktes in einer procaryotischen oder eucaryotischen Wirtszelle geeignet sind, wobei dieses Produkt wenigstens einen Teil der primären strukturellen Anordnung und eine oder mehrere der biologischen Eigenschaften von Erythropoietin aufweist und unter folgenden ausgewählt ist:The DNA sequences disclosed by the present invention thus include all DNA sequences suitable for safe expression of a polypeptide product in a procaryotic or eucaryotic host cell, which product comprises at least a portion of the primary structural arrangement and one or more of the biological properties of Having erythropoietin selected from:

(a) den in den Tabellen V und Vl aufgeführten DNA-Sequenzen;(a) the DNA sequences listed in Tables V and VI;

(b) DNA-Sequenzen, die zu den unter (a) aufgeführten oder deren Fragmenten hybridisieren; und(b) DNA sequences which hybridize to those listed under (a) or fragments thereof; and

(c) DNA-Sequenzen, die, allerdings unter Degenerierung des genetischen Codes, zu den unter (a) und (b) definierten DNA-Sequenzen hybridisieren. In diesem Zusammenhang ist es zum Beispiel bemerkenswert, daß zu erwarten ist, daß existierende allelische Affen- und Human-EPO-Gensequenzen und die Gensequenzen anderer Säugetierarten zu Sequenzen der Tabellen V und Vl oder zu Fragmenten davon hybridisieren. Darüber hinaus wurden auch — allerdings unter Degenerierung des genetischen(c) DNA sequences which hybridize, but with degeneracy of the genetic code, to the DNA sequences defined under (a) and (b). In this regard, it is noteworthy, for example, that existing allelic monkey and human EPO gene sequences and the gene sequences of other mammalian species are expected to hybridize to sequences of Tables V and VI or to fragments thereof. In addition were also - albeit under degeneration of the genetic

Codes — die SCEPO — und ECEPO-Gene und die hergestellten oder mutierten cDNA- oder genomischen DNA-Sequenzen, die verschiedene EPO-Fragmente und -analoge verschlüsseln, ebenfalls zu den oben genannten DNA-Sequenzen hybridisieren. Derartige Hybridisierungen könnten leicht unter den hier beschriebenen Hybridisierungsbedingungen durchgeführt werden im Hinblick auf die anfängliche Isolierung der Affen-und Human-EPO verschlüsselnden DNA oder schärferen Bedingungen, um die Hintergrundhybridisierung gewünschtenfalls zu verringern.Codes - the SCEPO and ECEPO genes and the prepared or mutated cDNA or genomic DNA sequences encoding different EPO fragments and analogs also hybridize to the above DNA sequences. Such hybridizations could easily be performed under the hybridization conditions described herein with regard to the initial isolation of monkey and human EPO-encoding DNA or more severe conditions to reduce background hybridization if desired.

Erfindungsgemäße verbesserte Hybridisierungsmethodologien, die erläuternd auf die obigen DNA/DNA-Hybridisierungsscreenings angewandt wurden, sind gleichfalls auf RNA/RNA- und RNA/DN Α-Screening anwendbar. Mischsondentechniken, wie sie hier erläutert wurden, bestehen allgemein aus einer Anzahl von Verbesserungen bei Hybridisierungsmethoden, die schnellere und zuverlässigere Polynucleotidisolierungen gestatten. Zu diesen vielen einzelnen Verfahrensverbesserungen gehören:Improved hybridization methodologies of the invention, illustratively applied to the above DNA / DNA hybridization screens, are also applicable to RNA / RNA and RNA / DNΑ screening. Mixed probe techniques, as discussed herein, generally consist of a number of improvements in hybridization techniques that allow for faster and more reliable polynucleotide isolation. These many individual process improvements include:

verbesserte Kolonieübertragungs- und -erhaltungsverfahren; Verwendung von Filtern auf Nylinbasis wie Gene-Screen und Gene-Screen-Plus, um mit demselben Filtern ein Re-Sondieren zu gestatten und die Filter wiederholt verwenden zu können. Anwendung neuerProteasebehandlungen [z.B.Taubetal., Anal. Biochem., 126,S.222-230(1982)]; Verwendung von sehr geringen Einzelkonzentrationen (im Bereich von 0,025 picomol) einer größeren Anzahl von Mischsonden (z.B. die über 32 liegenden Zahlen); und Durchführung von Hybridisierungs- und Nachhybridisierungsschritten unter strengen Temperaturen, die in der Nähe (d. i. innerhalb 40C und vorzugsweise innerhalb 2°C entfernt von) der niedrigsten berechneten Dissoziätionstemperatur einer beliebigen der eingesetzten Mischsonden liegt. Die Verbesserungen führen gemeinsam zu Ergebnissen, die von vornherein nicht zu erwarten gewesen sind. Verstärkt wird dies durch die Tatsache unterstrichen, daß Mischsondenverfahren mit der vierfachen Zahl der Sonden, über die je bisher als erfolgreich eingesetzt in gleichen cDNA-Screens von Boten-RNA-spezies relativ geringer Menge berichtet wurde, erfolgreich für die Isolierung eines einzelnen Gens in einer Genbibliothek unter Screenen von 1500000 Phagenplaques angewandt wurden. Dies wurde erreicht im wesentlichen entgegen der von Anderson et al., siehe oben, publizierten Auffassung, daß Mischsondenscreeningverfahren ...für die Isolierung von Säugetierproteingenen untunlich sind, wenn die entsprechenden RNA's nicht erhältlich sind. Die in der vorangegangenen Beschreibung, in den folgenden Patentansprüchen und/oder in den dazugehörigen Zeichnungen offenbarten Merkmale können sowohl getrennt voneinander als auch in Kombination Grundlage für die Realisierung der Erfindung in ihren diversen Formen sein.improved colony transfer and maintenance methods; Use of nylin-based filters, such as Gene-Screen and Gene-Screen-Plus, to allow re-probing with the same filtering and repeated use of the filters. Application of New Protease Treatments [eg, Taubetal., Anal. Biochem., 126, p.222-230 (1982)]; Using very low single concentrations (in the range of 0.025 picomoles) of a larger number of mixing probes (eg the numbers above 32); and conducting hybridization and post-hybridization steps under severe temperatures close to (ie within 4 0 C and preferably within 2 ° C of) the lowest calculated dissociation temperature of any of the mixed probes employed. The improvements together lead to results that were unexpected from the outset. This is further emphasized by the fact that mixed probing methods with four times the number of probes reported hitherto as successfully employed in the same cDNA screens of messenger RNA species of relatively small amount have succeeded in isolating a single gene in one Gene library were applied under screenings of 1500000 phage plaques. This was achieved in substantial contrast to the view published by Anderson et al., Supra, that mixing probe screening methods are incapable of isolating mammalian protein genes if the corresponding RNA's are not available. The features disclosed in the foregoing description, in the following claims and / or in the accompanying drawings, both separately and in combination, may be the basis for the realization of the invention in its various forms.

Claims (4)

Verfahren zur Bestimmung eines spezifischen einzelsträngigen Polynucleotide unbekannter Sequenz in einer heterogenen zellulären oder viralen Probe einschließlich multipler einzelsträngiger Polynucleotide, gekennzeichnet dadurch, daß « (a) ein Gemisch markierter einzelsträngiger Polynucleotidsonden mit gleichmäßig variierenden Sequenzen der Basen hergestellt wird, wobei jede der Sonden potentiell einer Sequenz von Basen komplementär ist, die zu dem zu bestimmenden Polynucleotid das vermeintlich nur einmal existierende Exemplar ist; (b) die Probe auf ein festes Substrat fixiert wird; (c) das Substrat mit der darauf fixierten Probe behandelt wird, um eine weitere Bindung von Polynucleotiden darauf abzuschwächen, ausgenommen durch Hybridisierung zu Polynucleotiden in der Probe; (d) das behandelte Substrat mit der darauf fixierten Probe flüchtig mit dem genannten Gemisch markierter Sonden unter Bedingungen in Berührung gebracht wird, die nur die Hybridisierung zwischen vollständig komplementären Polynucelotiden erleichtern; und (e) das spezifische Polynucleotid über die Beobachtung des Auftretens einer Hybridisierungsreaktion zwischen ihm und einer vollständig komplementären Sonde aus dem Gemisch der markierten Sonden bestimmt wird, was durch das Auftreten einer höheren Dichte des markierten Materials auf dem Substrat am Ort des spezifischen Polynucleotide im Vergleich zu einer Hintergrunddichte an markiertem Material, die sich aus dem nichtspezifischen Binden markierter Sonden an das Substrat ergibt, angezeigt wird, wobei die Verbesserung darin besteht, daß die Verwendung von 32 Mischsonden im Überschuß erfolgt und eines oder mehrere der folgenden Merkmale auftreten.A method of determining a specific single-stranded polynucleotide of unknown sequence in a heterogeneous cellular or viral sample including multiple single-stranded polynucleotides, characterized in that "(a) a mixture of labeled single-stranded polynucleotide probes with uniformly varying sequences of the bases is prepared, each of the probes being potentially of sequence is complementary to bases, which is the allegedly only once existing copy to the polynucleotide to be determined; (b) fixing the sample on a solid substrate; (c) treating the substrate with the sample fixed thereon to attenuate further binding of polynucleotides thereto, except by hybridization to polynucleotides in the sample; (d) contacting the treated substrate with the sample fixed thereon in a volatile manner with said mixture of labeled probes under conditions which only facilitate hybridization between fully complementary polynucelotides; and (e) the specific polynucleotide is determined by observing the occurrence of a hybridization reaction between it and a fully complementary probe from the mixture of labeled probes, as compared to the appearance of a higher density of the labeled material on the substrate at the site of the specific polynucleotide to a background density of labeled material resulting from non-specific binding of labeled probes to the substrate, the improvement being that the use of 32 mixing probes is in excess and one or more of the following features occurs. (1) Einsatzeines Papiers auf Nylonbasis als festes Substrat;(1) use of a nylon-based paper as a solid substrate; (2) Behandlung mit einer Protease in Stufe (c);(2) treatment with a protease in step (c); (3) Einsatz individuell markierter Sondenkonzentrationen von annähernd 0,025Picomol; und(3) use of individually labeled probe concentrations of approximately 0.025 picomole; and (4) Einsatz als einer der Hybridisierungsbedingungen in Stufe (d) strenge Temperaturen, die nahe bei . 4°C von der niedrigsten berechneten Td irgendeiner der verwendeten Sonden liegen.(4) Use as one of the hybridization conditions in step (d), severe temperatures close to. 4 ° C from the lowest calculated Td of any of the probes used.
DD30037687A 1984-09-28 1987-03-02 METHOD FOR DETERMINING A SPECIFIC SINGLE-TERM POLYNUCLEBIDE OF UNKNOWN SEQUENCE DD255359A5 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US65584184A 1984-09-28 1984-09-28

Publications (1)

Publication Number Publication Date
DD255359A5 true DD255359A5 (en) 1988-03-30

Family

ID=24630601

Family Applications (1)

Application Number Title Priority Date Filing Date
DD30037687A DD255359A5 (en) 1984-09-28 1987-03-02 METHOD FOR DETERMINING A SPECIFIC SINGLE-TERM POLYNUCLEBIDE OF UNKNOWN SEQUENCE

Country Status (3)

Country Link
DD (1) DD255359A5 (en)
LT (1) LT4012B (en)
UA (1) UA54363C2 (en)

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US439443A (en) 1890-10-28 Back-band buckle
US483451A (en) 1892-09-27 Waterproof composition
US4264731A (en) 1977-05-27 1981-04-28 The Regents Of The University Of California DNA Joining method
US4273875A (en) 1979-03-05 1981-06-16 The Upjohn Company Plasmid and process of isolating same
US4293652A (en) 1979-05-25 1981-10-06 Cetus Corporation Method for synthesizing DNA sequentially
CA1180647A (en) 1981-07-17 1985-01-08 Cavit Akin Light-emitting polynucleotide hybridization diagnostic method
EP0071685A3 (en) 1981-08-12 1983-06-15 Olaf Soot Method and apparatus for handling nuclear fuel elements
IL68561A (en) 1982-05-05 1991-01-31 Genentech Inc Preparation of polypeptide with human tissue plasminogen activator function,processes for making it,and dna and transformed cell intermediates thereof
US6936694B1 (en) 1982-05-06 2005-08-30 Intermune, Inc. Manufacture and expression of large structural genes

Also Published As

Publication number Publication date
LTIP1836A (en) 1995-08-25
LT4012B (en) 1996-08-26
UA54363C2 (en) 2003-03-17

Similar Documents

Publication Publication Date Title
US4703008A (en) DNA sequences encoding erythropoietin
DE69034171T2 (en) Recombinant protease inhibitor of Alzheimer's amyloid protein
US5441868A (en) Production of recombinant erythropoietin
US5547933A (en) Production of erythropoietin
EP0409113B1 (en) Human erythropoietin muteins, their production and their use
DE3111405C2 (en)
EP0986644B1 (en) Production of erythropoietin by endogenous gene activation with viral promoters
DD212982A5 (en) METHOD FOR THE PRODUCTION OF BOVINE GROWTH HORMONE-SIMILAR POLYPEPTIDES
CH681080A5 (en)
DE2848052A1 (en) SYNTHETIC DNA AND METHOD FOR THEIR PRODUCTION
DE2848053A1 (en) SYNTHETIC DNA AND METHOD FOR THEIR PRODUCTION
DE2848051A1 (en) SYNTHETIC DNA AND METHOD FOR THEIR PRODUCTION
DD297188A5 (en) GM-CSF AND IL-3 COMPREHENSIVE FUSION PROTEINS
DD219505A5 (en) METHOD FOR PRODUCING SWINE GROWTH HORMONEIC POLYPEPTIDES
AT389892B (en) DNA SEQUENCE WITH A GENE THAT CODES FOR HUMAN-INTERLEUKIN-2
DE69233155T2 (en) INSULIN-LIKE GROWTH FACTOR BINDING PROTEIN
DD255359A5 (en) METHOD FOR DETERMINING A SPECIFIC SINGLE-TERM POLYNUCLEBIDE OF UNKNOWN SEQUENCE
DD251786A5 (en) Process for the preparation of a polypeptide
RU2261276C2 (en) Isolated dna molecule encoding human erythropoietin (variants), expressing plasmid or viral dna-vector, glycoprotein erythropoietin (variants) and method for its preparing, pharmaceutical composition (variants), mammalian cell line (variants)
CA1341607C (en) Production of erythropoietin
DD257271A1 (en) PROCESS FOR PRODUCING HUMAN GROWTH HORMONE (SOMATOTROPINE)
AU4252400A (en) Production of erythropoietin
SK279959B6 (en) Dna sequence, a plasmid, vector, host cell, polypeptide of an erythropoietin-type, method of its production and pharmaceutical composition based thereon
DD251788A5 (en) Process for the preparation of a human cDNA clone
DD279687A5 (en) PROCESS FOR THE PRODUCTION OF ERYTHROPOIETIN

Legal Events

Date Code Title Description
IF04 In force in the year 2004

Expiry date: 20050620