DE69834190T2

DE69834190T2 - 5' ests für sekretierte proteine die im gehirn expremiert werden

Info

Publication number: DE69834190T2
Application number: DE69834190T
Authority: DE
Inventors: Jean-Baptiste Dumas Milne Edwards; Aymeric Duclert; Bruno Lacroix
Original assignee: Serono Genetics Institute SA
Current assignee: Merck Biodevelopment SAS
Priority date: 1997-08-01
Filing date: 1998-07-31
Publication date: 2007-01-11
Anticipated expiration: 2018-08-01
Also published as: EP1000150A2; WO1999006552B1; AU8555598A; WO1999006552A2; ATE323161T1; US6222029B1; DE69834190D1; WO1999006552A3; EP1000150B1; CA2296667A1; JP2001512015A

Description

Hintergrund der Erfindung
Die auf 50,000 bis 100,000 geschätzten Gene, die über die menschlichen Chromosomen verteilt sind, bieten eine enorme Aussicht für das Verständnis, die Diagnose und die Behandlung menschlicher Erkrankungen. Darüber hinaus finden Sonden, die zur spezifischen Hybridisierung an über das menschliche Genom verteilte Genloci in der Lage sind, bei der Erstellung hochaufgelöster Chromosomenkarten und bei der Identifizierung von Personen Anwendung.
In der Vergangenheit war die Charakterisierung auch nur eines einzelnen menschlichen Gens ein mühevolles Verfahren, das jahrelange Anstrengungen erforderte. Neuere Entwicklungen auf den Gebieten der Klonierungsvektoren, der DNA-Sequenzierung und der Computertechnologie kamen zusammen, um die Geschwindigkeit, mit der menschliche Gene isoliert, sequenziert, kartiert und charakterisiert werden können, außerordentlich zu beschleunigen. Klonierungsvektoren, wie beispielsweise künstliche Hefechromosomen (yeast artificial chromosomes; YACs) und künstliche Bakterienchromosomen (bacterial artificial chromosomes; BACs), sind in der Lage, DNA-Inserts, die hinsichtlich der Länge von 300 bis 1000 Kilobasen (kb) bzw. 100-400 kb reichen, aufzunehmen, wobei sie so die Manipulierung und Beschaffung von DNA-Sequenzen, die auf menschlichen Chromosomen über große Abstände verteilt sind, erleichtern. Automatisierte DNA-Sequenzierungsmaschinen ermöglichen die schnelle Sequenzierung von menschlichen Genen. Bioinformatische Software ermöglicht den Vergleich von Nukleinsäure- und Proteinsequenzen, wobei so die Charakterisierung menschlicher Genprodukte unterstützt wird.
Gegenwärtig werden zwei verschiedene Ansätze zur Identifizierung und Charakterisierung der über das menschliche Genom verteilten Gene verfolgt. In einem Ansatz werden große Fragmente genomischer DNA isoliert, kloniert und sequenziert. Potenziell offene Leserahmen in diesen genomischen Sequenzen werden unter Verwendung bioinformatischer Software identifiziert. Dieser Ansatz führt jedoch zur Sequenzierung langer Strecken menschlicher, kein Protein kodierender DNA, um die über das Genom verteilten Protein kodierenden Sequenzen zu finden. Über die erforderliche umfangreiche Sequenzierung hinausgehend kann die bioinformatische Software die erhaltenen genomischen Sequenzen falsch charakterisieren. Auf diese Weise kann die Software Falschpositive, in denen nicht kodierende DNA fälschlicherweise als kodierende DNA charakterisiert wird, oder Falschnegative, in denen kodierende DNA fälschlicherweise als nicht kodierende DNA bezeichnet wird, erzeugen.
Ein alternativer Ansatz nimmt zur Identifizierung und Charakterisierung menschlicher Gene einen direkteren Weg. In diesem Ansatz werden aus isolierten Boten-RNAs (mRNAs), die menschliche Proteine kodieren, komplementäre DNAs (cDNAs) synthetisiert. Unter Verwendung dieses Ansatzes wird eine Sequenzierung nur für DNA ausgeführt, die aus Protein kodierenden Abschnitten des Genoms abgeleitet worden ist. Oftmals werden nur kurze cDNA-Strecken sequenziert, um so Sequenzen zu erhalten, die als Expressed Sequence Tags (ESTs) bezeichnet werden. Diese ESTs können anschließend verwendet werden, um erweiterte cDNAs zu isolieren und aufzureinigen, die Sequenzen umfassen, die zu den EST-Sequenzen benachbart sind. Die erweiterten cDNAs können die vollständige EST-Sequenz umfassen, die verwendet wurde, um sie zu erhalten oder sie können nur einen Teil der EST-Sequenz umfassen, die verwendet wurde, um sie zu erhalten. Darüber hinaus können die erweiterten cDNAs die vollständig kodierende Sequenz des Gens enthalten, von dem das EST abgeleitet worden war, oder alternativ können die erweiterten cDNAs Abschnitte der kodierenden Sequenz des Gens enthalten, von dem das EST abgeleitet worden war. Es wird dabei erkannt, dass mehrere erweiterte cDNAs vorliegen können, die die EST-Sequenz als Ergebnis alternativen Spleißings oder als Ergebnis der Aktivität alternativer Promotoren umfassen.
In der Vergangenheit wurden diese kurzen EST-Sequenzen oft aus cDNA-Bibliotheken auf Grundlage von Oligo-dT erhalten. Entsprechend korrespondieren sie hauptsächlich mit der 3' untranslatierten Region der mRNA. Zum Teil ist das Übergewicht an aus mRNA 3'-Enden abgeleiteten EST-Sequenzen eine Folge der Tatsache, dass herkömmliche Techniken zum Erlangen von cDNAs für die Isolierung von aus mRNA 5'-Enden abgeleiteten cDNA-Sequenzen nicht richtig geeignet sind (Adams et al., Nature 377:3-174, 1996; Hillier et al., Genome Res. 6:807-828, 1996).
Darüber hinaus entsprechen in den beschriebenen Fällen, in denen längere cDNA-Sequenzen erhalten wurden, die beschriebenen Sequenzen typischerweise den kodierten Sequenzen und umfassen nicht die vollständige 5' untranslatierte Region der mRNA, von der die cDNA abgeleitet ist. Solche unvollständigen Sequenzen könnten das erste Exon der mRNA nicht umfassen, insbesondere in den Fällen, in denen das erste Exon kurz ist. Darüber hinaus könnten sie einige Exons nicht umfassen, oftmals kurze Exons, die stromaufwärts der Spleißingstellen liegen. Es besteht deshalb ein Bedarf, Sequenzen zu erhalten, die von den mRNA 5'-Enden abgeleitet sind.
Während viele von den menschlichen Chromosomen abgeleitete Sequenzen praktische Anwendung finden, sind Ansätze, die auf der Identifizierung und Charakterisierung derartiger chromosomaler Sequenzen basieren, die ein Proteinprodukt kodieren, insbesondere für diagnostische und therapeutische Verwendungen relevant. Von den 50,000 – 100,000 Protein kodierenden Genen sind sowohl die Gene, die Proteine kodieren, die von der Zelle, in der sie synthetisiert werden, sekretiert werden, als auch die sekretierten Proteine selbst als mögliche therapeutische Mittel besonders wertvoll. Solche Proteine spielen bei der Kommunikation von Zelle zu Zelle oftmals beteiligt sind und können für die Erzeugung einer klinisch relevanten Reaktion in ihren Zielzellen verantwortlich sein.
Tatsächlich finden gegenwärtig mehrere sekretorische Proteine, einschließlich Gewebeplasminogenaktivator, G-CSF, GM-CSF, Erythropoietin, humanes Wachstumshormon, Insulin, Interferon-α, Interferon-β, Interferon-γ und Interleukin-2 klinische Verwendung. Diese Proteine werden verwendet, um einen breiten Bereich von Zuständen einschließlich akutem Myokardinfarkt, akuter ischämischer Apoplexie, Anämie, Diabetes, Wachstumshormonmangel, Hepatitis, Nierenkrebs, Chemotherapie, einschließlich Neurotropenie, und Multipler Sklerose zu behandeln. Aus diesen Gründen stellen erweiterte cDNAs, die sekretierte Proteine oder Abschnitte davon kodieren, eine besonders wertvolle Quelle therapeutischer Mittel dar. Es besteht deshalb ein Bedarf zur Identifizierung und Charakterisierung von sekretierten Proteinen und den sie kodierenden Nukleinsäuren.
Über ihren eignen therapeutischen Nutzen hinausgehend, umfassen sekretorische Proteine an ihren Aminotermini kurze Peptide, die ihre Sekretion lenken, wobei diese Peptide als Signalpeptide bezeichnet werden. Diese Signalpeptide werden durch die Signalsequenzen kodiert, die an den 5'-Enden der kodierenden Gensequenzen, die die sekretierten Proteine kodieren, lokalisiert sind. Da diese Signalpeptide die extrazelluläre Sekretion eines beliebigen Proteins mit dem sie operativ verknüpft sind, lenken, können die Signalsequenzen ausgenutzt werden, um die effiziente Sekretion eines beliebigen Proteins durch operative Verknüpfung der Signalsequenz mit einem Gen, das das Protein kodiert, für das Sekretion erwünscht ist, zu lenken. Darüber hinausgehend können auch Teile der Signalsequenzen verwendet werden, um den intrazellulären Import eines Peptids oder eines Proteins von Interesse zu lenken. Dies kann sich in Strategien zur Gentherapie als vorteilhaft erweisen, in denen es erwünscht ist, ein bestimmtes Genprodukt an Zellen abzugeben, die sich von den Zellen unterscheiden, in denen das Genprodukt erzeugt wird. Signalpeptide kodierende Signalsequenzen finden auch in Techniken zur Vereinfachung der Proteinreinigung Anwendung. In solchen Anwendungen erleichtert die extrazelluläre Sekretion des gewünschten Proteins die Reinigung durch Verringerung der Zahl unerwünschter Proteine, aus denen das gewünschte Protein selektiert werden muss, in hohem Maße. Es besteht hier deshalb ein Bedarf, die 5'-Abschnitte der Gene für sekretorische Proteine, die Signalpeptide kodieren, zu identifizieren und zu charakterisieren.
Die öffentlichen Daten zur Anzahl menschlicher Gene, für die die Promotoren und stromaufwärts liegenden regulatorischen Regionen identifiziert und charakterisiert worden sind, sind recht beschränkt. Teilweise mag dies auf den Schwierigkeiten bei der Isolierung solcher regulatorischer Sequenzen beruhen. Stromaufwärts liegende regulatorische Sequenzen, wie beispielsweise Bindestellen für Transkriptionsfaktoren, sind typischerweise zu kurz, um als Sonden zur Isolierung von Promotoren aus humanen Genombibliotheken verwendet zu werden. In letzter Zeit wurden einige Ansätze entwickelt, um menschliche Promotoren zu isolieren. Einer von ihnen besteht in der Herstellung einer CpG-Insel Bibliothek (Cross, et al., Nature Genetics 6:236-244, 1994). Der zweite besteht in der Isolierung menschlicher genomischer DNA-Sequenzen, die Spel-Bindungsstellen enthalten, durch Verwendung eines Spel-Bindungsproteins (Mortlock et al., Genome Res., 6:327-335, 1996). Aufgrund mangelnder Spezifität oder mangelndem Umfang unterliegen beide Ansätze Beschränkungen.
Die vorliegenden 5'-ESTs können verwendet werden, um stromaufwärts liegende regulatorische Regionen, die sowohl die Lokalisierung, das Entwicklungsstadium, die Geschwindigkeit und die Menge an Proteinsynthese als auch die Stabilität von mRNA kontrollieren, effizient zu identifizieren und zu isolieren (Theil, BioFactors 4:87-93, 1993). Sobald sie einmal identifiziert und charakterisiert worden sind, können diese regulatorischen Regionen in der Gentherapie oder in Protein-Reinigungsschemen verwendet werden, um die gewünschte Menge an und die gewünschten Lokalisierungen von Proteinsynthese zu erhalten, oder um die Synthese unerwünschter Genprodukte zu hemmen, zu verringern oder zu verhindern.
Darüber hinaus können ESTs, die die 5'-Enden von sekretorischen Proteingenen enthalten, Sequenzen umfassen, die als Sonden zur Chromosomenkartierung und zur Identifizierung von Personen nützlich sind. Es besteht deshalb ein Bedarf, die Sequenzen zu identifizieren und zu charakterisieren, die stromaufwärts von den 5' kodierenden Gensequenzen, die sekretorische Proteine kodieren, liegen.
Zusammenfassung der Erfindung
Die vorliegende Erfindung betrifft gereinigte, isolierte oder rekombinante ESTs, die Sequenzen umfassen, die von den authentischen 5'-Enden ihrer korrespondierenden mRNAs abgeleitet wurden. Der Ausdruck „korrespondierende mRNA" betrifft die mRNA, die die Matrize in der cDNA-Synthese darstellte, die das 5'-EST erzeugte. Diese Sequenzen werden im Folgenden hierin als „5'-ESTs" bezeichnet. Wie hierin verwendet, erfordert der Begriff „gereinigt" keine absolute Reinheit; vielmehr ist er als relative Definition gedacht. Einzelne 5'-EST-Klone, die aus einer cDNA-Bibliothek isoliert wurden, wurden herkömmlich bis zur elektrophoretischen Homogenität aufgereinigt. Die aus diesen Klonen erhaltenen Sequenzen konnten weder aus der Bibliothek noch aus menschlicher Gesamt-DNA direkt erhalten werden. Die cDNA-Klone als solche kommen nicht natürlich vor, werden aber vielmehr durch Manipulation einer teilweise gereinigten natürlich vorkommenden Substanz (Boten-RNA) erhalten. Die Umwandlung der mRNA in eine cDNA-Bibliothek umfasst die Erzeugung einer synthetischen Substanz (cDNA) und reine einzelne cDNA-Klone können durch klonale Auswahl aus der synthetischen Bibliothek isoliert werden. Daher führt die Erzeugung einer cDNA-Bibliothek aus Boten-RNA und nachfolgender Isolierung einzelner Klone aus der Bibliothek zu einer etwa 10⁴ bis 10⁴ fachen Reinigung der nativen Botschaft. Die Reinigung von Ausgangsmaterial oder natürlichem Material um wenigstens eine Größenordnung, vorzugsweise zwei oder drei Größenordnungen und am stärksten bevorzugt um vier oder fünf Größenordnungen, ist ausdrücklich umfasst.
Wie hierin verwendet, erfordert der Ausdruck „isoliert", dass das Material aus seiner ursprünglichen Umgebung (z.B. die natürliche Umgebung, wenn es natürlich vorkommt) entfernt wird. Beispielsweise gilt ein natürlich vorkommendes Polynukleotid, das in einem lebendigen Tier vorliegt, als nicht isoliert, während das gleiche Polynukleotid, das von einem Teil oder von allem des im natürlichen System koexistierenden Materials abgetrennt ist, als isoliert gilt.
Wie hierin verwendet, bezeichnet der Ausdruck „rekombinant", dass das 5'-EST benachbart zu einer „Rückgrat" Nukleinsäure ist, zu der es in seiner natürlichen Umgebung nicht benachbart ist. Zusätzlich stellen die 5'-ESTs 5 oder mehr der Zahl der Nukleinsäureinserts in einer Population von Nukleinsäurerückgratmolekülen dar, um als „angereichert" zu gelten. Rückgratmoleküle der vorliegenden Erfindung umfassen Nukleinsäuren, wie beispielsweise Expressionsvektoren, selbstreplizierende Nukleinsäuren, Viren, integrierende Nukleinsäuren und andere Vektoren oder Nukleinsäuren, die verwendet werden, um ein Nukleinsäureinsert von Interesse zu erhalten oder zu manipulieren. Vorzugsweise stellen die angereicherten 5'-ESTs 15% oder mehr der Zahl an Nukleinsäureinserts in der Population rekombinanter Rückgratmoleküle dar. Stärker bevorzugt stellen die angereicherten 5'-ESTs 50 oder mehr der Zahl an Nukleinsäureinserts in der Population rekombinanter Rückgratmoleküle dar. In einer stark bevorzugten Ausführungsform stellen die angereicherten 5'-ESTs 90% oder mehr der Zahl an Nukleinsäureinserts in der Population rekombinanter Rückgratmoleküle dar.
„Stringente", „moderate" und „schwache" Hybridisierungsbedingungen sind wie in Beispiel 29 bestimmt.
Soweit nicht anders angegeben, ist eine „komplementäre" Sequenz vollständig komplementär.
Daher sind 5'-ESTs in cDNA-Bibliotheken, in welchen ein oder mehrere 5'- ESTs 5% oder mehr der Zahl an Nukleinsäureinserts in den Rückgratmolekülen ausmachen, „angereicherte rekombinante 5'-ESTs", wie hierin bestimmt. Ebenso sind 5'-ESTs in einer Population von Plasmiden, in denen eines oder mehrere erfindungsgemäße 5'-ESTs insertiert worden sind, so dass sie 5% oder mehr der Zahl an Inserts im Plasmidrückgrat darstellen, „angereicherte rekombinante 5'-ESTs", wie hierin bestimmt. Jedoch sind 5'-ESTs in cDNA-Bibliotheken, in welchen 5'-ESTs weniger als 5% der Zahl an Nukleinsäureinserts in der Population an Rückgratmolekülen ausmachen, wie beispielsweise Bibliotheken, in welchen Rückgratmoleküle mit 5'-EST selten sind, keine „angereicherten rekombinanten 5'-ESTs".
Die vorliegende Erfindung betrifft insbesondere 5'-ESTs, die aus Genen abgeleitet wurden, die sekretierte Proteine kodieren. Wie hierin verwendet, ist ein „sekretiertes" Protein ein Protein, das, wenn es in einer geeigneten Wirtszelle exprimiert wird, über oder durch eine Membran transportiert wird, wobei der Transport als Ergebnis von Signalpeptiden in der Aminosäuresequenz des Proteins umfasst ist. „Sekretierte" Proteine umfassen ohne Beschränkung Proteine, die vollständig (z.B. lösliche Proteine) oder teilweise (z.B. Rezeptoren) aus der Zelle, in der sie exprimiert werden, sekretiert werden. „Sekretierte" Proteine umfassen auch ohne Einschränkung Proteine, die über die Membran des endoplasmatischen Retikulums hinweg transportiert werden.
Derartige 5'-ESTs umfassen Nukleinsäuresequenzen, die Signalsequenzen genannt werden, die Signalpeptide kodieren, die die extrazelluläre Sekretion von Proteinen lenken, die durch Gene kodiert werden, die von den 5'-ESTs abgeleitet sind. Im Allgemeinen sind die Signalpeptide an den Aminotermini sekretierter Proteine lokalisiert.
Sekretierte Proteine werden durch Ribosomen, die mit dem „rauhen" endoplasmatischen Retikulum verbunden sind, translatiert. Im Allgemeinen werden sekretierte Proteine kotranslational zur Membran des endoplasmatischen Retikulums überführt. Die Verbindung des Ribosoms mit dem endoplasmatischen Retikulum während der Translation sekretierter Proteine wird durch das Signalpeptid vermittelt. Das Signalpeptid wird typischerweise nach seinem kotranslationalen Eintritt in das endoplasmatische Retikulum abgespalten. Nach der Abgabe an das endoplasmatische Retikulum können sekretierte Proteine den Golgi-Apparat durchlaufen. Im Golgi-Apparat können die Proteine posttranslationalen Modifizierungen unterzogen werden, bevor sie in sekretorische Vesikel eintreten, die sie über die Zellmembran hinweg transportieren.
Die hierin beschriebenen 5'-ESTs weisen einige wichtige Anwendungen auf. Zum Beispiel können sie verwendet werden, um cDNA-Klone zu erhalten und zu exprimieren, die die vollständigen proteinkodierenden Sequenzen der korrespondierenden Genprodukte umfassen, einschließlich der authentischen Translationsstartstellen, die aus den 5'-Enden der kodierenden mRNA-Sequenzen abgeleitet sind, aus denen die 5'-ESTs abgeleitet sind. Diese cDNAs werden im Folgenden als „Volllängen-cDNAs" bezeichnet. Diese cDNAs können auch DNA umfassen, die aus mRNA-Sequenzen, die stromaufwärts zur Translationsstartstelle liegen, abgeleitet sind. Die Volllängen-cDNA-Sequenzen können verwendet werden, um die Proteine zu exprimieren, die mit den 5'-ESTs korrespondieren. Wie oben diskutiert, sind sekretierte Proteine therapeutisch wichtig. Daher können die Proteine, die aus den cDNAs exprimiert werden, bei der Behandlung oder bei der Kontrolle einer Vielfalt von humanen Zuständen nützlich sein. Die 5'-ESTs können auch verwendet werden, um die korrespondierende genomische DNA zu erhalten. Der Ausdruck „korrespondierende genomische DNA" betrifft die genomische DNA, die die mRNA kodiert, aus der das 5'-EST abgeleitet wurde.
Alternativ können die 5'-ESTs verwendet werden, um erweiterte cDNAs, die Abschnitte des sekretierten Proteins kodieren, zu erhalten und zu exprimieren. Die Abschnitte können die Signalpeptide der sekretierten Proteine oder die reifen Proteine, die erzeugt werden, wenn das Signalpeptid abgespalten wird, umfassen. Die Abschnitte können auch Polypeptide mit wenigstens 10 aufeinander folgenden Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs kodiert werden, umfassen. Alternativ können die Abschnitte wenigstens 15 aufeinander folgende Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs kodiert werden, umfassen. In einigen Ausführungsformen können die Abschnitte wenigstens 25 aufeinander folgende Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs kodiert werden, umfassen. In anderen Ausführungsformen können die Abschnitte wenigstens 40 Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs kodiert werden, umfassen.
Antikörper, die die vollständigen sekretierten Proteine, die durch die erweiterten cDNAs oder Volllängen-cDNAs oder Fragmente davon mit wenigstens 10 aufeinander folgenden Aminosäuren, mit wenigstens 15 aufeinander folgenden Aminosäuren, mit wenigstens 25 aufeinander folgenden Aminosäuren oder mit wenigstens 40 aufeinander folgenden Aminosäuren, kodiert werden, spezifisch erkennen, können ebenfalls erhalten werden, wie es weiter unten beschrieben wird. Antikörper, die spezifisch das reife Protein erkennen, das erzeugt wird, wenn das Signalpeptid abgespalten wird, können ebenfalls erhalten werden, wie es weiter unten beschrieben wird. In ähnlicher Weise können auch Antikörper, die spezifisch die Signalpeptide erkennen, die durch die erweiterten cDNAs oder Volllängen-cDNAs kodiert werden, erhalten werden.
In einigen Ausführungsformen umfassen die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, die Signalsequenz. In anderen Ausführungsformen können die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, die vollständige kodierende Sequenz für das reife Protein umfassen (d.h. das Protein, das erzeugt wird, wenn das Signalpolypeptid abgespalten wird). Darüber hinaus können die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, regulatorische Regionen umfassen, die stromaufwärts der Translationsstartstelle oder stromabwärts des Stoppkodons liegen und die die Menge, Lokalisierung oder das Entwicklungsstadium der Genexpression lenken.
Wie oben diskutiert, sind sekretierte Proteine therapeutisch wichtig. Daher können die Proteine, die von den erweiterten cDNAs oder Volllängen-cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, exprimiert werden, bei der Behandlung oder Kontrolle einer Vielfalt von humanen Zuständen nützlich sein.
Die 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhalten wurden) können in forensischen Verfahren eingesetzt werden, um Personen zu identifizieren, oder in diagnostischen Verfahren, um Personen mit genetischen Erkrankungen zu identifizieren, die aus einer abnormalen Expression der Gene herrühren, die mit den 5'-ESTs korrespondieren. Darüber hinaus ist die vorliegende Erfindung bei der Erstellung einer hochaufgelösten Karte der menschlichen Chromosomen nützlich.
Die vorliegende Erfindung betrifft auch Vektoren zur Sekretion, die in der Lage sind, die Sekretion eines Proteins von Interesse zu lenken. Solche Vektoren können in Strategien zur Gentherapie verwendet werden, in welchen es wünschenswert ist, ein Genprodukt in einer Zelle zu erzeugen, das an eine andere Stelle im Körper abgegeben werden soll. Vektoren zur Sekretion können auch die Reinigung von gewünschten Proteinen erleichtern.
Die vorliegende Erfindung betrifft auch Vektoren zur Expression, die in der Lage sind, die Expression eines insertierten Gens in einer gewünschten räumlichen oder temporären Weise oder in einem gewünschten Maß zu lenken. Solche Vektoren können Sequenzen umfassen, die stromaufwärts von den 5'-ESTs liegen, wie beispielsweise Promotoren oder stromaufwärts liegende regulatorische Sequenzen.
Schließlich kann die vorliegende Erfindung auch zur Gentherapie verwendet werden, um genetische Erkrankungen zu kontrollieren oder zu behandeln. Signalpeptide können mit heterologen Proteinen fusioniert werden, um deren extrazelluläre Sekretion zu lenken.
Bakterienklone, die Bluescript-Plasmide mit Inserts enthalten, die das 5'-EST gemäß SEQ ID No: 38 aufweisen, werden gegenwärtig bei 80°C in 4% (v/v) Glycerin in den Laboratorien des Erfinders unter den Bezeichnungen gelagert, die neben der SEQ ID No aufgeführt sind. Die Inserts können aus den hinterlegten Materialien durch Anzucht der entsprechenden Klone in einem geeigneten Medium gewonnen werden. Anschließend kann die Bluescript-DNA unter Verwendung von dem Fachmann bekannten Verfahren zur Plasmidisolierung, wie beispielsweise alkalische Lyse von Minipreps oder alkalische Lyse im Großmaßstab als Verfahren zur Plasmidisolierung, isoliert werden. Wenn gewünscht, kann die Plasmid-DNA mittels Zentrifugation auf einem Cäsiumchloridgradienten, Größenausschlusschromatografie oder Anionenaustauschchromatografie weiter angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden. Alternativ kann eine PCR mit Primern, die hinsichtlich beider Enden der EST-Insertion konzipiert sind, durchgeführt werden. Das mit dem 5'-EST korrespondierende PCR-Produkt kann anschließend unter Verwendung von dem Fachmann vertrauten Standardklonierungstechniken manipuliert werden.
Ein Aspekt der vorliegenden Erfindung ist ein Signalpeptid mit der Sequenz der Aminosäuren –17 bis –1 gemäß SEQ ID No: 39.
Ein weiterer Aspekt der vorliegenden Erfindung ist eine Signalsequenz, die ein erfindungsgemäßes Signalpeptid kodiert. Vorzugsweise weist die Signalsequenz die Sequenz der Nukleotide 232 bis 282 gemäß SEQ ID No: 38 auf.
Ein noch weiterer Aspekt der vorliegenden Erfindung ist eine gereinigte und isolierte Nukleinsäure, die eine erfindungsgemäße Signalsequenz umfasst, die operativ mit einer Nukleinsäuresequenz verknüpft ist, die ein Protein kodiert, für das Sekretion erwünscht ist.
Ein weiterer Aspekt der vorliegenden Erfindung ist ein Vektor, der eine erfindungsgemäße Signalsequenz umfasst, die operativ mit einem Promotor verknüpft ist. Ferner umfasst der Vektor vorzugsweise Klonierungsstellen. Vorzugsweise umfasst der Vektor ferner eine Nukleinsäuresequenz, die ein Protein kodiert, für das Sekretion erwünscht ist und welche im Leserahmen mit der Signalsequenz insertiert ist. Vorzugsweise ist der Vektor ein Vektor zur Sekretion oder ein Vektor zur Gentherapie.
Ein weiterer Aspekt der vorliegenden Erfindung ist ein Fusionsprotein, das durch eine erfindungsgemäße Nukleinsäure oder einen erfindungsgemäßen Vektor kodiert wird, umfassend das erfindungsgemäße Signalpeptid.
Ein weiterer Aspekt der vorliegenden Erfindung ist die Verwendung des erfindungsgemäßen Signalpeptids oder des erfindungsgemäßen Vektors zum Lenken der extrazellulären Sekretion eines Polypeptids oder zur Vereinfachung der Proteinreinigung eines gewünschten Polypeptids. Vorzugsweise ist das Polypeptid ein erfindungsgemäßes Fusionsprotein.
Ein weiterer Aspekt der vorliegenden Erfindung ist ein Verfahren zur Herstellung eines sekretierten Proteins, umfassend den Schritt des Insertierens eines Gens, das ein nicht sekretiertes Protein kodiert, im Leserahmen mit einer erfindungsgemäßen Signalsequenz in einen Vektor, so dass das Protein, das durch das insertierte Gen kodiert wird, von der transkribierten mRNA exprimiert wird. Vorzugsweise umfasst das Verfahren ferner den Schritt: Einführen des Vektors in eine Wirtszelle, in Gewebe oder einen nicht menschlichen Organismus.
Ein weiterer Aspekt der vorliegenden Erfindung ist ein Verfahren zur Herstellung eines sekretierten Proteins, umfassend den Schritt: Einführen eines erfindungsgemäßen Vektors in eine Wirtszelle, in Gewebe oder in einen nicht menschlichen Organismus. Vorzugsweise umfassen die erfindungsgemäßen Verfahren ferner den Schritt: Isolierung des sekretierten Proteins. Vorzugsweise umfasst der Schritt zur Isolierung des sekretierten Proteins die Reinigung des sekretierten Proteins aus dem Überstand.
Kurze Beschreibung der Zeichnungen
1 stellt eine Zusammenfassung eines Verfahrens zum Erlangen von cDNAs dar, die daraufhin ausgewählt wurden, dass sie die 5'-Enden der mRNAs enthalten, von denen sie abgeleitet wurden.
2 zeigt die Verteilung von Von Heijne Scores für 5'-ESTs in jeder der hierin beschriebenen Kategorien und die Wahrscheinlichkeit, dass diese 5'-ESTs ein Signalpeptid kodieren.
3 fasst ein allgemeines Verfahren zusammen, das verwendet wird, um erweiterte cDNAs, die Sequenzen enthalten, die zu 5'-ESTs benachbart sind, zu klonieren und zu sequenzieren.
4 (Beschreibung von Promotorstrukturen, isoliert aus Signal-Tag 5'-ESTs) stellt eine schematische Beschreibung von isolierten Promotoren bereit und die Art und Weise, wie sie mit den korrespondierten 5'-Tags zusammengesetzt sind.
Ausführliche Beschreibung der bevorzugten Ausführungsform
Tabelle IV zeigt eine Analyse der 43 Aminosäuren, die am N-Terminus aller menschlicher SwissProt Proteine lokalisiert sind, um die Häufigkeit Falsch-positiver oder Falsch-negativer unter Verwendung von hierin beschriebenen Techniken zur Signalpeptididentifizierung zu bestimmen.
Tabelle V zeigt die Verteilung von 5'-ESTs in jeder hierin beschriebenen Kategorie und die Zahl von 5'-ESTs in jeder Kategorie mit einem gegebenen Mindest-Von Heijnes Score.
Tabelle VI zeigt die Verteilung von 5'-ESTs in jeder hierin beschriebenen Kategorie hinsichtlich des Gewebes, aus dem die 5'-ESTs der korrespondierenden mRNA erhalten wurden.
Tabelle VII beschreibt die Transkriptionsfaktor-Bindungsstellen, die in jedem dieser Promotoren vorliegen.
I. Allgemeine Verfahren zum Erlangen von 5'-ESTs, die aus mRNAs mit intakten 5'-Enden abgeleitet sind
Um die hierin beschriebenen 5'-ESTs zu erhalten, müssen mRNAs mit intakten 5'-Enden erhalten werden. Gegenwärtig gibt es zwei Ansätze zum Erhalt solcher mRNAs mit intakten 5'-Enden, wie sie weiter unten beschrieben werden: Entweder chemisch (1) oder enzymatisch (2).
1. Chemische Verfahren zum Erlangen von mRNAs mit intakten 5'-Enden
Einer dieser Ansätze ist ein chemisches Modifikationsverfahren, das die Derivatisierung der mRNA 5'-Enden und die Selektion der derivatisierten mRNAs umfasst. Die 5'-Enden eukaryotischer mRNAs weisen eine Struktur auf, die als „Cap" bezeichnet wird, das an Position 7 ein methyliertes Guanosin besitzt. Dieses Cap wird an die erste transkribierte Base der mRNA durch eine 5',5'-Triphosphatbindung angefügt. In einigen Beispielen ist das 5'-Guanosin sowohl an Position 2 als auch Position 7 methyliert. In seltenen Fällen ist das 5'-Guanosin an den Positionen 2, 7 und 7 trimethyliert. Beim chemischen Verfahren zum Erlangen von mRNAs mit intakten 5'-Enden wird das 5'-Cap spezifisch derivatisiert und an eine reaktive Gruppe auf einem immobilisierten Träger gekoppelt. Diese spezifische Derivatisierung basiert auf der Tatsache, dass nur die Ribose, die mit dem methylierten Guanosin am 5'-Ende der mRNA verknüpft ist, und die Ribose, die mit der Base am 3'-Terminus der mRNA verknüpft ist, 2',3'-cis-Diole besitzen.
Gegebenenfalls kann das 2',3'-cis-Diol der 3'-terminalen Ribose chemisch modifiziert, substituiert, umgewandelt oder entfernt werden, wobei nur die Ribose, die mit dem methylierten Guanosin am 5'-Ende der mRNA mit einem 2',3'-cis-Diol verknüpft ist, zurückbleit. Eine Vielfalt an Techniken zur Entfernung des 2',3'-cis-Diols an der 3'-terminalen Ribose stehen zur Verfügung. Beispielsweise kann kontrollierte alkalische Hydrolyse verwendet werden, um mRNA-Fragmente zu erzeugen, in welchen die 3'-terminale Ribose ein 3'-Phosphat, ein 2'-Phosphat oder ein (2'-3')-Cyclophosphat ist. Anschließend kann das Fragment, das die ursprüngliche 3'-Ribose umfasst, durch Chromatografie an einer Oligo-dT-Säule aus dem Gemisch entfernt werden. Alternativ kann eine Base, die kein 2',3'-cis-Diol aufweist, unter Verwendung einer RNA-Ligase, wie beispielsweise T4-RNA-Ligase, an das 3'-Ende der mRNA angefügt werden. Beispiel 1 beschreibt weiter unten ein Verfahren zur Ligation eines Nukleosiddiphosphats an das 3'-Ende von Boten-RNA.
BEISPIEL 1
Ligation des Nukleosiddiphosphats pCp an das mRNA 3'-Ende
Ein μg RNA wurde in einem Reaktionsmedium von insgesamt 10 μl in Gegenwart von 5 U T₄ Phagen-RNA-Ligase in dem vom Hersteller bereitgestellten Puffer (Gibco-BRL), 40 U des RNase-Inhibitors RNasin (Promega) und 2 μl ³²pCp (Amersham #PB 10208) inkubiert. Die Inkubation wurde bei 37°C für 2 Stunden oder über Nacht bei 7-8°C durchgeführt.
Im Anschluss an die Modifizierung oder Entfernung des 2',3'-cis-Diols an der 3'-Ribose kann das 2',3'-cis-Diol, das am 5'-Ende der mRNA vorliegt, unter Verwendung von Reagenzien, wie beispielsweise NaBH₄, NaBH₃CN oder Natriumperjodat, oxidiert werden, wobei das 2',3'-cis-Diol in einen Dialdehyd umgewandelt wird. Beispiel 2 beschreibt die Oxidation des 2',3'-cis-Diols am 5'-Ende der mRNA mit Natriumperjodat.
BEISPIEL 2
Oxidation eines 2',3'-cis-Diols am mRNA 5'-Ende mit Natriumperjodat
0,1 OD-Einheiten des entweder mit einem Cap versehenen Oligoribonukleotids mit 47 Nukleotiden (einschließlich des Caps) oder eines Oligoribonukleotids mit 46 Nukleotiden ohne Cap wurden wie im Folgenden beschrieben behandelt. Die Oligoribonukleotide wurden durch in vitro-Tanskription unter Verwendung des Transkriptionskits „AmpliScribe T7" (Epicentre Technologies) hergestellt. Wie unten gezeigt, enthielt die DNA-Matrize für das RNA-Transkript ein einzelnes Cytosin. Um die RNA ohne Cap zu synthetisieren, nahmen alle vier NTPs an der in vitro-Transkriptionsreaktion teil. Um die RNA mit Cap zu erhalten, wurde GTP durch ein Analogon des Caps, m7G(5')ppp(5')G, ersetzt. Diese von der Polymerase erkannte Verbindung wurde am 5'-Ende des entstehenden Transkripts während der Initiation der Transkription eingebaut, wurde aber während des Verlängerungsschritts nicht eingebaut. Folglich enthielt die sich ergebende RNA an ihrem 5'-Ende ein Cap. Die Sequenzen der durch die in vitro-Transkription erzeugten Oligoribonukleotide waren:
+Cap:
5'm7GpppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCA C-3' (SEQ ID NO: 1)
–Cap:
5'-pppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NO: 2)
Die Oligoribonukleotide wurden in 9μl Acetatpuffer (0,1 M Natriumacetat, pH 5,2) und 3μl frisch hergestelltem 0,1 M Natriumperjodatlösung gelöst. Das Gemisch wurde für 1 Stunde im Dunkeln bei 4°C oder bei Raumtemperatur inkubiert. Danach wurde die Reaktion durch Zugabe von 4 μl 10%igem Ethylenglycol gestoppt. Das Produkt wurde mit Ethanol präzipitiert, in wenigstens 10 μl Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser dialysiert.
Die sich ergebenden Aldehydgruppen können anschließend mit Molekülen, die eine reaktive Amingruppe aufweisen, wie beispielsweise Hydrazin-, Carbazid-, Thiocarbazid- oder Semicarbazidgruppen, gekoppelt werden, um die Anreicherung der 5'-Enden von mRNAs zu erleichtern. Moleküle mit reaktiven Amingruppen, die zur Verwendung bei der Selektion von mRNAs mit intakten 5'-Enden geeignet sind, umfassen Avidin, Proteine, Antikörper, Vitamine, Liganden, die zur spezifischen Bindung an Rezeptormoleküle fähig sind, oder Oligonukleotide. Beispiel 3 weiter unten beschreibt die Kopplung des sich ergebenden Dialdehyds an Biotin.
BEISPIEL 3
Kopplung des Dialdehyds am 5'-Ende der Transkripte mit Biotin
Das in Beispiel 2 erhaltene Oxidationsprodukt wurde in 50 μl Natriumacetat bei einem pH zwischen 5 und 5,2 und 50 μl frisch hergestellter 0,02 M Lösung von Biotinhydrazid in einem Methoxyethanol/Wassergemisch (1:1) der Formel
gelöst.
In der in diesen Experimenten verwendeten Verbindung ist n = 5. Jedoch wird erkannt, dass auch andere, kommerziell erhältliche Hydrazide verwendet werden können, wie beispielsweise Moleküle der obigen Formel, in denen n zwischen 0 und 5 variiert. Das Gemisch wurde anschließend für 2 Stunden bei 37°C inkubiert, mit Ethanol präzipitiert und gegen destilliertes Wasser dialysiert. Beispiel 4 zeigt die Spezifität der Biotinylierungsreaktion.
BEISPIEL 4
Spezifität der Biotinylierung von Transkripten mit Caps
Die Spezifität der Biotinylierung für mRNAs mit Caps wurde durch Gelelektrophorese der im Folgenden beschriebenen Proben beurteilt:

Probe 1. Das in vitro-Transkript mit 46 Nukleotiden und ohne Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, und mit ³²pCp markiert ist, wie es in Bespiel 1 beschrieben wird.
Probe 2. Das in vitro-Transkript mit 46 Nukleotiden und ohne Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, mit ³²pCp markiert ist, wie es in Beispiel 1 beschrieben wird, und in einer Oxidationsreaktion gemäß Beispiel 2 umgesetzt und den Biotinylierungsbedingungen gemäß Beispiel 3 unterzogen wurde.
Probe 3. Das in vitro-Transkript mit 47 Nukleotiden und Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, und mit ³²pCp markiert ist, wie es in Beispiel 1 beschrieben wird.
Probe 4. Das in vitro-Transkript mit 47 Nukleotiden und Cap, wie in Beispiel 2 beschrieben, mit ³²pCp markiert, wie in Beispiel 1 beschrieben, behandelt mit der Oxidationsreaktion aus Beispiel 2 und den Biotinylierungsbedingungen aus Beispiel 3 unterzogen.

Die Proben 1 und 2 zeigten identische Wandergeschwindigkeiten, was zeigt, dass RNAs ohne Cap nicht oxidiert und biotinyliert wurden. Probe 3 wanderte langsamer als die Proben 1 und 2, während Probe 4 die langsamste Wanderung zeigte. Der Unterschied bezüglich der RNA-Wanderung in den Proben 3 und 4 zeigt, dass die RNAs mit Cap spezifisch biotinyliert wurden.
In einigen Fällen können mRNAs mit intakten 5'-Enden durch Binden des Moleküls, das eine reaktive Aminogruppe enthält, an einen geeigneten Festphasenträger, wie beispielsweise die Innenseite des Gefäßes, das die mRNAs enthält, magnetische Beads, chromatografische Matrizen oder Nylon- oder Nitrozellulosemembranen angereichert werden. Beispielsweise kann, wenn das Molekül mit reaktiver Amingruppe Biotin ist, der Festphasenträger an Avidin oder Streptavidin gekoppelt werden. Alternativ kann, wenn das Molekül mit der reaktiven Amingruppe ein Antikörper oder ein Rezeptorligand ist, der Festphasenträger an das verwandte Antigen oder den verwandten Rezeptor gekoppelt werden. Schließlich kann der Festphasenträger ein komplementäres Oligonukleotid umfassen, wenn das Molekül mit reaktiver Amingruppe ein Oligonukleotid umfasst.
Die mRNAs mit intakten 5'-Enden können im Anschluss an das Anreicherungsverfahren von der Festphase freigesetzt werden. Beispielsweise können die mRNAs von der Festphase durch einfaches Erhitzen auf 95°C in 2% SDS freigesetzt werden, wenn der Dialdehyd an Biotinhydrazid gekoppelt ist und die Festphase Streptavidin umfasst. In einigen Verfahren kann das Molekül mit reaktiver Amingruppe im Anschluss an die Anreicherung auch von dem mRNAs mit intakten 5'-Enden abgespalten werden. Beispiel 5 beschreibt das Einfangen biotinylierter mRNA mit streptavidinbeschichteten Beads und die Freisetzung der biotinylierten mRNAs von den Beads nach der Anreicherung.
BEISPIEL 5
Einfangen und Freisetzung biotinylierter mRNAs unter Verwendung stregtavidinbeschichteter Beads
Die streptavidinbeschichteten magnetischen Beads wurden gemäß den Herstellerangaben (CPG Inc., USA) hergestellt. Die biotinylierten mRNAs wurden einem Hybridisierungspuffer zugegeben (1,5 M NaCl, pH 5-6). Nach Inkubation für 30 Minuten wurde das ungebundene und nicht biotinylierte Material entfernt. Die Beads wurden einige Male in Wasser mit 1% SDS gewaschen. Die so erhaltenen Beads wurden bei 95°C für 15 Minuten in Wasser, das 2% SDS enthielt, inkubiert. Beispiel 6 zeigt die Effizienz mit der biotinylierte mRNAs von den streptavidinbeschichteten Beads gewonnen wurden.
BEISPIEL 6
Effizienz der Gewinnung biotinylierter mRNAs
Die Effizienz des Gewinnungsverfahrens wurde wie folgt beurteilt. Wie oben beschrieben, wurden RNAs mit Cap mit ³²pCp markiert, oxidiert, biotinyliert und an streptavidinbeschichtete Beats gebunden. Anschließend wurden die gebundenen RNAs für 5, 15 oder 30 Minuten bei 95°C in Gegenwart von 2% SDS inkubiert.
Die Reaktionsprodukte wurden durch Elektrophorese auf 12%igen Polyaclamidgelen unter denaturierenden Bedingungen (7 M Harnstoff) analysiert. Die Gele wurden Autoradiografie unterzogen. Während dieser Manipulation wurden die Hydrazonbindungen nicht reduziert.
Sobald die Inkubationszeiten in 2% SDS anstiegen, wurden steigende Mengen an Nukleinsäuren gewonnen, was zeigt, dass biotinylierte mRNAs effizient gewonnen wurden.
In einem alternativen Verfahren zum Erlangen von mRNAs mit intakten 5'-Enden wurde ein Oligonukleotid, das derivatisiert worden war, um eine reaktive Amingruppen zu erhalten, spezifisch an mRNAs mit einem intakten Cap gekoppelt. Vorzugsweise wird das 3'-Ende der mRNA vor dem Schritt, bei welchem die Aldehydgruppen mit dem derivatisierten Oligonukleotid verbunden werden, wie oben beschrieben blockiert, um so zu verhindern, dass das derivatisierte Oligonukleotid mit dem mRNA 3'-Ende verbunden wird. Beispielsweise kann pCp unter Verwendung von T4 RNA-Ligasen am mRNA 3'-Ende, wie in Beispiel 1 beschrieben wird, angebracht werden. Wie oben diskutiert, ist die Blockierung des mRNA 3'-Endes jedoch ein optionaler Schritt. Derivatisierte Oligonukleotide können, wie in Beispiel 7 beschrieben, hergestellt werden.
BEISPIEL 7
Derivatisierung von Oligonukleotiden
Ein am 3'-Ende phosphoryliertes Oligonukleotid wurde durch Behandlung mit einer wässrigen Hydrazinlösung oder einer Dihydrazidlösung der Formel H₂N(R1)NH₂ bei etwa 1 bis 3 M und bei pH 4,5 bei einer Temperatur von 8°C über Nacht in ein 3'-Hydrazid in 3' umgewandelt. Die Inkubation wurde in Gegenwart eines wasserlöslichen Mittels vom Carbodiimidtyp bei einer Endkonzentration von 0,3 M durchgeführt, wie beispielsweise 1-Ethyl-3-(3-dimethylaminopropyl) carbodiimid.
Das derivatisierte Oligonukleotid wurde anschließend von den anderen Mitteln und Produkten unter Verwendung von Standardtechniken zur Isolierung von Oligonukleotiden abgetrennt.
Wie oben diskutiert, können die mRNAs zur Anreicherung behandelt werden, um die 3'-OH-Gruppen zu entfernen, die daran vorliegen können. Dies kann durch enzymatische Ligation von Sequenzen, denen ein 3'-OH fehlt erreicht werden, wie beispielsweise pCp wie es in Beispiel 1 beschrieben wird. Alternativ können die 3'-OH-Gruppen durch alkalische Hydrolyse entfernt werden, wie es in Beispiel 8 weiter unten beschrieben wird.
BEISPIEL 8
Entfernung von mRNA 3'-OH-Gruppen unter Verwendung alkalischer Hydrolyse
In einem Gesamtvolumen von 100 μl 0,1 N Natriumhydroxid wurden 1,5 μg mRNA für 40 bis 60 Minuten bei 4°C inkubiert. Die Lösung wird mit Essigsäure neutralisiert und mit Ethanol präzipitiert.
Im Anschluss an die optionale Entfernung der 3'-OH-Gruppen werden die Diolgruppen an die mRNA 5'-Enden der mRNAs oxidiert, wie es in Beispiel 9 weiter unten beschrieben wird.
BEISPIEL 9
Oxidation von mRNA Diolen
Bis zu 1 OD-Einheit RNA wurde in 9 μl Puffer (0,1 M Natriumacetat, pH 6-7) oder in Wasser und 3μl frisch hergestellter 0,1 M Natriumperjodatlösung gelöst. Die Reaktion wurde für 1 h in der Dunkelheit bei 4°C oder bei Raumtemperatur inkubiert. Im Anschluss an die Inkubation wurde die Reaktion durch Zugabe von 4 μl 10% Ethylenglycol gestoppt. Danach wurde das Gemisch für 15 Minuten bei Raumtemperatur inkubiert. Nach Ethanolpräzipitation wurde das Produkt in wenigstens 10 μl Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser dialysiert.
Im Anschluss an die Oxidation der Diolgruppen an den mRNA 5'-Enden wurde das derivatisierte Oligonukleotid mit den sich ergebenden Aldehyden verbunden wie es in Beispiel 10 beschrieben wird.
BEISPIEL 10
Ligation von mRNA Aldehyden an derivatisierte Oligonukleotide
Die oxidierte mRNA wurde in saurem Medium, wie beispielsweise 50 μl Natriumacetat, pH 4-6, gelöst. 50 μl einer Lösung des derivatisierten Oligonukleotids wurde zugegeben, um ein mRNA:derivatisiertes Oligonukleotidverhältnis von 1:20 zu erhalten. Das Gemisch wurde mit einem Borhydrid reduziert und für 2 h bei 37°C oder über Nacht (14 h) bei 10°C inkubiert. Das Gemisch wurde anschließend mit Ethanol präzipitiert, in 10 μl oder mehr Wasser oder einem geeigneten Puffer resuspendiert und gegen destilliertes Wasser dialysiert. Wenn gewünscht, kann das sich ergebende Produkt unter Verwendung von Acrylamidgelelektrophorese, HPLC-Analyse oder anderen herkömmlichen Techniken analysiert werden.
Im Anschluss an das Anbringen des derivatisierten Oligonukleotids an die mRNAs kann eine reverse Transkriptionsreaktion, wie in Beispiel 11 weiter unten beschrieben, durchgeführt werden.
BEISPIEL 11
Reverse Transkription von mRNAs, die an derivatisierte Oligonukleotide ligiert sind
Ein Oligodeoxyribonukleotid wurde wie im Folgenden beschrieben derivatisiert. Drei OD-Einheiten eines Oligodeoxyribonukleotids der Sequenz 5'ATCAAGAATTCGCACGAGACCA TTA3' (SEQ ID NO: 3) mit 5'-OH- und 3'-P-Enden wurde in 70 μl 1,5 M Hydroxybenzotriazollösung, pH 5,3, hergestellt in Dimethylformamid/Wasser (75:25), das 2 μg 1-Ethyl-3-(3-dimethylaminopropyl) carbodiimid enthielt, gelöst. Das Gemisch wurde für 2 h 30 min bei 22°C inkubiert und anschließend zweimal in LiClO₄/Aceton präzipitiert. Das Pellet wurde in 200 μl 0,25 M Hydrazin resuspendiert und bei 8°C 3 bis 14 h inkubiert. Im Anschluss an die Hydrazinreaktion wurde das Gemisch zweimal in LiClO₄/Aceton präzipitiert.
Die revers zu transkribierenden Boten-mRNAs wurden aus Plazentablöcken mit Seitenlängen von 2 cm extrahiert, die bei –80°C gelagert worden waren. Die Gesamt-RNA wurde unter Verwendung herkömmlicher Techniken auf Grundlage von sauerem Phenol extrahiert. Oligo-dT-Chromatografie wurde eingesetzt um die mRNAs zu reinigen. Die Integrität der mRNAs wurde durch Northern-Blot überprüft.
Die Diolgruppen von 7 μg der Plazenta mRNAs wurden, wie oben in Beispiel 9 beschrieben, oxidiert. Das derivatisierte Oligonukleotid wurde, wie in Beispiel 10 oben beschrieben, mit den mRNAs verbunden mit der Ausnahme, dass der Präzipitierungsschritt durch einen Ausschlusschromatografieschritt ersetzt wurde, um die derivatisierten Oligodeoxyribonukleotide, die nicht mit mRNAs verbunden worden waren, zu entfernen. Die Ausschlusschromatografie wurde wie folgt durchgeführt:
Zehn ml Ultrogel AcA34 (BioSepra#230151) Gel, ein Gemisch aus Agarose und Acrylamid, wurde in 50 ml einer Lösung aus 10 mM Tris, pH 8,0, 300 mM NaCl, 1 mM EDTA und 0,05% SDS equilibriert. Man ließ sich das Gemisch absetzen. Der Überstand wurde entfernt und das Gel wurde in 50 ml Puffer resuspendiert. Dieses Verfahren wurde 2 oder 3 Mal wiederholt.
Ein Glaskügelchen (Durchmesser 3 mm) wurde in eine 2 ml Einwegpipette (Länge 25 cm) eingeführt. Die Pipette wurde mit der Gelsuspension befüllt, bis sich die Höhe des Gels bei 1 cm vom oberen Ende der Pipette aus stabilisierte. Die Säule wurde anschließend mit 20 ml des Equilibrierungspuffers (10 mM Tris HCl pH 7,4, 20 mM NaCl) equilibriert.
Zehn μl der mRNA, die mit dem derivatisierten Oligonukleotid umgesetzt worden waren, wurden in 39 μl 10 mM Harnstoff und 2 μl Glycerin-blau Puffer gemischt, wobei der Glycerin-blau Puffer durch Auflösen von 5 mg Bromphenolblau in 60% Glycerin (v/v) und Leiten des Gemischs über einen Filter mit 0,45 μm Durchmesser hergestellt worden waren.
Anschließend wurde die Säule mit Oligonukleotid gekoppelten mRNAs beladen. Sobald diese eingedrungen waren, wurde Equilibrierungspuffer zugegeben. Anschließend wurden hundert μl Fraktionen gesammelt. Derivatisierte Oligonukleotide, die nicht an mRNA angebracht worden waren, traten in Fraktion 16 und späteren Fraktionen auf. Die Fraktionen 3 bis 15 wurden deshalb vereinigt und mit Ethanol präzipitiert.
Um zu bestimmen, ob das derivatisierte Oligonukleotid tatsächlich mit mRNA verknüpft war, wurde ein Zehntel der vereinigten Fraktionen zweifach auf einer Nylonmembran aufgetragen und unter Verwendung herkömmlicher Techniken mit einer radioaktiven Sonde hybridisiert. Die bei diesen Hybridisierungen eingesetzte ³²P markierte Sonde war ein Oligodeoxyribonukleotid der Sequenz 5'TAATGGTCTCGT GCGAATTCTTGAT3' (SEQ ID NO: 4), das sich zum derivatisierten Oligonukleotid antikomplementär verhielt. Ein nach Audioradiografie beobachtetes Signal zeigte, dass das derivatisierte Oligonukleotid tatsächlich mit der mRNA verbunden worden war.
Die verbleibenden neun Zehntel der mRNAs, die mit dem derivatisierten Oligonukleotid reagiert hatten, wurden wie im Folgenden beschrieben, revers transkribiert. Eine reverse Transkription wurden mit Reverser Transkriptase nach den Anweisungen des Herstellers und 50 pmol Nonameren mit willkürlichen Sequenzen als Primern durchgeführt.
Um sicher zu stellen, dass die reverse Transkription über die Capstruktur hinweg ausgeführt wurde, wurden zwei Arten von Experimenten durchgeführt.
Im ersten Ansatz wurde nach der durch alkalische Hydrolyse erreichten Entfernung der RNA aus den cDNA:RNA-Heteroduplexen, die aus der reversen Transkriptionsreaktion erhalten worden waren, ein Teil der sich ergebenden einzelsträngigen cDNAs auf einer positiv geladenen Membran aufgetragen und unter Verwendung herkömmlicher Verfahren an eine ³²P markierte Sonde mit identischer Sequenz zu der des derivatisierten Oligonukleotids hybridisiert. Kontrollspots, die 1 pmol, 100 fmol, 50 fmol, 10 fmol und 1 fmol eines Kontrolloligodeoxyribonukleotids mit einer Sequenz, die zu der des derivatisierten Oligonukleotids identisch war, enthielten, waren ebenfalls umfasst. Die von den cDNA enthaltenden Spots erhaltenen Signale zeigten, dass etwa 15 fmol des derivatisierten Oligonukleotids revers transkribiert worden waren. Diese Ergebnisse zeigen, dass die reverse Transkription über ein Cap hinweg durchgeführt werden kann und sie zeigen insbesondere, dass Reverse Transkriptase die 5'-P-P-P-5'-Bindung des Caps eukaryotischer Boten-RNAs überquert.
Im zweiten Typ von Experiment wurden die einzelsträngigen cDNAs, die aus der obigen Erststrangsynthese erhalten worden waren, als Matrize für PCR-Reaktionen verwendet. Zwei Reaktionstypen wurden ausgeführt. Als erstes wurde eine spezifische Amplifikation der mRNAs für Alphaglobin, Dehydrogenase, pp15 und Elongationsfaktor E4 unter Verwendung der folgenden Paare an Oligodeoxyribonukleotid-Primern durchgeführt.
Alphaglobin

GLO-S: 5'CCG ACA AGA CCA ACG TCA AGG CCG C3' (SEQ ID NO:5)
GLO-As: 5'TCA CCA GCA GGC AGT GGC TTA GGA G 3' (SEQ ID NO:6)

Dehydrogenase

3 DH-S: 5'AGT GAT TCC TGC TAC TTT GGλ TGG C3' (SEQ ID NO:7)
3 DH-As: 5'GCT TGG TCT TGT TCT GGA GTT TAG A3' (SEQ ID NQ:8)

pp15

PP 15-S: 5'TCC AGA ATG GGA GAC AAG CCA ATT T3' (SEQ ID NO:9)
PP 15-s: 5'AGG GAG GAG GAA ACA GCG TGA GTC C3' (SEQ ID NO:10)

Elongationsfaktor E4

EFA1-S: 5'ATG GGA AAG GAA AAG ACT CAT ATC ATC A3 (SEQ ID NO:11)
EF1A-As: 5'AGC AGC AAC AAT CAG GAC AGC ACA G3' (SEQ ID NO:12)

Als zweites wurden unspezifische Amplifikationen mit den Antisense Oligodeoxyribonukleotiden der oben beschriebenen Paare und einem Primer, der aus der Sequenz des derivatisierten Oligodeoxyribonukleotids (5'-ATCAAGAATTCGCACGAGACCATTA-3' (SEQ ID NO: 13) abgeleitet worden war, durchgeführt.
Ein Zwanzigstel der folgenden RT-PCR-Produktproben wurden auf einem 1,5% Agarosegel aufgetrennt und mit Ethidiumbromid angefärbt.

Probe 1: Die Produkte einer PCR-Reaktion unter Verwendung der Globinprimer gemäß SEQ ID NO: 5 und 6 in Gegenwart von cDNA.
Probe 2: Die Produkte einer PCR-Reaktion unter Verwendung der Globinprimer gemäß SEQ ID NO: 5 und 6 in Abwesenheit zugegebener cDNA.
Probe 3: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer gemäß SEQ ID NO: 7 und 8 in Gegenwart von cDNA.
Probe 4: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer gemäß SEQ ID NO: 7 und 8 in Abwesenheit zugegebener cDNA.
Probe 5: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer gemäß SEQ ID NO: 9 und 10 in Gegenwart von cDNA.
Probe 6: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer gemäß SEQ ID NO 9 und 10 in Abwesenheit zugegebener cDNA.
Probe 7: Die Produkte einer PCR-Reaktion unter Verwendung der EIF4-Primer gemäß SEQ ID NO: 11 und 12 in Gegenwart von zugegebener cDNA.
Probe 8: Die Produkte einer PCR-Reaktion unter Verwendung der EIF4-Primer gemäß SEQ ID NO: 11 und 12 in Abwesenheit zugegebener cDNA.

Eine Bande mit der für das PCR-Produkt erwarteten Größe wurde nur in den Proben 1, 3, 5 und 7 beobachtet und zeigt somit das Vorliegen der korrespondierenden Sequenz in der cDNA-Population an.
Es wurden auch PCR-Reaktionen mit den Antisense Oligonukleotiden der Globin- und Dehydrogenase-Primer (SEQ ID NO: 6 und 8) und einem Oligonukleotid, dessen Sequenz der des derivatisierten Oligonukleotids entsprach, durchgeführt. Das Vorliegen von PCR-Produkten mit der erwarteten Größe in den Proben, die den obigen Proben 1 und 3 entsprachen, zeigte, dass das derivatisierte Oligonukleotid mit mRNA verknüpft worden war.
Die obigen Beispiele fassen das chemische Verfahren zur Anreicherung von mRNAs für solche mRNAs, die intakte 5'-Enden aufweisen, zusammen, wie es in 1 dargestellt ist. Weitere Einzelheiten, die die chemischen Ansätze zum Erlangen solcher mRNAs betreffen, werden in der internationalen Anmeldung Nr. WO 96/34981, veröffentlicht 7. November 1996, offenbart. Strategien, die auf den oben beschriebenen chemischen Modifikationen der 5'-Capstruktur beruhen, können verwendet werden, um cDNAs zu erzeugen, die darauf hin selektiert wurden, dass sie die 5'-Enden der mRNAs, von denen sie abgeleitet wurden, umfassen. In einer Version derartiger Verfahren werden die mRNA 5'-Enden wie oben beschrieben modifiziert. Danach wird eine reverse Transkriptionsreaktion durchgeführt, um einen Primer, der komplementär zum mRNA 5'-Ende ist, zu verlängern. Einzelsträngige RNAs werden entfernt, um eine Population von cDNA/mRNA-Heteroduplexen zu erhalten, in denen die mRNA ein intaktes 5'-Ende umfasst. Die sich ergebenden Heteroduplexe können auf einer festen Phase, die mit einem Molekül beschichtet ist, das zur Wechselwirkung mit dem zur Derivatisierung des mRNA 5'-Endes verwendeten Moleküls in der Lage ist, eingefangen werden. Danach werden die Stränge der Heteroduplexe getrennt, um einzelsträngige Erststrang-cDNAs zu gewinnen, die das mRNA 5'-Ende umfassen. Die Zweitstrang-cDNA-Synthese kann anschließend unter Verwendung herkömmlicher Techniken fortgeführt werden. Beispielsweise können die in WO 96/34981 oder in Carninci et al., Genomics 37:327-336, 1996, offenbarten Verfahren verwendet werden, um cDNAs zu selektieren, die die Sequenz umfassen, die vom 5'-Ende der kodierenden mRNA Sequenz abgeleitet ist.
Im Anschluss an die Ligation des Oligonukleotid-Tags an das 5'-Cap der mRNA wird eine reverse Transkriptionsreaktion ausgeführt, um einen Primer, der zu der mRNA komplementär ist, zum 5'-Ende der mRNA hin zu verlängern. Im Anschluss an die Entfernung der RNA-Komponente aus dem sich ergebenden Heteroduplex unter Verwendung von Standardtechniken, wird die cDNA-Zweitstrangsynthese mit einem Primer durchgeführt, der komplementär zum Oligonukleotid-Tag ist.
2. Enzymatische Verfahren zum Erlangen von mRNAs mit intakten 5'-Enden
Andere Techniken zur Selektion von cDNAs, die über das 5'-Ende der mRNA, von der sie abgeleitet sind, hinaus erweitert sind, sind vollständig enzymatisch. Einige Versionen dieser Techniken werden in Dumas Milne Edwards J.B. (Doktorarbeit der Paris VI Universität, Le clonage des ADNc complets: difficultes et perspectives nouvelles. Apports pour l'etude de la regulation des l'expression de la tryptophane hydroxylase de rat, 20. Dezember 1993), EP 0,625,572 und Kato et al., Gene 150:243-250, 1994, offenbart.
In Kürze, in derartigen Ansätzen wird isolierte mRNA mit alkalischer Phosphatase behandelt, um die Phosphatgruppen, die an den 5'-Enden unvollständiger mRNAs ohne Cap vorliegen, zu entfernen. Im Anschluss an dieses Verfahren wird das bei Volllängen-mRNAs vorliegende Cap mit einem Cap entfernendem Enzym, wie beispielsweise T4-Polynukleotidgenase oder Tabaksäure-Pyrophosphatase enzymatisch entfernt. Ein Oligonukleotid, das entweder ein DNA-Oligonukleotid oder DNA-RNA-Hybridoligonukleotid mit RNA an seinem 3'-Ende sein kann, wird anschließend unter Verwendung von T4-RNA Ligase an das Phosphat, das am 5'-Ende der mRNA ohne Cap vorliegt, ligiert. Das Oligonukleotid kann eine Schnittstelle umfassen, um das Klonieren der cDNAs im Anschluss an deren Synthese zu erleichtern. Beispiel 12 weiter unten beschreibt ein enzymatisches Verfahren, das auf der Doktorarbeit von Dumas basiert.
BEISPIEL 12
Enzymatischer Ansatz zum Erlangen von 5'-ESTs
Zwanzig Mikrogramm PolyA⁺ RNA wurden unter Verwendung von Phosphatase aus Rinderdarm (Calf Intestinal Phosphatase) (Biolabs) dephosphoryliert. Nach einer Phenolchloroformextraktion wurde die mRNA Capstruktur unter Verwendung von Tabaksäure-Pyrophosphatase (gereinigt wie von Shinshi et al., Biochemstry 15:2185-2190, 1976 beschrieben) hydrolysiert und ein hemi 5'-DNA/RNA-3'-Oligonukleotid mit einem unphosphorylierten 5'-Ende, einem Adenosinribophosphatabschnitt am 3'-Ende und einer EcoRI-Stelle nahe dem 5'-Ende wurde unter Verwendung der T4 RNA-Ligase (Biolabs) an die 5'-P-Enden der mRNA ligiert. Oligonukleotide, die zur Verwendung in diesem Verfahren geeignet sind, weisen vorzugsweise eine Länge von 30 bis 50 Basen auf. Oligonukleotide mit einem unphosphorylierten 5'-Ende können durch Zugabe eines Fluorochroms an das 5'-Ende synthetisiert werden. Die Einbeziehung eines Adenosinribophosphatabschnitts am 3'-Ende der Oligonukleotide steigert die Effizienz der Ligation. Es wird erkannt, dass das Oligonukleotid außer EcoRI andere Klonierungsstellen enthalten kann.
Im Anschluss an die Ligation der Oligonukleotide an das Phosphat, das am 5'-Ende der mRNA ohne Cap vorliegt, wird die Erst- und Zweitstrang-cDNA-Synthese unter Verwendung herkömmlicher Verfahren oder unter Verwendung der Verfahren, die in EP 0,625,572 und Kato et al., supra und Dumas Milne Edwards, supra offenbart sind, ausgeführt. Die sich ergebende cDNA kann anschließend in Vektoren ligiert werden, wie beispielsweise solche Vektoren, die in Kato et al., supra offenbart sind oder andere dem Fachmann bekannte Nukleinsäurevektoren, wobei Techniken verwendet werden, wie sie beispielsweise in Sambrook et al., Molecular Cloning: A Laboratory Manual 2. Ausgabe, Cold Spring Harbor Laboratory Press, 1989 beschrieben sind.
II. Erlangen und Charakterisieren der erfindungsgemäßen 5'-ESTs
Die hierin beschriebenen 5'-ESTs wurden unter Verwendung der vorausgehend genannten chemischen und enzymatischen Ansätze zur Anreicherung von mRNAs im Hinblick auf mRNAs mit intakten 5'-Enden erhalten, wie es weiter unten beschrieben wird.
1. Erlangen von 5'-ESTs unter Verwendung von mRNAs mit intakten 5'-Enden
Zuerst wurden mRNAs hergestellt, wie es in Beispiel 13 weiter unten beschrieben wird.
BEISPIEL 13
Herstellung von mRNA mit intakten 5'-Enden
Menschliche Gesamt-RNAs bzw. PolyA⁺-RNAs, die aus 29 verschiedenen Geweben abgeleitet waren, wurden von LABIMO bzw. CLONTECH bezogen und verwendet, um 44 cDNA-Bibliotheken zu erstellen, wie es im Folgenden beschrieben wird. Die bezogene RNA war entweder aus Zellen oder Geweben unter Verwendung von saurer Guanidiumthiocyanat-Phenol-Chloroformextraktion isoliert worden (Chomczyniski und Sacchi, Analytical Biochemstry 162:156-159, 1987). Um die ribosomale RNA zu entfernen wurde PolyA⁺ RNA aus Gesamt-RNA (LABIMO) über zwei Durchläufe von Oligo-dT-Chromatografie isoliert, wie es von Aviv und Leder, Proc. Natl. Acad. Sci. USA 69:1408-1412, 1972 beschrieben wird.
Die Qualität und Integrität der PolyA⁺-RNAs wurden überprüft. Es wurden mit einer Globinsonde hybridisierte Northern Blots verwendet, um zu bestätigen, dass die mRNAs nicht degradiert waren. Verunreinigung der PolyA⁺-mRNAs durch ribosomale Sequenzen wurde unter Verwendung von Northern Blots und einer Sonde, die aus der Sequenz von 28S rRNA abgeleitet war, überprüft. mRNA-Präparationen mit weniger als 5% rRNAs wurden zur Herstellung einer Bibliothek verwendet. Um die Herstellung von Bibliotheken mit RNAs zu vermeiden, die mit exogenen Sequenzen verunreinigt waren (prokaryotisch oder aus Pilz), wurde das Vorliegen bakterieller 16S ribosomaler Sequenzen oder zweier stark exprimierter mRNAs aus Pilz unter Verwendung von PCR untersucht.
Im Anschluss an die Herstellung der mRNAs wurden die oben beschriebenen chemischen und/oder die enzymatischen Verfahren zur Anreicherung solcher mRNAs, die intakte 5'-Enden aufweisen, verwendet, um 5'-ESTs aus verschiedenen Geweben zu erhalten. In beiden Ansätzen wurde ein Oligonukleotid-Tag an die mRNA 5'-Enden angebracht. Der Oligonukleotid-Tag trug eine EcoRI-Stelle in sich, um spätere Klonierungsverfahren zu erleichtern. Um die Verarbeitung einzelsträngiger und doppelsträngiger cDNA, die bei der Erstellung der Bibliotheken erhalten wurde, zu erleichtern, wurde die gleiche Nukleotidsequenz verwendet, um das ligierte Oligonukleotid sowohl für den chemischen als auch den enzymatischen Ansatz zu konzipieren. Trotzdem war das im chemischen Verfahren verwendete Tag ein Oligodeoxyribonukleotid, das mit dem Cap der mRNA verknüpft war, wohingegen in der enzymatischen Ligation das Tag ein chimäres hemi 5'-DNA/RNA3'-Oligonukleotid war, das an das 5'-Ende von mRNA ohne Cap ligiert wurde, wie in Beispiel 12 beschrieben wird.
Bevor die Erststrangsynthese durchgeführt wurde, wie es in Beispiel 14 beschrieben wird, wurde im Anschluss an das Anbringen des Oligonukleotid-Tags an die mRNA durch entweder chemische oder enzymatische Verfahren die Integrität der mRNA durch Ausführung eines Northern Blots mit 200 bis 500 ng mRNA untersucht, wobei eine zum Oligonukleotid-Tag komplementären Sonde verwendet wurde.
BEISPIEL 14
cDNA-Synthese unter Verwendung von mRNA-Matrizen mit intakten 5'-Enden
Für die mRNAs, die unter Verwendung sowohl chemischer als auch enzymatischer Verfahren mit Oligonukleotid-Tags verknüpft worden waren, wurde die Erststrang-cDNA-Synthese unter Verwendung der Superscript II (Gibco BRL) oder der Rnase H Minus M-MLV (Promega) Reversen Transkriptase mit willkürlichen Nonameren als Primern durchgeführt. Um die internen EcoRI-Stellen in der cDNA vor Verdau bei späteren Verfahrensschritten zu schützen, wurde für die Erststrangsynthese methyliertes dCTP verwendet. Nach Entfernung von RNA durch alkalische Hydrolyse wurde die Erststrang-cDNA unter Verwendung von Isopropanol präzipitiert, um verbliebene Primer zu entfernen.
Sowohl für die chemischen als auch die enzymatischen Verfahren wurde der cDNA-Zweitstrang mit einem Klenow-Fragment unter Verwendung eines Primers entsprechend dem 5'-Ende des ligierten Oligonukleotids synthetisiert, wie es in Beispiel 12 beschrieben wird. Der Primer ist vorzugsweise 20-25 Basen lang. Methyliertes dCTP wurde auch zur Zweitstrangsynthese verwendet, um während des Klonierungsverfahrens die internen EcoRI-Stellen in der cDNA vor Verdau zu schützen.
Im Anschluss an die cDNA-Synthese wurden die cDNAs in pBlueScript-Vektoren kloniert, wie es in Beispiel 15 weiter unten beschrieben wird.
BEISPIEL 15
Klonierung von cDNAs, die aus mRNA mit intakten 5'-Enden abgeleitet sind, in BlueScript
Im Anschluss an die Zweitstrangsynthese wurden die Enden der cDNA mit T4 DNA-Polymerase (Biolabs) geglättet und die cDNA wurde mit EcoRI verdaut. Da während der cDNA-Synthese methyliertes dCTP verwendet worden war, stellte die im Tag vorliegende EcoRI-Stelle die einzige hemi methylierte Stelle dar und war demzufolge die einzige Stelle, die einem EcoRI-Verdau zugänglich war. Die cDNA wurde anschließend unter Verwendung von Ausschlusschromatografie (AcA, Biosepra) größenfraktioniert und die Fraktionen, die cDNAs mit mehr als 150 bp entsprachen, wurden vereinigt und mit Ethanol präzipitiert. Die cDNA wurde direkt in die Smal- und EcoRI-Enden des Phagemid pBlueScript-Vektors (Stratagene) kloniert. Das Ligationsgemisch wurde in Bakterien elektroporiert und unter geeigneten antibiotischen Auswahlbedingungen vermehrt.
Klone, die den angefügte Oligonukleotid-Tag enthielten, wurden selektiert, wie es in Beispiel 16 weiter unten beschrieben wird.
BEISPIEL 16
Selektion von Klonen mit daran angebrachtem Oligonukleotid-Tag
Die wie oben beschrieben hergestellten Plasmid-DNAs enthaltenden 5'-EST-Bibliotheken wurden gereinigt (Qiagen). Eine positive Selektion der Klone mit Tag wurde wie folgt durchgeführt. In Kürze, in diesem Selektionsverfahren wird die Plasmid-DNA unter Verwendung der Gen II-Endonuklease des Phagen F1 in Kombination mit einer Exonuklease (Chang et al., Gene 127:95-8, 1993), wie beispielsweise Exonuklease III oder T7 Gen 6 Exonuklease, in eine einzelsträngige DNA umgewandelt. Die sich ergebende einzelsträngige DNA wurde anschließend unter Verwendung paramagnetischer Beads, wie von Fry et al., Biotechniques, 13:124-131, 1992 beschrieben, aufgereinigt. In diesem Verfahren wird die einzelsträngige DNA mit einem biotinylierten Oligonukleotid, das eine Sequenz entsprechend dem 3'-Ende des in Beispiel 13 beschriebenen Oligonukleotids aufweist, hybridisiert. Der Primer weist vorzugsweise eine Länge von 20-25 Basen auf. Klone, die eine zum biotinylierten Oligonukleotid komplementäre Sequenz umfassen, wurden durch Inkubation mit Streptavidin beschichteten magnetischen Beads eingefangen, wobei sich daran eine magnetische Selektion anschloss. Nach dem Einfangen der positiven Klone wurde die Plasmid-DNA von den magnetischen Beads abgelöst und unter Verwendung einer DNA-Polymerase, wie beispielsweise der von Amersham Pharmacia Biotech erhältlichen ThermoSequenase in doppelsträngige DNA umgewandelt. Alternativ können Protokolle, wie beispielsweise das im Gene Trapper Kit, der von Gibco BRL bezogen werden kann, beschriebene verwendet werden. Die doppelsträngige DNA wurde anschließend in Bakterien elektroporiert. Unter Verwendung von Dot Blot Analyse wurde der Prozentanteil positiver Klone mit dem 5'-Tag Oligonukleotid dahingehend abgeschätzt, dass er sich typischerweise zwischen 90 und 98% bewegt.
Im Anschluss an die Elektroporation wurden die Bibliotheken in 384-Mikrotiterplatten (MTP) angeordnet. Für zukünftige Bedürfnisse wurde eine Kopie der MTP eingelagert. Anschließend wurden die Bibliotheken in 96 MTP überführt und wie unten beschrieben sequenziert.
BEISPIEL 17
Sequenzierung von Inserts in selektierten Klonen
Die Plasmidinserts wurden zuerst durch eine PCR-Reaktion in PE 9600 Thermocyclern (Perkin-Elmer, Applied Biosystems Divison, Foster City, CA) unter Verwendung von Standard-SETA-A- und SETA-B-Primern (Genset SA), AmpliTaqGold (Perkin-Elmer), dNTPs (Boehringer), Puffer und von der Perkin-Elmer Corporation empfohlenen Zyklusbedingungen amplifiziert.
Anschließend wurden die PCR-Produkte unter Verwendung automatischer ABI Prism 377 Sequenzierer (Perkin-Elmer) sequenziert. Die Sequenzierungsreaktionen wurden unter Verwendung von PE 9600 Thermocyclern mit Standardfarbstoffprimerchemie und ThermoSequenase (Amersham Pharmacia Biotech) durchgeführt. Die verwendeten Primer waren wie jeweils geeignet entweder T7 oder 21 M13 (erhältlich von Genset SA). Die Primer waren mit den JOE-, FAM-, ROX- und TAMRA-Farbstoffen markiert. Die für die Sequenzierungsreaktionen verwendeten dNTPs und ddNTPs wurden von Boehringer bezogen. Sequenzierungspuffer, Reagenzienkonzentrationen und Zyklusbedingungen waren wie von Amersham empfohlen.
Im Anschluss an die Sequenzierungsreaktion wurden die Proben mit Ethanol präzipitiert, in Formamidladepuffer aufgenommen und auf ein standardmäßiges 4% Acrylamidgel aufgetragen. Die Elektrophorese wurde für 2,5 Stunden bei 3000 V an einem ABI 377 Sequenzierungsgerät durchgeführt und die Sequenzdaten wurden gesammelt und unter Verwendung der ABI Prism DNA Sequencing Analysis Software, Version 2.1.2 analysiert.
2. Computeranalyse der erhaltenen 5'-ESTs: Einrichtung von NetGene und SignalTag Datenbanken
Die Sequenzdaten der 44 wie oben beschrieben hergestellten cDNA-Bibliotheken wurden auf eine proprietäre Datenbank übertragen, wo Schritte zur Qualitätskontrolle und Validierung durchgeführt wurden. Ein proprietärer Base-Caller, der unter einem Unix-System arbeitet, kennzeichnete automatisch fehlerverdächtige Scheitelwerte, wobei die Form der Scheitel, die Auflösung zwischen den Scheiteln und der Rauschpegel berücksichtigt wurden. Der proprietäre Base-Caller führte auch einen automatischen Abgleich durch. Jeder Abschnitt mit 25 oder weniger Basen und mehr als 4 fehlerverdächtigen Scheitelwerten wurde als unzuverlässig eingestuft und verworfen. Sequenzen, die dem Klonierungsvektor oder Ligationsoligonukleotiden entsprachen, wurden automatisch von den EST-Sequenzen entfernt. Die sich ergebenden EST-Sequenzen können an ihrem 5'-Ende jedoch 1 bis 5 Basen enthalten, die zu den oben erwähnten Sequenzen zählen. Wenn Bedarf entsteht, können sie auf Grundlage einer Fall zu Fall Unterscheidung einfach entfernt werden.
Im Anschluss an die oben beschriebene Sequenzierung wurden die 5'-EST-Sequenzen in NetGene^TM eingegeben, wobei es sich um eine proprietäre Datenbank handelt, die wie unten beschrieben zur Speicherung und Manipulierung aufgerufen wurde. Der Fachmann erkennt, dass die Daten auf einem beliebigen Medium, das von einem Computer gelesen werden kann und auf das ein Computer zugreifen kann, gespeichert und manipuliert werden können. Computerlesbare Medien umfassen magnetisch, optisch oder elektronisch lesbare Medien. Beispielsweise kann das computerlesbare Medium sowohl eine Hard Disc, eine Floppy Disc, ein magnetisches Band, CD-ROM, RAM oder ROM als auch andere dem Fachmann bekannte Medientypen sein.
Zusätzlich können die Daten in einer Vielfalt von Datenverarbeitungsprogrammen in unterschiedlichen Formaten gespeichert und manipuliert werden. Zum Beispiel können die Sequenzdaten als Text in einer Wortverarbeitungsdatei, wie beispielsweise Microsoft WORD oder WORDPERFECT oder als eine ASCII-Datei in einer Vielzahl von dem Fachmann bekannten Datenbankenprogrammen, wie beispielsweise DB2, SYBASE oder ORACLE, gespeichert werden.
Das computerlesbare Medium, auf dem die Sequenzinformation gespeichert ist, kann sich in einem Personal-Computer, einem Netzwerk, einem Server oder anderen, dem Fachmann bekannten Computersystemen befinden. Der Computer oder das andere System umfasst vorzugsweise das oben beschriebene Speichermedium und einen Prozessor für einen Zugriff auf und die Manipulation der Sequenzdaten. Sobald die Sequenzdaten gespeichert worden sind, können sie manipuliert werden und durchsucht werden, um diejenigen gespeicherten Sequenzen zu finden, die eine gewünschte Nukleinsäuresequenz enthalten oder die ein Protein mit einer bestimmten funktionalen Domäne kodieren. Beispielsweise kann die gespeicherte Sequenzinformation mit anderen bekannten Sequenzen verglichen werden, um Homologien, Motive, die eine biologische Funktion implizieren, oder strukturelle Motive zu identifizieren.
Programme, die verwendet werden können, um die gespeicherten Sequenzen zu durchsuchen oder zu vergleichen, umfassen die MacPattern (EMBL), BLAST und BLAST2 Programmserien (NCBI), einfache lokale Alignment Suchprogramme für Nukleotid- (BLASTN) und Peptid- (BLASTX) Vergleiche (Altschule et al., J. Mol. Biol. 215:403, 1990) sowie FASTA (Pearson und Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988). Die BLAST Programme erweitern anschließend die Alignments auf Grundlage bestimmter Abgleich- und Fehlabgleichkriterien (match- and mismatch criteria).
Motive, die unter Verwendung der oben und den in Beispiel 28 beschriebenen Programmen entdeckt werden können, umfassen Sequenzen, die Leucin-Zipper, Helix-Turn-Helix-Motive, Glycosylierungsstellen, Ubiquitinierungsstellen, Alphahelices und Betafaltblätter, Signalpeptide kodierende Signalsequenzen, die die Sekretion der kodierten Proteine lenken, Sequenzen, die mit der Regulation von Transkription in Zusammenhang stehen, wie beispielsweise Homeoboxen, saure Abschnitte, enzymatisch aktive Stellen, Substratbindungsstellen und enzymatische Spaltstellen kodieren.
Bevor die cDNAs in der NetGene^TM Datenbank nach Sequenzmotiven von Interessen durchsucht wurden, wurden von mRNAs abgeleitete cDNAs, die nicht von Interesse waren, identifiziert und von weiteren Überlegungen ausgeschlossen, wie es in Beispiel 18 weiter unten beschrieben wird.
BEISPIEL 18
Ausschluss unerwünschter Sequenzen von weiteren Überlegungen
5'-ESTs in der NetGene^TM-Datenbank, die von unerwünschten Sequenzen abgeleitet waren, wie beispielsweise Transfer-RNAs, ribosomale RNAs, mitochondrielle RNAs, prokaryotische RNAs, RNAs aus Pilzen, Alu-Sequenzen, L1-Sequenzen oder Repeatsequenzen, wurden unter Verwendung der FASTA- und BLASTN-Programme mit den in Tabelle 1 aufgelisteten Parametern identifiziert.
Um die tRNAs kodierenden 5'-ESTs von weiteren Überlegungen auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen 1190 bekannter tRNAs, die aus EMBL Version 38 erhalten wurden, verglichen, von denen 100 menschlich waren. Der Vergleich wurde unter Verwendung von FASTA für beide Stränge der 5'-ESTs durchgeführt. Sequenzen mit mehr als 80 Homologie über mehr als 60 Nukleotide hinweg wurden als tRNAs identifiziert. Von den 144.341 durchmusterten Sequenzen wurden 26 als tRNAs identifiziert und von weiteren Überlegungen ausgeschlossen.
Um die rRNAs kodierenden 5'-ESTs von weiteren Überlegungen auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen 2497 bekannter rRNAs, die aus EMBL Version 38 erhalten wurden, verglichen, von denen 73 menschlich waren. Der Vergleich wurde unter Verwendung von BLASTN für beide Stränge der 5'-ESTs mit dem Parameter S = 108 durchgeführt. Sequenzen mit mehr als 80% Homologie über Strecken, die länger als 40 Nukleotide waren, wurden als rRNAs identifiziert. Von den 144.341 durchmusterten Sequenzen wurden 3.312 als rRNAs identifiziert und von weiteren Überlegungen ausgeschlossen.
Um die mtRNAs kodierenden 5'-ESTs von weiteren Überlegungen auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen zweier bekannter mitochondrieller Genome, für die die vollständige genomische Sequenz zur Verfügung steht, und allen Sequenzen, die von diesen mitochondriellen Genomen transkribiert werden, einschließlich tRNAs, rRNAs und mRNAs, in der Summe 38 Sequenzen, verglichen. Der Vergleich wurde unter Verwendung von BLASTN für beide Stränge der 5'-ESTs mit dem Parameter S = 108 durchgeführt. Sequenzen mit mehr als 80% Homologie über Strecken, die länger als 40 Nukleotide waren, wurden als mtRNAs identifiziert. Von den 144.341 durchmusterten Sequenzen wurden 6.110 als mtRNAs identifiziert und von weiteren Überlegungen ausgeschlossen.
Sequenzen, die von exogenen Kontaminanten herrühren könnten, wurden von weiteren Überlegungen durch Vergleich der 5'-EST-Sequenzen mit Version 46 der EMBL-Abteilungen für Bakterien und Pilze unter Verwendung von BLASTN mit dem Parameter S = 144 entfernt. Alle Sequenzen mit mehr als 90% Homologie über wenigstens 40 Nukleotide hinweg wurden als exogene Kontaminanten identifiziert. Von den 42 untersuchten cDNA-Bibliotheken betrug der durchschnittliche Prozentanteil darin enthaltener prokaryotischer Sequenzen und darin enthaltener Pilzsequenzen 0,2% bzw. 0,5%. Von diesen Sequenzen konnte nur eine als pilzspezifische Sequenz identifiziert werden. Die anderen waren entweder Pilzsequenzen oder prokaryotische Sequenzen mit Homologien zu Wirbeltiersequenzen oder umfassten Repeatsequenzen, die während des elektronischen Vergleichs nicht maskiert worden waren.
Zusätzlich wurden die 5'-ESTs mit 6093 Alu-Sequenzen und 1115 L1-Sequenzen verglichen, um 5'-ESTs zu maskieren, die derartige Repeatsequenzen enthielten. 5'-ESTs, die THE- und MER-Repeats, SSTR-Sequenzen oder Satelliten, Mikrosatelliten oder telomerische Repeats umfassten, wurden ebenfalls von weiteren Überlegungen ausgeschlossen. Im Durchschnitt enthielten 11,5% der Sequenzen in den Bibliotheken Repeatsequenzen. Von diesen 11,5% enthielten 7% Alu-Repeats, 3,3% enthielten L1-Repeats und die übrigen 1,2% wurden von den anderen durchmusterten Typen repetitiver Sequenzen abgeleitet. Diese Prozentangaben stehen in Übereinstimmung mit denen, die in von anderen Gruppen hergestellten cDNA-Bibliotheken nachgewiesen wurden. Beispielsweise enthielten die cDNA-Bibliotheken von Adams et al. in Abhängigkeit von der zur cDNA-Bibliothek-Herstellung verwendeten RNA-Quelle zwischen 0% und 7,4% Alu-Repeats (Adams et al., Nature 377:174, 1996).
Die Sequenzen derjenigen 5'-ESTs, die nach der Entfernung unerwünschter Sequenzen zurück blieben, wurden mit den Sequenzen bekannter menschlicher mRNAs verglichen, um die Fehlerfreiheit der oben beschriebenen Sequenzierungsverfahren festzustellen.
BEISPIEL 19
Messen der Sequenzierungsfehlerfreiheit durch Vergleich mit bekannten Sequenzen
Um ferner die Fehlerfreiheit des oben beschriebenen Sequenzierungsverfahrens zu bestimmen, wurden die 5'-EST-Sequenzen, die von bekannten Sequenzen abgeleitet waren, identifiziert und mit den ursprünglich bekannten Sequenzen verglichen. Als Erstes wurde bezüglich der 5'-ESTs eine FASTA-Analyse mit Überhängen, die kürzer als 5 bp waren, an beiden Enden durchgeführt, um diejenigen 5'-ESTs zu identifizieren, die mit einem Eintrag in der öffentlichen Human mRNA Datenbank übereinstimmen. Die 6655 5'-ESTs, die mit einer bekannten menschlichen mRNA übereinstimmten, wurden anschließend mit ihrer verwandten mRNA abgeglichen und eine dynamische Programmierung wurde verwendet, um Substitutionen, Insertionen und Deletionen in die Liste der zu erkennenden „Fehler" aufzunehmen. Fehler, die in den letzten 10 Basen der 5'-EST-Sequenzen auftraten, wurden ignoriert, um eine Eibeziehung von störenden Klonierungsstellen bei der Analyse der Sequenzierungsfehlerfreiheit zu vermeiden.
Die Analyse offenbarte, dass die Sequenzen, die in der NetGene^TM-Datenbank enthalten waren, eine Fehlerfreiheit von mehr als 99,5% aufwiesen.
Um die Effizienz zu bestimmen, mit der das obige Selektionsverfahren cDNAs selektiert, die die 5'-Enden ihrer korrespondierenden mRNAs umfassen, wurde die folgende Analyse durchgeführt.
BEISPIEL 20
Bestimmung der Effizienz der 5'-EST-Selektion
Um die Effizienz zu bestimmen, mit der die oben beschriebenen Selektionsverfahren 5'-ESTs isolierten, die Sequenzen nahe am 5'-Ende der mRNAs umfassten, aus denen sie abgeleitet waren, wurden die Sequenzen der 5'-EST-Enden, die von den Genen für die Untereinheit α des Elongationsfaktors 1 und der schweren Kette von Ferritin abgeleitet waren, mit denen bekannter cDNA-Sequenzen dieser Gene verglichen. Da die Transkriptionsstartstellen beider Gene gut charakterisiert sind, können sie verwendet werden, um den Prozentanteil abgeleiteter 5'-ESTs zu bestimmen, die die authentischen Transkriptionsstartstellen umfassten.
Für beide Gene umfassten tatsächlich mehr als 95% der erhaltenen 5'-ESTs Sequenzen, die nahe am oder stromaufwärts des 5'-Endes der korrespondierenden mRNAs lagen.
Um die Analyse zur Verlässlichkeit der Isolierungsverfahren für 5'-ESTs aus ESTs in der NetGene^TM-Datenbank auszuweiten, wurde zum Vergleich eine ähnliche Analyse unter Verwendung einer Datenbank durchgeführt, die aus menschlichen mRNA-Sequenzen zusammengestellt worden war, wobei die menschlichen mRNA-Sequenzen aus der GenBank-Datenbank Version 97 entnommen worden waren. Die 5'-Enden von mehr als 85% der aus mRNAs abgeleiteten 5'-ESTs, die in der GenBank-Datenbank enthalten waren, waren nahe der 5'-Enden der bekannten Sequenz lokalisiert. Da einige der mRNA-Sequenzen, die in der GenBank-Datenbank zur Verfügung stehen, von genomischen Sequenzen abgeleitet sind, wird eine Übereinstimmung am 5'-Ende mit diesen Sequenzen als interne Übereinstimmung gerechnet. Daher unterschätzt das hier verwendete Verfahren die EST-Ausbeuten für ESTs, die die authentischen 5'-Enden ihrer korrespondierende mRNAs umfassen.
Die oben hergestellten EST-Bibliotheken umfassten mehrere 5'-ESTs, die von der gleichen mRNA abgeleitet waren. Die Sequenzen solcher 5'-ESTs wurden miteinander verglichen und die längsten 5'-ESTs für jede mRNA wurden identifiziert. Überlappende cDNAs wurden zu kontinuierlichen Sequenzen (Contigs) angeordnet. Die sich ergebenden kontinuierlichen Sequenzen wurden anschließend mit öffentlichen Datenbanken verglichen, um ihre Ähnlichkeit mit bekannten Sequenzen zu beurteilen, wie in Beispiel 21 weiter unten beschrieben wird.
BEISPIEL 21
Kopieren der 5'-ESTs und Berechnung der Neuheitsindices für cDNA-Bibliotheken
Für jede sequenzierte EST-Bibliothek wurden die Sequenzen über das 5'-Ende in Clustern zusammengefasst. Jede Sequenz in der Bibliothek wurde über BLASTN2 (direkter Strang, Parameter S = 107) mit den anderen verglichen. ESTs mit Segmentpaaren von hohem Scorewert (high scoring segment pairs) (HSPs), die wenigstens 25 bp lang waren, 95% identische Basen aufwiesen und näher als 10 bp von jedem EST 5'-Ende begannen, wurden gruppiert. Die längste Sequenz, die im Cluster nachgewiesen wurde, wurde als Vertreter der Gruppe herangezogen. Anschließend wurde eine Gesamtclusterbildung zwischen den Bibliotheken durchgeführt, was zur Bestimmung von Super-Contigs führte.
Um die Ausbeute an neuen Sequenzen innerhalb der EST-Bibliotheken zu bestimmen, wurde eine Neuheitsrate (NR) als: NR = 100 X (Zahl der neuen einmaligen Sequenzen, die in der Bibliothek nachgewiesen werden/Gesamtzahl der Sequenzen aus der Bibliothek) bestimmt. Typischerweise bewegte sich die Neuheitsrate in Abhängigkeit vom Gewebe, aus denen die EST-Bibliothek erhalten wurde, zwischen 10% und 41%. Für die meisten Bibliotheken wurde die statistische Sequenzierung von 5'-EST-Bibliotheken fortgesetzt, bis die Neuheitsrate 20% erreichte.
Im Anschluss an die oben beschriebene Charakterisierung wurde die 5'-EST-Kollektion in NetGene^TM durchmustert, um die diejenigen ESTs zu identifizieren, die potentielle Signalsequenzen trugen, wie es in Beispiel 22 weiter unten beschrieben wird.
BEISPIEL 22
Identifizierung potentieller Signalsequenzen in 5'-ESTs
Die 5'-ESTs in der NetGene^TM-Datenbank wurden durchmustert, um diejenigen 5'-ESTs zu identifizieren, die einen ununterbrochenen offenen Leserahmen (ORF) aufweisen, der länger als 45 Nukleotide ist, mit einem ATG-Kodon beginnt und bis zum Ende des ESTs reicht. Etwa die Hälfte der cDNA-Sequenzen in NetGene^TM enthielt einen derartigen ORF. Die ORFs dieser 5'-ESTs wurden anschließend unter Verwendung leicht abgeänderter von Von Heijne (Nucleic Acids Res. 14:4683-4690, 1986) offenbarten Verfahren durchsucht, um mögliche Signalmotive zu identifizieren. Für diejenigen 5'-EST-Sequenzen, die einen wenigstens 15 Aminosäuren langen Abschnitt mit einem Score von wenigstens 3,5 in der Von Heijne Signalpeptid-Identifizierungsmatrix kodierten, wurden in Betracht gezogen, ein Signalpeptid zu enthalten. Solche 5'-ESTs, die mit einer bekannten menschlichen mRNA oder einer EST-Sequenz übereinstimmten und ein 5'-Ende mehr als 20 Nukleotide stromabwärts des bekannten 5'-Ende aufwiesen, wurden von der weiteren Analyse ausgeschlossen. Die verbleibenden cDNAs, die eine Signalsequenz enthielten, wurden in eine Datenbank, die als SignalTag^TM bezeichnet wird, aufgenommen.
Um die Fehlerfreiheit des obigen Verfahrens zur Identifizierung von Signalsequenzen zu bestätigen, wurde die Analyse aus Beispiel 23 durchgeführt.
BEISPIEL 23
Bestätigung der Fehlerfreiheit zur Identifizierung möglicher Signalsequenzen in 5'-ESTs
Die Fehlerfreiheit des obigen Verfahrens zur Identifizierung von Signalsequenzen, die Signalpeptide kodieren, wurde durch Anwenden des Verfahrens auf 43 Aminosäuren, die am N-Terminus aller menschlichen SwissProt-Proteine lokalisiert sind, beurteilt. Der computerberechnete Von Heijnes-Score für jedes Protein wurde mit der bekannten Eigenschaft des Proteins, ein sekretiertes oder nicht sekretiertes Protein zu sein, verglichen. Auf diese Weise konnte die Zahl der nicht sekretierten Proteine mit einem Score höher als 3,5 (Falschpositive) und die Zahl der sekretierten Proteine mit einem Score niedriger als 3,5 (Falschnegative) berechnet werden.
Unter Verwendung der Ergebnisse aus der obigen Analyse wurde die Wahrscheinlichkeit, dass ein Peptid, das durch die 5'-Region der mRNA kodiert wird, wirklich ein echtes Signalpeptid auf Grundlage seines Von Heijnes-Scores ist, berechnet, wobei Annahme als Grundlage diente, dass entweder 10% der menschlichen Proteine sekretiert werden oder dass 20% der menschlichen Proteine sekretiert werden. Die Ergebnisse dieser Analyse sind in 2 und in Tabelle IV gezeigt.
Unter Verwendung des obigen Verfahrens zur Identifizierung von sekretorischen Proteinen wurden 5'-ESTs der nachfolgenden Polypeptide, für die bekannt ist, dass sie sekretiert werden, erhalten: humanes Glukagon, Gamma-Interferon induzierter Monokin-Precursor, sekretiertes Cyclophilin-ähnliches Protein, humanes Pleiotropin und humaner Biotinidase-Precursor. Somit identifizierte das obige Verfahren erfolgreich diejenigen 5'-ESTs, die ein Signalpeptid kodieren.
Um zu bestätigen, dass das Signalpeptid, das durch die 5'-ESTs kodiert wird, tatsächlich als Signalpeptid wirkt, können die Signalsequenzen aus den 5'-ESTs in einen Vektor kloniert werden, der zur Identifizierung von Signalpeptiden konzipiert ist. Solche Vektoren sind so konzipiert, dass sie die Fähigkeit in Selektionsmedium zu wachsen ausschließlich solchen Wirtszellen verleihen, die einen Vektor mit einer operativen verknüpften Signalsequenz enthalten. Um zu bestätigen, dass ein 5'-EST ein wirkliches Signalpeptid kodiert, kann die Signalsequenz des 5'-ESTs beispielsweise stromaufwärts und im Leserahmen mit einer nicht sekretorischen Form des Hefe-Invertasegens in Vektoren zur Signalpeptidselektion insertiert werden, wie denjenigen Vektoren, die in US-Patent Nr. 5,536,637 beschrieben sind. Wachstum von Wirtszellen, die Vektoren zur Signalsequenzselektion mit der korrekt insertierten 5'-EST-Signalsequenz enthalten, bestätigt, dass das 5'-EST ein echtes Signalpeptid kodiert.
Alternativ kann das Vorliegen eines Signalpeptid durch Klonierung der erweiterten cDNA, die unter Verwendung der ESTs erhalten wurden, in Expressionsvektoren, wie beispielsweise pXT1 (wie in Beispiel 30 weiter unten beschrieben) bestätigt werden oder durch Konstruktion von Promotorsignal-Sequenzreportergen-Vektoren, die Fusionsproteine zwischen dem Signalpeptid und einem Assay-fähigen Reportergen kodieren. Nach Einführung dieser Vektoren in eine geeignete Wirtszelle, wie beispielsweise COS-Zellen oder NIH 3T3-Zellen, kann das Wachstumsmedium geerntet werden und im Hinblick auf das Vorliegen des sekretierten Proteins analysiert werden. Das Medium aus diesen Zellen wird mit dem Medium aus Kontrollzellen, die Vektoren ohne die Signalsequenz oder das erweiterte cDNA-Insert enthalten, verglichen, um Vektoren zu identifizieren, die ein funktionales Signalpeptid oder ein authentisches sekretiertes Protein kodieren.
Diejenigen 5'-ESTs, die ein Signalpeptid kodieren, wie es durch das Verfahren gemäß Beispiel 22 oben bestimmt wurde, wurden ferner auf Grundlage ihrer Homologie zu bekannten Sequenzen in vier Kategorien eingruppiert, wie es in Beispiel 24 weiter unten beschrieben wird.
BEISPIEL 24
Kategorisierung von Signalpeptid kodierenden 5'-ESTs
Solche 5'-ESTs mit einer Sequenz, die weder mit einer beliebigen bekannten Wirbeltiersequenz noch mit einer beliebigen, öffentlich zugänglichen EST-Sequenz übereinstimmten, wurden als „neu" bezeichnet. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 947 der 5'-ESTs mit einem Von Heijnes Score von wenigstens 3,5 in diese Kategorie.
Solche 5'-ESTs, die eine Sequenz aufwiesen, die mit keiner Wirbeltiersequenz übereinstimmten, aber mit einem öffentlich bekannten EST übereinstimmten, wurden als „EST-ext" bezeichnet, vorausgesetzt, dass die bekannte EST-Sequenz wenigstens um 40 Nukleotide in 5'-Richtung erweitert war. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 150 der 5'-ESTs mit einem Von Heijnes Score von wenigstens 3,5 in diese Kategorie.
Solche ESTs, die mit keiner Wirbeltiersequenz übereinstimmten, jedoch mit einem öffentlich bekannten EST übereinstimmten, wobei das bekannte EST nicht wenigstens 40 Nukleotide in 5'-Richtung erweitert war, wurden als „EST" bezeichnet. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 599 der 5'-ESTs mit einem Von Heijnes Score von wenigstens 3,5 in diese Kategorie.
Solche 5'-ESTs, die mit einer humanen mRNA-Sequenz übereinstimmten, aber die bekannte Sequenz um wenigstens 40 Nukleotide in 5'-Richtung erweiterten, wurden als „VERT-ext" bezeichnet. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 23 der 5'-ESTs mit einem Von Heijnes Score von wenigstens 3,5 in diese Kategorie. Von dieser Kategorie war ein 5'-EST umfasst, das die bekannte Sequenzen der humanen Translokase-mRNA um mehr als 200 Basen in 5'-Richtung erweiterte. Es wurde auch ein 5'-EST identifiziert, das die Sequenz eines humanen Tumorsuppressor-Gens in 5'-Richtung erweiterte.
Tabelle V zeigt die Verteilung von 5'-ESTs in jeder Kategorie und die Zahl an 5'-ESTs in jeder Kategorie mit einem gegebenen von Heijnes Minimumscore.
3. Bewertung räumlicher und zeitlicher Expression von mRNAs, die mit den 5'-ESTs oder den erweiterten cDNAs korrespondieren
Jeder der 5'-ESTs wurde auf Grundlage des Gewebes, aus welchem die korrespondierende mRNA erhalten worden war, auch kategorisiert, wie es in Beispiel 25 weiter unten beschrieben wird.
BEISPIEL 25
Kategorisierung von Expressionsmustern
Tabelle VI zeigt die Verteilung von 5'-ESTs in jeder der oben definierten Kategorien im Hinblick auf das Gewebe, aus dem die 5'-ESTs der korrespondierenden mRNA erhalten wurden.
Tabelle II stellt die Sequenzidentifizierungsnummer einer aus Gehirn abgeleiteten 5'-EST-Sequenz, die Kategorie, unter welche diese Sequenz fällt, und den von Heijnes Score des Signalpeptids, das sie kodiert, bereit. Die 5'-EST-Sequenz und die kodierende Aminosäuresequenz sind im anhängigen Sequenzprotokoll bereitgestellt. Tabelle III stellt die Sequenz ID Nummern des 5'-ESTs und die Sequenz des Signalpeptids, das es kodiert, bereit. Die Sequenzen des 5'-ESTs und des Polypeptids, das es kodiert, werden im hieran angefügten Sequenzprotokoll bereitgestellt.
Die DNA-Sequenz SEQ ID No: 38 kann auf einfache Weise nach beliebigen darin enthaltenen Fehlern durchmustert werden und jede Zweideutigkeit bezüglich der Sequenz kann durch Resequenzierung beider Stränge eines Fragments, das solche Fehler oder Zweideutigkeiten enthält, aufgelöst werden. Solche Fragmente können aus den Plasmiden, die im Labor der Erfinder gelagert sind, erhalten werden oder können unter Verwendung der hierin beschriebenen Techniken isoliert werden. Die Auflösung jeglicher derartiger Zweideutigkeiten oder Fehler kann durch Verwendung von Primern erleichtert werden, die an Sequenzen hybridisieren, die nahe der zweideutigen oder fehlerhaften Sequenzen lokalisiert sind. Beispielsweise können die Primer an Sequenzen innerhalb von 50-75 Basen im Bereich der Zweideutigkeit oder des Fehlers hybridisieren. Nach Auflösung eines Fehlers oder einer Zweideutigkeit können in der Proteinsequenz, die durch die DNA kodiert wird, die den Fehler oder die Zweideutigkeit enthält, entsprechende Korrekturen vorgenommen werden.
Zusätzlich zur Kategorisierung der 5'-ESTs können im Hinblick auf ihr Ursprungsgewebe sowohl die räumlichen und zeitlichen Expressionsmuster der mRNAs, die mit den 5'-ESTs korrespondieren, als auch ihre Expressionsmengen, bestimmt werden, wie es in Beispiel 26 weiter unten beschrieben wird. Die Charakterisierung der räumlichen und zeitlichen Expressionsmuster und Expressionsmengen dieser mRNAs ist bei der Konzeption von Expressionsvektoren nützlich, die in räumlich oder zeitabhängig gewünschter Weise zur Herstellung einer gewünschten Menge eines Genprodukts in der Lage sind, und wird weiter unten ausführlicher diskutiert.
Darüber hinaus können auch 5'-ESTs, deren korrespondierende mRNAs mit einem Erkrankungszustand verbunden sind, identifiziert werden. Beispielsweise kann eine bestimmte Krankheit aus einem Expressionsmangel, Überexpression oder Unterexpression einer mRNA, die mit einem 5'-EST korrespondiert, herrühren. Durch Vergleich der mRNA-Expressionsmuster und -mengen in Proben, die von gesunden Individuen entnommen wurden, mit Proben von Individuen, die unter einer bestimmten Krankheit leiden, können für diese Krankheit verantwortliche 5'-ESTs identifiziert werden.
Es wird erkannt, dass die Ergebnisse der obigen Charakterisierungsverfahren für 5'-ESTs auch auf erweiterte cDNAs (die wie weiter unten beschrieben erhalten werden können) angewendet werden können, die Sequenzen enthalten, die zu den 5'-ESTs benachbart sind. Es wird auch erkannt, dass anstelle die ESTs selbst zu charakterisieren die Charakterisierung aufgeschoben werden kann, bis erweiterte cDNAs erhalten worden sind.
BEISPIEL 26
Bewertung von Exgressionsmengen und -mustern von mRNAs, die mit 5'-ESTs oder erweiterten cDNAs korrespondieren
Expressionsmengen und -muster von mRNAs, die mit 5'-ESTs oder erweiterten cDNAs (die wie weiter unten in Beispiel 27 beschrieben erhältlich sind) korrespondieren, können durch Hybridisierung in Lösung mit langen Sonden analysiert werden, wie es in der internationalen Patentanmeldung Nr. WO 97/05277 beschrieben wird. In Kürze, ein 5'-EST, eine erweiterte cDNA oder ein Fragment davon welche mit dem Gen korrespondieren, das die zu charakterisierende mRNA kodiert, wird in eine Klonierungsstelle unmittelbar stromabwärts von einem Bakteriophagen (T3, T7 oder SP6) RNA-Polymerasepromotor insertiert, um Antisense RNA zu erzeugen. Vorzugsweise weist das 5'-EST oder die erweiterte cDNA 100 oder mehr Nukleotide auf. Das Plasmid wird linearisiert und in Gegenwart von Ribonukleotiden transkribiert, die modifizierte Ribonukleotide (d.h. Biotin-UTP und DIG-UTP) umfassen. Ein Überschuss dieser doppelt markierten RNA wird in Lösung mit mRNA hybridisiert, die aus Zellen oder Gewebe von Interesse isoliert wurde. Die Hybridisierungen wurden unter stringenten Standardbedingungen durchgeführt (40-50°C für 16 Stunden in 80% Formamid, 0,4 M NaCl-Puffer, pH 7-8). Die nicht hybridisierte Sonde wird durch Verdau mit Ribonukleasen, die für einzelsträngige RNA spezifisch sind (d.h. RNasen CL3, TI, Phy M, U2 oder A), entfernt. Das Vorliegen der Biotin-UTP-Modifikation ermöglicht das Einfangen des Hybrids auf einer mit Streptavidin beschichteten Mikrotitrationsplatte. Das Vorliegen der DIG-Modifikation ermöglicht es, das Hybrid zu detektieren und unter Verwendung eines anti-DIG-Antikörpers, der mit alkalischer Phosphatase gekoppelt ist, mittels ELISA zu quantifizieren.
Die 5'-ESTs, erweiterten cDNAs oder Fragmente davon können für eine serielle Analyse der Genexpression (SAGE) auch mit Nukleotidsequenz-Tags versehen werden, wie es in der UK-Patentanmeldung No. 2 305 241 A beschrieben wird. In diesem Verfahren werden cDNAs aus einer Zelle, aus Gewebe, aus einem Organismus oder einer anderen Nukleinsäurequelle, für welche die Genexpressionsmuster bestimmt werden müssen, hergestellt. Die sich ergebenden cDNAs werden in zwei Pools aufgeteilt. In jedem Pool werden die cDNAs mit einer ersten Restriktionsendonuklease gespalten, die als Anchoring-Enzym bezeichnet wird und die eine Erkennungsstelle aufweist, für die es wahrscheinlich ist, dass sie in den meisten cDNAs wenigstens einmal vorkommt. Die Fragmente, die den 5'- oder 3'-Hauptabschnitt der gespaltenen cDNA enthalten, werden durch Binden an ein Einfangmedium, wie beispielsweise Streptavidin beschichtete Beads, isoliert. Ein erster Oligonukleotidlinker mit einer ersten Sequenz zur Hybridisierung an einen Amplifizierungsprimer und einer internen Restriktionsstelle für eine so genannte Tagging-Endonuklease wird an die verdauten cDNAs im ersten Pool ligiert. Ein Verdau mit der zweiten Endonuklease erzeugt kurze Tagfragmente aus den cDNAs.
Ein zweites Oligonukleotid mit einer zweiten Sequenz zur Hybridisierung eines Amplifikationsprimers und einer internen Restriktionsstelle wird mit den verdauten cDNAs im zweiten Pool ligiert. Die cDNA-Fragmente im zweiten Pool werden auch mit der Tagging-Endonuklease verdaut, um kurze Tagfragmente zu erzeugen, die von den cDNAs im zweiten Pool abgeleitet sind. Die Tags, die sich aus dem Verdau des ersten und zweiten Pools mit dem Anchoring-Enzym und der Tagging-Endonuklease ergeben, werden miteinander ligiert, um so genannte Ditags zu bilden. In einigen Ausführungsformen werden die Ditags hinter einander angeordnet (concatamerized), um Ligationsprodukte zu erzeugen, die 2 bis 200 Ditags enthalten. Anschließend werden die Tag-Sequenzen bestimmt und mit den Sequenzen der 5'-ESTs oder erweiterten cDNAs verglichen, um zu bestimmen, welche 5'-ESTs oder erweiterten cDNAs in der Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle, von denen die Tags abgeleitet waren, exprimiert werden. Auf diese Weise wird das Expressionsmuster der 5'-ESTs oder erweiterten cDNAs in der Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle erhalten.
Eine quantitative Analyse der Genexpression kann auch unter Verwendung von Arrays durchgeführt werden. Wie hierin verwendet, bezeichnet der Ausdruck Array eine eindimensionale, zweidimensionale oder multidimensionale Anordnung von Volllängen-cDNAs (z.B. erweiterte cDNAs, welche die kodierende Sequenz für das Signalpeptid, die kodierende Sequenz für das reife Protein und ein Stopkodon umfassen), erweiterten cDNAs, 5'-ESTs oder Fragmenten davon, die eine ausreichende Länge aufweisen, um eine spezifische Detektion der Genexpression zu ermöglichen. Vorzugsweise sind die Fragmente wenigstens 15 Nukleotide lang. Stärker bevorzugt sind die Fragmente wenigstens 100 Nukleotide lang, stärker bevorzugt sind die Fragmente mehr als 100 Nukleotide lang. In einigen Ausführungsformen können die Fragmente mehr als 500 Nukleotide lang sein.
Eine quantitative Analyse der Genexpression kann beispielsweise wie unten beschrieben mit Volllängen-cDNAs, erweiterten cDNAs, 5'-ESTs oder Fragmenten davon in einem Komplementär-DNA-Mikroarray durchgeführt werden, wie er von Schena et al. (Science 270:467-470, 1995; Proc. Natl. Acad. Sci. U.S.A. 93:10614-10619, 1996) beschrieben wird. Volllängen-cDNAs, erweiterte cDNAs, 5'-ESTs oder Fragmente davon werden durch PCR amplifiziert und aus 96 Well-Mikrotiterplatten auf silylierte Mikroskopdeckgläser unter Verwendung von Hochgeschwindigkeitsrobotertechnik angeordnet. Gedruckte (printed) Arrays werden in einer Feuchtigkeitskammer inkubiert, um eine Rehydrierung des Arrayelements zu ermöglichen und einmal in 0,2% SDS für 1 min, zweimal in Wasser für 1 min und einmal für 5 min in Natriumborhydridlösung gespült. Die Arrays werden in Wasser für 2 min bei 95°C eingetaucht, für 1 min in 0,2% SDS überführt, zweimal mit Wasser gespült, luftgetrocknet und in der Dunkelheit bei 25°C gelagert.
Zell- oder Gewebe-mRNA wird isoliert oder kommerziell bezogen und Sonden werden durch eine einzelne Runde reverser Transkription hergestellt. Die Sonden werden auf 1 cm² Mikroarrays unter einem 14 × 14 Deckglas aus Glas für 6-12 Stunden bei 60°C hybridisiert. Die Arrays werden für 5 min bei 25°C in Waschpuffer mit schwacher Stringenz (1 × SSC/0,2% SDS) und anschließend für 10 min bei Raumtemperatur in Waschpuffer mit hoher Stringenz (0,1 × SSC/0,2 SDS) gewaschen. Die Arrays werden in 0,1 × SSC unter Verwendung einer Fluoreszenzlaser-Scanningvorrichtung, die mit einem maßgeschneiderten Filterset ausgestattet ist, gescannt. Durch Bilden des Durchschnitts für die Verhältnisse von zwei unabhängigen Hybridisierungen werden genaue differentielle Expressionsmessungen erhalten.
Eine quantitative Analyse der Expression von Genen kann auch mit Volllängen-cDNAs, erweiterten cDNAs, 5'-ESTs oder Fragmenten davon in Komplementär-DNA-Arrays durchgeführt werden, wie es von Pietu et al. (Genome Research 6:492-503, 1996) beschrieben wird. Die Volllängen-cDNAs, erweiterten cDNAs, 5'-ESTs oder Fragmente davon werden durch PCR amplifiziert und auf Membranen punktförmig aufgetragen. Anschließend werden mRNAs, die aus verschiedenen Geweben oder Zellen stammen, mit radioaktiven Nukleotiden markiert. Nach der Hybridisierung und Waschen unter kontrollierten Bedingungen werden die hybridisierten mRNAs durch Phospho-Imaging oder Autoradiographie detektiert. Die Experimente werden zweifach ausgeführt und anschließend wird eine quantitative Analyse differentiell exprimierter mRNAs durchgeführt.
Alternativ kann die Expressionsanalyse der 5'-ESTs oder erweiterten cDNAs über Nukleotidarrays mit hoher Dichte durchgeführt werden, wie es von Lockhart et al. (Nature Biotechnology 14: 1675-1680, 1996) und Sosnowsky et al. (Proc. Natl. Acad. Sci. 94:1119-1123, 1997) beschrieben wird. Oligonukleotide mit 15-50 Nukleotiden, die mit den Sequenzen der 5'-ESTs oder erweiterten cDNAs korrespondieren, werden direkt auf dem Chip synthetisiert (Lockhard et al., supra) oder synthetisiert und anschließend an den Chip adressiert (Sosnowsky et al., supra). Vorzugsweise sind die Oligonukleotide etwa 20 Nukleotide lang.
Die cDNA-Sonden, die mit einer geeigneten Verbindung, wie beispielsweise Biotin, Digoxigenin oder einem fluoreszierenden Farbstoff markiert sind, werden aus der geeigneten mRNA-Population synthetisiert und anschließend auf Zufallsbasis zu einer Durchschnittsgröße von 50-100 Nukleotiden fragmentiert. Die Sonden werden anschließend auf dem Chip hybridisiert. Nach Waschen, wie es in Lockhard et al., supra, beschrieben wird, und Anlegen verschiedener elektrischer Felder (Sonowsky et al., supra) werden die Farbstoffe oder markierten Verbindungen detektiert und quantifiziert. Die Hybridisierungen werden zweifach durchgeführt. Eine vergleichende Analyse der Signalintensitäten, die von cDNA-Sonden auf demselben Zieloligonukleotid in verschiedenen cDNA-Proben stammen, zeigt eine differentielle Expression der mRNA, die mit dem 5'-EST oder der erweiterten cDNA korrespondiert, woraus die Oligonukleotidsequenz konzipiert wurde.
III. Verwendung von 5'-ESTs zur Klonierung erweiterter cDNAs sowie zur Klonierung entsprechender genomischer DNAs
Nachdem 5'-ESTs, die das 5'-Ende der entsprechenden mRNAs enthalten, unter Verwendung der oben beschriebenen Verfahren selektiert wurden, können sie verwendet werden, um erweiterte cDNAs zu isolieren, die Sequenzen enthalten, die zu den 5'-ESTs benachbart sind. Die erweiterten cDNAs können die vollständige kodierende Sequenz des Proteins enthalten, das durch die korrespondierende mRNA kodiert wird, einschließlich der authentischen Translationsstartstelle, der Signalsequenz und der Sequenz, die das reife Protein kodiert, das zurückbleibt, nachdem das Signalpeptid abgespalten wurde. Solche erweiterten cDNAs werden hierin als „Volllängen-cDNAs" bezeichnet. Alternativ können die erweiterten cDNAs nur die Sequenz enthalten, die das reife Protein kodiert, das zurückbleibt, nachdem das Signalpeptid abgespalten wurde, oder nur die Sequenz, die das Signalpeptid kodiert.
Beispiel 27 beschreibt weiter unten ein allgemeines Verfahren zum Erlangen erweiterter cDNAs unter Verwendung von 5'-ESTs. Beispiel 28 stellt unter Verwendung des in Beispiel 27 beschriebenen Verfahrens experimentelle Ergebnisse zur Verfügung, die einige erweiterte cDNAs beschreiben, einschließlich der vollständig kodierenden Sequenz und des authentischen 5'-Endes der korrespondierenden mRNA für einige sekretierte Proteine.
Die Verfahren gemäß der Beispiele 27, 28 und 29 können auch verwendet werden, um erweiterte cDNAs zu erhalten, die weniger als die vollständige kodierende Sequenz der sekretierten Proteine kodieren, die durch die Gene, die mit den 5'-ESTs korrespondieren, kodiert werden. In einigen Ausführungsformen kodieren die gemäß diesem Verfahren isolierten cDNAs wenigstens 10 Aminosäuren des Proteins, das durch die Sequenz gemäß SEQ ID No: 38 kodiert wird. In weiteren Ausführungsformen kodieren die erweiterten cDNAs wenigstens 20 Aminosäuren des Proteins, das durch die Sequenz gemäß SEQ ID No: 38 kodiert wird. In weiteren Ausführungsformen kodieren die erweiterten cDNAs wenigstens 30 Aminosäuren der Sequenz gemäß SEQ ID No: 38. In einer bevorzugten Ausführungsform kodieren die erweiterten cDNAs eine Volllängen-Proteinsequenz, die die Protein kodierende Sequenz gemäß SEQ ID No: 38 umfasst.
BEISPIEL 27
Allgemeines Verfahren zur Verwendung von 5'-ESTs zur Klonierung und Seguenzierung von cDNAs. die die vollständige kodierende Region und das authentische 5'-Ende der korrespondierenden mRNA umfassen
Das folgende allgemeine Verfahren wurde verwendet, um erweiterte cDNAs schnell und effizient zu isolieren, die sowohl die authentischen 5'-Enden ihrer korrespondierenden mRNAs als auch die das vollständige Protein kodierende Sequenz aufweisen und die Sequenz umfassen, die neben den Sequenzen der 5'-ESTs liegt, die verwendet wurde um diese zu erhalten. Dieses Verfahren kann auf erweiterte cDNAs für ein beliebiges 5'-EST in der NetGene^TM-Datenbank angewandt werden, einschließlich solcher 5'-ESTs, die Polypeptide kodieren, die zu sekretierten Proteinen gehören. Dieses Verfahren ist in 3 zusammengefasst.
I. Erlangen erweiterter cDNAs
a) Erststrangsynthese
Dieses Verfahren zieht seinen Vorteil aus der bekannten 5'-mRNA Sequenz. Eine reverse Transkriptionsreaktion wird an gereinigter mRNA mit einem Poly 14dT-Primer durchgeführt, der eine 49 Nukleotidsequenz an seinem 5'-Ende enthält, wobei die Reaktion die Addition einer bekannten Sequenz an das Ende der cDNA ermöglicht, die mit dem 3'-Ende der mRNA korrespondiert. Beispielsweise kann der Primer die folgende Sequenz aufweisen: 5'-ATC GTT GAG ACT CGT ACC AGC AGA GTC ACG AGA GAG ACT ACA CGG TAC TGG TTT TTT TTT TTT TTVN-3' (SEQ ID NO: 14). Der Fachmann erkennt, dass auch andere Sequenzen an die Poly dT-Sequenz addiert und verwendet werden können, um die Erststrangsynthese zu starten (to prime). Unter Verwendung dieses Primers und einer Reversen Transkriptase, wie beispielsweise dem Superscript II-Enzym (Gibco BRL) oder dem Rnase H Minus M-MLV-Enzym (Promega), wird ein reverses Transkript erzeugt, das an der 3'-PolyA-Stelle der RNAs verankert ist.
Nach Entfernung der an den cDNA-Erststrang hybridisierten mRNA durch alkalische Hydrolyse, werden die Produkte der alkalischen Hydrolyse und der verbleibende Poly dT-Primer durch eine Ausschluss-Säule, wie beispielsweise eine AcA34 (Biosepra) Matrix, entfernt, wie es in Beispiel 11 erläutert wird.
b) Zweitstrangsynthese
An jedem Ende wird auf Grundlage der bekannten 5'-Sequenz des 5'-ESTs und des bekannten 3'-Endes, das durch den während der Erststrangsynthese verwendeten Poly dT-Primer hinzugefügt wurde, ein Paar von Nested-Primern (verschachtelten Primern) konzipiert. Softwareprogramme, die zur Konzeption von Primern verwendet werden, basieren entweder auf dem GC-Gehalt und den Schmelztemperaturen von Oligonukleotiden, wie beispielsweise OSP (Illier und Green, PCR Meth. Appl. 1:124-128, 1991), oder beruhen auf dem Oktamerhäufigkeits-Disparitätsverfahren (octamer frequency disparity method) (Griffais et al., Nucleic Acids Res. 19:3887-3891, 1991), wie beispielsweise PC-Rare (http://bioinformatics.weizmann.ac.il/software/PC-Rare/doc/manuel.html).
Vorzugsweise sind die Nested-Primer am 5'-Ende durch vier bis neun Basen voneinander getrennt. Die 5'-Primersequenzen können im Hinblick darauf ausgewählt werden, dass sie Schmelztemperaturen und Spezifitäten aufweisen, die zur Verwendung in PCR-Reaktionen geeignet sind.
Vorzugsweise sind die Nested-Primer am 3'-Ende durch vier bis neun Basen voneinander getrennt. Beispielsweise können die Nested-3'-Primer die folgenden Sequenzen aufweisen: (5'-CCA GCA GAG TCA CGA GAG AGA CTA CAC GG-3' (SEQ ID NO: 15) und 5'-CAC GAG AGA GAC TAC ACG GTA CTG G-3' (SEQ ID NO: 16). Diese Primer wurden ausgewählt, da sie Schmelztemperaturen und Spezifitäten aufweisen, die mit ihrer Verwendung in PCR-Reaktionen kompatibel sind. Der Fachmann erkennt jedoch, dass auch andere Sequenzen als Primer verwendet werden können.
Der erste PCR-Lauf mit 25 Zyklen wird unter Verwendung des Advantage Tth Polymerase Mix (Clontech) und dem äußeren Primer von jedem der Nested-Paare durchgeführt. Anschließend wird eine PCR-Reaktion mit 20 Zyklen unter Verwendung desselben Enzyms und dem inneren Primer von jedem der Nested-Paare mit 1/2500 des ersten PCR-Produkts durchgeführt. Danach werden die Primer und Nukleotide entfernt.
2. Seguenzierung von erweiterten cDNAs mit voller Länge oder Fragmenten davon
Aufgrund des Fehlens von Positionsbeschränkungen bei der Konzeption der zur PCR-Verwendung geeigneten 5'-Nested-Primer werden unter Verwendung der OSP-Software zwei Typen von Amplicons erhalten. Vorzugsweise ist der zweite 5'-Primer stromaufwärts vom Translationsinitationskodon lokalisiert und ergibt so ein Nested-PCR-Produkt, das die vollständige kodierende Sequenz enthält. Eine derartige erweiterten cDNA mit voller Länge wird direkt einem Klonierungsverfahren unterzogen, wie es in Abschnitt a beschreiben ist. In einigen Fällen ist der zweite 5'-Primer jedoch stromabwärts vom Translationsinitationskodon lokalisiert und führt so zu einem PCR-Produkt, das nur einen Teil des ORF enthält. Derartige unvollständige PCR-Produkte werden einem modifiziertem Verfahren, das in Abschnitt b beschrieben wird, unterzogen.
a) Nested PCR-Produkte, die vollständige ORFs enthalten
Wenn das sich ergebende Nested PCR-Produkt die vollständige kodierende Sequenz enthält, wie es aus der 5'-EST-Sequenz vorhergesagt ist, wird es, wie es in Abschnitt 3 beschrieben wird, in einen geeigneten Vektor kloniert, wie beispielsweise pED6depc2.
b) Nested PCR-Produkte, die unvollständige ORFs enthalten
Wenn das Amplicon nicht die vollständige kodierende Sequenz enthält, sind Zwischenschritte notwendig, um sowohl die vollständige kodierende Sequenz als auch ein PCR-Produkt, das die vollständige kodierende Sequenz enthält, zu erhalten. Die vollständige kodierende Sequenz kann aus mehreren Teilsequenzen zusammengesetzt werden, die aus verschiedenen PCR-Produkten direkt bestimmt werden, wie es im folgenden Abschnitt beschrieben wird.
Nachdem die vollständige kodierende Sequenz vollständig bestimmt worden ist, werden neue Primer, die zur PCR-Verwendung kompatibel sind, konzipiert, um Amplicons zu erhalten, die die vollständige kodierende Region umfassen. In solchen Fällen sind jedoch zur PCR-Verwendung kompatible 3'-Primer innerhalb der 3'UTR der korrespondierenden mRNA lokalisiert und führen so zu Amplicons, denen ein Teil dieser Region fehlt, z.B. der PolyA-Strang und manchmal das Polyadenylierungssignal, wie es in 3 dargestellt ist. Solche erweiterten cDNAs mit voller Länge werden wie in Abschnitt 3 beschrieben anschließend in einen geeigneten Vektor kloniert.
c) Sequenzierung erweiterter cDNAs
Die Sequenzierung erweiterter cDNAs wird unter Verwendung eines Die Terminator Ansatzes mit dem AmpliTaq-DNA-Polymerase FS Kit, der von Perkin Elmer erhältlich ist, durchgeführt.
Um die PCR-Fragmente zu sequenzieren wird Primerwandern (primer walking) durchgeführt, wobei zur Auswahl der Primer Software, wie beispielsweise OSP, verwendet wird und zur Konstruktion von Contigs der Wandersequenzen (walking sequences), automatisierte Computersoftware, wie beispielsweise ASMG (Sutton et al., Genome Science Technol. 1:9-19, 1995) verwendet wird, wobei einschließlich des 5'-Tags am Start minimale Überlappungen von 32 Nukleotiden verwendet werden Vorzugsweise wird das Primerwandern solange durchgeführt, bis die Sequenzen der Volllängen-cDNAs erhalten werden.
Der Abschluss der Sequenzierung eines gegebenen erweiterten cDNA-Fragments wird wie im Folgenden beschrieben festgestellt. Da die Sequenzen, die nach dem PolyA-Strang lokalisiert sind, im Falle nicht klonierter Produkte nur schwer genau zu bestimmen sind, werden die Verfahren zur Sequenzierung und des Primerwanderns für PCR-Produkte unterbrochen, wenn ein PolyA-Strang in erweiterten cDNAs identifiziert wird, wobei die cDNAs erhalten wurden, wie es unter Fall b) beschrieben wird. Die Sequenzlänge wird mit der Größe des Nested PCR-Produkts verglichen, das wie oben beschrieben erhalten wurde. Aufgrund der beschränkten Genauigkeit der Bestimmung der PCR-Produktgröße durch Gelelektrophorese wird eine Sequenz dann als vollständig angesehen, wenn die Größe der erhaltenen Sequenz wenigstens 70% der Größe des ersten Nested PCR-Produkts beträgt. Wenn die Länge der durch Computeranalyse bestimmten Sequenz nicht wenigstens 70% der Länge des Nested PCR-Produkts beträgt, werden diese PCR-Produkte kloniert und die Sequenz der Insertion wird bestimmt. Wenn Northern Blot-Daten zur Verfügung stehen, wird die Größe der mRNA, die für ein gegebenes PCR-Produkt detektiert wurde, verwendet, um abschließend zu bewerten, ob die Sequenz vollständig ist. Sequenzen, die die obigen Kriterien nicht erfüllen, werden verworfen und einem neuen Isolierungsverfahren unterzogen.
Die Sequenzdaten aller erweiterten cDNAs werden anschließend auf eine proprietäre Datenbank überführt, wo Schritte zur Qualitätskontrolle und Validierung durchgeführt werden wie es in Beispiel 15 beschrieben wird.
3. Klonierung von erweiterten cDNAs mit voller Länge
Das die vollständige kodierende Sequenz enthaltende PCR-Produkt wird anschließend in einen geeigneten Vektor kloniert. Beispielsweise können die erweiterten cDNAs in den Expressionsvektor pED6dpc2 (DiscoverEase, Genetics Institute, Cambridge, MA) wie folgt kloniert werden. Die pED6dpc2-Vektor-DNA wird durch Durchführen eines EcoRI-Verdaus woran sich eine Auffüllreaktion anschließt mit glatten Enden bereitgestellt. Der Vektor mit glatten Enden wird dephosphoryliert. Nach Entfernung der PCR-Primer und Ethanolpräzipitation wird das PCR-Produkt, das die vollständige kodierende Sequenz oder die erweiterte cDNA wie oben beschrieben enthält, mit einer Kinase phosphoryliert, die anschließend durch Phenol-Sevag-Extraktion und Präzipitierung entfernt wird. Die doppelsträngige erweiterte cDNA wird anschließend in den Vektor ligiert und das sich ergebende Expressionsplasmid wird in geeignete Wirtszellen eingeführt.
Da die wie oben beschrieben erhaltenen PCR-Produkte Moleküle mit glatten Enden sind, die in beiden Richtungen kloniert werden können, wird für jedes PCR-Produkt die Orientierung mehrerer Klone bestimmt. Anschließend werden 4 bis 10 Klone in Mikrotiterplatten angeordnet und einer PCR-Reaktion unterzogen, wobei ein erster Primer verwendet wird, der nahe der Klonierungsstelle im Vektor lokalisiert ist, und ein zweiter Primer verwendet wird, der in dem Abschnitt der erweiterten cDNA lokalisiert ist, der mit dem 3'-Ende der mRNA korrespondiert. Dieser zweite Primer kann im Fall von direkter Klonierung (Fall a) der Antisense Primer sein, der in der Anchored-PCR-Reaktion verwendet wurde, oder im Fall indirekter Klonierung (Fall b) der Antisense Primer, der innerhalb der 3'UTR lokalisiert ist. Klone, in welchen das Startkodon der erweiterten cDNA operativ mit dem Promotor im Vektor verknüpft sind, um so die Expression des durch die erweiterte cDNA kodierten Proteins zu ermöglichen, werden aufbewahrt und sequenziert. Zusätzlich zu den Enden der cDNA-Inserts werden auch etwa 50 bp Vektor-DNA auf jeder Seite des cDNA-Inserts sequenziert.
Die klonierten PCR-Produkte werden anschließend gemäß dem zuvor beschriebenen Verfahren vollständig sequenziert. In diesem Fall wird anschließend eine Anordnung langer Fragmente zu Contigs (contigation) hinsichtlich von Wandersequenzen durchgeführt, die bereits für nicht klonierte PCR-Produkte während des Primerwanderns contigiert worden waren. Die Sequenzierung klonierter Amplicons ist abgeschlossen, wenn die sich ergebenden Contigs sowohl die vollständige kodierende Region als auch überlappende Sequenzen mit Vektor-DNA an beiden Enden umfassen.
4. Computeranalyse von erweiterter cDNA mit voller Länge
Sequenzen von erweiterten cDNAs mit voller Länge werden, wie weiter unten beschrieben, einer weiteren Analyse unterzogen. Bevor die erweiterten cDNAs mit voller Länge nach Sequenzen von Interesse durchsucht werden, werden erweiterte cDNAs, die nicht von Interesse sind (Vektor-RNAs, Transfer-RNAs, ribosomale RNAs, mitochondrielle RNAs, prokaryotische RNAs und RNAs aus Pilzen), unter Verwendung von Verfahren, die im wesentlichen ähnlich zu denen sind, die für 5'-ESTs in Beispiel 18 beschrieben wurden, verworfen.
a) Identifizierung struktureller Merkmale
Strukturelle Merkmale, z.B. PolyA-Schwanz und Polyadenylierungssignal, der Sequenzen der erweiterten cDNAs mit voller Länge werden anschließend wie im Folgenden beschrieben bestimmt.
Ein PolyA-Schwanz ist als homopolymerer Abschnitt von wenigstens 11 As mit höchstens einer alternativen Base darin definiert. Die Suche nach einem PolyA-Schwanz ist auf die letzten 100 Nt der Sequenz begrenzt und auf Abschnitte mit 11 aufeinander folgenden As beschränkt, da Sequenzierungsreaktionen nach einem solchen PolyA-Abschnitt oft nicht lesbar sind. Abschnitte mit mehr als 90 Homologie über 8 Nukleotide hinweg werden unter Verwendung von BLAST2N als PolyA-Schwänze identifiziert.
Um nach einem Polyadenylierungssignal zu suchen, wird der PolyA-Schwanz von der Volllängensequenz abgetrennt. Die 50 bp, die dem PolyA-Schwanz vorausgehen, werden als erstes nach dem kanonischen Polyadenylierungssignal AAUAAA durchsucht und wenn das kanonische Signal nicht detektier wird, werden sie nach dem alternativen AUUAAA-Signal durchsucht (Sheets et al., Nuc. Acids Res. 18:5799-5805, 1990). Wenn keines dieser beiden Konsensus-Polyadenylierungssignale nachgewiesen wird, wird das kanonische Motiv erneut durchsucht, wobei eine Nichtübereinstimmung zugelassen wird, um möglichen Sequenzierungsfehlern Rechnung zu tragen. Mehr als 85% der identifizierten Polyadenylierungssignale beider Typen enden tatsächlich 10 bis 30 bp vom PolyA-Schwanz entfernt. Die alternativen AUUAAA-Signale stelen etwa 15% der Gesamtzahl der identifizierten Polyadenylierungssignale dar.
b) Identifizierung funktioneller Merkmale
Funktionelle Merkmale, z.B. ORFs und Signalsequenzen, der Sequenzen der erweiterten cDNAs mit voller Länge wurden anschließend bestimmt wie es im Folgenden beschrieben wird.
Die 3 Leserahmen im oberen Strang erweiterter cDNAs werden nach ORFs durchsucht, die als die Fragmente mit maximaler Länge definiert sind, die mit einem Translationsinitatinoskodon beginnen und mit einem Stopkodon enden. ORFs, die wenigstens 20 Aminosäuren kodieren, sind bevorzugt.
Jeder nachgewiesene ORF wird anschließend auf das Vorliegen eines Signalpeptids in den ersten 50 Aminosäuren oder wo angebracht ist in kürzeren Regionen bis hin zu 20 Aminosäuren oder weniger im ORF unter Verwendung des Matrixverfahrens nach von Heijne (Nuc. Acids Res. 14:4683-4690, 1986) durchsucht, wie es in Beispiel 22 beschrieben wird.
c) Homologie zu Nukleotid- oder Proteinsequenzen
Eine Kategorisierung von Volllängen-Sequenzen kann unter Verwendung von Verfahren, die im Wesentlichen zu denjenigen ähnlich sind, die in Beispiel 24 für 5'-ESTs beschrieben wurden, erreicht werden.
Erweiterte cDNAs, die wie oben beschrieben hergestellt wurden, können anschließend bearbeitet werden, um Nukleinsäuren zu erhalten, die gewünschte Abschnitte der erweiterten cDNA umfassen, wobei herkömmliche Techniken, wie beispielsweise Subklonierung, PCR oder in vitro-Oligonukleotidsynthese verwendet werden. Beispielsweise können Nukleinsäuren, die nur die vollständig kodierenden Sequenzen umfassen (d.h. die Sequenzen, die das Signalpeptid und das reife Protein kodieren, das zurückbleibt, nachdem das Signalpeptid abgespalten worden ist), unter Verwendung von dem Fachmann bekannten Techniken erhalten werden. Alternativ können herkömmliche Techniken verwendet werden, um Nukleinsäuren zu erhalten, die nur die kodierenden Sequenzen für das reife Protein enthalten, das zurückbleibt, wenn das Signalpeptid abgespalten wurde, oder um Nukleinsäuren zu erhalten, die nur die für die Signalpeptide kodierenden Sequenzen enthalten.
In gleicher Weise können Nukleinsäuren, die einen anderen beliebigen Abschnitt der für das sekretierte Protein kodierenden Sequenzen enthalten, erhalten werden. Beispielsweise kann die Nukleinsäure wenigstens 10 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise eine der hierin weiter unten beschriebenen erweiterten cDNAs. In einer anderen Ausführungsform kann die Nukleinsäure wenigstens 15 aufeinander folgende Basen einer erweiterten cDNA, enthalten, wie beispielsweise einer der weiter unten beschriebenen erweiterten cDNAs. Alternativ kann die Nukleinsäure wenigstens 20 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise einer der weiter unten beschriebenen erweiterten cDNAs. In einer anderen Ausführungsform kann die Nukleinsäure wenigstens 25 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise einer der weiter unten beschriebenen erweiterten cDNAs. In noch einer anderen Ausführungsform kann die Nukleinsäure wenigstens 40 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise einer der weiter unten beschriebenen erweiterten cDNAs.
Nachdem eine erweiterte cDNA erhalten wurde, kann sie sequenziert werden, um die Aminosäuresequenz zu bestimmen, die sie kodiert. Nachdem die kodierte Aminosäuresequenz einmal bestimmt worden ist, kann jede der vielen denkbaren cDNAs, die das Protein kodieren, durch einfache Anwendung der Degeneration des genetischen Codes erzeugt und identifiziert werden. Beispielsweise können allelische Varianten und andere homologe Nukleinsäuren, wie weiter unten beschrieben, identifiziert werden. Alternativ können die Nukleinsäuren, die die gewünschte Aminosäuresequenz kodieren, in vitro synthetisiert werden.
In einer bevorzugten Ausführungsform kann die kodierende Sequenz unter Verwendung der bekannten Kodon- und Kodonpaar-Preferenzen des Wirtsorganismus, in dem die cDNA exprimiert werden soll, ausgewählt werden.
Die aus den hierin beschriebenen 5'-ESTs abgeleiteten erweiterten cDNAs wurden wie in Beispiel 28 weiter unten beschrieben erhalten.
BEISPIEL 28
Charakterisierung klonierter erweiterter cDNAs, die unter Verwendung von 5'-ESTs erhalten wurden
Das oben in Beispiel 27 beschriebene Verfahren wurden verwendet, um die erweiterten cDNAs, die von den hierin beschriebenen 5'-ESTs für eine Vielfalt von Geweben abgeleitet wurden, zu erhalten. Die folgende Liste stellt einige Beispiele der so erhaltenen erweiterten cDNAs zusammen.
Unter Verwendung dieses Ansatzes wurde die Volllängen-cDNA gemäß SEQ ID NO: 17 erhalten (interne Identifizierungsnummer 48-19-3-G1-FL1). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und kodiert das Signalpeptid MKKVLLLITAILAVAVG (SEQ ID NO: 18) mit einem von Heijne-Score von 8.2.
Die Volllängen-cDNA gemäß SEQ ID NO: 19 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten (interne Identifizierungsnummer 58-34-2-E7-FL2). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und kodiert das Signalpeptid MWWFQQGLSFLPSALVIWTSA (SEQ ID NO: 20) mit einem von Heijne-Score von 5.5.
Eine andere unter Verwendung des oben beschriebenen Verfahrens erhaltene Volllängen-cDNA weist die Sequenz gemäß SEQ ID NO: 21 auf (interne Identifizierungsnummer 51-27-1-E8-FL1). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und kodiert das Signalpeptid MVLTTLPSANSANSPVNMPTTGPNSLSYASSALSPCLT (SEQ ID NO: 22) mit einem von Heijne-Score von 5.9.
Das obige Verfahren wurde ebenfalls verwendet, um eine Volllängen-cDNA mit der Sequenz gemäß SEQ ID NO: 23 zu erhalten (interne Identifizierungsnummer 76-4-1-G5-FL1). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und kodiert das Signalpeptid ILSTVTALTFAXA (SEQ ID NO: 24) mit einem von Heijne-Score von 5.5.
Die Volllängen-cDNA gemäß SEQ ID NO: 25 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten (interne Identifizierungsnummer 51-3-3-B10-FL3). Diese cDNA fällt in die oben beschriebene Kategorie „neu" und kodiert ein Signalpeptid LVLTLCTLPLAVA (SEQ ID NO: 26) mit einem von Heijne-Score von 10.1.
Die Volllängen-cDNA gemäß SEQ ID NO: 27 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten (interne Identifizierungsnummer 58-35-2-F10-FL2). Diese cDNA fällt in die oben beschriebene Kategorie „neu" und kodiert ein Signalpeptid LWLLFFLVTAIHA (SEQ ID NO: 28) mit einem von Heijne-Score von 10.7.
Bakterienklone, die Plasmide enthalten, die die oben beschriebenen Volllängen-cDNAs enthalten, werden gegenwärtig in den Laboren des Erfinders unter den oben bereitgestellten internen Identifizierungsnummern gelagert. Die Inserts können aus den gelagerten Materialien durch Aufzucht eines Aliquots des entsprechenden Bakterienklons im geeigneten Medium gewonnen werden.
Anschließend kann die Plasmid-DNA unter Verwendung von dem Fachmann bekannten Verfahren zur Plasmidisolierung, wie beispielsweise alkalische Lyse von Minipreps oder alkalische Lyse im Großmaßstab als Verfahren zur Plasmidisolierung, isoliert werden. Wenn gewünscht, kann die Plasmid-DNA ferner mittels Zentrifugation auf einem Cäsiumchloridgradienten, Größenausschlusschromatografie oder Anionenaustauschchromatografie weiter angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden. Alternativ kann eine PCR mit Primern, die hinsichtlich beider Enden der cDNA-Insertion konzipiert sind, durchgeführt werden. Das mit der cDNA korrespondierende PCR-Produkt kann anschließend unter Verwendung von dem Fachmann vertrauten Standardklonierungstechniken manipuliert werden.
Die durch die erweiterten cDNAs kodierten Polypeptide können auf das Vorliegen bekannter struktureller oder funktioneller Motive oder auf das Vorliegen von Signaturen, kleiner Aminosäuresequenzen, die unter den Mitgliedern einer Proteinfamilie konserviert sind, durchsucht werden. Die konservierten Regionen sind verwendet worden, um Konsensusmuster oder -matrizen abzuleiten, die in der PROSITE-Datenbank erfasst sind, insbesondere die Datei Prosite.dat (Version 13.0 vom November 1995, die sich unter http://expasy.hcuge.ch/sprot/prosite.html befindet). Die Programme Prosite_convert und Prosite_scan (http://ulrec3.unil.ch/ftpserveur/prosite_scan) können verwendet werden, um Signaturen auf erweiterten cDNAs zu finden.
Für jedes Muster, das mit dem Prosite_convert Programm aus der Prosite.dat Datei erhalten wurde, kann die Fehlerfreiheit der Detektion einer neuen Proteinsequenz durch Bewertung der Häufigkeit irrelevanter Treffer im Hinblick auf die Population humaner sekretierter Proteine, die von der SWISSPROT-Datenbank umfasst sind, beurteilt werden. Das Verhältnis zwischen der Trefferzahl im Hinblick auf verschobene (shuffled) Proteine (mit einer Fenstergröße von 20 Aminosäuren) und der Trefferzahl Hinblick auf native (nicht verschobene; unshuffled) Proteine kann als Index verwendet werden. Jedes Muster, für das das Verhältnis größer als 20% ist (ein Treffer in Bezug auf verschobene Proteine gegenüber 5 Treffern in Bezug auf native Proteine) kann während der Suche mit Prosite_scan übergangen werden. Das Programm, das verwendet wurde, um Proteinsequenzen zu verschieben (db_shuffled) und das Programm, das verwendet wurde, um Statistiken für jedes Muster in den Proteindatenbanken zu bestimmen (Prosite_statistics), stehen auf der ftp-Seite http://ulrec3.unil.ch/ftpserveur/prosite_scan zur Verfügung.
Zusätzlich zu den auf PCR basierenden Verfahren zum Erlangen erweiterter cDNAs können auch traditionelle Verfahren auf Grundlage von Hybridisierung verwendet werden. Diese Verfahren können auch verwendet werden, um genomische DNAs zu erhalten, die mRNAs kodieren, von denen die 5'-ESTs abgeleitet sind, mRNAs, die mit den erweiterten cDNAs korrespondieren oder Nukleinsäuren, die zu den erweiterten cDNAs oder 5'-ESTs homolog sind. Beispiel 29 stellt weiter unten Beispiele für solche Verfahren bereit.
BEISPIEL 29
Verfahren zum Erlangen von cDNAs, die die vollständige kodierende Region und das authentische 5'-Ende der korrespondierenden mRNA umfassen
Eine Volllängen-cDNA-Bibliothek kann unter Verwendung der Strategien, die in den Beispielen 13,14,15 und 16 weiter oben beschrieben sind, durch Austausch des in Beispiel 14 verwendeten willkürlichen Nonamers mit einem Oligo-dT-Primer hergestellt werden. Beispielsweise kann das Oligonukleotid gemäß SEQ ID NO: 14 verwendet werden.
Alternativ kann eine cDNA-Bibliothek oder genomische DNA-Bibliothek von einer kommerziellen Bezugsquelle bezogen oder durch Verwendung von dem Fachmann bekannten Techniken hergestellt werden. Solche cDNA- oder genomische DNA-Bibliotheken können wie folgt verwendet werden, um erweiterte cDNAs zu isolieren, die aus einem 5'-EST oder zu den erweiterten cDNAs oder 5'-ESTs Nukleinsäurenhomologen erhalten wurden. Die cDNA-Bibliothek oder genomische DNA-Bibliothek wird mit einer detektierbaren Sonde hybridisiert, die wenigstens 10 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA umfasst, wobei herkömmliche Techniken verwendet werden. Vorzugsweise umfasst die Probe wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA. Stärker bevorzugt umfasst die Probe wenigstens 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA. In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide des 5'-ESTs oder der erweiterten cDNA.
Techniken zur Identifizierung von cDNA-Klonen in einer cDNA-Bibliothek, die an eine gegebene Sondensequenz hybridisieren, sind in Sambrook et al., Molecular Cloning: A Laboratoy Manual 2. Ausgabe, Cold Spring Harbor Laboratory Press, 1989, offenbart. Die gleichen Techniken können verwendet werden, um genomische DNA zu isolieren.
In Kürze, cDNA- oder genomische DNA-Klone, die an die detektierbare Sonde hybridisieren, werden identifiziert und zur weiteren Manipulierung wie folgt isoliert. Eine Probe, die wenigstens 10 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA umfasst, wird mit einer detektierbaren Markierung, wie beispielsweise einem Radioisotop oder einem Fluoreszenzmolekül, markiert. Die Probe umfasst vorzugsweise wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide aus dem 5'-EST oder der erweiterten cDNA. Stärker bevorzugt umfasst die Sonde 20 bis 30 aufeinander folgende Nukleotide aus dem 5'-EST oder der erweiterten cDNA. In einigen Ausführungsformen umfasst die Probe mehr als 30 Nukleotide aus dem 5'-EST oder der erweiterten cDNA.
Techniken zur Markierung der Sonde sind wohl bekannt und umfassen Phosphorylierung mit Polynukleotidkinase, Nick-Translation, in vitro-Transkription und nicht radioaktive Techniken. Die cDNAs oder genomischen DNAs in der Bibliothek werden auf Nitrocellulose- oder Nylonfilter überführt und denaturiert. Nach Blockierung unspezifischer Stellen wird der Filter mit der markierten Sonde für eine ausreichende Zeitspanne inkubiert, um das Binden der Sonde an cDNAs oder genomische DNAs, die eine Sequenz enthalten, die daran hybridisieren kann zu ermöglichen.
Durch Verändern der Stringenz der Hybridisierungsbedingungen, die verwendet werden, um erweiterte cDNAs oder genomische DNAs, die an die detektierbare Sonde hybridisieren, zu identifizieren, können erweiterte cDNAs mit unterschiedlichen Graden von Homologie gegenüber der Sonde identifiziert und isoliert werden, wobei dies weiter unten beschrieben wird.
1. Identifizierung erweiterter cDNA- oder genomischer cDNA-Sequenzen mit einem hohen Maß an Homologie zur markierten Sonde
Um die erweiterten cDNAs oder genomischen DNAs mit einem hohen Grad an Homologie zur Sondensequenz zu identifizieren, kann die Schmelztemperatur der Sonde unter Verwendung der folgenden Formel berechnet werden: Für Sonden mit einer Länge zwischen 14 und 70 Nukleotiden wird die Schmelztemperatur (Tm) unter Verwendung der Gleichung Tm=81,5+16,6(log[Na⁺])+0,41(Fraktion G+C)-(600/N) berechnet, wobei N die Länge der Sonde ist.
Wenn die Hybridisierung in einer Formamid haltigen Lösung durchgeführt wird, kann die Schmelztemperatur unter Verwendung der Gleichung Tm=81,5+16,6(log[Na+])+0,41 (Fraktion G+C)-(0,63% Formamid)-(600/N) berechnet werden, wobei N die Länge der Sonde ist.
Eine Vorhybridisierung kann in 6 × SSC, 5 × Denhardt's Reagenz, 0,5 SDS, 100 μg denaturierter fragmentierter Lachssperma-DNA oder 6 × SSC, 5 × Denhardt's Reagenz, 0,5% SDS, 100 μg denaturierter fragmentierter Lachssperma-DNA, 50% Formamid durchgeführt werden. Die Rezepte für SSC und Denhardt's-Lösungen sind in Sambrook et al., supra, aufgeführt.
Die Hybridisierung wird durch Zugabe der detektierbaren Sonde zu den oben aufgeführten Vorhybridisierungslösungen durchgeführt. Wenn die Sonde eine doppelsträngige DNA umfasst, wird sie vor der Zugabe zur Hybridisierungslösung denaturiert. Der Filter wird mit der Hybridisierungslösung für eine ausreichend lange Zeitspanne in Kontakt gebracht, um es der Sonde zu ermöglichen, an erweiterte cDNAs oder genomische DNAs, die zur Sonde komplementäre Sequenzen oder Homologe enthalten, zu hybridisieren. Für Sonden mit einer Länge von über 200 Nukleotiden kann die Hybridisierung 15-25°C unterhalb der Tm durchgeführt werden. Für kürzere Sonden, wie beispielsweise Oligonukleotidsonden, kann die Hybridisierung 15-25°C unterhalb der Tm durchgeführt werden. Für Hybridisierungen in 6× SSC wird die Hybridisierung vorzugsweise bei etwa 68°C ausgeführt. Für Hybridisierungen in 50% Formamid enthaltenden Lösungen wird die Hybridisierung vorzugsweise bei etwa 42°C ausgeführt.
Alle vorausgehenden Hybridisierungen werden als „stringente" Bedingungen betrachtet.
Im Anschluss an die Hybridisierung wird der Filter in 2 × SSC, 0,1% SDS bei Raumtemperatur für 15 Minuten gewaschen. Anschließend wird der Filter mit 0,1 × SSC, 0,5% SDS bei Raumtemperatur für 30 Minuten bis zu 1 Stunde gewaschen. Danach wird die Lösung bei der Hybridisierungstemperatur in 0,1 × SSC, 0,5 SDS gewaschen. Ein abschließender Waschschritt wird in 0,1 × SSC bei Raumtemperatur durchgeführt.
Erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder 5'-ESTs oder genomische DNAs, die an die Sonde hybridisierten, werden durch Autoradiographie oder andere herkömmliche Techniken identifiziert.
2. Erlangen erweiterter cDNA- oder genomischer cDNA-Sequenzen mit einem niedrigeren Maß an Homologie zur markierten Sonde
Das obige Verfahren kann modifiziert werden, um erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder genomische DNAs mit einem abnehmenden Maß an Homologie zur Sondensequenz zu identifizieren. Beispielsweise können weniger stringente Bedingungen verwendet werden, um erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder genomische DNAs mit abnehmender Homologie zu der detektierbaren Sonde zu erhalten. Beispielsweise kann die Hybridisierungstemperatur in Schrittgrößen von 5°C von 68°C bis auf 42°C in einem Hybridisierungspuffer mit einer Natriumkonzentration von etwa 1 M abgesenkt werden. Im Anschluss an die Hybridisierung kann der Filter mit 2 × SSC, 0,5% SDS bei der Hybridisierungstemperatur gewaschen werden. Diese Bedingungen werden über 50°C als „moderate" Bedingungen und unter 50°C als „schwache" Bedingungen betrachtet.
Alternativ kann die Hybridisierung in Puffern, wie beispielsweise Formamid enthaltender 6 × SSC-Puffer bei einer Temperatur von 42°C durchgeführt werden. In diesem Fall kann die Konzentration an Formamid im Hybridisierungspuffer in 5%-Schritten von 50% auf 0% verringert werden, um Klone mit einem niedrigeren Maß an Homologie zu der Sonde zu identifizieren. Im Anschluss an die Hybridisierung kann der Filter mit 6 × SSC, 0,5% SDS bei 50°C gewaschen werden. Über 25% Formamid werden die Bedingungen als „moderate" Bedingungen und unter 25% Formamid als „schwache" Bedingungen betrachtet.
Erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder genomische DNAs, die an die Sonde hybridisiert haben, werden durch Autoradiographie identifiziert.
3. Bestimmung des Grades an Homologie zwischen den erhaltenen erweiterten cDNAs und der markierten Sonde
Wenn es erwünscht ist, Nukleinsäurehomologe zu erweiterten cDNAs zu erhalten, wie beispielsweise allelische Varianten davon, oder Nukleinsäuren, die Proteine kodieren, die mit den Proteinen, die durch die erweiterten cDNAs kodiert werden, in Zusammenhang stehen, kann der Grad an Homologie zwischen der hybridisierten Nukleinsäure und der erweiterten cDNA oder dem 5'-EST, die als Sonde verwendet wurden, unter Verwendung von BLAST2N weiter bestimmt werden; die Parameter können abhängig von der Sequenzlänge und dem untersuchten Grad an Homologie angepasst werden. Um den Grad an Homologie zwischen der hybridisierten Nukleinsäure und der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet wurde, zu bestimmen, werden die Nukleotidsequenzen der hybridisierten Nukleinsäure und die der erweiterten cDNA oder des 5'-ESTs, von denen die Sonde abgeleitet wurde, verglichen.
Beispielsweise können unter Verwendung der obigen Verfahren Nukleinsäuren mit wenigsten 95% Nukleinsäurehomologie zu der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet wurde, erhalten und identifiziert werden. In ähnlicher Weise kann man unter Verwendung fortschreitend weniger stringenter Hybridisierungsbedingungen Nukleinsäuren mit wenigstens 90%, wenigstens 85%, wenigstens 80% oder wenigstens 75% Homologie zu der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet wurde, erhalten und identifizieren.
Um zu bestimmen, ob ein Klon ein Protein mit einem gegebenen Maß an Homologie zu dem Protein, das durch die erweiterte cDNA oder das 5'-EST kodiert wird, kodiert, wird die Aminosäuresequenz, die durch die erweiterte cDNA oder das 5'-EST kodiert wird, mit der Aminosäuresequenz, die durch die hybridisierende Nukleinsäure kodiert wird, verglichen. Es wird festgestellt, dass Homologie vorliegt, wenn eine Aminosäuresequenz in der erweiterten cDNA oder dem 5'-EST mit einer Aminosäuresequenz in der hybridisierenden Nukleinsäure in enger Beziehung steht. Eine Sequenz steht in enger Beziehung, wenn sie zu der Sequenz der erweiterten cDNA oder der des 5'-ESTs identisch ist oder wenn sie eine oder mehrere Aminosäuresubstitutionen enthält, in denen Aminosäuren mit ähnlichen Charaktereigenschaften untereinander substituiert worden sind. Unter Verwendung der obigen Verfahren und Algorithmen, wie beispielsweise FASTA, mit Parametern, die von der Sequenzlänge und dem untersuchten Grad an Homologie abhängig sind, kann man Nukleinsäuren erhalten, die Proteine kodieren, die wenigstens 95%, wenigstens 90%, wenigstens 85%, wenigstens 80% oder wenigstens 75% Homologie zu den Proteinen aufweisen, die von der erweiterten cDNA oder dem 5'-EST kodiert werden, von der/dem die Sonde abgeleitet wurde.
Um erweiterte cDNAs unter Verwendung von 5'-ESTs zu erhalten stehen über die oben beschriebenen Verfahren hinausgehend andere Protokolle zur Verfügung, wie es in den nachfolgenden Absätzen ausgeführt wird.
Erweiterte cDNAs können durch das Erlangen von mRNA aus dem Gewebe, aus der Zelle oder dem Organismus von Interesse hergestellt werden, wobei auf PolyA-Selektionsverfahren zurückgreifende mRNA-Herstellungsverfahren oder andere dem Fachmann bekannten Techniken verwendet werden. Ein erster Primer, der zur Hybridisierung mit dem PolyA-Schwanz der mRNA in der Lage ist, wird an die mRNA hybridisiert und eine reverse Transkriptionsreaktion wird durchgeführt, um einen cDNA-Erststrang zu erzeugen.
Der cDNA-Erststrang wird mit einem zweiten Primer, der wenigstens 10 aufeinander folgende Nukleotide gemäß der Sequenz SEQ ID NO: 38 enthält, hybridisiert. Vorzugsweise umfasst der Primer wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide gemäß der Sequenz SEO ID NO: 38. Stärker bevorzugt umfasst der Primer 20 bis 30 aufeinander folgende Nukleotide gemäß der Sequenz SEQ ID NO: 38. In einigen Ausführungsformen umfasst der Primer mehr als 30 Nukleotide der Sequenz gemäß SEQ ID NO: 38. Wenn es gewünscht ist, erweiterte cDNAs zu erhalten, die die Gesamtprotein kodierende Sequenz einschließlich der authentischen Translationsinitiationsstelle enthalten, enthält der verwendete zweite Primer Sequenzen, die stromaufwärts der Translationsinitiationsstelle lokalisiert sind. Zur Erzeugung eines zum cDNA-Erststrang komplementären cDNA-Sekundärstrangs, ist der zweite Primer erweitert. Alternativ kann wie weiter oben beschrieben wird, eine RT-PCR-Reaktion durchgeführt werden, wobei Primer von beiden Enden der cDNA, die erhalten werden soll, eingesetzt werden.
Erweiterte cDNAs, die 5'-Fragmente der mRNA enthalten, können durch Hybridisierung einer mRNA, die die Sequenz für das 5'-EST umfasst, für das eine erweiterte cDNA erwünscht ist, mit einem Primer, der wenigstens 10 aufeinander folgende Nukleotide der Sequenzen umfasst, die komplementär zu dem 5'-EST sind, und reverses Transkribieren des hybridisierten Primers zur Erstellung eines cDNA-Erststrang der mRNAs, erzeugt werden. Vorzugsweise umfasst der Primer wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs. Stärker bevorzugt umfasst der Primer 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs.
Danach wird ein cDNA-Zweitstrang, der komplementär zum cDNA-Erststrang ist, synthetisiert. Der cDNA-Zweitstrang kann durch Hybridisierung eines Primers, der komplementär zu Sequenzen im cDNA-Erststrang ist, an den cDNA-Erststrang und Verlängern des Primers zur Erzeugung des cDNA-Zweitstrangs hergestellt werden.
Die doppelsträngigen erweiterten cDNAs, die unter Verwendung der oben beschriebenen Verfahren hergestellt wurden, werden isoliert und kloniert. Die erweiterten cDNAs können in Vektoren, wie beispielsweise Plasmide, oder virale Vektoren kloniert werden, die zur Replikation in einer entsprechenden Wirtszelle fähig sind. Die Wirtszelle kann beispielsweise eine Bakterienzelle, eine Säugerzelle, eine Geflügelzelle oder eine Insektenzelle sein.
Techniken zur Isolierung von mRNA, zum reversen Transkribieren eines Primers, der an mRNA hybridisiert ist, um einen cDNA-Erststrang zu erzeugen, Verlängern eines Primers, um einen cDNA-Zweitstrang zu erzeugen, der komplementär zum cDNA-Erststrang ist, Isolieren der doppelsträngigen cDNA und Klonieren der doppelsträngigen cDNA sind dem Fachmann wohl bekannt und in Current Protocols in Molecular Biology, John Wiley and Sons, Inc. 1997 und Sambrook et al., Molecular Cloning: A Laboratory Manual, zweite Ausgabe, Cold Spring Harbor Laboratory Press, 1989, beschrieben.
Alternativ können Verfahren, wie beispielsweise das in Beispiel 29 beschriebene, zum Erlangen von Volllängen-cDNAs oder erweiterten cDNAs verwendet werden. In diesem Ansatz werden Volllängen- oder erweiterte cDNAs aus mRNA hergestellt und wie im Folgenden beschrieben in doppelsträngige Phagemids kloniert. Die cDNA-Bibliothek in den doppelsträngigen Phagemids wird anschließend durch Behandlung mit einer Endonuklease, wie beispielsweise dem Gene 11-Produkt des Phagen F1, und einer Exonuklease (Chang et al., Gene 127:95-8, 1993) in eine einzelsträngige Form gebracht. Ein biotinyliertes Oligonukleotid, das die Sequenz eines 5'-ESTs oder die Sequenz eines wenigstens 10 Nukleotide davon enthaltenden Fragments umfasst, wird an die einzelsträngigen Phagemids hybridisiert. Vorzugsweise umfasst das Fragment wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs. Stärker bevorzugt umfasst das Fragment 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs. In einigen Verfahren kann das Fragment mehr als 30 aufeinander folgende Nukleotide des 5'-ESTs umfassen.
Hybride zwischen dem biotinylierten Oligonukleotid und Phagemids mit Inserts, die die 5'-EST-Sequenz enthalten, werden durch Inkubation der Hybride mit Streptavidin beschichteten paramagnetischen Beads und Gewinnung der Beads mit einem Magneten isoliert (Fry et al., Biotechniques, 13:124-131, 1992). Danach werden die sich ergebenden Phagemids, die die 5'-EST-Sequenz enthalten, von den Beads abgelöst und unter Verwendung eines Primers, der für die 5'-EST-Sequenz spezifisch ist, in doppelsträngige DNA umgewandelt. Alternativ können Protokolle, wie beispielsweise der Gene Trapper Kit (Gibco BRL) verwendet werden. Die so erhaltene doppelsträngige DNA wird in Bakterien transformiert. Erweiterte cDNAs, die die 5'-EST-Sequenz enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
Unter Verwendung eines beliebigen der oben in Abschnitt III beschriebenen Verfahren kann eine Vielzahl erweiterter cDNAs, die Volllängenprotein kodierende Sequenzen oder Sequenzen enthalten, die nur das reife Protein kodieren, das zurückbleibt nachdem das Signalpeptid abgespalten wurde, als cDNA-Bibliotheken für eine nachfolgende Bewertung der kodierten Proteine oder zur Verwendung in diagnostischen Assays, wie es weiter unten beschrieben wird, bereitgestellt werden.
IV. Expression von Proteinen, die durch erweiterte cDNAs kodiert werden, welche unter Verwendung von 5'-ESTs isoliert wurden
Erweiterte cDNAs, die Gesamtprotein kodierende Sequenzen ihrer entsprechenden mRNAs oder Abschnitte davon kodieren, wie beispielsweise cDNAs, die das reife Protein kodieren, können verwendet werden, um die kodierten sekretierten Proteine oder Abschnitte davon zu exprimieren, wie es in Beispiel 30 weiter unten beschrieben wird. Wenn gewünscht, können die erweiterten cDNAs die Sequenzen enthalten, die das Signalpeptid kodieren, um so die Sekretion des exprimierten Proteins zu vereinfachen. Es wird erkannt, dass eine Vielzahl von erweiterten cDNAs, die Gesamtprotein kodierende Sequenzen oder Abschnitte davon enthalten, gleichzeitig in Expressionsvektoren kloniert werden können, um so eine Expressionsbibliothek zur Analyse der kodierten Proteine zu erzeugen, wie es weiter unten beschrieben wird.
BEISPIEL 30
Expression der Proteine, die durch die Gene kodiert werden, die mit 5'-ESTs oder Teilen davon korrespondieren
Um die Proteine zu exprimieren, die durch die Gene kodiert werden, die mit 5'-ESTs (oder Teilen davon) korrespondieren, werden Volllängen-cDNAs, die die vollständige Protein kodierende Region enthalten, oder erweiterte cDNAs, die Sequenzen in Nachbarschaft zu den 5'-ESTs (oder Abschnitten davon) enthalten, erhalten, wie es in den Beispielen 27-29 beschrieben wird, und in einen geeigneten Expressionsvektor kloniert. Wenn gewünscht, können die Nukleinsäuren die Sequenzen enthalten, die das Signalpeptid kodieren, um so die Sekretion des exprimierten Proteins zu erleichtern. Die Nukleinsäuren, die in die Expressionsvektoren insertiert werden, können auch Sequenzen enthalten, die sich stromaufwärts zu den Sequenzen befinden, die das Signalpeptid kodieren, wie beispielsweise Sequenzen, die Expressionsmengen regulieren oder Sequenzen, die eine gewebespezifische Expression übertragen.
Die Nukleinsäure, die das zu exprimierende Protein oder das Polypeptid kodiert, ist operativ mit einem Promotor in einem Expressionsvektor verknüpft, wobei hierzu herkömmliche Klonierungstechnologien verwendet werden. Der Expressionsvektor kann ein beliebiges, im Fachbereich bekanntes Säuger-, Hefe-, Insekten- oder bakterielles Expressionssystem sein. Kommerziell erhältliche Vektoren und Expressionssysteme stehen von einer Vielzahl von Lieferanten zur Verfügung, einschließlich Genetics Institut (Cambridge, MA), Stratagene (La Jolla, Kalifornien), Promega (Madison, Wisconsin) und Invitrogen (San Diego, Kalifornien). Wenn gewünscht, kann der Kodonkontext und die Kodonpaarung der Sequenz für den bestimmten Expressionsorganismus, in den der Expressionsvektor eingeführt wird, optimiert werden, wie es beispielhaft durch Hatfield, et al., US-Patent Nr. 5,082,767 beschrieben wird, um so die Expression zu steigern und um eine passende Proteinfaltung zu ermöglichen.
Die in den Expressionsvektor einklonierte cDNA kann das vollständige Protein (d.h. das Signalpeptid und das reife Protein), das reife Protein (d.h. das Protein, das durch Abspalten des Signalpeptids erzeugt wurde), nur das Signalpeptid oder einen anderen beliebigen Abschnitt davon enthalten.
Das folgende Verfahren wird als ein beispielhaftes Verfahren zur Expression der Proteine bereitgestellt, die durch die erweiterten cDNAs kodiert werden, die mit den 5'-ESTs oder den Nukleinsäuren korrespondieren wie es oben beschrieben wird. Zuerst werden das Methionininitiationskodon für das Gen und das PolyA-Signal des Gens identifiziert. Wenn die Nukleinsäure, die das zu exprimierende Polypeptid kodiert, kein Methionin aufweist, das als Initiationsstartstelle dient, kann ein initiierendes Methionin neben dem ersten Kodon der Nukleinsäure eingefügt werden, wobei herkömmliche Techniken verwendet werden. In gleicher Weise kann, wenn die erweiterte cDNA kein PolyA-Signal aufweist, diese Sequenz an das Konstrukt angefügt werden, beispielsweise durch Ausspleißen des PolyA-Signals aus pSG5 (Stratagene), wobei BglII- und SalI-Restriktionsendonukleaseenzyme verwendet werden, und Einfügen dieses PolyA-Signals in den Säugerexpressionsvektor pXT1 (Stratagene). pXT1 enthält die LTRs und einen Teil des gag-Gens aus Moloney Murine Leukemia Virus. Die Position der LTRs im Konstrukt ermöglicht eine effiziente stabile Transfektion. Der Vektor umfasst den Herpes Simplex Tymidinkinasepromotor und das selektierbare Neomycingen. Die erweiterte cDNA oder ein Abschnitt davon, die/der das zu exprimierende Polypeptid kodiert, wird durch eine PCR-Reaktion aus dem bakteriellen Vektor erhalten, wobei Oligonukleotidprimer verwendet werden, die komplementär zu der erweiterten cDNA oder einem Abschnitt davon sind und die Restriktionsendonuklease-Sequenzen für PstI enthalten, die in den 5'-Primer eingebracht sind, und für BglII am 5'-Ende des entsprechenden cDNA 3'-Primers, wobei darauf geachtet wird, sicherzustellen, dass die erweiterte cDNA mit dem PolyA-Signal positioniert ist. Das gereinigte Fragment, das aus der entsprechenden PCR-Reaktion erhalten wird, wird mit PstI verdaut, mit einer Exonuklease mit glatten Enden versehen, mit Bgl II verdaut, gereinigt und in den pXT1-Vektor ligiert, der ein PolyA-Signal enthält und für diese Ligation (glatt/BglII) vorbereitet wurde.
Das ligierte Produkt wird unter Verwendung von Lipofectin (Life Technologies, Inc., Grand Island, New York) in Maus-NIH 3T3-Zellen transfiziert, wobei Bedingungen wie sie in der Produktbeschreibung beschrieben sind, eingehalten werden. Nach Aufzucht der transfizierten Zellen in 600 μg/ml G418 (Sigma, St. Louis, Missouri) werden positive Transfektanten selektiert. Das exprimierte Protein wird vorzugsweise in das Kulturmedium abgegeben, wodurch die Aufreinigung vereinfacht wird.
Alternativ können die erweiterten cDNAs, wie es weiter oben beschrieben wird, in pED6dpc2 kloniert werden. Die sich ergebenden pED6dpc2-Konstrukte können in eine geeignete Wirtszelle, wie beispielsweise COS 1-Zellen, transfiziert werden. Methotrexat resistente Zellen werden selektiert und expandiert. Vorzugsweise wird das Protein, das von der erweiterten cDNA exprimiert wird, in das Kulturmedium abgegeben, wodurch die Aufreinigung vereinfacht wird.
Proteine im Kulturmedium werden durch Gelelektrophorese getrennt. Wenn gewünscht, können die Proteine durch Ammoniumsulfat präzipitiert werden oder vor der Elektrophorese auf Grundlage ihrer Größe oder Ladung getrennt werden.
Als Kontrolle wird der Expressionsvektor, der kein cDNA-Insert aufweist, in Wirtszellen oder Organismen eingebracht und die Proteine im Medium werden geerntet. Die sekretierten Proteine, die im Medium vorliegen, werden unter Verwendung von dem Fachmann bekannten Techniken detektiert, wie beispielsweise Coomassie Blau- oder Silberfärbung, oder unter Verwendung von Antikörpern gegen das durch die erweiterte cDNA kodierte Protein.
Antikörper, die in der Lage sind, das Protein von Interesse spezifisch zu erkennen, können unter Verwendung synthetischer 15-mer Peptide erzeugt werden, die eine Sequenz aufweisen, die durch das geeignete 5'-EST, die geeignete erweiterte cDNA oder einen Abschnitt davon kodiert wird. Die synthetischen Peptide werden in Mäuse injiziert, um einen Antikörper zu dem Polypeptid, das durch das 5'-EST, die erweiterte cDNA oder den Abschnitt davon kodiert wird, zu erzeugen.
Sekretierte Proteine aus den Wirtszellen oder Organismen, die einen Expressionsvektor enthalten, der die erweiterte cDNA enthält, die aus einem 5'-EST oder einem Abschnitt davon abgeleitet ist, werden mit denen aus den Kontrollzellen oder dem Kontrollorganismus verglichen. Die Gegenwart einer Bande im Medium von den Zellen, die den Vektor enthalten, die im Medium aus Kontrollzellen nicht vorliegt, zeigt, dass die erweiterte cDNA ein sekretiertes Protein kodiert. Im Allgemeinen hat die Bande, die dem Protein entspricht, das von der erweiterten cDNA kodiert wird, eine Mobilität nahe bei der erwarteten Mobilität, wobei dies auf der Zahl der Aminosäuren im offenen Leserahmen der erweiterten cDNA beruht. Jedoch kann die Bande in Folge von Modifikationen, wie beispielsweise Glykosylierung, Ubiquitinierung oder enzymatischer Spaltung, eine Mobilität aufweisen, die sich von der erwarteten Mobilität unterscheidet.
Alternativ können, wenn das aus den obigen Expressionsvektoren exprimierte Protein keine seine Sekretion lenkenden Sequenzen enthält, die von den Wirtszellen exprimierten Proteine, wobei die Wirtszellen einen Expressionsvektor mit einem Insert enthalten, das ein sekretiertes Protein oder einen Abschnitt davon kodiert, mit den Proteinen verglichen werden, die in Kontrollwirtszellen exprimiert werden, die den Expressionsvektor ohne Insert enthalten. Das Vorliegen einer Bande in Proben von Zellen, die den Expressionsvektor mit einem Insert enthalten, die in Proben von Zellen, die den Expressionsvektor ohne Insert enthalten, nicht vorliegt, zeigt, dass das gewünschte Protein oder der Abschnitt davon exprimiert wird. Im Allgemeinen weist die Bande die Mobilität, die für das sekretierte Protein oder den Abschnitt davon erwartet wird, auf. Jedoch kann die Bande in Folge von Modifizierungen, wie beispielsweise Glykosylierung, Ubiquitinierung oder enzymatischer Spaltung, eine von der erwarteten Mobilität abweichende Mobilität aufweisen.
Das durch die erweiterte cDNA kodierte Protein kann unter Verwendung von standardmäßigen Immunochromatografie-Techniken gereinigt werden. In derartigen Verfahren wird eine Lösung, die das sekretierte Protein enthält, wie beispielsweise Kulturmedium oder Zellextrakt, auf eine Säule aufgebracht, die Antikörper gegen das sekretierte Protein aufweist, wobei die Antikörper an der Chromatografiematrix angebracht sind. Man lässt das sekretierte Protein an die Immunochromatografiesäule binden. Danach wird die Säule gewaschen, um nicht spezifisch gebundene Proteine zu entfernen. Das spezifisch gebundene sekretierte Protein wird anschließend von der Säule freigesetzt und unter Verwendung von Standardtechniken gewonnen.
Falls eine Antikörperherstellung nicht möglich ist, kann die erweiterte cDNA-Sequenz oder der Abschnitt davon in Expressionsvektoren eingebracht werden, die zur Verwendung in Reinigungsschemata konzipiert worden sind, die auf Chimäre Polypeptide zurückgreifen. In derartigen Strategien ist die kodierende Sequenz der erweiterten cDNA oder des Abschnitts davon im Rahmen mit einem Gen insertiert, das die andere Hälfte der Chimäre kodiert. Die andere Hälfte der Chimäre kann β-Globin oder ein nickelbindendes Polypeptid sein. Eine Chromatografiematrix mit einem daran angebrachten Antikörper gegen β-Globin oder Nickel wird anschließend verwendet, um das Chimäre Protein zu reinigen. Proteasespaltstellen können zwischen dem β-Globin-Gen oder dem nickelbindendem Polypeptid und der erweiterten cDNA oder dem Abschnitt davon konstruiert sein. Daher können die zwei Polypeptide der Chimäre durch Proteaseverdau voneinander getrennt werden.
Ein zur Erzeugung von β-Globin-Chimären nützlicher Expressionsvektor ist pSG5 (Stratagene), der Kaninchen-β-Globin kodiert. Intron II des Kaninchen-β-Globin-Gens ermöglicht das Spleißen des exprimierten Transkripts und das in dieses Konstrukt eingebrachte Polyadenylierungssignal erhöht die Expressionsmenge. Diese Verfahren sind so wie beschrieben dem Fachmann im Bereich der Molekularbiologie wohl vertraut. Standardverfahren sind in Texten über Verfahren, wie beispielsweise Davis et al., (Basic Methods in Molecular Biology, Davis, Dibner und Battex, Hg., Elsevier Press, NY, 1986) beschrieben und viele andere Verfahren stehen von Stratagene, Life Technologies, Inc. oder Promega zur Verfügung. Zusätzlich können vom Konstrukt Polypeptide unter Verwendung von in vitro-Translationssystemen, wie beispielsweise dem In vitro Express^TM Translation Kit (Stratagene), hergestellt werden.
Im Anschluss an die Expression und Reinigung der sekretierten Proteine, die durch die 5'-ESTs, erweiterten cDNAs oder Fragmente davon kodiert werden, können die gereinigten Proteine auf ihre Fähigkeit, an die Oberfläche verschiedener Zelltypen zu binden, getestet werden, wie es in Beispiel 31 weiter unten beschrieben wird. Es wird erkannt, dass eine Vielzahl von Proteinen, die durch diese cDNAs exprimiert werden, von einem Panel von Proteinen umfasst sein kann, um so gleichzeitig sowohl hinsichtlich ihrer weiter unten genau beschrieben Aktivitäten, als auch im Hinblick auf andere biologische Rollen, für die Assays zur Aktivitätsbestimmung zur Verfügung stehen, beurteilt zu werden.
BEISPIEL 31
Analyse sekretierter Proteine, zur Bestimmung, ob die Proteine an die Zelloberfläche binden
Die durch die 5'-ESTs, erweiterten cDNAs oder Fragmente davon kodierten Proteine werden in Expressionsvektoren, wie diejenigen, die in Beispiel 30 beschrieben sind, kloniert. Die Proteine werden über Größe, Ladung, Immunchromatografie oder andere dem Fachmann vertraute Techniken gereinigt. Im Anschluss an die Reinigung werden die Proteine unter Verwendung von dem Fachmann bekannten Techniken markiert. Die markierten Proteine werden mit Zellen oder Zelllinien inkubiert, die aus einer Vielfalt von Organismen oder Geweben abgeleitet sind, um es den Proteinen zu ermöglichen, an einen beliebigen Rezeptor auf der Zelloberfläche zu binden. Im Anschluss an die Inkubation werden die Zellen gewaschen, um unspezifisch gebundenes Protein zu entfernen. Die markierten Proteine werden durch Autoradiografie detektiert. Alternativ können nicht markierte Proteine mit den Zellen inkubiert werden und unter Verwendung von daran anhaftenden Antikörpern, die eine detektierbare Markierung aufweisen, wie beispielsweise ein fluoreszierendes Molekül, detektiert werden.
Die Spezifität der Zelloberflächenbindung kann durch Durchführung einer Kompetitionsanalyse analysiert werden, wobei verschiedene Mengen unmarkiertes Protein zusammen mit dem markierten Protein inkubiert werden. Die Menge an markiertem Protein, das an die Zelloberfläche gebunden ist, nimmt ab, wenn die Menge an kompetitivem unmarkiertem Protein ansteigt. Als Kontrolle sind in einigen Bindereaktionen verschiedene Mengen an unmarkiertem Protein umfasst, das mit dem markierten Protein nicht in Beziehung steht. Die Mengen an markiertem Protein, das an die Zelloberfläche gebunden ist, sinkt nicht in solchen Bindereaktionen ab, die steigende Mengen an nicht in Beziehung stehendem unmarkierten Proteinen enthalten, was zeigt, dass das Protein, das durch die cDNA kodiert wird, spezifisch an die Zelloberfläche bindet.
Wie oben diskutiert, zeigen sekretierte Proteine eine Vielzahl von wichtigen physiologischen Effekten und stellen in der Konsequenz eine wertvolle therapeutische Quelle dar. Die sekretierten Proteine, die durch die erweiterten cDNAs oder Teile davon kodiert werden, die gemäß den Beispielen 27-29 hergestellt wurden, können wie es weiter unten beschrieben wird, beurteilt werden, um ihre physiologischen Wirkungen zu bestimmen.
BEISPIEL 32
Untersuchen der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich Zytokin-, Zellproliferations- oder Zelldifferenzierungs-Aktivität
Wie oben diskutiert, können sekretierte Proteine als Zytokine wirken oder können die zelluläre Proliferation oder Differenzierung beeinflussen. Viele bis heute entdeckte Proteinfaktoren, einschließlich aller bekannten Zytokine, wiesen in einem oder mehreren faktorabhängigen Zellproliferationsassays Aktivität auf und daher dienen diese Assays als zweckmäßige Bestätigung der Zytokinaktivität. Die Aktivität eines Proteins, das durch die erweiterten cDNAs kodiert wird, wird durch einen beliebigen aus einer Reihe von routinemäßigen faktorabhängigen Zellproliferationsassays für Zelllinien, einschließlich, ohne Beschränkung, 32D, DA2, DA1G, T10, B9, B9/11, BaF3, MC9/G, M⁺ (preB M⁺), 2E8, RB5, DA1, 123, T1165, HT2, CTLL2, TF-1, Mo7c und CMK, bewiesen. Die Proteine, die durch die oben beschriebenen erweiterten cDNAs oder Abschnitte davon kodiert werden, können bezüglich ihrer Fähigkeit, die T-Zell- oder Thymozytproliferation in Assays, wie beispielsweise diejenigen, die oben oder in den folgenden Referenzen beschrieben sind, beurteilt werden: Current Protocols in Immunology, Hrsg. von Coligan et al., Greene Publishing Associates and Wiley-Interscience; Takai et al., J. Immunol. 137:3494-3500, 1986; Bertagnolli et al., J. Immunol. 145:1706-1712, 1990; Bertagnolli et al., Cell. Immunol. 133:327-341, 1991; Bertagnolli et al., J. Immunol. 149:3778-3783 1992; Bowman et al., J. Immunol. 152:1756-1761, 1994.
Zusätzlich sind zahlreiche Assays zur Zytokinproduktion und/oder der Proliferation von Milzzellen, Lymphknotenzellen und Thymozyten bekannt. Diese umfassen die Techniken, die in Current Protocols in Immunology, supra 1:3.12.1-3.12.14 und in Schreiber in Current Protocols in Immunology, supra 1:6.8.1-6.8.8 offenbart sind.
Die durch die cDNAs kodierten Proteine können auch nach ihrer Fähigkeit, Proliferation und Differenzierung hämatopoetischer oder lymphopoetischer Zellen zu regulieren, untersucht werden. Viele Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays in den folgenden Referenzen: Bottomly et al., in Current Protocols in Immunology, supra 1:6.3.1-6.3.12; de Vries et al., J. Exp. Med. 173:1205-1211, 1991; Moreau et al., Nature 36:690-692, 1988; Greenberger et al., Proc. Natl. Acad. Sci. U.S.A., 80:2931-2938, 1983; Nordan, R., in Current Protocols in Immunology, supra 1:6.6.1-6.6.5; Smith et al., Proc. Natl. Acad. Sci. U.S.A., 83:1857-1861, 1986; Bennett et al., in Current Protocols Immunology supra, 1:6.15.1; Ciarletta et al., in Current Protocols Immunology supra, 1:6.13.1.
Die durch die cDNAs kodierten Proteine können auch auf ihre Fähigkeit, die Antworten von T-Zellen auf Antigene zu regulieren, hin untersucht werden. Viele Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben sind: Kapitel 3 (In vitro Assays zur Maus Lymphozytenfunktion), Kapitel 6 (Zytokine and ihre zellulären Rezeptoren) und Kapitel 7 (Immunologische Studien in Menschen) in Current Protocols in Immunology supra, Weinberger et al., Proc. Natl. Acad. Sci. USA 77:6091-6095, 1980; Weinberger et al., Eur. J. Immun. 11:405-411, 1981; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988.
Derartige, eine Zytokin-, Zellproliferations- oder Zelldifferenzierungsaktivität aufweisende Proteine können anschließend als Pharmazeutika formuliert werden oder verwendet werden, um klinische Zustände zu behandeln, unter welchen die Induktion von Zellproliferation oder -differenzierung günstig ist. Alternativ können Gene, die diese Proteine kodieren oder Nukleinsäuren, die die Expression dieser Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen, wobei dies weiter unten ausführlicher beschrieben wird.
BEISPIEL 33
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich einer Aktivität als Regulatoren des Immunsystems
Die durch die cDNAs kodierten Proteine können auch hinsichtlich ihrer Wirkungen als Immunregulatoren beurteilt werden. Beispielsweise können diese Proteine bezüglich ihrer Aktivität, die Thymozyten- oder Splenozyten-Zytotoxizität zu beeinflussen, beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Kapitel 3 (In vitro Assays zur Maus Lymphozytenfunktion 3.1-3.19) und Kapitel 7 (Immunologische Studien in Menschen) in Current Protocols in Immunology, Coligan et al., Hrsg., Greene Publishing Associates and Wiley-Interscience; Herrmann et al., Proc. Natl. Acad. Sci. USA 78:2488-2492, 1981; Herrmann et al., J. Immunol. 128:1968-1974, 1982; Handa et al., J. Immunol. 135:1564-1572, 1985; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988; Bowman et al., J. Virology 61:1992-1998; Bertagnolli et al., Cell. Immunol. 133:327-341, 1991; Brown et al., J. Immunol. 153:3079-3092, 1994.
Die durch die cDNAs kodierten Proteine können auch bezüglich ihrer Wirkungen auf T-Zell abhängige Immunglobulinreaktionen und Isotyp Switching beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Maliszewski, J. Immunol. 144:3028-3033, 1990; Mond et al., in Current Protocols in Immunology, 1:3.8.1-3.8.16, supra.
Die durch die cDNAs kodierten Proteine können auch hinsichtlich ihrer Wirkung auf Immuneffektorzellen, einschließlich ihrer Wirkung auf Th1-Zellen und zytotoxische Lymphozyten hin beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Kapitel 3 (In vitro Assays zur Maus Lymphozytenfunktion 3.1-3.19) und Kapitel 7 (Immunologische Studien in Menschen) in Current Protocols in Immunology, supra; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988; Bertagnolli et al., J. Immunol. 149:3778-3783, 1992.
Die durch die cDNAs kodierten Proteine können auch hinsichtlich ihrer Wirkung auf die durch dendritische Zellen vermittelte Aktivierung von naiven T-Zellen beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Guery et al., J. Immunol., 134:536-544, 1995; Inaba et al., J. Exp. Med. 173:549-559, 1991; Macatonia et al., J. Immunol. 154:5071-5079, 1995; Porgador et al., J. Exp. Med. 182:255-260, 1995; Nair et al., J. Virol. 67:4062-4069, 1993; Huang et al., Science 264:961-965, 1994; Macatonia et al., J. Exp. Med. 169:1255-1264, 1989; Bhardwaj et al., Journal of Clinical Investigation 94:797-807, 1994 und Inaba et al., J. Exp. Med. 172:631-640, 1990.
Die durch die cDNAs kodierten Proteine können auch hinsichtlich ihres Einflusses auf die Lebensdauer von Lymphozyten beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Darzynkiewicz et al., Cytometry 13:795-808, 1992; Gorczyca et al., Leukemia 7:659-670, 1993; Gorczyca et al., Cancer Res. 53:1945-1951, 1993; Itoh et al., Cell 66:233-243, 1991; Zacharchuk, J. Immunol. 145:4037-4045, 1990; Zamai et al., Cytometry 14:891-897, 1993; Gorczyca et al., Int. J. Oncol. 1:639-648, 1992.
Die durch die cDNAs kodierten Proteine können auch hinsichtlich ihres Einflusses auf frühe Stufen des T-Zell-Deteminierung und der T-Zell-Entwicklung hin beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich aber ohne Beschränkung auf die Assays, die in den folgenden Referenzen beschrieben werden: Antica et al., Blood 84:111-117, 1994; Fine et al., Cell. Immunol. 155:111-122, 1994; Galy et al., Blood 85:2770-2778, 1995; Toki et al., Proc. Natl. Acad. Sci. USA 88:7548-7551, 1991.
Die Proteine, die Aktivität als Regulatoren der Immunsystemaktivität zeigen, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in welchen die Regulation von Immunaktivität günstig ist. Beispielsweise kann das Protein bei der Behandlung verschiedener Immunschwächen und Erkrankungen nützlich sein (einschließlich schwerer kombinierter Immunschwächen), z.B. sowohl beim Regulieren (nach oben oder nach unten) von Wachstum und Proliferation von T- und/oder B-Lymphozyten als auch beim Einwirken auf die zytolytische Aktivität von NK-Zellen und anderen Zellpopulationen. Diese Immunschwächen können genetischen Ursprungs sein oder können sowohl durch virale (z.B. HIV) als auch durch bakterielle Infektionen oder von Pilzinfektionenn verursacht werden oder können sich aus Autoimmunerkrankungen ergeben. Insbesondere können infektiöse Erkrankungen, die durch virale oder bakterielle Infektionen oder durch Pilze oder andere Infektionen verursacht werden, unter Verwendung eines Proteins, das durch erweiterte cDNAs, kodiert wird, die von den 5'-ESTs der vorliegenden Erfindung abgeleitet sind, behandelt werden, einschließlich Infektionen mit HIV, Hepatitis-Viren, Herpes-Viren, Mycobakterien, Leishmania spp., Plasmodium und verschiedenen durch Pilzinfektionen, wie zum Beispiel Candidiasis. In diesem Zusammenhang kann selbstverständlich ein Protein, das durch erweiterte cDNAs kodiert wird, die von den 5'-ESTs der vorliegenden Erfindung abgeleitet sind, ebenfalls dabei nützlich ein Immunsystem zu stimulieren, wo dies im Allgemeinen wünschenswert ist d.h. bei der Behandlung von Krebs.
Alternativ können Proteine, die von erweiterten cDNAs kodiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, bei der Behandlung von Autoimmunerkrankungen verwendet werden, einschließlich beispielsweise Bindegewebserkrankungen, Multipler Sklerose, systemisches Lupus erythematosus, Rheumatoide Arthritis, autoimmune Lungenentzündung, Guillian-Barre Syndrom, autoimmune Thyroiditis, insulinabhängiger Diabetes mellitus, Myasthenia gravis, Transplantat-Wirt-Reaktion (graft-versus-host disease, GVHD) und autoimmune entzündliche Augenerkrankungen. Ein derartiges Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann auch bei der Behandlung allergischer Reaktionen und Zustände, wie zum Beispiel Asthma (insbesondere allergisches Asthma) oder anderen Atemwegserkrankungen, nützlich sein. Andere Zustände, bei denen eine Immunsuppression wünschenswert ist (einschließlich beispielsweise Organtransplantation), können auch unter Verwendung eines Proteins behandelbar sein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind.
Unter Verwendung der erfindungsgemäßen Proteine kann es ebenfalls möglich sein, Immunantworten nach oben oder nach unten zu regulieren.
Eine Regulation nach unten kann das Hemmen oder Blockieren einer Immunantwort, die bereits abläuft, umfassen, oder kann das Verhindern der Induktion einer Immunantwort umfassen. Die Funktionen aktivierter T-Zellen können durch Supprimieren der T-Zell-Antworten oder durch Induzieren spezifischer Toleranz in T-Zellen oder durch beides gehemmt werden. Die Immunsuppression von T-Zell-Antworten ist im Allgemeinen ein aktiver, nicht antigenspezifischer Prozess, der einer kontinuierlichen Exposition von T-Zellen gegenüber dem suppressiven Mittel bedarf. Toleranz, die eine Induktion von Unempfindlichkeit oder Anergie in T-Zellen umfasst, ist von Immunsuppression dadurch unterscheidbar, dass sie im Allgemeinen antigenspezifisch ist und nach dem Ende der Exposition gegenüber dem Toleranz verleihenden (tolerizing) Mittel andauert. Praktisch kann Toleranz durch das Fehlen einer T-Zell-Antwort auf Reexposition gegenüber einem spezifischen Antigen in der Abwesenheit eines Toleranz verleihenden Mittels gezeigt werden.
Regulierung nach unten oder Verhinderung einer oder mehrerer Antigenfunktionen (einschließlich aber ohne Beschränkung auf B-Lymphozyt-Antigenfunktionen, wie zum Beispiel B7-Costimulation), z.B. Verhinderung eines hohen Grads an Lymphokinsynthese durch aktivierte T-Zellen, sind unter den Umständen einer Gewebe-, Haut- und Organtransplantation und bei einer Transplantat-Wirt-Reaktion (GVHD) nützlich. Beispielsweise sollte die Blockierung der T-Zell-Funktion bei einer Gewebetransplantation zu einer verringerten Zerstörung von Gewebe führen. Typischerweise wird in Gewebetransplantaten die Abstoßung des Transplantats über seine Fremderkennung durch T-Zellen initiiert, woran sich eine Immunreaktion anschließt, die das Transplantat zerstört. Die Verabreichung eines Moleküls vor der Transplantation, das die Wechselwirkung eines B-7-Lymphozyt-Antigens mit seinem/seinen natürlichem(n) Ligand(en) auf Immunzellen hemmt oder blockiert (wie beispielsweise eine lösliche, monomere Form eines Peptids mit B7-2-Aktivität allein oder in Verbindung mit einer monomeren Form eines Peptids mit einer Aktivität eines anderen B-Lymphozyt-Antigens (z.B. B7-1, B7-3) oder einem blockierenden Antikörper), kann zum Binden des Moleküls an den/die natürlichen Ligand(en) auf den Immunzellen führen, ohne das entsprechende kostimulatorische Signal zu übertragen. In diesem Fall verhindert die Blockierung der B-Lymphozyt-Antigenfunktion eine Zytokinsynthese durch Immunzellen, wie beispielsweise T-Zellen, und wirkt daher als ein Immunsuppressor. Darüber hinaus kann das Fehlen der Costimulation auch ausreichen, zu einem Nichtreagieren (anergize) der T-Zellen bei herabgesetzter Immunlage zu führen, wodurch in einem Probanden Toleranz induziert wird. Durch Induktion einer lang andauernden Toleranz durch B-Lymphozyt-Antigen blockierende Mittel kann durch das Bedürfnis nach einer wiederholten Verabreichung dieser blockierenden Mittel vermieden werden. Um eine ausreichende Immunsuppression oder Toleranz in einem Probanden zu erreichen, kann es auch notwendig sein, die Funktion einer Kombination von B-Lymphozyt-Antigenen zu blockieren.
Die Wirksamkeit bestimmter blockierender Mittel beim Verhindern der Abstoßung eines Organtransplantats oder von GVHD kann unter Verwendung von Tiermodellen beurteilt werden, die zur Vorhersage über die Wirksamkeit in Menschen geeignet sind. Beispiele geeigneter Systeme, die verwendet werden können, umfassen allogene Herztransplantate in Ratten und xenogene Bauchspeicheldrüsen-Inselzelltransplantate in Mäusen, wobei beide Transplantate eingesetzt wurden, um die immunsuppressiven Wirkungen des CTLA4Ig-Fusionsproteins in vivo zu untersuchen, wie es in Lenschow et al., Science 257:789-792, 1992 und Turka et al., Proc. Natl. Acad. Sci. USA, 89:11102-11105, 1992, beschrieben wird. Zusätzlich können GVHD-Mausmodelle (siehe Paul, Hrsg., Fundamental Immunology. Raven Press, New York, 1989, Seiten 846-847) verwendet werden, um in vivo die Wirkung der Blockierung der B-Lymphozyt-Antigenfunktion auf die Entwicklung dieser Erkrankung zu untersuchen.
Eine Blockierung der Antigenfunktion kann auch bei der Behandlung von Autoimmunerkrankungen therapeutisch nützlich sein. Viele Autoimmunerkrankungen sind das Ergebnis einer unpassenden Aktivierung von T-Zellen, die gegen Eigengewebe reaktiv sind, und die die Herstellung von Zytokinen und Autoantikörpern fördern, die an der Pathologie dieser Erkrankungen beteiligt sind. Die Verhinderung der Aktivierung autoreaktiver T-Zellen kann Krankheitssymptome verringern oder beseitigen. Eine Verabreichung von Mitteln, die auf die Kostimulierung von T-Zellen durch Stören der Rezeptor/Ligandwechselwirkungen der B-Lymphozyt-Antigene blockierend wirken, können verwendet werden, um die T-Zell-Aktivierung zu hemmen und um die Erzeugung von Autoantikörpern oder T-Zell abgeleiteten Zytokinen zu verhindern, die am Krankheitsprozess möglicherweise beteiligt sind. Zusätzlich können blockierende Mittel eine antigenspezifische Toleranz autoreaktiver T-Zellen induzieren, die zu einer langfristigen Entlastung von der Krankheit führen könnte. Die Wirksamkeit blockierender Mittel bei der Verhinderung oder Linderung von Autoimmunerkrankungen kann unter Verwendung einer Vielzahl gut charakterisierter Tiermodelle für humane Autoimmunerkrankungen bestimmt werden. Beispiele umfassen experimentelle murine Autoimmunencephalitis, systemische Lupus erythematosis in MRUpr/pr Mäusen oder NZB Hybridmäusen, murine Autoimmuncollagenarthritis, Diabetes mellitus in OD Mäusen und BB Ratten und experimentelles murines Erbgoldflammsyndrom (siehe Paul Hrsg., supra, Seiten 840-856).
Eine Hochregulierung einer Antigenfunktion (vorzugsweise einer B-Lymphozyt-Antigenfunktion) als Mittel zur Hochregulierung von Immunantworten kann in der Therapie auch nützlich sein. Die Hochregulierung von Immunantworten kann entweder eine Steigerung einer bestehenden Immunantwort oder das Auslösen einer Inititalimmunantwort umfassen, wie es durch die folgenden Beispiele gezeigt wird. Beispielsweise kann das Steigern einer Immunantwort durch Stimulierung der B-Lymphozyt-Antigenfunktion in Fällen viraler Infektionen nützlich sein. Zusätzlich können systemische virale Erkrankungen, wie beispielsweise Grippe, Schnupfen und Encephalitis durch Verabreichung einer stimulatorischen Form von B-Lymphozyt-Antigenen systemisch gelindert werden.
Alternativ können antivirale Immunantworten in einem infizierten Patienten durch Entfernen der T-Zellen aus dem Patienten, Kostimulieren der T-Zellen in vitro mit viral antigen-gepulsten APCs, wobei entweder ein Peptid, das durch die erweiterten cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, oder zusammen mit einer stimulatorischen Form eines löslichen Peptids, das durch die erweiterten cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet ist, exprimiert wird, und Wiedereinführen der in vitro vorbehandelten (primed) T-Zellen in den Patienten. Die infizierten Zellen sind nun in der Lage, ein kostimulatorisches Signal an T-Zellen in vivo abzugeben, wodurch die T-Zellen aktiviert werden.
In einer anderen Anwendung kann die Hochregulierung oder Steigerung der Antigenfunktion (vorzugsweise B-Lymphozyt-Antigenfunktion) bei der Induktion von Tumorimmunität nützlich sein. Tumorzellen (z.B. Sarcoma, Melanoma, Lymphoma, Leukämie, Neuroblastoma, Carcinoma), die mit einer Nukleinsäure transfiziert sind, die wenigstens ein Peptid kodiert, das durch cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, können einem Probanden verabreicht werden, um eine tumorspezifische Toleranz in dem Proband zu überwinden. Wenn gewünscht, kann die Tumorzelle transfiziert werden, um eine Kombination von Peptiden zu exprimieren. Beispielsweise können von einem Patienten erhaltene Tumorzellen ex vivo mit einem Expressionsvektor transfiziert werden, der die Expression eines Peptids mit ausschließlich B7-2-artiger Aktivität oder in Verbindung mit einem Peptid mit B7-1-artiger Aktivität und/oder B7-3-artiger Aktivität lenkt. Die transfizierten Tumorzellen werden an den Patienten zurückgegeben, um eine Expression der Peptide auf der Oberfläche der transfizierten Zelle zu bewirken. Alternativ können Gentherapietechniken verwendet werden, um eine Tumorzelle als Zielstruktur für eine Transfektion in vivo anzusprechen.
Das Vorliegen der durch die erweiterten cDNAs kodierten Peptide, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, mit der Aktivität eines/von B-Lymphozyt-Antigens/Antigenen auf der Tumorzellenoberfläche stellt das notwendige Kostimulierungssignal für T-Zellen bereit, um eine T-Zell vermittelte Immunantwort gegen die transfizierten Tumorzellen zu induzieren. Darüber hinaus können Tumorzellen, die keine MHC Klasse I- oder MHC Klasse II-Moleküle reexprimieren können oder unzureichende Mengen davon reexprimieren, mit Nukleinsäuren transfiziert werden, die eine vollständige oder einen Teil (z.B. ein verkürzter Abschnitt einer zytoplasmatischen Domäne) einer MHC Klasse I α-Kette und β₂-Microglobulin oder einer MHC Klasse II α-Kette und einer MHC Klasse II β-Kette kodieren, um so MHC Klasse I- bzw. MHC Klasse II-Proteine auf der Zelloberfläche zu exprimieren. Die Expression geeigneter MHC Klasse I- oder MHC Klasse II-Moleküle in Verbindung mit einem Peptid, das die Aktivität eines B-Lymphozyten-Antigens aufweist (z.B. B7-1, B7-2, B7-3), induziert eine T-Zell vermittelte Immunantwort gegen die transfizierte Tumorzelle. Gegebenenfalls kann auch ein Antisense-Konstrukt kodierendes Gen, das die Expression eines MHC Klasse II assoziierten Proteins blockiert, wie beispielsweise die Invariante Kette, ebenfalls mit einer ein Peptid kodierenden DNA kotransfiziert werden, wobei dieses Peptid die Aktivität eines B-Lymphozyten-Antigens aufweist, um so die Präsentation tumorassoziierter Antigene zu fördern und um tumorspezifische Immunität zu induzieren. Daher kann die Induktion einer T-Zell vermittelten Immunantwort in einem menschlichen Probanden ausreichen, um die tumorspezifische Toleranz in dem Probanden zu überwinden. Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die diese für das Immunsystem regulatorischen Proteine kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in eine geeignete Wirtszelle eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 34
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich einer Blutdruck regulierenden Aktivität
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch hinsichtlich ihrer Blutdruck regulierenden Aktivität beurteilt werden. Beispielsweise kann die Wirkung der Proteine auf die nichthumane embryonale Stammzelldifferenzierung beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben sind: Johansson et al., Cell. Biol. 15:141-151, 1995; Keller et al., Mol. Cell. Biol. 13:473-486, 1993; McClanahan et al., Blood 81:2903-2915, 1993.
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine, können auch hinsichtlich ihres Einflusses auf die Lebensdauer von Stammzellen und die Stammzelldifferenzierung beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben sind: Freshney, Methylzellulosekoloniebildende Assays, in Culture of Hematopoietic Cells., Freshney et al., Hrsg., Seiten 265-268, Wiley-Liss, Inc., New York, NY. 1994; Hirayama et al., Proc. Natl. Acad. Sci. USA 89:5907-5911, 1992; McNiece und Briddell, in Culture of Hematopoietic Cells, supra; Neben et al., Exp. Hematol. 22:353-359, 1994; Ploemacher und Cobblestone in Culture of Hematopoietic Cells, supra, 1-21; Spooncer et al., in Culture of Hematopoietic Cells, supra 163-179 und Sutherland in Culture of Hematopoietic Cells, supra, 139-162.
Die eine Blutdruck regulierende Aktivität aufweisenden Proteine können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, unter denen die Regulierung von Blutdruck günstig ist, wie beispielsweise bei der Behandlung von Knochenmark- oder Lymphoidzellmängeln. Eine Beteiligung bei der Regulierung von Blutdruck wird sogar auch durch eine geringfügige biologische Aktivität zugunsten von koloniebildenden Zellen oder von faktorabhängigen Zelllinien deutlich. Zum Beispiel zeigen Proteine, die das Wachstum und die Proliferation von Erythroidvorläuferzellen allein oder in Kombination mit anderen Zytokinen stimulieren, einen Nutzen, beispielsweise bei der Behandlung verschiedener Anämien oder zur Verwendung in Verbindung mit Bestrahlung/Chemotherapie, um die Produktion von Erythroidvorläufer und/oder Erythroidzellen zu stimulieren. Proteine, die das Wachstum und die Proliferation von Knochenmarkszellen stimulieren, wie beispielsweise Granulozyten und Monozyten/Macrophagen (d.h. herkömmliche CSF-Aktivität), können beispielsweise in Verbindung mit Chemotherapie nützlich sein, um einer nachfolgenden Knochenmarksdepression vorzubeugen oder diese zu behandeln. Proteine, die das Wachstum und die Proliferation von Megakaryozyten und infolge dessen von Plättchen unterstützen, ermöglichen die Vorbeugung oder die Behandlung verschiedener Plättchenerkrankungen, wie beispielsweise von Thrombozytopenie, und können im Allgemeinen anstelle von oder ergänzend zu Plättchentransfusionen verwendet werden. Proteine, die das Wachstum und die Proliferation von hämatopoetischen Stammzellen unterstützen, die in der Lage sind, zu beliebigen und allen oben erwähnten hämatopoetischen Zellen zu reifen, können deshalb sowohl bei verschiedenen Stammzellerkrankungen ihren therapeutischen Nutzen finden (wie beispielsweise denjenigen, die gewöhnlich mit Transplantation behandelt werden, einschließlich aber ohne Beschränkung auf aplastische Anämie und paroxysmale nächtliche Hämoglobinurie), als auch bei der Neubesiedlung des Stammzellkompartments nach Bestrahlung/Chemotherapie entweder in vivo oder ex vivo (d.h. in Verbindung mit Knochenmarktransplantation oder mit peripherer Stammzelltransplantation (homolog oder heterolog)), als auch als normale oder genetisch veränderte Zellen zur Gentherapie. Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine mit Blutdruck regulierender Aktivität kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingebracht werden, um wie gewünscht die Expression der Proteine zu steigern oder zu verringern.
BEISPIEL 35
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich der Regulation von Gewebewachstum
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch hinsichtlich ihrer Wirksamkeit auf Gewebewachstum beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in der internationalen Patentveröffentlichung Nr. WO 95/16035, der internationalen Patentveröffentlichung Nr. WO 95/05846 und der internationalen Patentveröffentlichung Nr. WO 91/07491 offenbart sind.
Assays zur Wundheilungsaktivität umfassen ohne Beschränkung die Assays, die beschrieben sind in: Winter, Epidermal Wound Healing, Seiten 71-112, Maibach und Rovee, Hrsg., Year Book Medical Publishers, Inc., Chicago, sowie die durch Eaglstein und Mertz, J. Invest. Dermatol. 71:382-84, 1978 veränderten Assays, und die hierin durch Referenz eingeschlossen sind.
Diejenigen Proteine, die an der Regulation von Gewebewachstum beteiligt sind, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, bei denen die Regulation von Gewebewachstum günstig ist. Beispielsweise kann ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, sowohl auch in Zusammensetzungen nützlich sein, die zum Knochen-, Knorpel-, Sehnen-, Bänder- und/oder Nervengewebewachstum oder – regeneration verwendet werden, als auch bei der Wundheilung und zur Erneuerung und zum Ersatz von Gewebe, sowie bei der Behandlung von Verbrennungen, Schnittwunden und Entzündungen Verwendung finden.
Ein Protein, das durch erweiterte cDNAs kodiert wird, die aus den hierin beschriebenen 5'-ESTs abgeleitet sind, das Knorpel- und/oder Knochenwachstum unter Umständen induziert, unter denen Knochen normalerweise nicht gebildet wird, findet bei der Heilung von Knochenbrüchen und Knorpelschaden oder- defekten in Menschen oder anderen Tieren Anwendung. Eine derartige Präparation, die auf ein erfindungsgemäßes Protein zurückgreift, kann prophylaktisch zur Linderung sowohl von geschlossenen als auch offenen Brüchen und auch für eine verbesserte Fixierung künstlicher Verbindungsstücke verwendet werden. Eine de novo Knochensynthese, die durch ein osteogenes Mittel induziert wird, trägt zur Reparatur congenitaler, traumainduzierter oder onkologischer resektionsinduzierter, den Schädel betreffender Defekte bei und ist in der kosmetisch-plastischen Chirurgie ebenfalls nützlich.
Ein erfindungsgemäßes Protein kann auch bei der Behandlung peridontaler Erkrankungen und anderen Verfahren zur Zahnreparatur verwendet werden. Solche Mittel können eine Umgebung bereitstellen, um knochenbildende Zellen anzuziehen, das Wachstum knochenbildender Zellen zu stimulieren oder die Differenzierung von Vorläufern knochenbildender Zellen zu induzieren. Ein erfindungsgemäßes Protein kann auch bei der Behandlung von Osteoporose und Osteoarthritis nützlich sein, wie beispielsweise durch Stimulation der Knochen- und/oder Knorpelreparatur oder durch Blockieren von Entzündungen oder Prozessen des Gewebeabbaus (Collagenaseaktivität, Osteoklastenaktivität etc.), die durch Entzündungsprozesse vermittelt werden.
Eine andere Kategorie geweberegenerierender Aktivität, die dem Protein zugeschrieben werden kann, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, ist die Sehnen/Bänderbildung. Ein Protein, das von erweiterten cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, das sehnen/bänderartiges Gewebe oder andere Gewebebildung unter Umständen induziert, unter welchen sich Gewebe normalerweise nicht bildet, findet beim Heilen von Sehnen- oder Bänderrissen, Fehlbildungen oder anderen Sehnen- oder Bänderdefekten in Menschen oder anderen Tieren Anwendung. Eine derartige Präparation, die ein sehnen/bänderartiges Gewebe induzierendes Protein verwendet, kann sowohl bei der Schadensvorbeugung für Sehnen- oder Bändergewebe prophylaktische Anwendung finden als auch für eine verbesserten Fixierung von Sehnen oder Bändern gegenüber Knochen oder anderen Geweben, sowie beim Reparieren von Defekten von Sehnen- oder Bändergewebe verwendet werden. Eine de novo Bildung von sehnen/bänderartigen Geweben, das durch eine Zusammensetzung induziert wird, die durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, trägt zur Reparatur von Sehnen- oder Bänderdefekten mit congen talem, traumatischem oder anderem Ursprung bei und ist in der kosmetisch-plastischen Chirurgie zum Anbringen oder Reparieren von Sehnen oder Bändern ebenfalls anwendbar. Die Zusammensetzungen, die durch erweiterte cDNAs kodiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, können eine Umgebung bereitstellen, um bänder- oder sehnenbildende Zellen anzuziehen, das Wachstum von bänder- oder sehnenbildenden Zellen zu stimulieren, die Differenzierung von Vorläufern von bänder- oder sehnenbildenden Zellen zu induzieren oder das Wachstum von Bänder-/Sehnenzellen oder Vorläuferzellen ex vivo für eine Rückgabe in vivo zu induzieren, um dort eine Gewebereparatur zu bewirken. Die hierin beschriebenen Zusammensetzungen können auch bei der Behandlung von Tendinitis, Carpaltunnelsyndrom und anderen Sehnen- oder Bänderdefekten nützlich sein. Die Zusammensetzungen können wie im Fachbereich bekannt auch eine geeignete Matrix und/oder ein absonderndes Mittel als Träger enthalten.
Das Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann auch zur Proliferation neuraler Zellen und zur Regenerierung von Nerven- und Gehirngewebe anwendbar sein, d.h. sowohl zur Behandlung von Erkrankungen des zentralen und peripheren Nervensystems und Neuropathien als auch von mechanischen und traumatischen Erkrankungen, die eine Degenerierung, ein Absterben oder Trauma von Neuralzellen oder Nervengewebe umfassen, verwendet werden. Insbesondere kann ein Protein zur Behandlung von Erkrankungen des peripheren Nervensystems verwendet werden, wie beispielsweise Verletzungen peripherer Nerven, peripherer Neuropathie und lokalisierten Neuropathien und Erkrankungen des zentralen Nervensystems, wie beispielsweise der Alzheimer-Erkrankung, Parkinson-Erkrankung, Huntington-Erkrankung, amyotropher Lateralsklerose und Shy-Drager-Syndrom. Weitere Zustände, die in Übereinstimmung mit der vorliegenden Erfindung behandelt werden können, umfassen mechanische und traumatische Erkrankungen, wie beispielsweise Rückenmarkserkrankungen, Schädeltrauma und cerebrovaskuläre Erkrankungen, wie beispielsweise Apoplexie. Periphere Neuropathien, die aus Chemotherapie oder anderen medizinischen Therapien herrühren, können ebenfalls unter Verwendung eines erfindungsgemäßen Proteins behandelbar sein.
Erfindungsgemäße Proteine können auch nützlich sein, um ein besseres Verschließen von nicht heilenden Wunden zu fördern, einschließlich aber ohne Beschränkung auf Druckulzeration, mit vaskulärer Insuffizienz im Zusammenhang stehende Ulzerationen, chirurgische und traumatische Wunden und dergleichen.
Es wird erwartet, dass ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch eine Aktivität hinsichtlich der Erzeugung oder Regenerierung anderer Gewebe aufweist, wie beispielsweise Organen (einschließlich zum Beispiel Bauchspeicheldrüse, Leber, Darm, Niere, Haut, Endothel), Muskeln (glatt, quergestreift oder Herz) und vaskulärem Gewebe (einschließlich vaskuläres Endothel) oder zur Wachstumsförderung von Zellen, die solches Gewebe umfassen, dient. Ein Teil der gewünschten Wirkungen kann durch Hemmung oder Veränderung fibrotischer Narbenbildung erreicht werden, um es so normalem Gewebe zu ermöglichen sich zu bilden. Ein erfindungsgemäßes Protein kann auch angiogenetische Aktivität aufweisen.
Ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann ebenfalls zum Schutz oder zur Regeneration des Darms, sowie zur Behandlung von Lungen- oder Leberfibrose, für Reperfusionsverletzungen in verschiedenen Geweben und Zuständen, die aus einem systemischen Zytokinschaden herrühren, anwendbar sein.
Ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann auch beim Fördern oder Hemmen der Differenzierung von oben beschriebenen Geweben aus Vorläufergeweben oder -zellen oder zur Hemmung des Wachstums von oben beschriebenen Geweben nützlich sein.
Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine mit wachstumsregulierender Aktivität kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingebracht werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 36
Untersuchung der durch die erweiterten cDNAs oder durch Abschnittn davon exprimierten Proteine hinsichtlich der Regulation von Fortpflanzungshormonen
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch hinsichtlich ihrer Fähigkeit Fortpflanzungshormone zu regulieren, beurteilt werden, wie beispielsweise Follikel stimulierende Hormone. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Vale et al., Endocrinol. 91:562-572, 1972; Ling et al., Nature 321:779-782, 1986; Vale et al., Nature 321:776-779, 1986; Mason et al., Nature 318:659-663, 1985; Forage et al., Proc. Natl. Acad. Sci. USA 83:3091-3095, 1986, Kapitel 6.12 in Current Protocols in Immunology, Coligan et al. Hrsg. Greene Publishing Associates and Wiley-Interscience; Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:140-146, 1995; Muller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol. 153:1762-1768, 1994.
Die Proteine, die Aktivität wie Fortpflanzungshormone oder wie Regulatoren der Zellbewegung aufweisen, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in welchen die Regulation von Fortpflanzungshormonen günstig ist. Beispielsweise kann ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch mit Activin oder Inhibin in Zusammenhang stehende Aktivitäten aufweisen. Inhibine sind durch ihre Fähigkeit gekennzeichnet, die Freisetzung des follikelstimulierenden Hormons (FSH) zu hemmen, während Activine durch ihre Fähigkeit gekennzeichnet sind, die Freisetzung von FSH zu stimulieren. Daher kann ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, allein oder in Form von Heterodimeren mit einem Mitglied der Inhibin α-Familie als Verhütungsmittel anwendbar sein, wobei dies auf der Fähigkeit der Inhibine basiert, die Fruchtbarkeit in weiblichen Säugern abzusenken sowie die Spermatogenese in männlichen Säugern abzusenken. Die Verabreichung ausreichender Mengen anderer Inhibine kann in diesen Säugern Unfruchtbarkeit induzieren. Alternativ kann das erfindungsgemäße Protein als Homodimer oder Heterodimer mit anderen Proteinuntereinheiten der Inhibin-B-Gruppe als Fruchtbarkeit induzierendes Therapeutikum verwendet werden, wobei dies auf der Fähigkeit von Activinmolekülen basiert, die FSH-Freisetzung aus Zellen des Hypophysenvorderlappens zu stimulieren. Siehe zum Beispiel US-Patent 4,798,885. Ein erfindungsgemäßes Protein kann auch zur Förderung des Beginns der Fruchtbarkeit in nicht geschlechtsreifen Säugetieren anwendbar sein, um so die reproduktive Lebensleistung von Haustieren, wie beispielsweise Kühen, Schafen und Schweinen, zu erhöhen.
Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine mit regulierender Aktivität hinsichtlich von Fortpflanzungshormonen kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 37
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich ihrer chemotaktischen/chemokinetischen Aktivität
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch bezüglich ihrer chemotaktischen/chemokinetischen Aktivität beurteilt werden. Beispielsweise kann ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, chemotaktische oder chemokinetische Aktivität für Säugetierzellen aufweisen (z.B. als ein Chemokin wirken), einschließlich zum Beispiel Monozyten, Fibroblasten, Neutrophile, T-Zellen, Mastzellen, Eosinophile, Epithel- und/oder Endothelzellen. Chemotaktische und chemokinetische Proteine können verwendet werden, um eine gewünschte Zellpopulation für einen gewünschten Wirkungsort zu mobilisieren oder anzuziehen. Chemotaktische oder chemokinetische Proteine stellen sowohl bestimmte Vorteile bei der Behandlung von Wunden und anderen Gewebetrauma als auch bei der Behandlung lokalisierter Infektionen bereit. Beispielsweise kann das Anziehen von Lymphozyten, Monozyten oder Neutrophilen zu Tumoren oder Infektionsstellen zu verbesserten Immunantworten gegen den Tumor oder das infektiöse Mittel führen.
Ein Protein oder Peptid weist für eine bestimmte Zellpopulation chemotaktische Aktivität auf, wenn es die gerichtete Orientierung oder Bewegung einer solchen Zellpopulation direkt oder indirekt stimulieren kann. Vorzugsweise weist das Protein oder Peptid die Fähigkeit auf, die gerichtete Bewegung der Zellen direkt zu stimulieren. Ob ein bestimmtes Protein chemotaktische Aktivität für eine Zellpopulation aufweist, kann unter Verwendung eines derartigen Proteins oder Peptids auf einfache Weise in jedem bekannten Assay zur Chemotaxis von Zellen bestimmt werden.
Die Aktivität eines erfindungsgemäßen Proteins kann neben anderen Möglichkeiten durch die folgenden Verfahren gemessen werden: Assays zur chemotaktischen Aktivität (die Proteine identifizieren, die Chemotaxis induzieren oder verhindern) bestehen aus Assays, die sowohl die Fähigkeit eines Proteins messen, die Wanderung von Zellen über eine Membran hinweg zu induzieren als auch die Fähigkeit eines Proteins, die Adhäsion einer Zellpopulation an eine andere Zellpopulation zu induzieren. Geeignete Assays zur Bewegung und Adhäsion umfassen ohne Beschränkung diejenigen die beschrieben sind in: Current Protocols in Immunology, Hrsg. von Coligan, Kruisbeek, Margulies, Shevach und Strober, Pub. Greene Publishing Associates and Wiley-Interscience, Kapitel 6.12:6.12.1-6.12.28; Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:140-146, 1995; Mueller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol., 153:1762-1768, 1994.
BEISPIEL 38
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich der Regulation der Blutgerinnung
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch hinsichtlich ihrer Wirkungen auf die Blutgerinnung beurteilt werden. Zahlreiche Assays auf eine derartige Aktivität hin sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen offenbart sind: Linet et al., J. Clin. Pharmacol. 26:131-140, 1986; Burdick et al., Thrombosis Res. 45:413-419, 1987; Humphrey et al., Fibrinolysis 5:71-79, 1991; Schaub, Prostaglandins 35:467-474, 1988.
Die Proteine, die an der Regulierung der Blutgerinnung beteiligt sind, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, bei welchen die Regulierung der Blutgerinnung günstig ist. Beispielsweise kann ein erfindungsgemäßes Protein hämostatische oder thrombolytische Aktivität aufweisen. Im Ergebnis wird von einem derartigen Protein erwartet, dass es bei der Behandlung verschiedener Gerinnungskrankheiten (einschließlich Erbrankheiten, wie zum Beispiel Bluterkrankheiten) oder zur Steigerung der Gerinnung und anderen hämostatischen Ereignissen beim Behandeln von Wunden, die aus Trauma, chirurgischen Eingriffen oder anderen Gründen herrühren, nützlich ist. Ein erfindungsgemäßes Protein kann auch zur Auflösung oder zur Bildungshemmung von Thrombosen und zur Behandlung und Vorbeugung von Zuständen, die sich daraus ergeben (wie beispielsweise Herzinfarkt und Infarkt von Gefäßen des zentralen Nervensystems (z.B. Apoplexie)), nützlich sein. Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine mit Blutgerinnungsaktivität kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingefügt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 39
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich ihrer Beteiligung bei Rezeptor/Ligandwechselwirkungen
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch hinsichtlich ihrer Beteiligung bei Rezeptor/Ligandwechselwirkungen beurteilt werden. Zahlreiche Assays im Hinblick auf eine derartige Beteiligung sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen offenbart werden: Kapitel 7. 7.28.1-7.28.22 in Current Protocols in Immunology, Coligan et al. Hrsg. Greene Publishing Associates and Wiley-Interscience; Takai et al., Proc. Natl. Acad. Sci. USA 84:6864-6868, 1987; Bierer et al., J. Exp. Med. 168:1145-1156, 1988; Rosenstein et al., J. Exp. Med. 169:149-160, 1989; Stoltenborg et al., J. Immunol. Methods 175:59-68, 1994; Stitt et al., Cell 80:661-670, 1995; Gyuris et al., Cell 75:791-803, 1993.
Beispielsweise können die Proteine, die durch erweiterte cDNAs kodiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch Aktivität als Rezeptoren, Rezeptorliganden oder Inhibitoren oder als Agonisten von Rezeptor/Ligandwechselwirkungen aufweisen. Beispiele für solche Rezeptoren und Liganden umfassen ohne Beschränkung Zytokinrezeptoren und ihre Liganden, Rezeptorkinasen und ihre Liganden, Rezeptorphosphatasen und ihre Liganden, Rezeptoren, die an Zell-Zell-Wechselwirkungen beteiligt sind und ihre Liganden (einschließlich aber ohne Beschränkung auf zelluläre Adhäsionsmoleküle (wie beispielsweise Selektine, Integrine und ihre Liganden) und Rezeptor/Ligandpaare, die bei der Antigenpräsentation, Antigenerkennung und an der Entwicklung zellulärer und humoraler Immunantworten beteiligt sind). Rezeptoren und Liganden sind auch zum Screening nach möglichen Peptiden oder kleinen Molekülen, die als Inhibitoren der relevanten Rezeptor/Ligandwechselwirkung wirken, nützlich. Ein Protein, das durch erweiterte cDNAs kodiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind (einschließlich aber ohne Beschränkung auf Fragmente von Rezeptoren und Liganden), kann selbst als Inhibitor von Rezeptor/Ligandwechselwirkungen verwendet werden. Alternativ, wie es weiter unten ausführlicher beschrieben wird, können Gene, die Proteine kodieren, die bei Rezeptor/Ligandwechselwirkungen beteiligt sind, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 40
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich entzündungshemmender Aktivität
Die durch die erweiterten cDNAs oder einen Abschnitt davon kodierten Proteine können auch hinsichtlich ihrer entzündungshemmenden Aktivität beurteilt werden. Die entzündungshemmenden Aktivität kann durch Bereitstellen eines Stimulus für an der Entzündungsreaktion beteiligte Zellen, durch Hemmung oder Förderung von Zell-Zell-Wechselwirkungen (wie zum Beispiel Zelladhäsion), durch Hemmung oder Förderung von am Entzündungsprozess beteiligter Zellchemotaxis, durch Hemmung oder Förderung von Flüssigkeitsaustritt aus der Zelle oder durch Stimulierung oder Unterdrückung der Produktion anderer Faktoren, die eine Entzündungsreaktion auf direktere Weise hemmen oder fördern, erreicht werden. Proteine, die solche Aktivitäten aufweisen, können verwendet werden, um entzündliche Zustände zu behandeln, einschließlich chronischer oder akuter Zustände, einschließlich aber ohne Beschränkung auf Entzündungen, die im Zusammenhang stehen mit einer Infektion (wie zum Beispiel septischer Schock, Sepsis oder systemisches Entzündungsreaktionssyndrom), Ischämie-Reperfusionsverletzung, Endotoxin-Sterblichkeit, Arthritis, komplementvermittelte hyperakute Abstoßungsreaktion, Nephritis, Zytokin- oder chemokininduzierte Lungenverletzung, entzündliche Darmerkrankung, Crohn-Erkrankung oder die sich aus einer Überproduktion von Zytokinen ergeben, wie beispielsweise TNF oder IL-1. Erfindungsgemäße Proteine können auch nützlich sein, um Anaphylaxie und Hyperempfindlichkeit gegenüber einer antigenischen Substanz oder einem antigenischen Material zu behandeln. Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine mit entzündungshemmender Aktivität kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 41
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich Aktivität bei der Hemmung von Tumoren
Die durch die erweiterten cDNAs oder Abschnitte davon kodierten Proteine können auch hinsichtlich ihrer Aktivität bei der Hemmung von Tumoren beurteilt werden. Zusätzlich zu den oben beschriebenen Aktivitäten zur immunologischen Behandlung oder Vorbeugung von Tumoren kann ein erfindungsgemäßes Protein andere Antitumoraktivität aufweisen. Ein Protein kann Tumorwachstum direkt oder indirekt (wie zum Beispiel durch ADCC) hemmen. Ein Protein kann seine Wirkung bei der Tumorhemmung durch Einwirken auf Tumorgewebe oder Tumorvorläufergewebe, durch Hemmung der Bildung von Geweben, die notwendig sind, um das Tumorwachstum zu unterstützen (wie beispielsweise durch Hemmung von Angiogenese), durch ein Bewirken einer Produktion anderer Tumorwachstum hemmender Faktoren, Mittel oder Zelltypen oder durch Unterdrücken, Entfernen oder Hemmen von Tumorwachstum fördernden Faktoren, Mitteln oder Zelltypen zeigen. Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine mit einer Tumor hemmenden Aktivität kodieren, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Ein erfindungsgemäßes Protein kann auch eine oder mehrere der folgenden zusätzlichen Aktivitäten oder Wirkungen aufweisen: Hemmung des Wachstums, Infektion oder Funktion von, oder das Abtöten von, infektiösen Mitteln, einschließlich, aber ohne Beschränkung auf Bakterien, Viren, Pilze und andere Parasiten; Einwirkung auf körperliche Merkmale (unterdrückend oder verstärkend), einschließlich, aber ohne Beschränkung auf Größe, Gewicht, Haarfarbe, Augenfarbe, Haut, Fett-zu-Fettfreiverhältnis oder eine andere Gewebepigmentierung oder Größe oder Form von Organen oder des Körpers (beispielsweise Brustvergrößerung oder -verkleinerung, Änderung der Knochenform oder -gestalt); Einwirken auf den Biorhythmus oder 24-Stunden-Zyklen oder Rhythmen: Einwirken auf die Fruchtbarkeit von männlichen oder weiblichen Probanden; Einwirken auf den Metabolismus, Katabolismus, Anabolismus, die Verarbeitung, die Verwertung, Speicherung oder Entfernung von diätischem Fett, Lipid, Protein, Kohlenhydrat, Vitaminen, Mineralien, Cofaktoren oder anderen Ernährungsfaktoren oder -komponente(n); Einwirken auf Verhaltensmerkmale, einschließlich, aber ohne Beschränkung auf Appetit, Libido, Stress, Denkfähigkeit (einschließlich kognitiver Erkrankungen), Depression (einschließlich depressiver Erkrankungen) und gewalttätigen Verhaltensmustern; Bereitstellung analgetischer Wirkungen oder anderer schmerzverringernder Wirkungen; Förderung von Differenzierung und Wachstum von embryonalen Stammzellen in Linien, die sich von hämotopoetischen Linien unterscheiden; hormonelle oder endokrine Aktivität; im Fall von Enzymen Korrektur von Mangelfunktionen des Enzyms und Behandlung von Erkrankungen, die mit einer Mangelfunktion im Zusammenhang stehen; Behandlung hyperproliferativer Erkrankungen (wie beispielsweise Psoriasis); immunglobulinartiger Aktivität (wie beispielsweise die Fähigkeit, Antigene oder ein Komplement zu binden); und die Fähigkeit, als Antigen in einer Impfstoffzusammensetzung zu wirken, um eine Immunantwort gegen ein derartiges Protein oder ein anderes Material oder eine Einheit, die mit einem derartigen Protein kreuzreaktiv ist, hervorzurufen. Alternativ können, wie es weiter unten ausführlicher beschrieben wird, Gene, die Proteine kodieren, die mit einer der oben dargelegten Aktivitäten in Zusammenhang stehen, oder Nukleinsäuren, die die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
BEISPIEL 42
Identifizierung von Proteinen, die mit durch erweiterte cDNAs kodierten Polypeptiden Wechselwirken
Proteine, die mit den Polypeptiden wechselwirken, die durch erweiterte cDNAs kodiert werden, die von den 5'-ESTs oder Fragmenten davon abgeleitet sind, wie beispielsweise Rezeptorproteine, können unter Verwendung von zwei Hybridsystemen, wie beispielsweise dem Matchmaker Two Hybrid System 2 (Katalog Nr. K1604-1, Clontech), identifiziert werden. Wie es im dem Kit beigelegten Handbuch beschrieben wird, werden die cDNAs, die von den 5'-ESTs abgeleitet sind, oder Fragmente davon in einen Expressionsvektor insertiert, so dass sie sich im Leserahmen mit DNA befinden, die die DNA-Bindungsdomäne des Hefetranskriptionsaktivators GAL4 kodiert. cDNAs in einer cDNA-Bibliothek, die Proteine kodiert, die mit den Polypeptiden, die durch die erweiterten cDNAs oder Abschnitte davon kodiert werden, wechselwirken könnten, werden in einen zweiten Expressionsvektor insertiert, so dass sie sich im Leserahmen mit der DNA befinden, die die Aktivierungsdomäne von GAL4 kodiert. Die zwei Expressionsplasmide werden in Hefe transformiert und die Hefe wird auf Selektionsmedium ausplattiert, das sowohl hinsichtlich einer Expression selektierbarer Marker auf jedem der beiden Expressionsvektoren als auch hinsichtlich der GAL4-abhängigen Expression des HIS3-Gens selektiert. Transformanten, die in der Lage sind, auf Medium, das kein Histidin enthält, zu wachsen, werden hinsichtlich GAL4-abhängiger lacZ-Expression durchmustert. Solche Zellen, die sowohl bezüglich der Histidinselektion und des lacZ-Assays positiv sind, enthalten Plasmide, die Proteine kodieren, die mit den Polypeptiden Wechselwirken, die durch die erweiterten cDNAs oder Abschnitte kodiert werden.
Alternativ kann das System, das in Lustig et al., Methods in Enzymology 283:83-99, 1997 und im US-Patent Nr. 5,654,150 beschrieben wird, verwendet werden, um Moleküle zu identifizieren, die mit den Polypeptiden wechselwirken, die durch erweiterte cDNAs kodiert werden. In solchen Systemen werden in vitro-Transkriptionsreaktionen bezüglich eines Pools von Vektoren durchgeführt, die erweiterte cDNA-Inserts enthalten, die stromabwärts eines Promotors kloniert sind, der die in vitro-Transkription lenkt. Die sich ergebenden mRNA-Pools werden in Xenopus laevis Oozyten eingeführt. Die Oozyten werden anschließend hinsichtlich einer gewünschten Aktivität untersucht.
Alternativ können die zusammengefassten, wie oben beschrieben hergestellten in vitro-Transkriptionsprodukte in vitro translatiert werden. Die zusammengefassten in vitro-Translationsprodukte können hinsichtlich einer gewünschten Aktivität oder hinsichtlich einer Wechselwirkung mit einem bekannten Polypeptid untersucht werden.
Proteine oder andere Moleküle, die mit Polypeptiden wechselwirken, die durch erweiterte cDNAs kodiert werden, können durch eine Vielfalt zusätzlicher Techniken nachgewiesen werden. In einem Verfahren können Affinitätssäulen erstellt werden, die das Polypeptid enthalten, das durch die erweiterte cDNA oder einen Abschnitt davon kodiert wird. In einigen Versionen dieses Verfahrens enthält die Affinitätssäule chimäre Proteine, in denen das Protein, das durch die erweiterten cDNAs oder einen Abschnitt davon kodiert wird, mit einer Glutathion-S-Transferase fusioniert ist. Ein Gemisch zellulärer Proteine oder ein Pool wie oben beschrieben exprimierter Proteine wird auf die Affinitätssäule aufgetragen. Proteine, die mit dem Polypeptid wechselwirken, das an die Säule angefügt ist, können anschließend isoliert und auf einem 2-D-Elektrophoresegel analysiert werden, wie es in Rasmunsen et al., Electrophoresis 18:588-598, 1997, beschrieben wird. Alternativ können die Proteine, die auf der Affinitätssäule zurückgehalten werden, durch Verfahren, die auf Elektrophorese basieren, gereinigt und sequenziert werden. Das gleiche Verfahren kann verwendet werden, um Antikörper zu isolieren, um nach Produkten aus Phage Display zu durchmustern oder Phage Display humane Antikörper durchzumustern.
Proteine, die mit Polypeptiden wechselwirken, die durch erweiterte cDNAs oder Abschnitte davon kodiert werden, können auch unter Verwendung eines optischen Biosensors durchmustert werden, wie er in Edwards und Leatherbarrow, Analytical Biochemistry 246:1-6,1997, beschrieben wird. Der Hauptvorteil des Verfahrens ist, dass es die Bestimmung der Assoziierungsrate zwischen dem Protein und anderen wechselwirkenden Molekülen ermöglicht. Daher ist es möglich, spezifisch wechselwirkende Moleküle mit einer hohen oder niedrigen Assoziierungsrate zu selektieren. Typischerweise wird ein Zielmolekül mit einer Sensoroberfläche verknüpft (über eine Carboxymethyldextranmatrix) und eine Probe mit Testmolekülen wird mit den Zielmolekülen in Kontakt gebracht. Das Binden eines Testmoleküls an das Zielmolekül führt zu einer Veränderung hinsichtlich des Brechungsindex und/oder der Dicke. Diese Veränderung wird durch den Biosensor detektiert, vorausgesetzt sie vollzieht sich im evaneszenten Feld (das sich einige hundert Nanometer von der Sensoroberfläche ausdehnt). In diesen Screening-Assays kann das Zielmolekül eines der Polypeptide sein, die durch erweiterte cDNAs oder einen Abschnitt davon kodiert werden, und die Testprobe kann eine Proteinkollektion sein, die aus Geweben oder Zellen extrahiert wurde, ein Pool exprimierter Proteine, kombinatorische Peptide und/oder chemische Bibliotheken oder Peptide aus Phage Display. Die Gewebe oder Zellen, von welchen die Testproteine extrahiert werden, können von jeder beliebigen Spezies stammen.
In anderen Verfahren wird ein Zielmolekül immobilisiert und die Testpopulation ist eine Kollektion einzelner Polypeptide, die durch die erweiterten cDNAs oder Abschnitte davon kodiert wird.
Um die Wechselwirkung der Proteine, die durch die erweiterten cDNAs oder Abschnitte davon kodiert werden, mit Wirkstoffen zu untersuchen, kann das mit Mikrodialyse gekoppelte HPLC-Verfahren, das von Wang et al., Chromatographia 44:205-208, 1997, beschrieben wurde, oder das Affinitätskapillarelektrophoreseverfahren, das von Busch et al., J. Chromatogr. 777:311-328, 1997, beschrieben wurde, verwendet werden:
Es wird vom Fachmann erkannt, dass die von den erweiterten cDNAs oder Abschnitten davon exprimierten Proteine zusätzlich zu den weiter oben spezifisch aufgezählten Aktivitäten hinsichtlich zahlreicher anderer Aktivitäten untersucht werden können. Beispielsweise können die exprimierten Proteine hinsichtlich Anwendungen beurteilt werden, die Kontrolle und Regulierung von Entzündungen, Tumorproliferation oder Metastasis, Infektionen oder andere klinische Zustände umfassen. Zusätzlich können die von den erweiterten cDNAs oder Abschnitten davon exprimierten Proteine als Nahrungsmittel oder kosmetische Mittel nützlich sein.
Die von den cDNAs oder Abschnitten davon exprimierten Proteine können verwendet werden, um Antikörper zu erzeugen, die in der Lage sind, spezifisch an das exprimierte Protein oder Fragmente davon zu binden, wie es in Beispiel 40 weiter unten beschrieben wird. Die Antikörper können in der Lage sein, an ein Volllängenprotein, das durch eine cDNA kodiert wird, die von einem 5'-EST abgeleitet ist, an ein reifes Protein (d.h. das Protein, das durch Abspaltung des Signalpeptids erzeugt wird), das durch eine cDNA kodiert ist, die von einem 5'-EST abgeleitet ist, oder an ein Signalpeptid zu binden, das durch eine cDNA kodiert wird, die von einem 5'-EST abgeleitet ist. Alternativ können die Antikörper in der Lage sein, Fragmente mit wenigstens 10 Aminosäuren der Proteine, die durch die obigen cDNAs kodiert werden, zu binden. In einigen Ausführungsformen können die Antikörper in der Lage sein, Fragmente mit wenigstens 15 Aminosäuren der durch die obigen cDNAs kodierten Proteine zu binden. In anderen Ausführungsformen können die Antikörper in der Lage sein, Fragmente mit wenigstens 25 Aminosäuren der Proteine, die durch die erweiterten cDNAs exprimiert werden, die wenigstens 25 Aminosäuren der Proteine umfassen, die durch die obigen cDNAs kodiert werden, zu binden. In anderen Ausführungsformen können die Antikörper in der Lage sein, Fragmente von wenigstens 40 Aminosäuren der durch die obigen cDNAs kodierten Proteine zu binden.
BEISPIEL 43
Herstellung eines Antikörpers für ein humanes Protein
Ein im Wesentlichen reines Protein oder Polypeptid wird, wie in Beispiel 30 beschrieben, aus den transfizierten und transformierten Zellen isoliert. Die Konzentration des Proteins in der Endpräparation wird auf einen Wert im Bereich von einigen μg/ml angepasst, beispielsweise durch Konzentrierung auf einer Amicon-Filtervorrichtung. Ein monoklonaler oder polyklonaler Antikörper gegen das Protein kann anschließend wie folgt hergestellt werden:
1. Herstellung monoklonaler Antikörper durch Hybridom-Fusion
Monoklonale Antikörper gegen Epitope beliebiger Peptide, die wie oben beschrieben identifiziert und isoliert worden sind, können gemäß dem klassischen Verfahren von Kohler und Milstein, Nature 256:495, 1975, oder davon abgeleiteten Verfahren aus murinen Hybridomen hergestellt werden. In Kürze, eine Maus wird wiederholt mit wenigen Mikrogramm des ausgewählten Proteins oder davon abgeleiteter Peptide über einen Zeitraum von wenigen Wochen beimpft. Die Maus wird anschließend geopfert und die Antikörper erzeugenden Milzzellen werden isoliert. Die Milzzellen werden mittels Polyethylenglycol mit Mausmyelomzellen fusioniert und der Überschuss an unfusionierten Zellen wird durch Anzucht des Systems auf selektiven Medien, die Aminopterin (HAT-Medien) umfassen, zerstört. Die erfolgreich fusionierten Zellen werden verdünnt und Aliquote der Verdünnung werden in Wells einer Mikrotiterplatte platziert, wobei das Kulturwachstum dort fortgeführt wird. Antikörper erzeugende Klone werden durch Immunoassayverfahren über die Detektion eines Antikörpers im Überstandfluid der Wells identifiziert, wie beispielsweise durch ELISA, wie es ursprünglich von Engvall, Meth. Enzymol. 70:419, 1980, und davon abgeleiteten Verfahren beschrieben wird. Ausgewählte positive Klone können expandiert werden und ihr monoklonales Antikörperprodukt kann zur Verwendung geerntet werden. Ausführliche Verfahren zur Herstellung monoklonaler Antikörper werden in Davis et al., in Basic Methods in Molecular Biology Elsevier, New York, Abschnitt 21-2 beschrieben.
2. Erzeugung polyklonaler Antikörper durch Immunisierung
Polyklonales Antiserum, das Antikörper für heterogene Epitope eines einzelnen Proteins enthält, kann durch Immunisierung geeigneter Tiere mit dem exprimierten Protein oder davon abgeleiteten Peptiden hergestellt werden, wobei diese unverändert oder verändert sein können, um die Immunogenität zu steigern. Eine effektive Herstellung polyklonaler Antikörper wird durch viele Faktoren beeinflusst, die sowohl mit dem Antigen als auch der Wirtsspezies im Zusammenhang stehen. Beispielsweise neigen kleine Moleküle dazu, weniger immunogen als andere zu sein und können die Verwendung von Trägern und Adjuvantien erfordern. Die Reaktion der Wirtstiere kann in Abhängigkeit von der Impfstelle und den Dosierungen ebenfalls variieren, wobei sowohl unzureichende als auch überschüssige Dosen an Antigen zu Antiseren mit niedrigem Titer führen. Geringe Dosen (ng-Mengen) an Antigen, die an mehreren intradermalen Stellen verabreicht werden, scheinen am verlässlichsten zu sein. Ein effektives Immunisierungsprotokoll für Kaninchen kann Vaitukaitis et al., J. Clin. Endocrinol. Metab. 33:988-991 (1971) entnommen werden.
Auffrischungsinjektionen können in regelmäßigen Abständen verabreicht werden und Antiserum kann geerntet werden, wenn der Antikörpertiter des Antiserums zu fallen beginnt, wobei dies halb quantitativ bestimmt wird, wie beispielsweise durch doppelte Immunodiffusion in Agar gegen bekannte Konzentrationen des Antigens. Siehe zum Beispiel Ouchterlony et al., Kapitel 19 in: Handbook of Experimental Immunology D. Wier (Hrsg.) Blackwell (1973). Die Plateaukonzentration des Antikörpers liegt gewöhnlich im Bereich von 0,1 bis 0,2 mg/ml Serum (etwa 12 μM). Die Affinität der Antiseren für das Antigen wird durch Erstellung kompetetiver Bindungskurven bestimmt, wie es beispielsweise durch Fisher, D., Kapitel 42 in: Manual of Clinical Immunology, 2. Ausgabe (Rose und Friedman, Hrsg.) Amer. Soc. For Microbiol., Washington, D.C. (1980) beschrieben wird.
Nach einem der beiden Protokolle hergestellte Antikörperpräparationen sind in quantitativen Immunoassays zur Konzentrationsbestimmung von antigentragenden Substanzen in biologischen Proben nützlich; sie werden halb-quantitativ oder qualitativ verwendet, um das Vorliegen eines Antigens in einer biologischen Probe zu identifizieren. Die Antikörper können auch in therapeutischen Zusammensetzungen zum Abtöten von Zellen verwendet werden, die das Protein exprimieren, oder sie können zur Verringerung der Menge an Protein im Körper verwendet werden.
V. Verwendung von 5'-ESTs oder Sequenzen, die davon erhältlich sind oder Abschnitten davon, als Reagenzien
Die hierin beschriebenen 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können als Reagenzien in Isolierungsverfahren, diagnostischen Assays und forensischen Verfahren verwendet werden. Beispielsweise können Sequenzen aus den 5'-ESTs (oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind) detektierbar markiert werden und als Sonden verwendet werden, um andere Sequenzen zu isolieren, die fähig sind mit ihnen zu hybridisieren. Zusätzlich können Sequenzen aus 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) verwendet werden, um PCR-Primer zu konzipieren, die in Isolierungsverfahren, diagnostischen und forensischen Verfahren verwendet werden.
1. Verwendung von 5'-ESTs oder Sequenzen die davon erhältlich sind oder Abschnitten davon in Isolierungsverfahren diagnostischen und forensischen Verfahren
BEISPIEL 44
Herstellung von PCR-Primern und Amplifizierung von DNA
Die 5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können verwendet werden, um PCR-Primer für eine Vielfalt von Anwendungen herzustellen, einschließlich Isolierungsverfahren zur Klonierung von Nukleinsäuren, die in der Lage sind, an derartigen Sequenzen zu hybridisieren, diagnostischen Techniken und forensischen Techniken. Die PCR-Primer sind wenigstens 10 Basen und vorzugsweise wenigstens 12, 15 oder 17 Basen lang. Stärker bevorzugt sind die PCR-Primer wenigstens 20-30 Basen lang. In einigen Ausführungsformen können die PCR-Primer mehr als 30 Basen lang sein. Es ist bevorzugt, dass die Primerpaare in etwa das gleiche G/C-Verhältnis aufweisen, so dass die Schmelztemperaturen in etwa die gleichen sind. Eine Vielfalt an PCR-Techniken ist dem Fachmann bekannt. Für eine Übersicht zur PCR-Technologie siehe Molecular Cloning to Genetic Engineering, White Hrsg. In Methods in Molecular Biology 67:Humana Press, Totowa 1997. In jedem dieser PCR-Verfahren werden PCR-Primer auf beiden Seiten der Nukleinsäuresequenzen, die amplifiziert werden sollen, zusammen mit dNTPs und einer thermostabilen Polymerase, wie beispielsweise Taq-Polymerase, Pfu-Polymerase oder Vent-Polymerase, zu einer geeignet hergestellten Nukleinsäureprobe zugegeben. Die Nukleinsäure in der Probe wird denaturiert und die PCR-Primer werden spezifisch an komplementäre Nukleinsäuresequenzen in der Probe hybridisiert. Die hybridisierten Primer werden verlängert. Danach wird ein weiterer Zyklus aus Denaturierung, Hybridisierung und Verlängerung begonnen. Zur Erzeugung eines amplifizierten Fragments, das die Nukleinsäuresequenz zwischen den Primerstellen enthält, werden die Zyklen mehrmals wiederholt.
BEISPIEL 45
Verwendung von 5'-ESTs als Sonden
Sonden, die von 5'-ESTs abgeleitet sind (oder von cDNAs oder genomischen DNAs, die davon erhältlich sind), einschließlich Volllängen-cDNAs oder genomischen Sequenzen, können mit dem Fachmann bekannten detektierbaren Markierungen, einschließlich Radioisotopen und nicht radioaktiven Markierungen, markiert werden, um eine detektierbare Sonde bereitzustellen. Die detektierbare Sonde kann einzelsträngig oder doppelsträngig sein und kann unter Verwendung von dem Fachmann bekannten Techniken hergestellt werden, einschließlich in vitro-Transkription, Nick-Translation oder Kinasereaktionen. Eine Nukleinsäureprobe, die eine Sequenz enthält, die in der Lage ist, mit der markierten Sonde zu hybridisieren, wird mit der markierten Sonde in Kontakt gebracht. Wenn die Nukleinsäure in der Probe doppelsträngig ist, kann sie vor dem Inkontaktbringen mit der Sonde denaturiert werden. In einigen Anwendungen kann die Nukleinsäureprobe auf einer Oberfläche, wie beispielsweise einer Nitrozellulose- oder einer Nylonmembran, immobilisiert werden. Die Nukleinsäureprobe kann Nukleinsäuren umfassen, die aus einer Vielfalt an Quellen erhalten wurden, einschließlich genomischer DNA, cDNA-Bibliotheken, RNA oder Gewebeproben.
Verfahren, die verwendet werden, um das Vorliegen von Nukleinsäuren zu detektieren, die in der Lage sind, an die detektierbare Sonde zu hybridisieren, umfassen wohl bekannte Techniken, wie beispielsweise Southern Blotting, Northern Blotting, Dot Blotting, Koloniehybridisierung und Plaquehybridisierung. In einigen Anwendungen kann die Nukleinsäure, die zur Hybridisierung an die markierte Sonde fähig ist, in Vektoren kloniert werden, wie beispielsweise Expressionsvektoren, Sequenzierungsvektoren oder in vivo-Transkriptionsvektoren, um die Charakterisierung und Expression der hybridisierenden Nukleinsäuren in der Probe zu ermöglichen. Beispielsweise können derartige Techniken verwendet werden, um Sequenzen in einer genomischen Bibliothek oder einer cDNA-Bibliothek zu isolieren und zu klonieren, die in der Lage sind, an die detektierbare Probe zu hybridisieren, wie es in Beispiel 30 weiter oben beschrieben wird.
PCR-Primer, die, wie in Beispiel 44 weiter oben beschrieben, hergestellt wurden, können in forensischen Analysen verwendet werden, wie beispielsweise den DNA-Fingerprint-Techniken, wobei dies in den Beispielen 46-50 weiter unten beschrieben wird. Solche Analysen können detektierbare Sonden oder Primer verwenden, die auf den Sequenzen der 5'-ESTs oder der cDNAs oder der genomischen DNAs, die unter Verwendung der 5'-ESTs isoliert wurden, basieren.
Forensischer Abgleich durch DNA-Sequenzierunq
In einem beispielhaften Verfahren werden DNA-Proben, die aus forensischen Einzelproben isoliert wurden, zum Beispiel Haar-, Samen-, Blut- oder Hautzellen, durch herkömmliche Verfahren isoliert. Ein Panel an PCR-Primern, die auf einer Anzahl der 5'-ESTs aus Beispiel 25 oder cDNAs oder genomischen DNAs, die daraus wie weiter oben beschrieben isoliert wurden, basiert, wird anschließend in Übereinstimmung mit Beispiel 44 verwendet, um DNA mit einer Länge von etwa 100-200 Basen aus den forensischen Einzelproben zu amplifizieren. Entsprechende Sequenzen werden aus einem Testprobanden erhalten. Jede dieser Identifizierungs-DNAs wird anschließend unter Verwendung von Standardtechniken sequenziert und ein einfacher Datenbankvergleich bestimmt die Unterschiede, falls welche vorliegen, zwischen den Sequenzen aus dem Probanden und denen aus der Probe. Statistisch signifikante Unterschiede zwischen DNA-Sequenzen des Verdächtigen und denen aus der Probe belegen beweiskräftig ein Fehlen von Identität. Dieses Fehlen an Identität kann beispielsweise mit nur einer Sequenz bestätigt werden. Andererseits sollte Identität mit einer großen Zahl von Sequenzen, die alle übereinstimmen, gezeigt werden. Vorzugsweise wird ein Minimum von 50 statistisch identischen Sequenzen mit 100 Basen Länge verwendet, um die Identität zwischen dem Verdächtigen und der Probe zu beweisen.
BEISPIEL 47
Positive Identifizierung durch DNA-Sequenzierung
Die im vorausgehenden Beispiel aufgezeigte Technik kann in einem größeren Maßstab auch verwendet werden, um eine eindeutige Identifizierung in der Art eines Fingerabdrucks von einem beliebigen Individuum bereitzustellen. In dieser Technik werden Primer aus einer großen Anzahl von 5'-EST-Sequenzen aus Beispiel 25 oder cDNA oder genomische DNA-Sequenzen, die davon erhältlich sind, hergestellt. Vorzugsweise werden 20 bis 50 verschiedene Primer verwendet. Diese Primer werden verwendet, um eine entsprechende Anzahl PCR-generierter DNA-Segmente des fraglichen Individuums in Übereinstimmung mit Beispiel 44 zu erzeugen. Jedes dieser DNA-Segmente wird unter Verwendung der in Beispiel 46 dargelegten Verfahren sequenziert. Die Sequenzdatenbanken, die durch dieses Verfahren erzeugt wurden, identifizieren eindeutig das Individuum, von dem die Sequenzen erhalten wurden. Das gleiche Panel an Primern kann dann zu einem beliebigen späteren Zeitpunkt verwendet werden, um Gewebe oder andere biologische Einzelproben mit diesem Individuum in absoluten Bezug zu setzen.
BEISPIEL 48
Forensische Southern Blot Identifizierung
Das Verfahren gemäß Beispiel 47 wird wiederholt, um ein Panel von wenigstens 10 amplifizierten Sequenzen aus einem Individuum und einer Einzelprobe zu erhalten. Vorzugsweise enthält das Panel wenigstens 50 amplifizierte Sequenzen. Stärker bevorzugt enthält das Panel 100 amplifizierte Sequenzen. In einigen Ausführungsformen enthält das Panel 200 amplifizierte Sequenzen. Diese PCR-erzeugte DNA wird anschließend mit einem oder einer Kombination, vorzugsweise 4 basenspezifischen Restriktionsenzymen verdaut. Solche Enzyme sind kommerziell erhältlich und dem Fachmann bekannt. Nach dem Verdau werden die sich ergebenden Genfragmente bezüglich ihrer Größe in mehreren doppelten Wells auf einem Agarosegel aufgetrennt und auf Nitrozellulose unter Verwendung von dem Fachmann bekannten Southern Blot-Techniken übertragen. Für eine Übersicht bezüglich Southern Blot-Übertragung siehe Davis et al. (Basic Methods in Molecular Biology, 1986, Elsevier Press, Seiten 62-65).
Ein Panel an Proben, die auf den 5'-EST-Sequenzen (oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind) oder Fragmenten davon mit wenigstens 10 Basen basieren, werden radioaktiv oder colorimetrisch unter Verwendung von dem Fachmann bekannten Verfahren, wie beispielsweise Nick-Translation oder Endmarkierung, markiert und auf dem Southern Blot unter Verwendung von im Fachbereich bekannten Techniken hybridisiert (Davis et al., supra). Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind). Stärker bevorzugt umfasst die Sonde wenigstens 20-30 aufeinander folgende Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind).
Vorzugsweise werden wenigstens 5 bis 10 dieser markierten Sonden verwendet und stärker bevorzugt werden wenigstens etwa 20 oder 30 verwendet, um ein eindeutiges Muster bereitzustellen. Die sich ergebenden Banden, die in Folge der Hybridisierung einer großen 5'-EST-Probe (oder einer cDNA-Probe oder einer genomischen DNA-Probe, die davon erhältlich sind) erscheinen, sind ein eindeutiger Identifikator. Da die Restriktionsenzymspaltung für jedes Individuum unterschiedlich ist, ist auch das Bandenmuster auf dem Southern Blot eindeutig. Eine Erhöhung der Zahl an 5'-EST-Sonden (oder an cDNA- oder genomischen DNA-Sonden, die davon erhältlich sind) stellt ein statistisch höheres Maß an Zuverlässigkeit bezüglich der Identifizierung bereit, da eine erhöhte Zahl an Bandensätzen zur Identifizierung verwendet wird.
BEISPIEL 49
Dot Blot-Identifizierungsverfahren
Eine andere Technik zur Identifizierung von Individuen greift auf eine Dot Blot-Hybridisierungstechnik unter Verwendung der hierin offenbarten 5'-EST-Sequenzen zurück.
Genomische DNA wird aus dem Kern eines Probanden, der identifiziert werden soll, isoliert. Oligonukleotidsonden mit einer Länge von etwa 30 bp werden synthetisiert, die wenigstens 10, vorzugsweise 50 Sequenzen der 5'-ESTs oder cDNAs oder genomischen DNAs, die davon erhältlich sind, entsprechen. Die Sonden werden verwendet, um die genomische DNA unter dem Fachmann bekannten Bedingungen zu hybridisieren. Die Oligonukleotide werden unter Verwendung von Polynukleotidkinase (Pharmacia) mit P³² endmarkiert. Die Dot Blots werden durch Platzieren der genomischen DNA auf Nitrozellulose oder ähnlichem unter Verwendung eines Vakuum Dot Blot Manifolds (BioRad, Richmond, Kalifornien) aufgetragen. Der Nitrozellulosefilter, der die genomischen Sequenzen enthält, wird gebacken oder die Sequenzen werden mittels UV mit dem Filter verknüpft, prehybridisiert und unter Verwendung von im Fachbereich bekannten Techniken (Davis et al., supra) hybridisiert. Die ³²P markierten DNA-Fragmente werden anschließend nacheinander unter stufenweise veränderten stringenten Bedingungen hybridisiert, um minimale Unterschiede zwischen der 30 bp Sequenz und der DNA zu detektieren. Tetramethylammoniumchlorid ist bei der Identifizierung von Klonen, die eine geringe Zahl an Nukleotid-Fehlabgleichen enthalten, nützlich (Wood et al., Proc. Natl. Acad. Sci. USA 82(6):1585-1588, 1985). Ein eindeutiges Dotmuster unterscheidet ein Individuum von einem anderen Individuum.
5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind) oder Oligonukleotide, die wenigstens 10 aufeinander folgende Basen aus diesen Sequenzen enthalten, können als Sonden in der nachfolgend beschriebenen alternativen Fingerprint-Technik verwendet werden. Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 aufeinander folgende Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind). Stärker bevorzugt umfasst die Sonde wenigstens 20-30 aufeinander folgende Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind).
Vorzugsweise wird in dieser alternativen Fingerprinting-Technik eine Vielzahl an Sonden mit Sequenzen aus verschiedenen Genen verwendet. Beispiel 50 weiter unten stellt ein repräsentatives alternatives Fingerprint-Verfahren bereit, in dem die Sonden von 5'-EST abgeleitet sind.
BEISPIEL 50
Alternative "Fingerprint"-Identifizierungstechnik
20-mer Oligonukleotide werden aus einer großen Anzahl von 5'-ESTs z.B. 50, 100 oder 200 unter Verwendung kommerziell zur Verfügung stehender Oligonukleotid-Dienstleistungsunternehmen, wie beispielsweise Genset, Paris, Frankreich, hergestellt. Zellproben aus dem Testprobanden werden unter Verwendung von im Fachbereich bekannten Techniken auf DNA hin aufgereinigt. Die Nukleinsäure wird mit Restriktionsenzymen, wie beispielsweise EcoRI und XbaI, verdaut. Nach dem Verdau werden die Proben auf Wells zur Elektrophorese aufgetragen. Dieses im Fachbereich bekannte Verfahren kann abgeändert werden, um Polyacrylamidelektrophorese einsetzen zu können, jedoch werden in diesem Beispiel Proben, die 5 μg DNA enthalten, in Wells aufgetragen und auf 0,8% Agarosegel aufgetrennt. Die Gele werden unter Verwendung von standardmäßigen Southern Blot auf Nitrozellulose überführt.
10 ng von jedem der Oligonukleotide werden zusammengefasst und mit ³²P endmarkiert. Die Nitrozellulose wird mit Blockierlösung prehybridisiert und mit den markierten Sonden hybridisiert. Im Anschluss an die Hybridisierung und Waschen wird der Nitrozellulosefilter gegenüber einem X-Omat AR-Röntgenfilm exponiert. Das sich ergebende Hybridisierungsmuster ist für jedes Individuum eindeutig.
Es wird im Rahmen dieses Beispiels zusätzlich in Erwägung gezogen, dass die Anzahl der verwendeten Probensequenzen zum Zwecke zusätzlicher Genauigkeit und Klarheit verändert werden kann.
Die Proteine, die durch die erweiterten cDNAs kodiert werden, können auch verwendet werden, um, wie es in den Beispielen 30 und 43 erklärt wird, Antikörper zu erzeugen, um so den Gewebetyp oder die Zellspezies, von dem/der die Probe abgeleitet wurde, zu identifizieren, wobei dies in Beispiel 51 beschrieben wird.
BEISPIEL 51
Identifizierung von Gewebetypen oder Zellspezies mittels markierter gewebespezifischer Antikörper
Die Identifizierung spezifischer Gewebe wird durch die Visualisierung gewebespezifischer Antigene mittels Antikörperpräparationen gemäß den Beispielen 30 und 43 ermöglicht, die mit einem detektierbaren Marker direkt oder indirekt konjugiert sind. Ausgewählte markierte Antikörperspezies binden an ihren spezifischen Antigenbindepartner in Gewebeabschnitten, Zellsuspensionen oder in Extrakten löslicher Proteine aus einer Gewebeprobe, um so ein Muster für eine qualitative oder halb-qualitative Interpretation bereitzustellen.
Für diese Verfahren müssen Antiseren einen Wirkstoffgehalt aufweisen, der über dem der nativen Präparation liegt, und deshalb werden Antikörper durch Isolierung der Gammaglobulinfraktion bis zu einem mg/ml Niveau konzentriert, beispielsweise durch Ionenaustauschchromatografie oder durch Ammoniumsulfatfraktionierung. Um höchstmöglich spezifische Antiseren bereitzustellen, müssen bevor die Antikörper mit dem Marker markiert werden auch unerwünschte Antikörper, zum Beispiel für gewöhnliche Proteine, aus der Gammaglobulinfraktion entfernt werden, beispielsweise mittels unlöslicher Immunoabsorbentien. Sowohl monoklonale als auch heterologe Antikörper sind für beide Verfahren geeignet.
A. Immunohistochemische Techniken
Gereinigte Antikörper mit hohem Titer, die wie oben beschrieben hergestellt wurden, werden mit einem detektierbaren Marker konjugiert, wie es beispielsweise von Fudenberg, Kapitel 26 in: Basic and Clinical Immunology, 3. Ausgabe, Lange, Los Altos, Kalifornien, 1980 oder Rose et al., Kapitel 12 in: Methods in Immunodiagnosis, 2. Ausgabe John Wiley and Sons, New York (1980) beschrieben wird.
Ein Fluoreszenzmarker, entweder Fluorescein oder Rhodamin, ist bevorzugt, aber die Antikörper können auch mit einem Enzym markiert sein, das eine farberzeugende Reaktion mit einem Substrat unterstützt, wie beispielsweise Meerrettich-Peroxidase. Wie es weiter unten beschrieben wird, können in einem zweiten Schritt Marker zu einem gewebegebundenen Antikörper hinzugegeben werden. Alternativ können spezifische Antigewebe-Antikörper mit Ferritin oder anderen Partikeln mit hoher Elektronendichte markiert werden und die Lokalisierung der Ferritin-gekoppelten Antigen-Antikörper-Komplexe kann mittels eines Elektronenmikroskops erfolgen. In noch einem weiteren Ansatz können die Antikörper radiomarkiert werden, beispielsweise mit ¹²⁵I, und durch Überschichten der mit Antikörper behandelten Präparation mittels einer fotografischen Emulsion detektiert werden.
Präparationen zur Ausführung der Verfahren können monoklonale oder polyklonale Antikörper für ein einzelnes Protein oder Peptid umfassen, deren Spezifität für einen Gewebetyp, wie beispielsweise Hirngewebe, identifiziert worden ist, oder es können Antikörperpräparationen für mehrere antigenisch unterschiedliche gewebespezifische Antigene in Panelen verwendet werden, je nach dem wie erforderlich, unabhängig voneinander oder in Gemischen.
Gewebeabschnitte und Zellsuspensionen zur immunohistochemischen Untersuchung werden gemäß herkömmlichen histologischen Techniken hergestellt. Mehrere Cryostatabschnitte (etwa 4 um, unfixiert) des unbekannten Gewebes und der bekannten Kontrolle werden montiert und jeder Objektträger wird mit unterschiedlichen Verdünnungen der Antikörperpräparation bedeckt. Abschnitte bekannter und unbekannter Gewebe sollten auch mit Präparationen behandelt werden, um eine Positivkontrolle, eine Negativkontrolle, beispielsweise Pre-Immunseren, und eine Kontrolle für unspezifische Färbung, beispielsweise Puffer, bereitzustellen.
Die behandelten Abschnitte werden in einer feuchten Kammer für etwa 30 min bei Raumtemperatur inkubiert, gespült und anschließend in Puffer für 30-45 min gewaschen. Überschüssige Flüssigkeit wird abgetupft und der Marker wird entwickelt.
Falls der gewebespezifische Antikörper während der ersten Inkubation nicht markiert wurde, kann er zu diesem Zeitpunkt in einer zweiten Antikörper-Antikörper-Reaktion markiert werden, beispielsweise durch Zugabe von Fluorescein- oder Enzym-konjugiertem Antikörper gegen die Immunoglobulinklasse der das Antiserum erzeugenden Spezies, zum Beispiel Fluorescein-markierter Antikörper gegen Maus-IgG. Derartige markierte Seren sind kommerziell erhältlich.
Das Antigen, das durch das obige Verfahren in den Geweben nachgewiesen worden ist, kann durch Messung der Farb- oder Fluoreszenz-Intensität im Gewebeabschnitt und Kalibrierung des Signals unter Verwendung von geeigneten Standards quantifiziert werden.
B. Identifizierung gewebespezifischer löslicher Proteine
Die Visualisierung gewebespezifischer Proteine und die Identifizierung unbekannter Gewebe gemäß diesem Verfahren wird unter Verwendung markierter Antikörperreagenzien und einer Detektionsstrategie, wie sie für die Immunohistochemie beschrieben wurde, durchgeführt; jedoch wird die Probe nach einer elektrophoretischen Technik hergestellt, um die Proteine, die aus dem Gewebe extrahiert wurden, zur Detektion in einem systematischen Array auf Grundlage des Molekulargewichts zu verteilen.
Eine Gewebeprobe wird unter Verwendung einer Virtis-Vorrichtung homogenisiert; Zellsuspensionen werden durch Dounce-Homogenisierung oder osmotische Lyse, wie im Fachbereich üblich aufgebrochen, wobei in beiden Fällen, falls nötig, Detergenzien verwendet werden, um Zellmembranen aufzubrechen. Unlösliche Zellkomponenten, wie beispielsweise Zellkerne, Microsomen und Membranfragmente, werden durch Ultrazentrifugation entfernt und die lösliche proteinenthaltende Fraktion, falls nötig, konzentriert und zur Analyse zurückgehalten.
Eine Probe der Lösung mit löslichen Proteinen wird durch herkömmliche SDS-Polyacrylamidelektrophorese in einzelne Proteinspezies aufgelöst, wie es beispielsweise durch Davis et al., Abschnitt 19-2 in: Basic Methods in Molecular Biology, Leder Hrsg., Elsevier, New York, 1986 beschrieben wird, wobei in einem Satz von Gelen ein Bereich von Polyacrylamidmengen verwendet wird, um den voltständigen Molekulargewichtsbereich der Proteine, die in der Probe detektiert werden sollen, aufzulösen. Ein Größenmarker wird parallel aufgetrennt, um so die Molekulargewichte der einzelnen Proteine abschätzen zu können. Die zu analysierende Probengröße entspricht einem zweckmäßigen Volumen von 5 bis 55 μl und enthält etwa 1 bis 100 μg Protein. Ein Aliquot von jedem der aufgelösten Proteine wird durch blotten auf ein Nitrozellulosefilterpapier übertragen, wobei dieses Verfahren das Auflösungsmuster erhält. Es werden mehrere Kopien hergestellt. Das Verfahren, das als Western Blot Analyse bekannt ist, ist in Davis, L. Et al., supra Abschnitt 19-3, gut beschrieben. Ein Satz der Nitrozelluloseblots wird mit Coomassie Blau Farbstoff angefärbt, um den vollständigen Satz an Proteinen zum Vergleich mit den antikörpergebundenen Proteinen sichtbar zu machen. Die verbleibenden Nitrozellulosefilter werden anschließend mit einer Lösung aus einem oder mehreren spezifischen Antiseren von gewebespezifischen Proteinen, die wie in den Beispielen 30 und 43 beschrieben hergestellt wurden, inkubiert. In diesen Verfahren werden, wie in Verfahren A oben beschrieben, geeignete Positiv- und Negativproben und Reagenzkontrollen mitgeführt.
In beiden Verfahren A oder B kann eine detektierbare Markierung an den Primärgewebeantigen-Primärantikörper-Komplex nach verschiedenen Strategien und Abänderungen davon angebracht werden. In einem direkten Ansatz kann der primärspezifische Antikörper markiert werden; alternativ kann der unmarkierte Komplex durch einen markierten Zweit-anti-IgG-Antikörper gebunden werden. In anderen Ansätzen ist entweder der Primär- oder der Sekundärantikörper mit einem Biotinmolekül konjugiert, das in einem nachfolgenden Schritt an einen avidinkonjugierten Marker binden kann. Gemäß noch einer weiteren Strategie wird enzymmarkiertes oder radioaktives Protein A, das die Fähigkeit besitzt, an jedes beliebige IgG zu binden, in einem abschließenden Schritt entweder an den Primär- oder Sekundärantikörper gebunden.
Das Sichtbarmachen gewebespezifischer Antigenbindung in einem Ausmaß, das über dem liegt, das in Kontrollgeweben für einen oder mehrere gewebespezifische Antikörper beobachtet wird, wobei die Antikörper aus den Gensequenzen hergestellt wurden, die aus erweiterten cDNA-Sequenzen identifiziert wurden, kann Gewebe von unbekanntem Ursprung identifizieren, wie beispielsweise forensische Proben oder differenziertes Tumorgewebe, das an fremden Körperstellen metastasiert hat.
Zusätzlich zu ihren Anwendungen in der Forensik und bei der Identifizierung können 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) bezüglich ihrer chromosomalen Lage kartiert werden. Beispiel 52 weiter unten beschreibt Strahlungshybrid(SH)kartierung von humanen chromosomalen Abschnitten unter Verwendung von 5'-ESTs. Beispiel 53 weiter unten beschreibt ein repräsentatives Verfahren zur Kartierung eines 5'-ESTs bezüglich seiner Lage auf einem humanen Chromosom. Beispiel 54 beschreibt die Kartierung von 5'-ESTs bezüglich Chromosomen in der Metaphase durch Fluoreszenz-in-situ-Hybridisierung (FISH). Der Fachmann erkennt, dass die Verfahren gemäß den Beispielen 52-54 auch verwendet werden können, um cDNAs oder genomische DNAs, die aus den 5'-ESTs erhalten werden können, bezüglich ihrer chromosomalen Lage zu kartieren.
2. Verwendung von 5'-ESTs oder Sequenzen, die daraus erhältlich sind oder Abschnitten davon, bei der Chromosomenkartierung
BEISPIEL 52
Strahlungshybridkartierung von 5'-ESTs hinsichtlich des menschlichen Genoms
Strahlungshybrid (SH)kartierung ist ein genetischer Ansatz für somatische Zellen, der zur hochaufgelösten Kartierung des menschlichen Genoms verwendet werden kann. In diesem Verfahren werden Zelllinien, die eines oder mehrere menschliche Chromosomen enthalten, in einem tödlichen Ausmaß bestrahlt, wobei jedes Chromosom in Fragmente zerbricht, deren Größe von der Strahlendosis abhängig ist. Diese Fragmente werden durch Fusion mit kultivierten Fresszellen gewonnen, was zu Subklonen führt, die verschiedene Abschnitte des menschlichen Genoms enthalten. Dieses Verfahren wird von Benham et al., Genomics 4:509-517, 1989, und Cox et al., Science 250:245-250, 1990, beschrieben. Die zufällige und unabhängige Art der Subklone ermöglicht eine effiziente Kartierung eines beliebigen menschlichen Genommarkers. Menschliche DNA, die aus einem Panel von 80-100 Zelllinien isoliert wurde, stellt ein Kartierungsreagenz zur 5'-EST-Anordnung bereit. In diesem Verfahren wird die Bruchhäufigkeit zwischen Markern herangezogen, um den Abstand zu bestimmen, wobei dies die Konstruktion hochaufgelöster Karten ermöglicht, wie es für die Verwendung herkömmlicher ESTs bereits ausgeführt wurde (Schuler et al., Science 274:540-546, 1996).
Es wurde SH-Kartierung verwendet, um eine hochaufgelöste Strahlungshybridkarte des vollständigen Genoms des menschlichen Chromosoms 17q22-q25.3 über die Gene für das Wachstumshormon (Growth Hormome, GH) und Tymidinkinase (TK) (Foster et al., Genomics 33:185-192, 1996), den Abschnitt, der das Gorlin-Syndromgen umgibt (Obermayr et al., Eur. J. Hum. Genet. 4:242-245, 1996), die Loci, die den vollständigen kurzen Arm von Chromosom 12 abdecken (Raeymaekers et al., Genomics 29:170-178, 1995), den Abschnitt des humanen Chromosoms 22, der den Neurofibromatosistyp 2 Locus enthält (Frazer et al., Genomics 14:574-584, 1992), und die 13 Loci auf dem langen Arm von Chromosom 5 (Warrington et al., Genomics 11:701-708, 1991) herzustellen.
BEISPIEL 53
Kartierung von 5'-ESTs auf humanen Chromosomen unter Verwendung von PCR-Techniken
5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können unter Verwendung von Methoden auf PCR-Basis menschlichen Chromosomen zugeordnet werden. In solchen Ansätzen werden Oligonukleotid-Primerpaare aus den 5'-ESTs (oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind) konzipiert, um die Wahrscheinlichkeit einer Amplifizierung über ein Intron zu minimieren. Vorzugsweise weisen die Oligonukleotid-Primer eine Länge von 18-23 bp auf und sind zur PCR-Amplifizierung konzipiert. Die Erstellung von PCR-Primern aus bekannten Sequenzen ist dem Fachmann wohl bekannt. Für eine Übersicht zur PCR-Technologie siehe Erlich in PCR Technology, Principles and Applications for DNA Amplification, Freeman und Co., New York, 1992.
Zur Amplifizierung von Matrizen aus humaner genomischer Gesamt-DNA werden Primer werden in Polymerasekettenreaktionen (PCR) eingesetzt. Die PCR-Bedingungen sind wie folgt: 60 ng genomische DNA wird als Matrize für eine PCR mit 80 ng eines jeden Oligonukleotid-Primers, 0,6 Einheiten Taq-Polymerase und 1 μCu eines ³²P-markierten Deoxycytidintriphosphats verwendet. Die PCR wird in einem Microplate Thermocycler (Techne) unter den folgenden Bedingungen durchgeführt: 30 Zyklen bei 94°C, 1,4 min; 55°C, 2 min; und 72°C, 2 min; mit einer abschließenden Verlängerung bei 72°C für 10 min. Die amplifizierten Produkte werden auf einem 6%igen Polyacrylamidsequenzierungsgel analysiert und durch Autoradiografie visualisiert. Wenn die Länge des sich ergebenden PCR-Produkts identisch ist zum Abstand zwischen den Enden der Primersequenzen in der erweiterten cDNA, aus der die Primer abgeleitet wurden, wird die PCR- Reaktion anschließend mit DNA-Matrizen aus zwei Panelen somatischer Mensch-Nager Zellhybride, BIOS PCRable DNA (BIOS Corporation) und NIGMS Human-Rodent Somatic Cell Hybrid Mapping Panel Number 1 (NIGMS, Camden, NJ) wiederholt.
Die PCR wird eingesetzt, um eine Serie somatischer Zellhybrid-Zelllinien, die definierte Sätze an humanen Chromosomen enthalten, bezüglich des Vorliegens eines gegebenen 5'-ESTs (oder einer cDNA oder einer genomischen DNA, die davon erhältlich ist) durchzumustern. Die DNA wird aus den somatischen Hybriden isoliert und als Ausgangsmatrizen für PCR-Reaktionen unter Verwendung der Primerpaare des 5'-ESTs (oder einer cDNA oder einer genomischen DNA, die davon erhältlich ist) verwendet. Nur solche somatischen Zellhybride mit Chromosomen, die das humane Gen enthalten, das mit dem 5'-EST (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) korrespondiert, führen zu einem amplifizierten Fragment. Das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) wird dem Chromosom durch Analyse des Segregationsmusters der PCR-Produkte aus den somatischen Hybrid-DNA-Matrizen zugeordnet. Das einzige humane Chromosom, das in allen Zellhybriden vorliegt, die zu einem amplifizierten Fragment führen, ist das Chromosom, das das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) enthält. Für eine Übersicht zu Techniken und Analysen von Ergebnissen aus Experimenten zur somatischen Zell-Gen-Charakterisierung siehe Ledbetter et al., Genomics 6:475-481, 1990.
BEISPIEL 54
Kartierung erweiterter 5'-ESTs auf Chromosomen unter Verwendung von Fluoreszenz-in situ-Hybridisierung
Fluoreszenz in situ-Hybridisierung ermöglicht, dass das 5'-EST (oder die cDNA oder die genomische DNA, die davon erhältlich ist) an einer bestimmter Stelle auf einem gegebenen Chromosom kartiert wird. Die Chromosomen, die für Fluoreszenz-in situ-Hybridisierungstechniken verwendet werden, können aus einer Vielfalt von Quellen, einschließlich Zellkulturen, Geweben oder Vollblut, erhalten werden.
In einer bevorzugten Ausführungsform wird eine chromosomale Lage eines 5'-ESTs (oder einer cDNA oder genomischen DNA, die davon erhältlich ist) durch FISH erhalten, wie es von Cherif et al. (Proc. Natl. Acad. Sci. USA, 87:6639-6643, 1990) beschrieben wird. Chromosomen in der Metaphase werden aus Phytohemagglutinin (PHA)-stimulierten Blutzelldonoren hergestellt. PHS-stimulierte Lymphozyten aus gesunden Männern werden für 72 hin RPMI-1640-Medium kultiviert. Zur Synchronisierung wird Methotrexat (10 μM) für 17 h zugegeben, wobei im Anschluss 5-Bromdeoxyuridin (5-BrdU, 0,1 mM) für 6 h zugegeben wird. Colcemid (1 μg/ml) wird für die letzten 15 min vor der Ernte der Zellen zugegeben. Die Zellen werden gesammelt, in RPMI gewaschen, mit einer hypotonischen Lösung aus KCl (75 mM) bei 37°C für 15 min inkubiert und unter dreimaligem Wechseln in Methanol:Essigsäure (3:1) fixiert. Die Zellsuspension wird auf einen Glasobjektträger aufgetropft und luftgetrocknet. Das 5'-EST (oder die cDNA oder die genomische DNA, die davon erhältlich ist) wird mit Biotin-16 dUTP durch Nick-Translation gemäß den Anweisungen des Herstellers (Bethesda Research Laboratories, Bethesda, MD) markiert, unter Verwendung einer Sephadex G-50-Säule (Pharmacia, Upsala, Schweden) gereinigt und präzipitiert. Kurz vor der Hybridisierung wird das DNA-Pellet in Hybridisierungspuffer gelöst (50% Formamid, 2 × SSC, 10% Dextransulfat, 1 mg/ml mit Ultraschall behandelte Lachssperma-DNA, pH 7) und die Probe wird bei 70°C für 5-10 min denaturiert.
Die bei –20°C gehaltenen Objektträger werden für 1 h bei 37°C mit RNase A (100 μg/ml) behandelt, dreimal in 2 × SSC gespült und in einer Ethanolreihe dehydriert. Die Chromosompräparationen werden in 70% Formamid, 2 × SSC für 2 min bei 70°C denaturiert, anschließend bei 4°C dehydriert. Die Objektträger werden mit Proteinase K (10 μg/100 ml in 20 mM Tris-HCl, 2 mM CaCl₂) bei 37°C für 8 min behandelt und dehydriert. Das Hybridisierungsgemisch, das die Sonde enthält, wird auf dem Objektträger platziert, mit einem Deckglas abgedeckt, mit Gummikitt versiegelt und über Nacht in einer feuchten Kammer bei 37°C hybridisiert. Nach der Hybridisierung und Waschschritten im Anschluss an die Hybridisierung wird die biotinylierte Sonde durch Avidin-FITC detektiert und mit zusätzlichen Schichten von biotinylierten Ziege-anti-Avidin und Avidin-FITC amplifiziert. Zur chromosomalen Lagebestimmung werden fluoreszierende R-Banden, wie kürzlich beschrieben (Cherif et al., supra), erhalten. Die Objektträger werden unter einem LEICA-Fluoreszenzmikroskop (DMRXA) beobachtet. Die Chromosomen werden mit Propidiumjodid gegengefärbt und das Fluoreszenzsignal der Sonde erscheint als zwei symmetrisch gelbgrüne Punkte auf beiden Chromatiden des fluoreszierenden R-Band-Chromosoms (rot). Daher kann ein bestimmtes 5'-EST (oder eine cDNA oder genomische DNA, die daraus erhältlich ist) einer bestimmten zytogenetischen R-Bande auf einem gegebenen Chromosom zugeordnet werden.
Nachdem das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) unter Verwendung der in den Beispielen 52-54 weiter oben beschriebenen Techniken einmal bestimmten Chromosomen zugeordnet worden ist, können sie verwendet werden, um eine hochaufgelöste Chromosomenkarte zu erstellen, auf der sie lokalisiert sind oder um die Chromosomen in der Probe zu identifizieren.
BEISPIEL 55
Verwendung von 5'-ESTs, um Chromosomkarten zu konstruieren oder zu erweitern
Chromosomkartierung umfasst das Zuordnen einer gegebenen eindeutigen Sequenz zu einem bestimmten Chromosom, wie es oben beschrieben wurde. Nachdem die eindeutige Sequenz einmal auf einem gegebenen Chromosom kartiert worden ist, wird sie relativ zu anderen eindeutigen Sequenzen zugeordnet, die auf demselben Chromosom lokalisiert sind. Ein Ansatz zur Chromosomenkartierung verwendet eine Serie künstlicher Hefechromosomen (YACs), die mehrere tausend lange Inserts tragen, die aus den Chromosomen des Organismus abgeleitet wurden, von denen die erweiterten cDNAs (oder die genomische DNAs, die daraus erhältlich sind) erhalten wurden. Dieser Ansatz wird in Nagaraja et al., Genome Research 7:210-222, 1997, beschrieben. In Kürze, in diesem Ansatz wird jedes Chromosom in überlappende Stücke zerbrochen, die in den YAC-Vektor insertiert werden. Die YAC-Inserts werden unter Verwendung von PCR oder anderen Verfahren durchmustert, um zu bestimmen, ob sie das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) umfassen, dessen Position bestimmt werden soll. Sobald das Insert, das das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) umfasst, einmal nachgewiesen worden ist, kann das Insert durch PCR oder andere Verfahren analysiert werden, um zu bestimmen, ob das Insert auch andere Sequenzen enthält, für die bekannt ist, dass sie sich auf dem Chromosom in dem Abschnitt befinden, von dem das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) abgeleitet wurde. Dieses Verfahren kann für jedes Insert in der YAC-Bibliothek wiederholt werden, um die Lokalisierung einer jeden der erweiterten cDNAs (oder der genomischen DNAs, die daraus erhältlich sind) relativ zueinander und zu anderen bekannten chromosomalen Markern zu bestimmen. Auf diese Weise kann eine hochaufgelöste Karte der Verteilung einer Vielzahl eindeutiger Marker über jedes einzelne der Chromosomen des Organismus erhalten werden.
Wie in Beispiel 56 weiter unten beschrieben, können erweiterte cDNAs (oder genomische DNAs, die daraus erhältlich sind) auch zur Identifizierung von Genen verwendet werden, die mit einem bestimmten Phänotyp verbunden sind, wie beispielsweise einer Erbkrankheit oder einer Wirkstoffantwort.
3. Verwendung von 5'-ESTs oder Sequenzen, die daraus erhältlich sind, oder Fragmenten davon zur Identifizierung von Genen
BEISPIEL 56
Identifizierung von Genen, die mit Erbkrankheiten oder Ansprechen auf einen Wirkstoff im Zusammenhang stehen
Dieses Beispiel zeigt einen Ansatz, der zum Erstellen eins Zusammenhangs von 5'-ESTs (oder cDNA oder genomischer DNA, die daraus erhältlich ist) mit bestimmten phänotypischen Merkmalen nützlich ist. In diesem Beispiel wird ein bestimmtes 5'-EST (oder eine cDNA oder genomische DNA, die daraus erhältlich ist) als Testsonde verwendet, um dieses 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) mit einem bestimmten phänotypischen Merkmal in Zusammenhang zu setzen.
5'-ESTs (oder cDNA oder genomische DNA, die daraus erhältlich ist) werden an bestimmten Stelle auf einem menschlichen Chromosom unter Verwendung von Techniken, wie denjenigen, die in den Beispielen 52 und 53 beschrieben sind, oder anderen, im Fachbereich bekannten Techniken, kartiert. Eine Suche zur Mendelschen Vererbung im Menschen (McKusick in Mendelian Inheritance in Man (Online verfügbar über Johns Hopkins University Welch Medical Library) offenbart, dass der Abschnitt des humanen Chromosoms, der das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) enthält, eine sehr genreiche Region darstellt, die mehrere bekannte Gene und einige Krankheiten oder Phänotypen umfasst, für die keine Gene identifiziert wurden. Das Gen, das mit diesem 5'-EST (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) korrespondiert, ist deshalb ein unmittelbar ein Kandidat für jede dieser genetischen Erkrankungen.
Zellen aus Patienten mit diesen Erkrankungen oder Phänotypen werden isoliert und in Kultur expandiert. PCR-Primer des 5'-ESTs (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) werden verwendet, um genomische DNA, mRNA oder cDNA, die von den Patienten erhalten wurde, durchzumustern. 5'-ESTs (oder cDNA oder genomische DNA, die daraus erhältlich ist), die in den Patienten nicht amplifiziert werden, können durch weitere Untersuchungen mit einer bestimmten Krankheit positiv in Zusammenhang gebracht werden. Alternativ kann die PCR-Untersuchung zu Fragmenten mit abweichenden Längen führen, wenn die Proben von einem Individuum abgeleitet sind, das den Phänotyp aufweist, der mit der Erkrankung in Zusammenhang steht, als wenn die Probe von einem gesunden Individuum abgeleitet ist, wobei dies zeigt, dass das Gen, das das 5'-EST enthält, für die genetische Erkrankung verantwortlich sein kann.
VI. Verwendung eines 5'-ESTs (oder cDNA oder genomischer DNA, die daraus erhältlich ist) zur Konstruktion von Vektoren
Die vorliegenden 5'-ESTs (oder cDNA oder genomische DNA, die daraus erhältlich ist) können auch verwendet werden, um Sekretionsvektoren zu konstruieren, die in der Lage sind, die Sekretion der Proteine zu lenken, die durch Gene in den Vektoren kodiert werden. Solche Sekretionsvektoren können die Reinigung oder Anreicherung der Proteine erleichtern, die durch Gene kodiert werden, die im Sekretionsvektor insertiert sind, wobei die Zahl an Hintergrundproteinen, von welchen das gewünschte Protein gereinigt oder angereichert werden muss, verringert wird. Beispielhafte Sekretionsvektoren werden in Beispiel 57 weiter unten beschrieben.
1. Konstruktion von Sekretionsvektoren
BEISPIEL 57
Konstruktion von Sekretionsvektoren
Die Sekretionsvektoren umfassen einen Promotor, der in der Lage ist, Genexpression in der Wirtszelle, im Gewebe oder einem Organismus von Interesse zu lenken. Solche Promotoren umfassen den Rous Sarcoma Virus- Promotor, den SV40-Promotor, den humanen Zytomegalovirus-Promotor und andere dem Fachmann vertraute Promotoren.
Eine Signalsequenz eines 5'-ESTs (oder einer cDNA oder einer genomischen DNA, die daraus erhältlich ist) ist mit dem Promotor operativ so verknüpft, dass die mRNA, die vom Promotor transkribiert wird, die Translation des Signalpeptids lenkt. Die Wirtszelle, das Gewebe oder der Organismus kann eine beliebige Zelle, ein beliebiges Gewebe oder ein beliebiger Organismus sein, der das Signalpeptid erkennt, das durch die Signalsequenz im 5'-EST (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) kodiert wird. Geeignete Wirtszellen umfassen Säugerzellen, Gewebe aus Säugern oder Säugerorganismen, Vogelzellen, Vogelgewebe oder Vogelorganismen, Insektenzellen, Insektengewebe oder Insektenorganismen oder Hefe.
Zusätzlich enthält der Sekretionsvektor Klonierungsstellen zum Insertieren der Gene, die die Proteine kodieren, die sekretiert werden sollen. Die Klonierungsstellen ermöglichen die Klonierung des insertierten Gens im Leserahmen mit der Signalsequenz, so dass ein Fusionsprotein, in dem das Signalpeptid mit dem Protein fusioniert ist, das durch das insertierte Gen kodiert wird, von der mRNA exprimiert wird, die vom Promotor transkribiert wird. Das Signalpeptid lenkt die extrazelluläre Sekretion des Fusionsproteins.
Der Sekretionsvektor kann DNA oder RNA sein und kann sich in das Chromosom des Wirts integrieren, wobei er als ein extrachromosomales Replikon stabil im Wirt verbleiben kann, der Sekretionsvektor kann ein künstliches Chromosom sein oder er kann transient im Wirt vorliegen. Viele Nukleinsäurerückgrate, die zur Verwendung als Sekretionsvektoren geeignet sind, sind dem Fachmann bekannt, einschließlich retroviraler Vektoren, SV40-Vektoren, Bovine Papilloma Virus-Vektoren, hefeintegrierender Plasmiden, hefeepisomaler Plasmiden, künstlicher Chromosomen aus Hefe, künstlicher menschlicher Chromosomen, P-Element-Vektoren, Baculovirus-Vektoren oder bakterieller Plasmide, die in der Lage sind, transient in den Wirt eingeführt werden zu können.
Der Sekretionsvektor kann auch ein PolyA-Signal enthalten, dergestalt, dass das PolyA-Signal stromabwärts des Gens, das in den Sekretionsvektor insertiert ist, lokalisiert ist.
Nachdem das Gen, das das Protein kodiert, für das eine Sekretion erwünscht ist, in den Sekretionsvektor insertiert worden ist, wird der Sekretionsvektor in die Wirtszelle, das Gewebe oder den Organismus unter Verwendung von Calciumphosphatpräzipitierung, DEAE-Dextran, Elektroporation, liposomenvermittelter Transfektion, viraler Partikel oder als bloße DNA eingeführt. Das durch das insertierte Gen kodierte Protein wird anschließend unter Verwendung konventioneller Techniken, wie beispielsweise Ammoniumsulfatpräzipitierung, Immunopräzipitierung, Immunochromatografie, Größenausschlusschromatografie, Ionenaustauschchromatografie und HPLC, aus dem Überstand aufgereinigt oder angereichert. Alternativ kann das sekretierte Protein in ausreichendem Maß angereichert oder in reinen Zustand im Überstand oder im Wachstumsmedium des Wirts vorliegen, so dass es möglich ist, es für den beabsichtigten Zweck ohne weitere Anreicherung zu verwenden.
Die Signalsequenzen können auch in Vektoren insertiert werden, die zur Gentherapie konzipiert sind. In derartigen Vektoren ist die Signalsequenz operativ mit einem Promotor verknüpft, so dass die mRNA, die vom Promotor transkribiert wird, das Signalpeptid kodiert. Eine Klonierungsstelle ist stromabwärts der Signalsequenz lokalisiert, so dass ein Gen, das ein Protein kodiert, dessen Sekretion erwünscht ist, leicht in den Vektor insertiert werden kann und mit der Signalsequenz fusioniert werden kann. Der Vektor wird in eine geeignete Wirtszelle eingeführt. Das Protein, das vom Promotor exprimiert wird, wird extrazellulär sekretiert, wodurch ein therapeutischer Effekt erzeugt wird.
Die 5'-ESTs können auch verwendet werden, um Sequenzen zu klonieren, die stromaufwärts der 5'-ESTs lokalisiert sind und in der Lage sind, die Genexpression zu regulieren, einschließlich Promotorsequenzen, Enhancer- Sequenzen und anderen stromaufwärts liegenden Sequenzen, die den Grad an Transkription oder Translation beeinflussen. Nachdem sie identifiziert und kloniert worden sind, können diese stromaufwärts liegenden regulatorischen Sequenzen in Expressionsvektoren verwendet werden, die konzipiert wurden, die Expression eines insertierten Gens in einer räumlichen, zeitlichen, entwicklungsspezifischen oder quantitativen Weise zu lenken. Beispiel 58 beschreibt ein Verfahren zur Klonierung von Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs liegen.
2. Identifizierung von stromaufwärts liegenden Sequenzen mit Promotoraktivität oder regulatorischer Aktivitäten
BEISPIEL 58
Verwendung erweiterter cDNAs oder 5'-ESTs um stromaufwärts liegende Sequenzen aus genomischer DNA zu klonieren
Aus erweiterten cDNAs oder 5'-ESTs abgeleitete Sequenzen können verwendet werden, um die entsprechenden Gene unter Verwendung von Chromosomen-Wander-Techniken (chromosome walking) zu isolieren. In einer Chromosomen-Wander-Technik, die den von Clontech verfügbaren GenomeWalker^TM-Kit verwendet, werden fünf Gesamtgenom-DNA-Proben mit einem jeweils einem unterschiedlichen Restriktionsenzym verdaut, das eine 6 Basen-Erkennungsstelle aufweist und ein glattes Ende zurücklässt. Im Anschluss an den Verdau werden Oligonukleotidadapter an jedes Ende der sich ergebenden genomischen DNA-Fragmente ligiert.
Für jede der fünf genomischen DNA-Bibliotheken wird eine erste PCR-Reaktion gemäß den Anweisungen des Herstellers durchgeführt, wobei ein äußerer Adapterprimer, der im Kit bereitgestellt wird, und ein äußerer genspezifischer Primer verwendet wird. Der genspezifische Primer sollte so gewählt werden, um spezifisch für die erweiterte cDNA oder das 5'-EST von Interesse zu sein und sollte eine Schmelztemperatur, eine Länge und eine Lage in der erweiterten cDNA oder dem 5'-EST aufweisen, die mit seiner Verwendung in PCR-Reaktionen vereinbar sind. Jede erste PCR-Reaktion enthält 5 ng genomische DNA, 5 μl 10 × Tth-Reaktionspuffer, 0,2 mM eines jeden dNTP, jeweils 0,2μM äußeren Adapterprimer und äußeren genspezifischen Primer, 1,1 mM Mg(OAc)₂ und 1 μl des Tth-Polymerase 50 × Mix in einem Gesamtvolumen von 50 μl. Der Reaktionszyklus für die erste PCR-Reaktion ist der folgende: 1 min – 94°C/2 sec –94°C, 3 min – 72°C (7 Zyklen)/2 sec – 94°C, 3 min – 67°C (32 Zyklen)/5 min – 67°C.
Das Produkt der ersten PCR-Reaktion wird verdünnt und als Matrize für eine zweite PCR-Reaktion gemäß den Anweisungen des Herstellers verwendet, wobei ein Paar von Nested-Primern verwendet wird, die innerhalb des Amplicons lokalisiert sind, das sich aus der ersten PCR-Reaktion ergibt. Beispielsweise können 5 μl des Reaktionsprodukts aus dem ersten PCR-Reaktionsgemisch 180 fach verdünnt werden. Die Reaktion werden in einem 50 μl Volumen mit einer Zusammensetzung durchgeführt, die der der ersten PCR-Reaktion entspricht, außer das Nested-Primer verwendet werden. Der erste Nested-Primer ist spezifisch für den Adapter und wird mit dem GenomeWalker^TM-Kit bereitgestellt. Der zweite Nested-Primer ist spezifisch für die bestimmte erweiterte cDNA oder das 5'-EST, für das der Promotor kloniert werden soll und sollte eine Schmelztemperatur, Länge und Lage in der erweiterten cDNA oder dem 5'-EST aufweisen, die mit seiner Verwendung in PCR-Reaktionen vereinbar ist. Die Reaktionsparameter der zweiten PCR-Reaktion sind die folgenden: 1 min – 94°C/2 sec –94°C, 3 min – 72°C (6 Zyklen)/2 sec – 94°C, 3 min – 67°C (25 Zyklen)/5 min – 67°C. Das Produkt der zweiten PCR-Reaktion wird unter Verwendung von Standardtechniken gereinigt, kloniert und sequenziert.
Alternativ können zwei oder mehrere humane genomische DNA-Bibliotheken unter Verwendung von zwei oder mehr Restriktionsenzymen konstruiert werden. Die verdaute genomische DNA wird in Vektoren kloniert, die in einzelsträngige, zirkuläre oder lineare DNA umgewandelt werden können. Ein biotinyliertes Oligonukleotid, das wenigstens 15 Nukleotide der erweiterten cDNA oder der 5'-EST-Sequenz umfasst, wird an die einzelsträngige DNA hybridisiert. Die Hybride zwischen dem biotinylierten Oligonukleotid und der einzelsträngigen DNA, die die erweiterte cDNA oder 5'-EST-Sequenz enthält, werden, wie in Beispiel 29 weiter oben beschrieben, isoliert. Danach wird die einzelsträngige DNA, die die erweiterte cDNA oder 5'-EST-Sequenz enthält, von den Beads abgelöst und unter Verwendung eines Primers, der für die erweiterte cDNA oder 5'-EST-Sequenz spezifisch ist, oder eines Primers, der einer Sequenz entspricht, die vom Klonierungsvektor umfasst ist, in doppelsträngige DNA umgewandelt. Die sich ergebende doppelsträngige DNA wird in Bakterien transformiert. DNAs, die die 5'-EST- oder erweiterte cDNA-Sequenzen enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
Nachdem die stromaufwärts liegenden genomischen Sequenzen einmal wie weiter oben beschrieben kloniert und sequenziert worden sind, können voraussichtliche Promotoren und Transkriptionsstartstellen innerhalb der stromaufwärts liegenden Sequenzen durch Vergleich der Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs liegen, mit Datenbanken, die bekannte Transkriptionsstartstellen, Transkriptionsfaktorbindungsstellen oder Promotorsequenzen enthalten, identifiziert werden.
Zusätzlich können Promotoren in stromaufwärts liegende Sequenzen unter Verwendung von Promotorreportervektoren identifiziert werden, wie es in Beispiel 59 beschrieben wird.
BEISPIEL 59
Identifizierung von Promotoren in klonierten stromaufwärts liegenden Sequenzen
Die stromaufwärts liegenden genomischen Sequenzen der erweiterten cDNAs oder 5'-ESTs werden in einen geeigneten Promotorreportervektor kloniert, wie beispielsweise die pSEAP-Basic, pSEAP-Enhancer, pβgal-Basic, pβgal-Enhancer oder pEGFP-1-Promotorreportervektoren, die von Clontech erhältlich sind. In Kürze, jeder dieser Promotorreportervektoren umfasst multiple Klonierungsstellen, die stromaufwärts eines Reportergens liegen, das ein Protein kodiert, für das in einfacher Weise eine Probenbestimmung durchgeführt werden kann, wie beispielsweise sekretierte alkalische Phosphatase, β-Galactosidase oder grün fluoreszierendes Protein. Die Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs liegen, werden in die Klonierungsstellen stromaufwärts des Reportergens in beiden Orientierungen kloniert und in eine geeignete Wirtszelle eingeführt. Hinsichtlich der Menge an Reporterprotein wird eine Untersuchung durchgeführt und mit der Menge verglichen, die von einem Vektor erhalten wird, der kein Insert in der Klonierungsstelle trägt. Das Vorliegen einer erhöhten Expressionsmenge in einem Vektor, der das Insert enthält im Hinblick auf den Kontrollvektor, zeigt das Vorliegen eines Promotors im Insert. Wenn nötig, können die stromaufwärts liegenden Sequenzen in Vektoren kloniert werden, die einen Enhancer für eine Erhöhung der Transkriptionsmengen von schwachen Promotorsequenzen enthält. Eine signifikant höhere Menge an Expression als die, die für den Vektor beobachtet wird, der kein Insert trägt, zeigt, dass eine Promotorsequenz in der insertierten stromaufwärts liegenden Sequenz vorliegt.
Geeignete Wirtszellen für die Promotorreportervektoren können auf Grundlage der Ergebnisse zur oben beschriebenen Bestimmung der Expressionsmuster der erweiterten cDNAs und 5'-ESTs ausgewählt werden. Wenn die Expressionsmusteranalyse beispielsweise zeigt, dass die mRNA, die einer bestimmten erweiterten cDNA oder einem 5'-EST entspricht, in Fibroblasten exprimiert wird, kann der Promotorreportervektor in eine humane Fibroblastenzelllinie eingeführt werden.
Promotorsequenzen innerhalb der stromaufwärts liegenden genomischen DNA können ferner durch Konstruktion von verschachtelten Deletionen (nested deletions) in der stromaufwärts liegenden DNA bestimmt werden, wobei herkömmliche Techniken, wie beispielsweise Exonuklease III-Verdau, verwendet werden. Die sich ergebenden deletierten Fragmente können in den Promotorreportervektor insertiert werden, um zu bestimmen, ob die Deletion eine verringerte oder ausgeschaltete Promotoraktivität aufweist. Auf diese Weise können die Grenzen der Promotoren bestimmt werden. Wenn gewünscht, können die möglichen einzelnen regulatorischen Stellen innerhalb des Promotors unter Verwendung von ortsgerichteter Mutagenese (side directed mutagenesis) oder Linkerscanning identifiziert werden, um die möglichen Transkriptionsfaktorbindungsstellen innerhalb des Promotors einzeln oder in Kombination zu auszuschalten. Die Wirkungen dieser Mutationen auf das Transkriptionsniveau können unter Einführung der Mutationen in die Klonierungsstellen in die Promotorreportervektoren bestimmt werden.
BEISPIEL 60
Klonierung und Identifizierung von Promotoren
Unter Verwendung des Verfahrens, das in Beispiel 58 weiter oben mit 5'-ESTs beschrieben wird, wurden stromaufwärts liegende Sequenzen von mehreren Genen erhalten. Unter Verwendung des Primerpaares GGG AAG ATG GAG ATA GTA TTG CCT G (SEQ ID NO: 29) und CTG CCA TGT ACA TGA TAG AGA GAT TC (SEQ ID NO: 30) wurde der Promotor mit der internen Bezeichnung P13H2 (SEQ ID NO: 31) erhalten.
Unter Verwendung des Primerpaares GTA CCA GGGG ACT GTG ACC ATT GC (SEQ ID NO: 32) und CTG TGA CCA TTG CTC CCA AGA GAG (SEQ ID NO: 33) wurde der Promotor mit der internen Bezeichnung t15B4 (SEQ ID NO: 34) erhalten.
Unter Verwendung des Primerpaares CTG GGA TGG AAG GCA CGG TA (SEQ ID NO: 35) und GAG ACC ACA CAG CTA GAC AA (SEQ ID NO: 36) wurde der Promotor mit der internen Bezeichnung P29B6 (SEQ ID NO: 37) erhalten.
4 stellt eine schematische Beschreibung der isolierten Promotoren bereit und die Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengesetzt sind. Die stromaufwärts liegenden Sequenzen wurden hinsichtlich des Vorliegens von Motiven, die Transkriptionsfaktorbindungsstellen oder bekannten Transkriptionsstartstellen ähneln, durchmustert, wobei das Computerprogramm Matlnspector Version 2.0, August 1996 verwendet wurde.
Tabelle VII beschreibt die Transkriptionsfaktorbindungsstellen, die in jedem dieser Promotoren vorliegen. Die mit Matrix bezeichneten Spalten zeigen den Namen der verwendeten Matlnspector-Matrix an. Die mit Position bezeichneten Spalten zeigen die 5'-Position der Promotorstelle. Die Nummerierung der Sequenzen beginnt mit der Transkriptionsstelle, wie sie durch Abgleich der Genomsequenz mit der 5'-EST-Sequenz bestimmt wird. Die Spalte, die mit „Orientierung" bezeichnet ist, zeigt den DNA-Strang, auf dem die Stelle nachgewiesen wird, wobei der +-Strang der kodierende Strang ist, wobei er durch Abgleich der Genomsequenz mit der Sequenz des 5'-ESTs bestimmt wird. Die Spalte, die mit „Score" bezeichnet ist, zeigt den Matlnspector Score, der für diese Stelle nachgewiesen wurde. Die Spalte, die mit „Länge" bezeichnet ist, zeigt die Länge der Stelle in Nukleotiden. Die Spalte, die mit „Sequenz" bezeichnet ist, zeigt die Sequenz der gefundenen Stelle.
Bakterienklone, die Plasmide enthalten, die die oben beschriebenen Promotorsequenzen enthalten, werden gegenwärtig in den Laboratorien des Erfinders unter den oben bereitgestellten internen Identifizierungsnummern gelagert. Die Inserts können aus den hinterlegten Materialien durch Anzucht eines Aliquotes eines geeigneten Bakterienklons in geeignetem Medium gewonnen werden. Die Plasmid-DNA kann anschließend unter dem Fachmann bekannten Plasmidisolierungsverfahren, wie beispielsweise Verfahren zur alkalischen Lyse im Miniprep-Maßstab oder Plasmidisolierung auf Basis alkalischer Lyse im Großmaßstab, isoliert werden. Wenn gewünscht, kann die Plasmid-DNA durch Zentrifugation auf einem Cäsiumchloridgradienten, Größenausschlusschromatografie oder Anionenaustauschchromatografie weiter angereichert werden.
Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden. Alternativ kann eine PCR mit Primern, die an beiden Enden der EST-Insertion konzipiert worden sind, durchgeführt werden. Das dem 5'-EST entsprechende PCR-Produkt kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden.
Die Promotoren und andere regulatorische Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs lokalisiert sind, können verwendet werden, um Expressionsvektoren zu konzipieren, die in der Lage sind, die Expression eines insertierten Gens in einer gewünschten räumlichen, zeitlichen, entwicklungsspezifischen oder quantitativen Weise zu lenken. Ein Promotor, der in der Lage ist, die gewünschten räumlichen, zeitlichen, entwicklungsspezifischen und quantitativen Muster zu lenken, kann unter Verwendung der Ergebnisse zur Expressionsanalyse, die in Beispiel 26 weiter oben beschrieben wird, selektiert werden. Beispielsweise kann, wenn ein Promotor erwünscht ist, der ein hohes Maß an Expression im Muskel verleiht, die Promotorsequenz, die stromaufwärts einer erweiterten cDNA oder eines 5'-EST liegt, die von einer mRNA abgeleitet sind, die im Muskel in hohem Maße exprimiert wird, im Expressionsvektor verwendet werden, wie es durch das Verfahren gemäß Beispiel 26 bestimmt ist.
Vorzugsweise wird der gewünschte Promotor nahe einer multiplen Restriktionsschnittstelle platziert, um die Klonierung des gewünschten Inserts stromabwärts des Promotors zu ermöglichen, so dass der Promotor in der Lage ist, die Expression des insertierten Gens zu lenken. Der Promotor kann in herkömmliche Nukleinsäurerückgrate insertiert werden, die für eine extrachromosomale Replikation, Integration in die Wirtschromosomen oder transiente Expression konzipiert sind. Geeignete Rückgrate für die vorliegenden Expressionsvektoren umfassen retrovirale Rückgrate, Rückgrate von eukaryotischen Episomen, wie beispielsweise SV40 oder Bovine Papilloma Virus, Rückgrate von bakteriellen Episomen oder künstliche Chromosomen.
Vorzugsweise umfassen die Expressionsvektoren ein PolyA-Signal stromabwärts der multiplen Restriktionsstelle, dass zur Polyadenylierung von mRNA dient, die von dem Gen transkribiert wird, das in den Expressionsvektor insertiert ist.
Im Anschluss an die Identifizierung von Promotorsequenzen, wobei Verfahren gemäß den Beispielen 58-60 verwendet werden, können Proteine, die mit dem Promotor wechselwirken, identifiziert werden wie es in Beispiel 61 weiter unten beschrieben wird.
BEISPIEL 61
Identifizierung von Proteinen, die mit Promotorsequenzen stromaufwärts liegender regulatorischer Sequenzen oder mit mRNA wechselwirken
Sequenzen innerhalb der Promotorregion, die wahrscheinlich Transkriptionsfaktoren binden, können durch Homologie mit bekannten Transkriptionsfaktorbindungsstellen oder durch herkömmliche Mutagenese- oder Deletionsanalysen von Reporterplasmiden identifiziert werden, die die Promotorsequenz enthalten. Beispielsweise können Deletionen in einem Reporterplasmid erzeugt werden, das die Promotorsequenz von Interesse enthält, die operativ mit einem Reportergen verknüpft ist, hinsichtlich dessen ein Assay durchgeführt werden kann. Die Reporterplasmide, die verschiedene Deletionen innerhalb der Promotorregion tragen, werden in eine geeignete Wirtszelle transfiziert und die Wirkung der Deletionen auf die Expressionsniveaus wird beurteilt. Transkriptionsfaktorbindungsstellen mit den Regionen, in welchen Deletionen, die die Expressionsniveaus absenken, können ferner unter Verwendung von ortsgerichteter Mutagenese, Linkerscanning-Analyse oder anderen, dem Fachmann bekannten Techniken, lokalisiert werden.
Nukleinsäuren, die Proteine kodieren, die mit Sequenzen im Promotor wechselwirken, können unter Verwendung von Ein-Hybridsystemen identifiziert werden, wie beispielsweise den Ein-Hybridsystemen, die im Handbuch beschrieben sind, das dem Matchmaker One-Hybrid System Kit beiliegt, wobei der Kit von Clontech erhältlich ist (Katalog Nr. K1603-1 ). In Kürze, das Matchmaker One-Hybrid System wird wie folgt verwendet. Die Zielsequenz, für die es erwünscht ist, daran bindende Proteine zu identifizieren, wird stromaufwärts von einem selektierbaren Reportergen kloniert und in das Hefegenom integriert. Vorzugsweise werden mehrere Kopien der Zielsequenzen als Tandem in das Reporterplasmid insertiert. Eine Bibliothek, die aus Fusionsprodukten von cDNAs, die hinsichtlich ihrer Fähigkeit an den Promotor zu binden, beurteilt werden sollen, und der Aktivierungsdomäne eines Hefetranskriptionsfaktors, wie beispielsweise GAL4, besteht, wird in den Hefestamm transformiert, der die integrierte Reportersequenz enthält. Die Hefe wird auf selektiven Medien ausplattiert, um Zellen zu selektieren, die selektierbaren Marker, der mit der Promotorsequenz verknüpft ist, zu exprimieren. Die Kolonien, die auf den selektiven Medien wachsen, enthalten Gene, die Proteine kodieren, die an die Zielsequenz binden. Die Inserts in den Genen, die die Fusionsproteine kodieren, werden ferner durch Sequenzierung charakterisiert. Zusätzlich können die Inserts in Expressionsvektoren oder in in vitro-Transkriptionsvektoren insertiert werden. Das Binden der durch Inserts kodierten Polypeptide an die Promotor-DNA kann durch Techniken, die dem Fachmann bekannt sind, bestätigt werden, wie beispielsweise Gelshift-Analysen oder DNAse-Protection-Analyse.
VII. Verwendung von 5'-ESTs (oder cDNAs oder genomischer DNAs, die davon erhältlich sind) in der Gentherapie
Die vorliegende Erfindung umfasst auch die Verwendung von 5'-ESTs (oder cDNA oder genomischer DNA, die daraus erhältlich ist) in Strategien zur Gentherapie, einschließlich Antisense- und Triple Helix-Strategien, wie sie in den Beispielen 62 und 63 weiter unten beschrieben wird. In Antisense-Ansätzen werden zu einer mRNA komplementäre Nukleinsäuresequenzen intrazellulär an die mRNA hybridisiert, wodurch sie die Expression des durch die mRNA kodierten Proteins blockieren. Die Antisense Sequenzen können Genexpression über eine Vielfalt an Mechanismen verhindern. Beispielsweise können die Antisense Sequenzen die Fähigkeit der Ribosomen hemmen, die mRNA zu translatieren.
Alternativ können die Antisense Sequenzen den Transport der mRNA aus dem Kern ins Zytoplasma blockieren, wodurch die zur Translation zur Verfügung stehende mRNA-Menge beschränkt wird. Ein anderer Mechanismus, über den Antisense Sequenzen Genexpression hemmen können, ist eine Wechselwirkung mit mRNA-Spleißen. In noch einer anderen Strategie kann die Antisense Nukleinsäure Teil eines Ribozyms sein, das in der Lage ist, die Ziel-mRNA spezifisch zu spalten.
BEISPIEL 62
Herstellung und Verwendung von Antisense-Oligonukleotiden
Die Antisense Nukleinsäuremoleküle, die in der Gentherapie verwendet werden sollen, können entweder DNA- oder RNA-Sequenzen sein. Sie können eine Sequenz umfassen, die komplementär zu der Sequenz des 5'-ESTs (oder der cDNA oder der genomischen DNA, die davon erhältlich ist) ist. Die Antisense Nukleinsäuren können eine Länge und eine Schmelztemperatur aufweisen die ausreicht, die Bildung einer intrazellulären Duplex mit ausreichender Stabilität zu ermöglichen, um so die Expression der mRNA in der Duplex zu hemmen. Strategien zur Konzipierung von Antisense Nukleinsäuren, die zur Verwendung in der Gentherapie geeignet sind, sind in Green et al., Anm. Rev. Biochem. 55:569-597, 1986, und Izant und Weintraub, Cell 36:1007-1015, 1984, offenbart.
In einigen Strategien werden Antisense Moleküle von einer Protein kodierenden Nukleotidsequenz durch Umkehrung der Orientierung der kodierenden Region im Hinblick auf einen Promotor erhalten, um so den Gegenstrang von dem Strang zu transkribieren, der normalerweise in der Zelle transkribiert wird. Die Antisense Moleküle können unter Verwendung von in vitro-Transkriptionssystemen transkribiert werden, wie beispielsweise denjenigen Systemen, die T7- oder SP6-Polymerase verwenden, um das Transkript zu erzeugen. Ein anderer Ansatz greift auf die Transkription der Antisense Nukleinsäuren in vivo zurück, wobei eine Antisense Sequenz enthaltende DNA in einem Expressionsvektor operativ mit einem Promotor verknüpft wird.
Alternativ können Oligonukleotide, die zu dem Strang komplementär sind, der in der Zelle normalerweise transkribiert wird, in vitro synthetisiert werden. Daher sind die Antisense Nukleinsäuren komplementär zu der entsprechenden mRNA und in der Lage, an die mRNA zu hybridisieren, um so eine Duplex zu erzeugen. In einigen Ausführungsformen können die Antisense Sequenzen modifizierte Zuckerphosphatrückgrate enthalten, um die Stabilität zu erhöhen und um sie weniger sensitiv für einen RNAse-Angriff zu machen. Beispiele für Modifikationen, die zur Verwendung in Antisense Strategien geeignet sind, werden von Rossi et al., Pharmacol. Ther. 50(2):245-254, 1991, beschrieben.
Verschiedene Typen von Antisense Oligonukleotiden, die zu der Sequenz des 5'-ESTs (oder der cDNA oder der genomischen DNA, die davon erhältlich ist) komplementär sind, können verwendet werden. In einer bevorzugten Ausführungsform werden stabile und semi-stabile Antisense Oligonukleotide verwendet, wie sie in der internationalen Patentanmeldung Nr. PCT WO 94/23026 beschrieben sind. In diesen Molekülen sind das 3'-Ende oder beide 3'- und 5'-Enden mit intramolekularen Wasserstoffbrücken zwischen komplementären Basenpaaren belegt. Im Vergleich zu herkömmlichen Antisense Oligonukleotiden sind diese Moleküle besser in der Lage, Exonuklease-Angriffen zu widerstehen und weisen eine erhöhte Stabilität auf.
In einer anderen bevorzugten Ausführungsform werden die Antisense Oligodeoxynukleotide gegen Herpes simplex Virus-Typen 1 und 2 verwendet, wie sie in der internationalen Patentanmeldung Nr. WO 95/0414 1 beschrieben sind.
In noch einer weiteren bevorzugten Ausführungsform werden die kovalent querverknüpften Antisense Oligonukleotide verwendet, die in der internationalen Patentanmeldung Nr. WO 96/31523 beschrieben sind. Diese doppel- oder einzelsträngigen Oligonukleotide umfassen eine bzw. mehrere kovalente inter- oder intraoligonukleotid Querverknüpfungen, wobei die Querverknüpfung aus einer Amidbindung zwischen einer primären Amingruppe des einen Strangs und einer Carboxylgruppe des anderen Strangs oder des gleichen Strangs besteht, wobei die primäre Amingruppe in der 2'-Position des Strangnukleotid-Monosaccharidrings direkt substituiert ist und die Carboxylgruppe durch eine aliphatische Spacergruppe getragen wird, substituiert an einem Nukleotid oder Nukleotidanalogon des anderen oder des gleichen Strangs.
Die Antisense Oligodeoxynukleotide und Oligonukleotide, die in der internationalen Anmeldung Nr. WO 92/18522 offenbart sind, können auch verwendet werden. Diese Moleküle sind gegenüber einem Abbau stabil und enthalten wenigstens eine Transkriptionskontrollerkennungssequenz, die an Kontrollproteine bindet und dafür als Köder wirksam ist. Diese Moleküle können "Haarnadel-Strukturen", "Hantel-Strukturen" ("dumbbell" structures), "modifizierte Hantel-Strukturen", "quervernetzte Köderstrukturen" ("cross-linked" decoy structures) und "Schleifen"-Strukturen enthalten.
In einer weiteren bevorzugten Ausführungsform werden die zyklischen doppelsträngigen Oligonukleotide, die in der europäischen Patentanmeldung Nr. 0 572 287 A2 beschrieben sind, verwendet. Diese ligierten Oligonukleotid-"Hanteln" enthalten die Bindungsstelle für einen Transkriptionsfaktor und hemmen die Expression des unter Kontrolle des Transkriptionsfaktors stehenden Gens durch Beschlagnahme des Faktors.
Die Verwendung der geschlossenen Antisense-Oligonukleotide, die in der internationalen Anmeldung Nr. WO 92/19732 offenbart sind, ist ebenfalls umfasst. Da diese Moleküle keine freien Enden aufweisen, sind sie gegenüber Abbau durch Exonukleasen resistenter als herkömmliche Oligonukleotide. Diese Oligonukleotide können multifunktional sein und können mit mehreren Regionen, die zur Ziel-mRNA nicht benachbart sind, wechselwirken.
Die geeignete Menge an Antisense Nukleinsäuren, die benötigt wird, um Genexpression zu hemmen, kann unter Verwendung von in vitro-Expressionsanalyse bestimmt werden. Das Antisense Molekül kann durch Diffusion, Injektion, Infusion, Transfektion oder h-Region vermitteltem Import unter Verwendung von im Fachbereich bekannten Verfahren in die Zellen eingeführt werden. Beispielsweise kann die Antisense Nukleinsäure als bloßes oder nacktes Oligonukleotid, als in Lipid verkapseltes Oligonukleotid, als Oligonukleotidsequenz, die durch ein virales Protein verkappselt ist, oder als eine Oligonukleotidsequenz, die mit einem in einem Expressionsvektor enthaltenem Promotor operativ verknüpft ist, in den Körper eingeführt werden. Der Expressionsvektor kann ein beliebiger aus der Vielfalt von im Fachbereich bekannten Expressionsvektoren sein, einschließlich retroviraler oder viraler Vektoren, Vektoren die zur extrachromosomalen Replikation fähig sind oder integrierenden Vektoren. Die Vektoren können DNA oder RNA sein.
Die Antisense Moleküle werden in Zellproben mit einer Reihe von verschiedenen Konzentrationen, vorzugsweise zwischen 1 × 10^–10 M bis 1 × 10^–4 M eingeführt. Nachdem die Minimumkonzentration, die die Genexpression adäquat kontrollieren kann, identifiziert worden ist, wird die optimierte Dosis in eine Dosierung umgerechnet, die zur Verwendung in vivo geeignet ist. Beispielsweise wird eine Hemmkonzentration in Kultur von 1 × 10^–7' zu einer Dosis von etwa 0,6 mg/kg Körpergewicht umgerechnet. Oligonukleotidmengen, die 100 mg/kg Körpergewicht oder höher erreichen, können möglich sein, nachdem die Toxizität der Oligonukleotide an Labortieren getestet wurde. Es ist zusätzlich umfasst, dass Zellen aus Wirbeltieren entnommen werden, mit Antisense Oligonukleotiden behandelt werden und wieder in das Wirbeltier eingeführt werden.
Es ist ferner umfasst, dass die Antisense Oligonukleotidsequenz in eine Ribozymsequenz eingebracht wird, um es dem Antisense Element zu ermöglichen, spezifisch zu binden und seine Ziel-mRNA zu spalten. Für technische Anwendungen im Hinblick auf Ribozyme und Antisense Oligonukleotide siehe Rossi et al., supra.
In einer bevorzugten Ausführungsform dieser Erfindung wird das durch das Gen kodierte Polypeptid zuerst identifiziert, so dass die Wirkung der Antisense Hemmung auf die Translation unter Verwendung von Techniken überwacht werden kann, die umfassen aber nicht beschränkt sind auf Antikörper vermittelte Tests, wie beispielsweise RIAs und ELISA, funktionale Assays oder Radiomarkierung.
Die hierin beschriebenen 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können auch in Gentherapieansätzen verwendet werden, die auf Bildung einer intrazellulären Triplehelix beruhen. Triplehelix-Oligonukleotide werden verwendet, um die Transkription von einem Genom zu hemmen. Sie sind insbesondere für Untersuchungen hinsichtlich Veränderungen der Zellaktivität nützlich, da sie mit einem bestimmten Gen in Zusammenhang stehen. Die 5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind) oder stärker bevorzugt ein Abschnitt dieser Sequenzen kann verwendet werden, um die Genexpression in Individuen mit Krankheiten, die mit der Expression eines bestimmten Gens in Zusammenhang stehen, zu hemmen. In ähnlicher Weise kann ein Abschnitt der 5'-EST-Sequenzen (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind) verwendet werden, um die Wirkung der Hemmung der Transkription eines bestimmten Gens innerhalb der Zelle zu untersuchen. Herkömmlich wurden Homopurinsequenzen im Rahmen von Triplehelix-Strategien für am nützlichsten gehalten. Jedoch können Homopyrimidinsequenzen ebenfalls die Genexpression hemmen. Derartige Homopyrimidinoligonukleotide binden an die große Furche bei Homopurin/Homopyrimidinsequenzen. Deshalb sind beide Arten von Sequenzen des 5'-ESTs oder des Gens, das mit dem 5'-EST korrespondiert, umfasst.
BEISPIEL 63
Herstellung und Verwendung von Triplehelix-Sonden
Die Sequenzen der 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind) werden durchsucht, um 10-mer oder 20-mer Homopyrimidin- oder Homopurinabschnitte zu identifizieren, die in Strategien auf Grundlage von Triplehelices zur Hemmung von Genexpression verwendet werden könnten. Im Anschluss an die Identifizierung von Homopyrimidin- oder Homopurinabschnitten mit Kandidatenstatus wird ihre Wirksamkeit bei der Hemmung von Genexpression durch Einführen verschiedener Mengen an Oligonukleotiden, die die Kandidatensequenzen enthalten, in Gewebekulturzellen, die normalerweise das Zielgen exprimieren, beurteilt. Die Oligonukleotide können mit einem Oligonukleotid-Synthesizer hergestellt werden oder können kommerziell von einer Firma bezogen werden, die sich auf die Oligonukleotidsynthese für Kunden spezialisiert hat, wie beispielsweise GENSET, Paris, Frankreich.
Die Oligonukleotide können in die Zellen unter Verwendung einer Vielfalt von dem Fachmann bekannten Verfahren eingeführt werden, einschließlich aber nicht beschränkt auf Calciumphosphatpräzipitierung, DEAE-Dextran, Elektroporation, liposomvermittelte Transfektion oder native Aufnahme.
Behandelte Zellen werden auf eine veränderte Zellfunktionen oder verringerte Genexpression hin überwacht, wobei Techniken, wie beispielsweise Northern Blotting, RNAse Protection Assays oder Strategien auf Grundlage von PCR verwendet werden, um so die Transkriptionsmengen des Zielgens in den Zellen zu überwachen, die mit dem Oligonukleotid behandelt wurden. Die zu überwachenden Zellfunktionen werden auf Grundlage der Homologien des Zielgens, das mit der erweiterten cDNA korrespondiert, von der das Oligonukleotid abgeleitet wurde, mit bekannten Gensequenzen, die mit einer bestimmten Funktion im Zusammenhang stehen, vorhergesagt. Die Zellfunktionen können auch auf Grundlage des Vorliegens abnormaler Physiologien innerhalb der Zellen, die aus Individuen mit einer Erbkrankheit abgeleitet wurden, vorhergesagt werden, insbesondere wenn die erweiterte cDNA mit der Krankheit verbunden ist, wobei die in Beispiel 56 beschriebenen Techniken verwendet werden.
Die Oligonukleotide, die bei der Hemmung der Genexpression in den Gewebekulturzellen wirksam sind, können anschließend unter Verwendung von Techniken, die weiter oben und in Beispiel 62 beschrieben sind, mit einer Dosierung, die auf Grundlage der in vitro-Ergebnisse berechnet wurde, wie es in Beispiel 62 beschrieben wird, eingeführt werden.
In einigen Ausführungsformen können die natürlichen (beta) Anomere der Oligonukleotideinheiten durch alpha Anomere ersetzt werden, um so die Oligonukleotide gegenüber Nukleasen resistenter zu machen. Ferner kann ein interkalierendes Mittel, wie beispielsweise Ethidiumbromid oder dergleichen, an das 3'-Ende des alpha Oligonukleotids angebracht werden, um die Triplehelix zu stabilisieren. Für Informationen zur Herstellung von Oligonukleotiden, die zur Triplehelixbildung geeignet sind, siehe Griffin et al., Science 245:967-971, 1989.
BEISPIEL 64
Verwendung unter Verwendung der 5'-ESTs erhaltenen cDNAs zur Expression eines kodierten Protein in einem Wirtsorganismus
Die cDNAs, die wie oben beschrieben unter Verwendung der hierin beschriebenen 5'-ESTs erhalten wurden, können auch verwendet werden, um ein kodiertes Protein in einem Wirtsorganismus zu exprimieren, um eine vorteilhafte Wirkung zu erzielen. In solchen Verfahren kann das kodierte Protein transient im Wirtsorganismus exprimiert werden oder das kodierte Protein kann stabil im Wirtsorganismus exprimiert werden. Das kodierte Protein kann eine beliebige der oben beschriebenen Aktivitäten aufweisen. Das kodierte Protein kann ein Protein sein, das im Wirtsorganismus nicht vorhanden ist oder das kodierte Protein kann alternativ die im Wirtsorganismus vorkommenden Proteinmengen erhöhen.
Eine erweiterte cDNA mit voller Länge, die das Signalpeptid und das reife Protein kodiert, oder eine erweiterte cDNA, die nur das reife Protein kodiert, wird in den Wirtsorganismus eingeführt. Die erweiterte cDNA kann in den Wirtsorganismus unter Verwendung einer Vielfalt von dem Fachmann bekannten Techniken eingeführt werden. Beispielsweise kann die erweiterte cDNA als nackte DNA in den Wirtsorganismus injiziert werden, so dass das kodierte Protein im Wirtsorganismus exprimiert wird, wodurch eine vorteilhafte Wirkung erzielt wird.
Alternativ kann die erweiterte cDNA in einen Expressionsvektor stromabwärts eines Promotors kloniert werden, der im Wirtsorganismus aktiv ist. Der Expressionsvektor kann ein beliebiger der Expressionsvektoren sein, die zur Verwendung in der Gentherapie konzipiert sind, einschließlich viraler oder retroviraler Vektoren. Der Expressionsvektor kann direkt in den Wirtsorganismus eingeführt werden, so dass das kodierte Protein im Wirtsorganismus exprimiert wird, um eine vorteilhafte Wirkung zu erzeugen. In einem anderen Ansatz kann der Expressionsvektor in vitro in Zellen eingefügt werden. Die Zellen, die den Expressionsvektor enthalten, werden danach selektiert und in den Wirtsorganismus eingeführt, wo sie das kodierte Protein exprimieren, um eine vorteilhafte Wirkung zu erzeugen.
BEISPIEL 65
Verwendung von Signalpeptiden, die durch 5'-ESTs oder daraus erhaltenen Sequenzen kodiert werden, um Proteine in Zellen zu importieren
Die kurze hydrophobe Kernregion (h) von Signalpeptiden, die durch die 5'-ESTs oder erweiterte cDNAs kodiert werden, die von den SEQ ID Nos: 38-270 abgeleitet sind, können auch als Träger verwendet werden, um ein Peptid oder Protein von Interesse, eine so genannte Fracht, in Gewebekulturzellen zu importieren (Lin et al., J. Biol. Chem.,270:14225-14258, 1995; Du et al., J. Peptide Res., 51:235-243, 1998; Rojas et al., Nature Biotech., 16:370-375, 1998).
Wenn zellpermeable Peptide von beschränkter Größe (etwa bis zu 25 Aminosäuren) über eine Zellmembran transloziert werden sollen, kann auf chemische Synthese zurückgegriffen werden, um die h-Region entweder an den C-Terminus oder an den N-Terminus des Frachtpeptids von Interesse anzufügen. Alternativ können, wenn längere Peptide oder Proteine in Zellen importiert werden sollen, Nukleinsäuren genetisch verändert werden, wobei dem Fachmann bekannte Techniken verwendet werden, um die erweiterte cDNA-Sequenz, die die h-Region kodiert, mit dem 5'- oder 3'-Ende der DNA-Sequenz, die das Frachtpolypeptid kodiert, zu verknüpfen. Derartig genetisch veränderte Nukleinsäuren werden anschließend entweder in vitro oder in vivo nach der Transfektion in geeignete Zellen translatiert, wobei herkömmliche Techniken verwendet werden, um das sich ergebende zellpermeable Polypeptid herzustellen. Geeignete Wirtszellen werden anschließend mit dem zellpermeablen Polypeptid einfach inkubiert, das anschließend über die Membran hinweg transloziert wird.
Dieses Verfahren kann angewandt werden, um verschiedene intrazelluläre Funktionen oder zelluläre Prozesse zu untersuchen. Beispielsweise wurde es verwendet, um funktionell relevante Domänen intrazellulärer Proteine zu sondieren und um Protein-Protein-Wechselwirkungen, die an Signaltransduktionswegen beteiligt sind, zu untersuchen (Lin et al., supra; Lin et al., J. Biol. Chem., 271:5305-5308, 1996; Rojas et al., J. Biol. Chem., 271:27456-27461, 1996; Liu et al., Proc. Natl. Acad. Sci. USA, 93:11819-11824, 1996; Rojas et al., Bioch. Biophys. Res. Commun., 234:675-680, 1997).
Solche Techniken können in der Zelltherapie eingesetzt werden, um Proteine zu importieren, wobei therapeutische Wirkungen erzielt werden. Beispielsweise können Zellen, die aus einem Patienten isoliert wurden, mit importierten therapeutischen Proteinen behandelt werden und anschließend wieder in den Wirtsorganismus eingeführt werden.
Alternativ kann die h-Region von Signalpeptiden der vorliegenden Erfindung in Kombination mit einem Kernlokalisierungssignal verwendet werden, um Nukleinsäuren in den Zellkern abzugeben. Derartige Oligonukleotide können Antisense Oligonukleotide oder Oligonukleotide sein, die konzipiert wurden, um Triplehelices zu bilden, wie es in den Beispielen 62 bzw. 63 beschrieben wird, um die Prozessierung und/oder Reifung einer zellulären Ziel-RNA zu hemmen.
Wie oben beschrieben, können die cDNAs oder Abschnitte davon, die unter Verwendung der hierin beschriebenen 5'-ESTs erhalten wurden, für verschiedene Zwecke verwendet werden. Die Polynukleotide können verwendet werden, um rekombinantes Protein zur Analyse, Charakterisierung oder therapeutischen Verwendung zu exprimieren; als Marker für Gewebe, in denen das entsprechende Protein vorzugsweise exprimiert wird (entweder konstitutiv oder in einer bestimmten Phase der Gewebedifferenzierung oder -entwicklung oder bei Krankheitszuständen); als Molekulargewichtsmarker auf Southern Gelen; als Chromosomenmarker oder Tags (wenn markiert), um Chromosomen zu identifizieren oder um miteinander in Beziehung stehende Genpositionen zu kartieren; um sie mit endogenen DNA-Sequenzen in Patienten zu vergleichen, um so mögliche genetische Erkrankungen zu identifizieren; als Sonden zur Hybridisierung und zur Entdeckung neuer miteinander in Beziehung stehender DNA-Sequenzen; als Informationsquelle, um PCR-Primer für genetisches Fingerprinting abzuleiten; für eine Auswahl und Herstellung von Oligomeren zur Befestigung auf einem „Genchip" oder einem anderem Träger, einschließlich der Untersuchung von Expressionsmustern; zur Herstellung von Anti-Proteinantikörpern unter Verwendung von DNA-Immunisierungstechniken und als Antigen zur Herstellung von Anti-DNA-Antikörpern oder um andere Immunantworten auszulösen. In Fällen in denen das Polynukleotid ein Protein kodiert, das an ein anderes Protein bindet oder möglicherweise bindet (beispielsweise in einer Rezeptor-Ligand-Wechselwirkung) kann das Polynukleotid auch in Interaction Trap Assays verwendet werden (wie beispielsweise dem der in Gyuris et al., Cell 75:791-803, 1993 beschrieben wird), um Polynukleotide zu identifizieren, mit denen die Bindung stattfindet oder um Hemmstoffe der Bindewechselwirkung zu identifizieren.
Die Proteine oder Polypeptide, die durch die vorliegende Erfindung bereitgestellt werden, können in ähnlicher Weise in Assays verwendet werden, um die biologische Aktivität zu bestimmen, einschließlich einem Panel multipler Proteine für Hochdurchsatz-Screening; um Antikörper zu erzeugen oder um eine andere Immunantwort auszulösen; als ein Reagenz (einschließlich des markierten Reagenz) in Assays, die konzipiert sind, die Mengen des Proteins (oder seines Rezeptors) in biologischen Fluiden quantitativ zu bestimmen; als Marker für Gewebe, in denen das entsprechende Protein vorzugsweise exprimiert wird (entweder konstitutiv oder in einer bestimmten Phase der Gewebedifferenzierung oder -entwicklung oder in einem Krankheitszustand); und selbstverständlich um korrelierende Rezeptoren oder Liganden zu isolieren. In Fällen in denen das Protein bindet oder möglicherweise bindet (wie beispielsweise in einer Rezeptor-Ligand-Wechselwirkung), kann das Protein verwendet werden, um andere Proteine zu identifizieren, mit denen eine Bindung stattfindet, oder um Hemmstoffe der Bindungswechselwirkung zu identifizieren. Proteine, die bei diesen Bindungswechselwirkungen beteiligt sind, können auch verwendet werden, um nach Peptidhemmstoffen oder kleinen Molekülhemmstoffen oder Agonisten dieser Bindewechselwirkung durchzumustern.
Beliebige oder alle dieser Forschungsmöglichkeiten können dahingehend entwickelt werden, dass sie als Reagenz geeignet sind, oder zu einem Kitformat zur Kommerzialisierung als Forschungsprodukte weiterentwickelt werden.
Die weiter oben aufgeführten Verfahren zur Durchführung der Verwendungen sind dem Fachmann wohl bekannt. Referenzen, die derartige Verfahren offenbaren, umfassen ohne Beschränkung Molecular Cloning; A Laboratory Manual, 2. Ausgabe, Cold spring Harbor Laboratory Press, Sambrook, Fritsch und Maniatis Hrsg., 1989, und Methods in Enzymology; Guide to Molecular Cloning Techniques, Academic Press, Berger und Kimmel Hrsg., 1987.
Erfindungsgemäße Polynukleotide und Proteine können auch als Nahrungsmittelquellen oder Nahrungsmittelergänzungsstoffe verwendet werden. Derartige Verwendungen umfassen ohne Beschränkung die Verwendung als Protein- oder Aminosäurezusatz, die Verwendung als Kohlenstoffquelle, die Verwendung als Stickstoffquelle und die Verwendung als Kohlenwasserstoffquelle. In derartigen Fällen kann das erfindungsgemäße Protein oder Polynukleotid der Nahrung für einen beliebigen Organismus zugefügt werden oder es kann als getrennte feste oder flüssige Präparation verabreicht werden, wie beispielsweise in Form eines Puders, als Pillen, Lösungen, Suspensionen oder als Kapseln. Im Fall von Mikroorganismen kann das erfindungsgemäße Protein oder Polynukleotid dem Medium zugegeben werden, in oder auf welchem der Mikroorganismus kultiviert wird.
Auch wenn diese Erfindung hinsichtlich bestimmter bevorzugter Ausführungsformen beschrieben wurde, sind andere Ausführungsformen dem Durchschnittsfachmann im Hinblick auf die hierin dargelegte Offenbarung offensichtlich und fallen auch in den Bereich dieser Erfindung. Entsprechend ist es beabsichtigt, dass der Bereich der Erfindung nur durch Referenz auf die angefügten Ansprüche bestimmt ist.
Tabelle II
Tabelle III

SEQ.ID NO. SIGNALPEPTID

ID38 MLLEVPWLSSTVSCAQG
Tabelle IV
Tabelle V
Tabelle VI
Beschreibung von Transkriptionsfaktorbindungsstellen, die auf Promotoren vorliegen, die aus SignalTag-Sequenzen isoliert worden sind
Promotorsequenz P13H2 (546bp):
Promotorsequenz P16B4 (861 bp):
Promotorsequenz P29B6 (556bp):
Tabelle VII
Sequenzprotokoll

Claims

Signalpeptid mit der Sequenz der Aminosäuren –17 bis –1 gemäß SEQ ID NO:39.
Signalsequenz, kodierend ein Signalpeptid gemäß Anspruch 1.
Signalsequenz gemäß Anspruch 2 mit der Sequenz der Nukleotide 232 bis 282 gemäß SEQ ID NO:38.
Gereinigte und isolierte Nukleinsäure, umfassend eine Signalsequenz gemäß Anspruch 2 oder 3 operativ verknüpft mit einer Nukleinsäuresequenz, die ein Protein kodiert, für welches Sekretion erwünscht ist.
Vektor, umfassend eine Signalsequenz gemäß Anspruch 2 oder Anspruch 3, operativ verknüpft mit einem Promotor.
Vektor gemäß Anspruch 5, ferner umfassend Klonierungsstellen.
Vektor gemäß Anspruch 5 oder Anspruch 6, ferner umfassend eine Nukleinsäuresequenz, die eine Protein, für welches Sekretion erwünscht ist, kodiert und die im Leserahmen der Signalsequenz insertiert ist.
Vektor gemäß einem der Ansprüche 5 bis 7, worin der Vektor ein Vektor zur Sekretion ist.
Vektor gemäß einem der Ansprüche 5 bis 7, worin der Vektor ein Vektor zur Gentherapie ist.
Fusionsprotein, kodiert durch eine Nukleinsäure gemäß Anspruch 4, umfassend ein Signalpeptid gemäß Anspruch 1.
Fusionsprotein, kodiert durch einen Vektor gemäß einem der Ansprüche 7 bis 9, umfassend das Signalpeptid gemäß Anspruch 1.
Ex vivo Verwendung eines Signalpeptids gemäß Anspruch 1 zum Lenken der extrazellulären Sekretion eines Polypeptids.
Verwendung eines Signalpeptids gemäß Anspruch 1 zur Vereinfachung der Proteinreinigung eines gewünschten Polypeptids.
Ex vivo Verwendung eines Vektors gemäß einem der Ansprüche 5 bis 9 zum Lenken der extrazellulären Sekretion eines Polypeptids.
Verwendung eines Vektors gemäß einem der Ansprüche 5 bis 9 zur Vereinfachung der Proteinreinigung eines gewünschten Polypeptids.
Verwendung gemäß einem der Ansprüche 12 bis 15, wobei das Polypeptid ein Fusionsprotein gemäß Anspruch 10 oder Anspruch 11 ist.
Ex vivo Verfahren zur Herstellung eines sekretierten Proteins, umfassend den Schritt: Insertieren eines Gens, welches ein nicht-sekretiertes Protein kodiert, im Leserahmen mit einer Signalsequenz gemäß Anspruch 2 oder Anspruch 3, in einen Vektor, so dass das Protein, welches durch das insertierte Gen kodiert ist, von der transkribierten mRNA exprimiert wird.
Verfahren gemäß Anspruch 17, ferner umfassend den Schritt: Einführen des Vektors in eine Wirtszelle, in Gewebe oder in einen nicht-menschlichen Organismus.
Ex vivo Verfahren zur Herstellung eines sekretierten Proteins, umfassend den Schritt: Einführen eines Vektors gemäß einem der Ansprüche 5 bis 9 in eine Wirtszelle, in Gewebe oder in einen nicht-menschlichen Organismus.
Verfahren gemäß einem der Ansprüche 17 bis 19, ferner umfassend den Schritt: Isolieren des sekretierten Proteins.
Verfahren gemäß Anspruch 20, worin der Schritt zur Isolierung des sekretierten Proteins das Reinigen des sekretierten Proteins aus dem Überstand umfasst.