DE69835751T2

DE69835751T2 - 5' ests für proteine, die nicht gewebespezifisch sind

Info

Publication number: DE69835751T2
Application number: DE69835751T
Authority: DE
Inventors: Jean-Baptiste Dumas Milne Edwards; Aymeric Duclert; Bruno Lacroix
Original assignee: Serono Genetics Institute SA
Current assignee: Merck Biodevelopment SAS
Priority date: 1997-08-01
Filing date: 1998-07-31
Publication date: 2007-10-04
Anticipated expiration: 2018-08-01
Also published as: ATE338117T1; ES2267192T3; EP1000146A2; DK1000146T3; WO1999006548A3; JP2001512011A; PT1000146E; CY1106216T1; WO1999006548A2; EP1000146B1; CA2297306A1; WO1999006548B1; AU8554798A; DE69835751D1

Description

Hintergrund der Erfindung
Die auf 50,000 bis 100,000 geschätzten Gene, die entlang der humanen Chromosomen verstreut sind, bieten eine enorme Aussicht für das Verständnis, die Diagnose und die Behandlung humaner Erkrankungen. Darüber hinaus finden Sonden, welche spezifisch mit über das humane Genom verteilten Loci hybridisieren können, Anwendung bei der Erstellung hochaufgelöster Chromosomenkarten und bei der Identifizierung von Individuen.
In der Vergangenheit war selbst die Charakterisierung eines einzelnen humanen Gens ein mühsames Verfahren, welches jahrelange Bemühungen erforderte. Neuere Entwicklungen auf den Gebieten der Klonierungsvektoren, der DNA-Sequenzierung und der Computertechnologie sind verbunden worden, um die Geschwindigkeit, mit der humane Gene isoliert, sequenziert, kartiert und charakterisiert werden können, außerordentlich zu beschleunigen. Klonierungsvektoren, wie beispielsweise künstliche Hefechromosomen (YACs) und künstliche Bakterienchromosomen (BACs) können DNA-Inserts mit einer Länge von 300 bis 1000 Kilobasen (kb) bzw. 100–400 kb aufnehmen, wodurch die Manipulation und Anordnung von DNA-Sequenzen, welche auf den humanen Chromosomen über große Abstände verteilt sind, erleichtert wird. Automatisierte DNA-Sequenzierungsmaschinen ermöglichen die schnelle Sequenzierung von humanen Genen. Bioinformatik-Software ermöglicht den Vergleich von Nukleinsäure- und Proteinsequenzen, wodurch die Charakterisierung von humanen Genprodukten unterstützt wird.
Gegenwärtig werden zwei verschiedene Ansätze zur Identifizierung und Charakterisierung der über das humane Genom verteilten Gene verfolgt. In einem Ansatz werden große Fragmente genomischer DNA isoliert, kloniert und sequenziert. Potenzielle offene Leserahmen in diesen genomischen Sequenzen werden unter Verwendung von Bioinformatik-Software identifiziert. Dieser Ansatz führt jedoch zur Sequenzierung langer Strecken humaner DNA, welche für kein Protein codiert, um die über das Genom verteilten für ein Protein codierenden Sequenzen zu finden. Zusätzlich zum Erfordernis einer umfangreichen Sequenzierung kann die Bioinformatik-Software die erhaltenen genomischen Sequenzen falsch charakterisieren. Auf diese Weise kann die Software falschpositive Ergebnisse, in denen nicht codierende DNA fälschlicherweise als codierende DNA charakterisiert wird, oder falsch-negative Ergebnisse erzeugen, in denen codierende DNA fälschlicherweise als nicht codierende DNA bezeichnet wird.
Ein alternativer Ansatz verfolgt einen direkteren Weg zur Identifizierung und Charakterisierung humaner Gene. In diesem Ansatz werden aus isolierten Messenger-RNAs (mRNAs), welche für humane Proteine codieren, komplementäre DNAs (cDNAs) synthetisiert. Unter Verwendung dieses Ansatzes wird eine Sequenzierung nur mit DNA durchgeführt, welche aus Abschnitten des Genoms abgeleitet wurde, welche für ein Protein codieren. Oftmals werden nur kurze Strecken der cDNA sequenziert, um Sequenzen zu erhalten, die als „Expressed Sequenz Tags" (ESTs) bezeichnet werden. Diese ESTs können dann verwendet werden, um erweiterte cDNAs zu isolieren und aufzureinigen, welche Sequenzen umfassen, die zu den EST-Sequenzen benachbart sind. Die erweiterten cDNAs können die vollständige EST-Sequenz umfassen, die verwendet wurde, um sie zu erhalten oder sie können nur einen Teil der EST-Sequenz umfassen, die verwendet wurde, um sie zu erhalten. Darüber hinaus können die erweiterten cDNAs die vollständige codierende Sequenz des Gens enthalten, von dem das EST abgeleitet wurde, oder alternativ können die erweiterten cDNAs Teile der codierenden Sequenz des Gens enthalten, von dem das EST abgeleitet wurde. Es ist verständlich, dass mehrere erweiterte cDNAs vorliegen können, welche die EST-Sequenz als Ergebnis eines alternativen Spleißings oder als Ergebnis der Aktivität von alternativen Promotoren umfassen.
In der Vergangenheit wurden diese kurzen EST-Sequenzen oft aus cDNA-Bibliotheken auf Grundlage von Oligo-dT erhalten. Demgemäß entsprechen sie hauptsächlich der nicht translatierten 3'-Region der mRNA. Zum Teil ist das Übergewicht der EST-Sequenzen, welche von dem 3'-Ende der mRNA abgeleitet sind, eine Folge der Tatsache, dass herkömmliche Techniken zum Erhalten von cDNAs für die Isolierung von cDNA-Sequenzen, welche von den 5'-Enden von mRNAs abgeleitet sind, nicht gut geeignet sind (Adams et al., Nature 377:3-174, 1996; Hillier et al., Genome Res. 6:807-828, 1996).
Darüber hinaus entsprechen in den beschriebenen Fällen, in denen längere cDNA-Sequenzen erhalten wurden, die beschriebenen Sequenzen üblicherweise den codierenden Sequenzen und umfassen nicht die vollständige nicht translatierte 5'-Region der mRNA, von welcher die cDNA abgeleitet ist. Solche unvollständigen Sequenzen umfassen das erste Exon der mRNA möglicherweise nicht, insbesondere in den Fällen, bei welchen das erste Exon kurz ist. Darüber umfassen sie möglicherweise einige Exons nicht, oftmals kurze Exons, die stromaufwärts der Spleißingstellen liegen. Es besteht deshalb ein Bedarf, Sequenzen zu erhalten, die von den 5'-Enden von mRNAs abgeleitet sind.
Während viele Sequenzen, welche von humanen Chromosomen abgeleitet sind, praktische Anwendung besitzen, sind Ansätze, welche auf der Identifizierung und Charakterisierung der chromosomalen Sequenzen basieren, welche für ein Proteinprodukt codieren, für diagnostische und therapeutische Verwendungen besonders relevant. Von den 50,000–100,000 Genen, welche für ein Protein codieren, sind sowohl diejenigen Gene, welche für Proteine codieren, welche von der Zelle, in der sie synthetisiert werden, sekretiert werden, als auch die sekretierten Proteine selbst als mögliche therapeutische Mittel besonders wertvoll. Solche Proteine sind oftmals bei der Kommunikation von Zelle zu Zelle beteiligt und können für die Erzeugung einer klinisch relevanten Reaktion in ihren Zielzellen verantwortlich sein.
Tatsächlich finden gegenwärtig mehrere sekretorische Proteine, einschließlich Gewebeplasminogenaktivator, G-CSF, GM-CSF, Erythropoietin, humanes Wachstumshormon, Insulin, Interferon-α, Interferon-β, Interferon-γ und Interleukin-2 klinische Verwendung. Diese Proteine werden verwendet, um eine breite Auswahl an Erkrankungen zu behandeln, einschließlich akutem Myokardinfarkt, akuter ischämischer Apoplexie, Anämie, Diabetes, Wachstumshormondefizienz, Hepatitis, Nierencarzinom, durch Chemotherapie induzierte Neutropenie, und Multipler Sklerose. Aus diesen Gründen stellen erweiterte cDNAs, welche für sekretierte Proteine oder Abschnitte davon codieren, eine besonders wertvolle Quelle für therapeutische Mittel dar. Es besteht deshalb ein Bedarf zur Identifizierung und Charakterisierung von sekretierten Proteinen und den Nukleinsäuren, welche für sie codieren.
Außer, dass sie selbst therapeutisch verwendbar sind, enthalten sekretorische Proteine an ihren Aminotermini kurze Peptide, sogenannte Signalpeptide, welche ihre Sekretion steuern. Diese Signalpeptide werden durch die Signalsequenzen codiert, welche an den 5'-Enden der codierenden Sequenzen lokalisiert sind, welche für die sekretierten Proteine codieren. Da diese Signalpeptide die extrazelluläre Sekretion eines beliebigen Proteins steuern, mit dem sie operativ verknüpft sind, können die Signalsequenzen ausgenutzt werden, um die effiziente Sekretion eines beliebigen Proteins durch operative Verknüpfung der Signalsequenz mit einem Gen, welches für das Protein codiert, dessen Sekretion erwünscht ist, zu steuern. Ferner können auch Teile von Signalsequenzen verwendet werden, um den intrazellulären Import eines Peptids oder eines Proteins von Interesse zu steuern. Dies kann sich in Strategien zur Gentherapie als vorteilhaft erweisen, bei welchen es erwünscht ist, ein bestimmtes Genprodukt an Zellen abzugeben, die sich von der Zelle unterscheiden, in welcher das Genprodukt erzeugt wird. Signalsequenzen, welche für Signalpeptide codieren, finden auch in Techniken zur Vereinfachung der Proteinreinigung Anwendung. In solchen Anwendungen erleichtert die extrazelluläre Sekretion des gewünschten Proteins die Reinigung durch Verringerung der Anzahl unerwünschter Proteine, aus welchen das gewünschte Protein ausgewählt werden muss, in hohem Maße. Es besteht hier deshalb ein Bedarf, die 5'-Abschnitte der Gene für sekretorische Proteine, welche für Signalpeptide codieren, zu identifizieren und zu charakterisieren.
Die öffentlichen Informationen zur Anzahl humaner Gene, für welche die Promotoren und stromaufwärts liegenden regulatorischen Regionen identifiziert und charakterisiert worden sind, sind ziemlich beschränkt. Teilweise mag dies auf den Schwierigkeiten bei der Isolierung solcher regulatorischer Sequenzen beruhen. Stromaufwärts liegende regulatorische Sequenzen, wie beispielsweise Bindestellen für Transkriptionsfaktoren, sind normalerweise zu kurz, um als Sonden zur Isolierung von Promotoren aus humanen Genombibliotheken verwendet zu werden. In letzter Zeit sind einige Ansätze entwickelt worden, um Humanpromotoren zu isolieren. Einer von ihnen besteht in der Herstellung einer CpG-Insel-Bibliothek (Cross, et al., Nature Genetics 6:236-244, 1994). Der zweite besteht in der Isolierung humaner genomischer DNA-Sequenzen, welche Spel-Bindungsstellen enthalten, durch die Verwendung eines Spel-Bindungsproteins (Mortlock et al., Genome Res., 6:327-335, 1996). Aufgrund mangelnder Spezifität oder mangelndem Umfang weisen beide Ansätze Grenzen auf.
Die vorliegenden 5'-ESTs können verwendet werden, um stromaufwärts liegende regulatorische Regionen, welche sowohl die Lokalisierung, das Entwicklungsstadium, die Rate und die Menge der Proteinsynthese ebenso wie die Stabilität der mRNA kontrollieren bzw. steuern, effizient zu identifizieren und zu isolieren (Theil, BioFactors 4:87-93, 1993). Sobald sie einmal identifiziert und charakterisiert wurden, können diese regulatorischen Regionen in der Gentherapie oder in Protein-Reinigungssystemen verwendet werden, um die gewünschte Menge und die gewünschten Lokalisierungen der Proteinsynthese zu erhalten, oder um die Synthese von unerwünschten Genprodukten zu hemmen, zu verringern oder zu verhindern.
Darüber hinaus können ESTs, welche die 5'-Enden von sekretorischen Proteingenen enthalten, Sequenzen umfassen, die als Sonden zur Chromosomenkartierung und zur Identifizierung von Individuen nützlich sind. Es besteht deshalb ein Bedarf, die Sequenzen zu identifizieren und zu charakterisieren, welche stromaufwärts von den 5'-codierenden Gensequenzen liegen, welche für sekretorische Proteine codieren.
Zusammenfassung der Erfindung
Die vorliegende Erfindung betrifft gereinigte, isolierte oder rekombinante ESTs, welche Sequenzen umfassen, die von den authentischen 5'-Enden ihrer entsprechenden mRNAs abgeleitet wurden. Der Ausdruck „entsprechende mRNA" bezieht sich auf die mRNA, welche die Matrize in der cDNA-Synthese darstellte, die das 5'-EST erzeugte. Diese Sequenzen werden im Folgenden hierin als „5'-ESTs" bezeichnet. Wie hierin verwendet, erfordert der Begriff „gereinigt" keine absolute Reinheit; vielmehr ist er als eine relative Definition beabsichtigt. Einzelne 5'-EST-Klone, die aus einer cDNA-Bibliothek isoliert wurden, wurden herkömmlich bis zur elektrophoretischen Homogenität aufgereinigt. Die aus diesen Klonen erhaltenen Sequenzen konnten direkt weder aus der Bibliothek noch aus humaner Gesamt-DNA erhalten werden. Die cDNA-Klone als solche kommen nicht natürlich vor, sondern werden vielmehr durch Manipulation einer teilweise gereinigten natürlich vorkommenden Substanz (Messenger-RNA) erhalten. Die Umwandlung der mRNA in eine cDNA-Bibliothek umfasst die Erzeugung einer synthetischen Substanz (cDNA) und reine einzelne cDNA-Klone können durch klonale Auswahl aus der synthetischen Bibliothek isoliert werden. Daher führt die Erzeugung einer cDNA-Bibliothek aus Messenger-RNA und nachfolgender Isolierung einzelner Klone aus der Bibliothek zu einer etwa 10⁴ bis 10⁴-fachen Reinigung der nativen Messenger-RNA. Die Reinigung des Ausgangsmaterials oder natürlichen Materials um mindestens eine Größenordnung, vorzugsweise zwei oder drei Größenordnungen und mehr bevorzugt um vier oder fünf Größenordnungen, ist ausdrücklich umfasst.
Wie hierin verwendet, erfordert der Ausdruck „isoliert", dass das Material aus seiner ursprünglichen Umgebung (z.B. die natürliche Umgebung, wenn es natürlich vorkommt) entfernt wird. Beispielsweise gilt ein natürlich vorkommendes Polynukleotid, das in einem lebendigen Tier vorliegt, als nicht isoliert, während das gleiche Polynukleotid, welches von einem Teil oder von dem Gesamten des im natürlichen System koexistierenden Materials abgetrennt ist, isoliert ist.
Wie hierin verwendet, bedeutet der Ausdruck „rekombinant", dass das 5'-EST zu einer „Gerüst"-Nukleinsäure benachbart ist, zu der es in seiner natürlichen Umgebung nicht benachbart ist. Zusätzlich stellen die 5'-ESTs 5% oder mehr der Anzahl der Nukleinsäureinserts in einer Population von Nukleinsäuregerüstmolekülen dar, um als „angereichert" zu gelten. Gerüstmoleküle der vorliegenden Erfindung umfassen Nukleinsäuren, wie beispielsweise Expressionsvektoren, selbstreplizierende Nukleinsäuren, Viren, integrierende Nukleinsäuren und andere Vektoren oder Nukleinsäuren, welche verwendet werden, um ein Nukleinsäureinsert von Interesse zu erhalten oder zu manipulieren. Vorzugsweise stellen die angereicherten 5'-ESTs 15% oder mehr der Zahl an Nukleinsäure inserts in der Population rekombinanter Gerüstmoleküle dar. Mehr bevorzugt stellen die angereicherten 5'-ESTs 50% oder mehr der Anzahl an Nukleinsäureinserts in der Population rekombinanter Gerüstmoleküle dar. In einer höchst bevorzugten Ausführungsform stellen die angereicherten 5'-ESTs 90% oder mehr der Anzahl an Nukleinsäureinserts in der Population rekombinanter Gerüstmoleküle dar.
„Stringente", „moderate" und „schwache" Hybridisierungsbedingungen sind wie in Beispiel 29 definiert.
Soweit nicht anders angegeben, ist eine „komplementäre" Sequenz vollständig komplementär.
Daher sind 5'-ESTs in cDNA-Bibliotheken, in welchen ein oder mehrere 5'-ESTs 5% oder mehr der Anzahl an Nukleinsäureinserts in den Gerüstmolekülen ausmachen, „angereicherte rekombinante 5'-ESTs", wie hierin bestimmt. Ebenso sind 5'-ESTs in einer Population von Plasmiden, worin eines oder mehrere erfindungsgemäße 5'-ESTs insertiert worden sind, so dass sie 5% oder mehr der Anzahl der Inserts im Plasmidgerüst darstellen, „angereicherte rekombinante 5'-ESTs", wie hierin bestimmt. Jedoch sind 5'-ESTs in cDNA-Bibliotheken, in welchen 5'-ESTs weniger als 5% der Anzahl an Nukleinsäureinserts in der Population an Gerüstmolekülen ausmachen, wie beispielsweise in Bibliotheken, in welchen Gerüstmoleküle mit 5'-EST äußerst selten sind, keine „angereicherten rekombinanten 5'-ESTs".
Die vorliegende Erfindung betrifft insbesondere 5'-ESTs, die aus Genen abgeleitet wurden, welche für sekretierte Proteine codieren. Wie hierin verwendet, ist ein „sekretiertes" Protein ein Protein, das, wenn es in einer geeigneten Wirtszelle exprimiert wird, über oder durch eine Membran transportiert wird, wobei der Transport als Ergebnis von Signalpeptiden in der Aminosäuresequenz des Proteins umfasst ist. „Sekretierte" Proteine umfassen ohne Beschränkung Proteine, die vollständig (z.B. lösliche Proteine) oder teilweise (z.B. Rezeptoren) aus der Zelle, in der sie exprimiert werden, sekretiert werden. „Sekretierte" Proteine umfassen auch ohne Einschränkung Proteine, die über die Membran des endoplasmatischen Retikulums hinweg transportiert werden.
Derartige 5'-ESTs umfassen Nukleinsäuresequenzen, die Signalsequenzen genannt werden, welche für Signalpeptide codieren, welche die extrazelluläre Sekretion der Proteine steuern, welche durch die Gene codiert werden, von welchen die 5'-ESTs abgeleitet sind. Im Allgemeinen sind die Signalpeptide an den Aminotermini sekretierter Proteine lokalisiert.
Sekretierte Proteine werden durch Ribosomen, die mit dem „rauhen" endoplasmatischen Retikulum verbunden sind, translatiert. Im Allgemeinen werden sekretierte Proteine kotranslational zur Membran des endoplasmatischen Retikulums überführt. Die Verbindung des Ribosoms mit dem endoplasmatischen Retikulum während der Translation sekretierter Proteine wird durch das Signalpeptid vermittelt. Das Signalpeptid wird normalerweise nach seinem kotranslationalen Eintritt in das endoplasmatische Retikulum abgespalten. Nach der Abgabe an das endoplasmatische Retikulum können sekretierte Proteine den Golgi-Apparat durchlaufen. Im Golgi-Apparat können die Proteine posttranslationalen Modifizierungen unterzogen werden, bevor sie in sekretorische Vesikel eintreten, die sie über die Zellmembran hinweg transportieren.
Die erfindungsgemäßen 5'-ESTs weisen einige wichtige Anwendungen auf. Zum Beispiel können sie verwendet werden, um cDNA-Klone zu erhalten und zu exprimieren, welche die vollständigen proteincodierenden Sequenzen der entsprechenden Genprodukte umfassen, einschließlich der authentischen Translationsstartstellen, die aus den 5'-Enden der codierenden mRNA-Sequenzen abgeleitet sind, aus denen die 5'-ESTs abgeleitet sind. Diese cDNAs werden im Folgenden als „Volllängen-cDNAs" bezeichnet. Diese cDNAs können auch DNA umfassen, die aus mRNA-Sequenzen, die stromaufwärts zur Translationsstartstelle liegen, abgeleitet sind. Die Volllängen-cDNA-Sequenzen können verwendet werden, um die Proteine zu exprimieren, die den 5'-ESTs entsprechen. Wie oben diskutiert, sind sekretierte Proteine therapeutisch wichtig. Daher können die Proteine, die durch die cDNAs exprimiert werden, bei der Behandlung oder bei der Kontrolle einer Vielfalt von humanen Beschwerden nützlich sein. Die 5'-ESTs können auch verwendet werden, um die entsprechende genomische DNA zu erhalten. Der Ausdruck „entsprechende genomische DNA" betrifft die genomische DNA, welche die mRNA codiert, aus der das 5'-EST abgeleitet wurde.
Alternativ können die 5'-ESTs verwendet werden, um erweiterte cDNAs, die für Abschnitte des sekretierten Proteins codieren, zu erhalten und zu exprimieren. Die Abschnitte können die Signalpeptide der sekretierten Proteine oder die reifen Proteine umfassen, die erzeugt werden, wenn das Signalpeptid abgespalten wird. Die Abschnitte können auch Polypeptide mit mindestens 10 aufeinander folgenden Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden, umfassen. Alternativ können die Abschnitte mindestens 15 aufeinander folgende Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden, umfassen. In einigen Ausführungsformen können die Abschnitte mindestens 25 aufeinander folgende Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden, umfassen. In anderen Ausführungsformen können die Abschnitte mindestens 40 Aminosäuren, die durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden, umfassen.
Antikörper, welche die vollständigen sekretierten Proteine, die durch die erweiterten cDNAs oder Volllängen-cDNAs oder Fragmente davon mit mindestens 10 aufeinander folgenden Aminosäuren, mit mindestens 15 aufeinander folgenden Aminosäuren, mit mindestens 25 aufeinander folgenden Aminosäuren oder mit mindestens 40 aufeinander folgenden Aminosäuren, codiert werden, spezifisch erkennen, können ebenfalls erhalten werden, wie es unten beschrieben wird. Antikörper, die spezifisch das reife Protein erkennen, das erzeugt wird, wenn das Signalpeptid abgespalten wird, können ebenfalls erhalten werden, wie es unten beschrieben wird. In ähnlicher Weise können auch Antikörper erhalten werden, die spezifisch die Signalpeptide erkennen, die durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden.
In einigen Ausführungsformen umfassen die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, die Signalsequenz. In anderen Ausführungsformen können die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, die vollständige codierende Sequenz für das reife Protein umfassen (d.h. das Protein, das erzeugt wird, wenn das Signalpolypeptid abgespalten wird). Darüber hinaus können die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, regulatorische Regionen umfassen, die stromaufwärts der Translationsstartstelle oder stromabwärts des Stoppcodons liegen und welche die Menge, Lokalisierung oder das Entwicklungsstadium der Genexpression kontrollieren bzw. steuern.
Wie oben diskutiert, sind sekretierte Proteine therapeutisch wichtig. Daher können die Proteine, die von den erweiterten cDNAs oder Volllängen-cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, exprimiert werden, bei der Behandlung oder Kontrolle einer Vielfalt von humanen Beschwerden nützlich sein.
Die 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhalten wurden) können in forensischen Verfahren eingesetzt werden, um Individuen zu identifizieren, oder in diagnostischen Verfahren, um Individuen mit genetischen Erkrankungen zu identifizieren, die aus einer abnormalen Expression der Gene herrühren, die den 5'-ESTs entsprechen. Darüber hinaus ist die vorliegende Erfindung bei der Erstellung einer hochaufgelösten Karte der humanen Chromosomen nützlich.
Die vorliegende Erfindung betrifft auch Vektoren zur Sekretion, die in der Lage sind, die Sekretion eines Proteins von Interesse zu steuern. Solche Vektoren können in Strategien zur Gentherapie verwendet werden, in welchen es wünschenswert ist, ein Genprodukt in einer Zelle zu erzeugen, das an eine andere Stelle im Körper abgegeben werden soll. Vektoren zur Sekretion können auch die Reinigung von gewünschten Proteinen erleichtern.
Die vorliegende Erfindung betrifft auch Vektoren zur Expression, die in der Lage sind, die Expression eines insertierten Gens in einer gewünschten räumlichen oder temporären Weise oder in einem gewünschten Maß zu steuern. Solche Vektoren können Sequenzen umfassen, die stromaufwärts der 5'-ESTs liegen, wie beispielsweise Promotoren oder stromaufwärts liegende regulatorische Sequenzen.
Schließlich kann die vorliegende Erfindung auch zur Gentherapie verwendet werden, um genetische Erkrankungen zu kontrollieren oder zu behandeln. Signalpeptide können auch mit heterologen Proteinen fusioniert werden, um deren extrazelluläre Sekretion zu steuern.
Bakterienklone, die Bluescript-Plasmide mit Inserts enthalten, welche die erfindungsgemäßen 5'-EST (SEQ ID NO: 38-291) aufweisen, werden gegenwärtig bei 80°C in 4% (v/v) Glycerin in den Laboratorien des Erfinders unter den Bezeichnungen gelagert, die neben den SEQ ID-Nummern aufgeführt sind. Die Inserts können aus den hinterlegten Materialien durch Anzucht der entsprechenden Klone in einem geeigneten Medium gewonnen werden. Anschließend kann die Bluescript-DNA unter Verwendung von dem Fachmann bekannten Verfahren zur Plasmidisolierung isoliert werden, wie beispielsweise alkalische Lyse von Minipreps oder alkalische Lyse im Großmaßstab als Verfahren zur Plasmidisolierung. Wenn gewünscht, kann die Plasmid-DNA mittels Zentrifugation auf einem Cäsiumchloridgradienten, Größenausschlusschromatografie oder Anionenaustauschchromatografie weiter angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann dann unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden. Alternativ kann eine PCR mit Primern, die hinsichtlich beider Enden der EST-Insertion konzipiert sind, durchgeführt werden. Das dem 5'-EST entsprechende PCR-Produkt kann anschließend unter Verwendung von dem Fachmann vertrauten Standardklonierungstechniken manipuliert werden.
Ein Aspekt der vorliegenden Erfindung ist ein Signalpeptid, welches die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 aufweist.
Ein anderer Aspekt der vorliegenden Erfindung ist eine Signalsequenz, welche für ein Signalpeptid mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 codiert. In einer Ausführungsform weist die Signalsequenz die Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45 auf.
Noch ein anderer Aspekt der vorliegenden Erfindung ist eine gereinigte und isolierte Nukleinsäure, welche für ein humanes sekretiertes Polypeptid codiert, welches die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 am 5'-Ende der codierenden Sequenz aufweist. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Eine weitere Ausführungsform der vorliegenden Erfindung ist ein Expressionsvektor, umfassend eine Signalsequenz, welche für ein Signalpeptid mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 codiert, welche in funktionsfähiger Weise mit einem Promoter verbunden ist. Der Expressionsvektor kann ein Sekretionsvektor sein. In einer Ausführungsform besitzt die Signalsequenz die Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45.
Ein weiterer Aspekt der Erfindung ist ein Expressionsvektor, welcher eine gereinigte und isolierte Nukleinsäure umfasst, welche für ein humanes sekretiertes Polypeptid codiert, welche in funktionsfähiger Weise mit einem Promoter verbunden ist, worin die isolierte Nukleinsäure für ein Polypeptid codiert, welches am 5'-Ende der codierenden Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 umfasst. Der Expressionsvektor kann ein Sekretionsvektor sein. In einer ersten Auzsführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform ist der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende der einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Noch ein weiterer Aspekt der vorliegenden Erfindung ist ein Polypeptid, welches für eine gereinigte und isolierte Nukleinsäure codiert, welche für ein humanes sekretiertes Polypeptid codiert, umfassend die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 am 5'-Ende der codierenden Sequenz. Das Polypeptid kann die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Ein weiterer Aspekt der vorliegenden Erfindung ist ein Fusionsprotein, welche svon einer gereinigten und isolierten Nukleinsäure codiert ist, welche für ein humanes sekretiertes Polypeptid codiert, umfassend die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 am 5'-Ende der codierenden sequenz, worin die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden ist, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Ein weiterer Aspekt der vorliegenden Erfindung ist die Verwendung eines Signalpeptids mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 zum Steuern der extrazellulären Sekretion eines Polypeptids, mit der Maßgabe, dass die Verwendung nicht an einem menschlichen oder tierischen Körper eingesetzt wird.
Ein anderer Aspekt der vorliegenden Erfindung ist die Verwendung eines Signalpeptids mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 zum Vereinfachen der Proteinreinigung eines gewünschten Polypeptids. Das Polypeptid kann codiert sein von einer gereinigten und isolierten Nukleinsäure, welche für ein humanes sekretiertes Polypeptid codiert, welches am 5'-Ende der codierenden Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 umfasst. Das Polypeptid kann die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Ein weiterer Aspekt der vorliegenden Erfindung ist die Verwendung eines Vektors, umfassend eine gereinigte und isolierte Nukleinsäure, welche für ein humanes sekretiertes Polypeptid codiert, welche in funktionsfähiger Weise mit einem Promoter verbunden ist, worin die isolierte Nukleinsäure am 5'-Ende der codierenden Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 umfasst, Steuern der extrazellulären Sekretion eines Polypeptids, mit der Maßgabe, dass die Verwendung nicht an einem menschlichen oder tierischen Körper eingesetzt wird. Der Expressionsvektor kann ein Sekretionsvektor sein. Das Polypeptid, dessen Sekretion gesteuert wird, kann codiert sein von einer gereinigten und isolierten Nukleinsäure, welche für ein humanes sekretiertes Polypeptid codiert, welches am 5'-Ende der codierenden Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 umfasst. Das Polypeptid kann die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Die Verwendung eines Expressionsvektors, umfassend eine gereinigte und isolierte Nukleinsäure, welche für ein humanes sekretiertes Polypeptid codiert, welche in funktionsfähiger Weise mit einem Promoter verbunden ist, worin die isolierte Nukleinsäure am 5'-Ende der codierenden Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 umfasst, vereinfacht die Protein reinigung eines gewünschten Polypeptids. Der Expressionsvektor kann ein Sekretionsvektor sein. Das Polypeptid kann die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst. In einer ersten Ausführungsform umfasst die Nukleinsäure eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45. In dieser Ausführungsform kann der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Kurze Beschreibung der Zeichnungen
1 ist eine Zusammenfassung eines Verfahrens zum Erhalten von cDNAs, die daraufhin ausgewählt wurden, dass sie die 5'-Enden der mRNAs enthalten, von denen sie abgeleitet wurden.
2 zeigt die Verteilung von Von Heijne-Ergebnissen für 5'-ESTs in jeder der hierin beschriebenen Kategorien und die Wahrscheinlichkeit, dass diese 5'-ESTs für ein Signalpeptid codieren.
3 fasst ein allgemeines Verfahren zusammen, das verwendet wird, um erweiterte cDNAs, die zu 5'-ESTs benachbarte Sequenzen enthalten, zu klonieren und zu sequenzieren.
4 (Beschreibung von Promotorstrukturen, isoliert aus Signal-Tag-5'-ESTs) stellt eine schematische Beschreibung von isolierten Promotoren und der Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengesetzt sind, bereit.
Ausführliche Beschreibung
Tabelle IV zeigt eine Analyse der 43 Aminosäuren, die am N-Terminus aller humaner SwissProt-Proteine lokalisiert sind, um die Häufigkeit falsch positiver oder falsch-negativer Ergebnisse unter Verwendung der hierin beschriebenen Techniken zur Signalpeptididentifizierung zu bestimmen.
Tabelle V zeigt die Verteilung von 5'-ESTs in jeder hierin beschriebenen Kategorie und die Zahl von 5'-ESTs in jeder Kategorie mit einem bestimmten Von Heijne-Mindestergebnis.
Tabelle VI zeigt die Verteilung von 5'-ESTs in jeder hierin beschriebenen Kategorie hinsichtlich des Gewebes, aus dem die 5'-ESTs der entsprechenden mRNA erhalten wurden.
Tabelle VII beschreibt die Transkriptionsfaktor-Bindungsstellen, die in jedem dieser Promotoren vorliegen.
I. Allgemeine Verfahren zum Erhalten von 5'-ESTs, die aus mRNAs mit intakten 5'-Enden abgeleitet sind
Um die erfindungsgemäßen 5'-ESTs zu erhalten, müssen mRNAs mit intakten 5'-Enden erhalten werden. Gegenwärtig gibt es zwei Ansätze zum Erhalten solcher mRNAs mit intakten 5'-Enden, wie unten beschrieben wird: Entweder chemisch (1) oder enzymatisch (2).
1. Chemische Verfahren zum Erhalten von mRNAs mit intakten 5'-Enden
Einer dieser Ansätze ist ein chemisches Modifikationsverfahren, das die Derivatisierung der mRNA 5'-Enden der mRNAs und die Selektion der derivatisierten mRNAs umfasst. Die 5'-Enden eukaryotischer mRNAs weisen eine Struktur auf, die als „Cap" bezeichnet wird, das an Position 7 ein methyliertes Guanosin besitzt. Dieses Cap wird durch eine 5',5'-Triphosphatbindung mit der ersten transkribierten Base der mRNA verbunden. In einigen Fällen ist das 5'-Guanosin sowohl an Position 2 als auch Position 7 methyliert. In seltenen Fällen ist das 5'-Guanosin dreifach an den Positionen 2, 7 und 7 methyliert. Beim chemischen Verfahren zum Erhalten von mRNAs mit intakten 5'-Enden wird das 5'-Cap spezifisch derivatisiert und an eine reaktive Gruppe auf einem immobilisierten Träger gekoppelt. Diese spezifische Derivatisierung basiert auf der Tatsache, dass nur die Ribose, die mit dem methylierten Guanosin am 5'-Ende der mRNA verknüpft ist, und die Ribose, die mit der Base am 3'-Terminus der mRNA verknüpft ist, 2',3'-cis-Diole besitzen.
Gegebenenfalls kann das 2',3'-cis-Diol der 3'-terminalen Ribose chemisch modifiziert, substituiert, umgewandelt oder entfernt werden, wobei nur die Ribose, die mit dem methylierten Guanosin verknüpft ist, am 5'-Ende der mRNA mit einem 2',3'-cis-Diol verbleit. Eine Vielfalt an Techniken zur Entfernung des 2',3'-cis-Diols an der 3'-terminalen Ribose stehen zur Verfügung. Beispielsweise kann eine kontrollierte alkalische Hydrolyse verwendet werden, um mRNA-Fragmente zu erzeugen, in welchen die 3'-terminale Ribose ein 3'-Phosphat, ein 2'-Phosphat oder ein (2'-3')-Cyclophosphat ist. Anschließend kann das Fragment, das die ursprüngliche 3'-Ribose umfasst, durch Chromatografie an einer Oligo-dT-Säule aus dem Gemisch entfernt werden. Alternativ kann eine Base, die kein 2',3'-cis-Diol aufweist, unter Verwendung einer RNA-Ligase, wie beispielsweise einer T4-RNA-Ligase, an das 3'-Ende der mRNA angefügt werden. Beispiel 1 unten beschreibt ein Verfahren zur Ligation eines Nukleosiddiphosphats an das 3'-Ende von Messenger-RNA.
Beispiel 1
Ligation des Nukleosiddiphosphats pCp an das mRNA 3'-Ende
Ein μg RNA wurde in einem Reaktionsmedium von insgesamt 10 μl in Gegenwart von 5 U T₄-Phagen-RNA-Ligase in dem vom Hersteller bereitgestellten Puffer (Gibco-BRL), 40 U des RNase-Inhibitors RNasin (Promega) und 2 μl ³²pCp (Amersham #PB 10208) inkubiert. Die Inkubation wurde bei 37°C für 2 Stunden oder über Nacht bei 7–8°C durchgeführt.
Im Anschluss an die Modifizierung oder Entfernung des 2',3'-cis-Diols an der 3'-Ribose kann das 2',3'-cis-Diol, das am 5'-Ende der mRNA vorliegt, unter Verwendung von Reagenzien, wie beispielsweise NaBH₄, NaBH₃CN oder Natriumperjodat, oxidiert werden, wobei das 2',3'-cis-Diol in einen Dialdehyd umgewandelt wird. Beispiel 2 beschreibt die Oxidation des 2',3'-cis-Diols am 5'-Ende der mRNA mit Natriumperjodat.
Beispiel 2
Oxidation eines 2',3'-cis-Diols am 5'-Ende der mRNA mit Natriumperjodat 0,1 OD-Einheiten des entweder mit einem Cap versehenen Oligoribonukleotids mit 47 Nukleotiden (einschließlich des Caps) oder eines Oligoribonukleotids mit 46 Nukleotiden ohne Cap wurden wie im Folgenden beschrieben behandelt. Die Oligoribonukleotide wurden durch in vitro-Tanskription unter Verwendung des Transkriptionskits „AmpliScribe T7" (Epicentre Technologies) hergestellt. Wie unten gezeigt, enthielt die DNA-Matrize für das RNA-Transkript ein einzelnes Cytosin. Um die RNA ohne Cap zu synthetisieren, wurden alle vier NTPs in die in vitro-Transkriptionsreaktion gegeben. Um die RNA mit Cap zu erhalten, wurde GTP durch ein Analogon des Caps, m7G(5')ppp(5')G, ersetzt. Diese von der Polymerase erkannte Verbindung wurde am 5'-Ende des entstehenden Transkripts während der Initiation der Transkription eingebaut, wurde aber während des Verlängerungsschritts nicht eingebaut. Folglich enthielt die resultierende RNA an ihrem 5'-Ende ein Cap. Die Sequenzen der durch die in vitro-Transkription erzeugten Oligoribonukleotide waren:
+Cap:
5'm7GpppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NO: 1)
–Cap:
5'-pppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NO: 2)
Die Oligoribonukleotide wurden in 9 μl Acetatpuffer (0,1 M Natriumacetat, pH 5,2) und 3 μl frisch hergestellter 0,1 M Natriumperjodatlösung gelöst. Das Gemisch wurde für 1 Stunde im Dunkeln bei 4°C oder bei Raumtemperatur inkubiert. Danach wurde die Reaktion durch Zugabe von 4 μl 10%igem Ethylenglycol gestoppt. Das Produkt wurde mit Ethanol präzipitiert, in mindestens 10 μl Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser dialysiert.
Die resultierenden Aldehydgruppen können anschließend mit Molekülen gekoppelt werden, die eine reaktive Amingruppe aufweisen, wie beispielsweise Hydrazin-, Carbazid-, Thiocarbazid- oder Semicarbazidgruppen, um die Anreicherung der 5'-Enden der mRNAs zu erleichtern. Moleküle mit reaktiven Amingruppen, die zur Verwendung bei der Selektion von mRNAs mit intakten 5'-Enden geeignet sind, umfassen Avidin, Proteine, Antikörper, Vitamine, Liganden, die zur spezifischen Bindung an Rezeptormoleküle fähig sind, oder Oligonukleotide. Beispiel 3 unten beschreibt die Kopplung des resultierenden Dialdehyds an Biotin.
Beispiel 3
Kopplung des Dialdehyds am 5'-Ende der Transkripte mit Biotin Das in Beispiel 2 erhaltene Oxidationsprodukt wurde in 50 μl Natriumacetat bei einem pH zwischen 5 und 5,2 und 50 μl frisch hergestellter 0,02 M Lösung von Biotinhydrazid in einem Methoxyethanol/Wassergemisch (1:1) der Formel
gelöst.
In der in diesen Experimenten verwendeten Verbindung ist n = 5. Jedoch wird erkannt, dass auch andere, kommerziell erhältliche Hydrazide verwendet werden können, wie beispielsweise Moleküle der obigen Formel, bei denen n zwischen 0 und 5 variiert. Das Gemisch wurde anschließend für 2 Stunden bei 37°C inkubiert, mit Ethanol präzipitiert und gegen destilliertes Wasser dialysiert. Beispiel 4 zeigt die Spezifität der Biotinylierungsreaktion.
Beispiel 4
Spezifität der Biotinylierung von Transkripten mit Caps
Die Spezifität der Biotinylierung für mRNAs mit Caps wurde durch Gelelektrophorese der folgenden Proben beurteilt: Probe 1. Das in vitro-Transkript mit 46 Nukleotiden und ohne Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, und mit ³²pCp markiert ist, wie es in Bespiel 1 beschrieben wird.
Probe 2. Das in vitro-Transkript mit 46 Nukleotiden und ohne Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, mit ³²pCp markiert ist, wie es in Beispiel 1 beschrieben wird, und in einer Oxidationsreaktion gemäß Beispiel 2 umgesetzt und den Biotinylierungsbedingungen gemäß Beispiel 3 unterzogen wurde.
Probe 3. Das in vitro-Transkript mit 47 Nukleotiden und Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, und mit ³²pCp markiert ist, wie es in Beispiel 1 beschrieben wird.
Probe 4. Das in vitro-Transkript mit 47 Nukleotiden und Cap, wie in Beispiel 2 beschrieben, mit ³²pCp markiert, wie in Beispiel 1 beschrieben, behandelt mit der Oxidationsreaktion aus Beispiel 2 und den Biotinylierungsbedingungen aus Beispiel 3 unterzogen.
Die Proben 1 und 2 zeigten identische Wandergeschwindigkeiten, was zeigt, dass RNAs ohne Cap nicht oxidiert und biotinyliert wurden. Probe 3 wanderte langsamer als die Proben 1 und 2, während Probe 4 die langsamste Wanderung zeigte. Der Unterschied bezüglich der RNA-Wanderung in den Proben 3 und 4 zeigt, dass die RNAs mit Cap spezifisch biotinyliert wurden.
In einigen Fällen können mRNAs mit intakten 5'-Enden durch Binden des Moleküls, das eine reaktive Aminogruppe enthält, an einen geeigneten Festphasenträger, wie beispielsweise die Innenseite des Gefäßes, das die mRNAs enthält, magnetische Beads, chromatografische Matrizen oder Nylon- oder Nitrozellulosemembranen angereichert werden. Beispielsweise kann, wenn das Molekül mit reaktiver Amingruppe Biotin ist, der Festphasenträger an Avidin oder Streptavidin gekoppelt werden. Alternativ kann, wenn das Molekül mit der reaktiven Amingruppe ein Antikörper oder ein Rezeptorligand ist, der Festphasenträger an das verwandte Antigen oder den verwandten Rezeptor gekoppelt werden. Schließlich kann der Festphasenträger ein komplementäres Oligonukleotid umfassen, wenn das Molekül mit reaktiver Amingruppe ein Oligonukleotid umfasst.
Die mRNAs mit intakten 5'-Enden können im Anschluss an das Anreicherungsverfahren von der Festphase abgelöst werden. Beispielsweise können die mRNAs von der Festphase durch einfaches Erhitzen auf 95°C in 2% SDS abgelöst werden, wenn der Dialdehyd an Biotinhydrazid gekoppelt ist und die Festphase Streptavidin umfasst. In einigen Verfahren kann das Molekül mit reaktiver Amingruppe im Anschluss an die Anreicherung auch von dem mRNAs mit intakten 5'-Enden abgespalten werden. Beispiel 5 beschreibt das Einfangen biotinylierter mRNA mit streptavidinbeschichteten Beads und die Freisetzung der biotinylierten mRNAs von den Beads nach der Anreicherung.
Beispiel 5
Einfangen und Freisetzung biotinylierter mRNAs unter Verwendung streptavidinbeschichteter Beads
Die streptavidinbeschichteten magnetischen Beads wurden gemäß den Herstellerangaben (CPG Inc., USA) hergestellt. Die biotinylierten mRNAs wurden einem Hybridisierungspuffer zugegeben (1,5 M NaCl, pH 5–6). Nach Inkubation für 30 Minuten wurde das ungebundene und nicht biotinylierte Material entfernt. Die Beads wurden einige Male in Wasser mit 1 % SDS gewaschen. Die so erhaltenen Beads wurden bei 95°C für 15 Minuten in Wasser, das 2% SDS enthielt, inkubiert.
Beispiel 6 zeigt die Effizienz mit der biotinylierte mRNAs von den streptavidinbeschichteten Beads gewonnen wurden.
Beispiel 6
Effizienz der Gewinnung biotinylierter mRNAs
Die Effizienz des Gewinnungsverfahrens wurde wie folgt beurteilt. Wie oben beschrieben, wurden RNAs mit Cap mit ³²pCp markiert, oxidiert, biotinyliert und an streptavidinbeschichtete Beats gebunden. Anschließend wurden die gebundenen RNAs für 5, 15 oder 30 Minuten bei 95°C in Gegenwart von 2% SDS inkubiert.
Die Reaktionsprodukte wurden durch Elektrophorese auf 12%igen Polyacylamidgelen unter denaturierenden Bedingungen (7 M Harnstoff) analysiert. Die Gele wurden einer Autoradiografie unterzogen. Während dieser Manipulation wurden die Hydrazonbindungen nicht reduziert.
Sobald die Inkubationszeiten in 2% SDS anstiegen, wurden steigende Mengen an Nukleinsäuren gewonnen, was zeigt, dass biotinylierte mRNAs effizient gewonnen wurden.
In einem alternativen Verfahren zum Erhalten von mRNAs mit intakten 5'-Enden wurde ein Oligonukleotid, das derivatisiert worden war, um eine reaktive Amingruppen zu erhalten, spezifisch an mRNAs mit einem intakten Cap gekoppelt. Vorzugsweise wird das 3'-Ende der mRNA vor dem Schritt, bei welchem die Aldehydgruppen mit dem derivatisierten Oligonukleotid verbunden werden, wie oben beschrieben blockiert, um so zu verhindern, dass das derivatisierte Oligonukleotid mit dem mRNA 3'-Ende verbunden wird. Beispielsweise kann pCp unter Verwendung von T4 RNA-Ligasen am mRNA 3'-Ende angebracht werden, wie in Beispiel 1 beschrieben wird. Wie oben diskutiert, ist die Blockierung des mRNA 3'-Endes jedoch ein optionaler Schritt. Derivatisierte Oligonukleotide können hergestellt werden, wie in Beispiel 7 beschrieben wird.
Beispiel 7
Derivatisierung von Oligonukleotiden
Ein am 3'-Ende phosphoryliertes Oligonukleotid wurde durch Behandlung mit einer wässrigen Lösung eines Hydrazins oder Dihydrazids mit der Formel H₂N(R1) NH₂ bei etwa 1 bis 3 M und bei pH 4,5 bei einer Temperatur von 8°C über Nacht in ein 3'-Hydrazid in 3' umgewandelt. Die Inkubation wurde in Gegenwart eines wasserlöslichen Mittels vom Carbodiimidtyp bei einer Endkonzentration von 0,3 M durchgeführt, wie beispielsweise 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid.
Das derivatisierte Oligonukleotid wurde anschließend von den anderen Mitteln und Produkten unter Verwendung von Standardtechniken zur Isolierung von Oligonukleotiden abgetrennt.
Wie oben diskutiert, können die mRNAs, welche angereichert werden sollen, behandelt werden, um die 3'-OH-Gruppen zu entfernen, die daran vorliegen können. Dies kann durch enzymatische Ligation von Sequenzen, denen ein 3'-OH fehlt erreicht werden, wie beispielsweise pCp wie es in Beispiel 1 beschrieben wird. Alternativ können die 3'-ON-Gruppen durch alkalische Hydrolyse entfernt werden, wie es in Beispiel 8 unten beschrieben wird.
Beispiel 8
Entfernung von 3'-OH-Gruppen der mRNA unter Verwendung einer alkalischen Hydrolyse
In einem Gesamtvolumen von 100 μl 0,1 N Natriumhydroxid wurden 1,5 μg mRNA für 40 bis 60 Minuten bei 4°C inkubiert. Die Lösung wird mit Essigsäure neutralisiert und mit Ethanol präzipitiert.
Im Anschluss an die optionale Entfernung der 3'-ON-Gruppen werden die Diolgruppen an den mRNA 5'-Enden der mRNAs oxidiert, wie es in Beispiel 9 unten beschrieben wird.
Beispiel 9
Oxidation von Diolen der mRNA
Bis zu 1 OD-Einheit RNA wurde in 9 μl Puffer (0,1 M Natriumacetat, pH 6–7) oder in Wasser und 3 μl frisch hergestellter 0,1 M Natriumperjodatlösung gelöst. Die Reaktion wurde für 1 h in der Dunkelheit bei 4°C oder bei Raumtemperatur inkubiert. Im Anschluss an die Inkubation wurde die Reaktion durch Zugabe von 4 μl 10% Ethylenglycol gestoppt. Danach wurde das Gemisch für 15 Minuten bei Raumtemperatur inkubiert. Nach Ethanolpräzipitation wurde das Produkt in mindestens 10 μl Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser dialysiert.
Im Anschluss an die Oxidation der Diolgruppen an den mRNA 5'-Enden wurde das derivatisierte Oligonukleotid mit den resultierenden Aldehyden verbunden wie es in Beispiel 10 beschrieben wird.
Beispiel 10
Ligation von mRNA-Aldehyden an derivatisierte Oligonukleotide
Die oxidierte mRNA wurde in saurem Medium, wie beispielsweise 50 μl Natriumacetat, pH 4–6, gelöst. 50 μl einer Lösung des derivatisierten Oligonukleotids wurden zugegeben, um ein Verhältnis mRNA:derivatisiertes Oligonukleotid von 1:20 zu erhalten. Das Gemisch wurde mit einem Borhydrid reduziert und für 2 h bei 37°C oder über Nacht (14 h) bei 10°C inkubiert. Das Gemisch wurde anschließend mit Ethanol präzipitiert, in 10 μl oder mehr Wasser oder einem geeigneten Puffer resuspendiert und gegen destilliertes Wasser dialysiert. Wenn gewünscht, kann das resultierende Produkt unter Verwendung von Acrylamidgelelektrophorese, HPLC-Analyse oder anderen herkömmlichen Techniken analysiert werden.
Im Anschluss an das Anbringen des derivatisierten Oligonukleotids an die mRNAs kann eine reverse Transkriptionsreaktion, wie in Beispiel 11 unten beschrieben, durchgeführt werden.
Beispiel 11
Reverse Transkription von mRNAs, die an derivatisierte Oligonukleotide ligiert sind
Ein Oligodeoxyribonukleotid wurde wie im Folgenden beschrieben derivatisiert. Drei OD-Einheiten eines Oligodeoxyribonukleotids der Sequenz 5'ATCAAGAATTCGCACGAGACCA TTA3' (SEQ ID NO: 3) mit 5'-OH- und 3'-P-Enden wurden in 70 μl 1,5 M Hydroxybenzotriazollösung, pH 5,3, hergestellt in Dimethylformamid/Wasser (75:25), das 2 μg 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid enthielt, gelöst. Das Gemisch wurde für 2 h 30 min bei 22°C inkubiert und anschließend zweimal in LiClO₄/Aceton präzipitiert. Das Pellet wurde in 200 μl 0,25 M Hydrazin resuspendiert und bei 8°C 3 bis 14 h inkubiert. Im Anschluss an die Hydrazinreaktion wurde das Gemisch zweimal in LiClO₄/Aceton präzipitiert.
Die revers zu transkribierenden Messenger-mRNAs wurden aus Plazentablöcken mit Seitenlängen von 2 cm extrahiert, die bei –80°C gelagert worden waren. Die Gesamt-RNA wurde unter Verwendung herkömmlicher Techniken auf Grundlage von sauerem Phenol extrahiert. Oligo-dT-Chromatografie wurde eingesetzt um die mRNAs zu reinigen. Die Integrität der mRNAs wurde durch Northern-Blot überprüft.
Die Diolgruppen von 7 μg der Plazenta mRNAs wurden, wie oben in Beispiel 9 beschrieben, oxidiert. Das derivatisierte Oligonukleotid wurde, wie in Beispiel 10 oben beschrieben, mit den mRNAs verbunden mit der Ausnahme, dass der Präzipitiationsschritt durch einen Ausschlusschromatografieschritt ersetzt wurde, um die derivatisierten Oligodeoxyribonukleotide, die nicht mit mRNAs verbunden worden waren, zu entfernen. Die Ausschlusschromatografie wurde wie folgt durchgeführt:
Zehn ml Ultrogel AcA34 (BioSepra#230151) Gel, ein Gemisch aus Agarose und Acrylamid, wurde in 50 ml einer Lösung aus 10 mM Tris, pH 8,0, 300 mM NaCl, 1 mM EDTA und 0,05% SDS equilibriert. Man ließ sich das Gemisch absetzen. Der Überstand wurde entfernt und das Gel wurde in 50 ml Puffer resuspendiert. Dieses Verfahren wurde 2 oder 3 Mal wiederholt.
Ein Glaskügelchen (Durchmesser 3 mm) wurde in eine 2 ml Einwegpipette (Länge 25 cm) eingeführt. Die Pipette wurde mit der Gelsuspension befüllt, bis sich die Höhe des Gels bei 1 cm vom oberen Ende der Pipette aus stabilisierte. Die Säule wurde anschließend mit 20 ml des Equilibrierungspuffers (10 mM Tris HCl pH 7,4, 20 mM NaCl) equilibriert.
Zehn μl der mRNA, die mit dem derivatisierten Oligonukleotid umgesetzt worden waren, wurden in 39 μl 10 mM Harnstoff und 2 μl Glycerin-Blau Puffer gemischt, wobei der Glycerin-Blau Puffer durch Auflösen von 5 mg Bromphenolblau in 60% Glycerin (v/v) und Leiten des Gemischs über einen Filter mit 0,45 μm Durchmesser hergestellt worden waren.
Anschließend wurde die Säule mit den mRNAs beladen, welche mit dem Oligonukleotid gekoppelt waren. Sobald die Probe eingedrungen war, wurde Equilibrierungspuffer zugegeben. Anschließend wurden hundert μl Fraktionen gesammelt. Derivatisierte Oligonukleotide, die nicht an mRNA angebracht worden waren, traten in Fraktion 16 und späteren Fraktionen auf. Die Fraktionen 3 bis 15 wurden deshalb vereinigt und mit Ethanol präzipitiert.
Um zu bestimmen, ob das derivatisierte Oligonukleotid tatsächlich mit mRNA verknüpft war, wurde ein Zehntel der vereinigten Fraktionen zweifach auf einer Nylonmembran aufgetragen und unter Verwendung herkömmlicher Techniken mit einer radioaktiven Sonde hybridisiert. Die bei diesen Hybridisierungen eingesetzte ³²P markierte Sonde war ein Oligodeoxyribonukleotid mit der Sequenz 5'TAATGGTCTCGT GCGAATTCTTGAT3' (SEQ ID NO: 4), das sich zum derivatisierten Oligonukleotid antikomplementär verhielt. Ein nach Audioradiografie beobachtetes Signal zeigte, dass das derivatisierte Oligonukleotid tatsächlich mit der mRNA verbunden worden war.
Die verbleibenden neun Zehntel der mRNAs, die mit dem derivatisierten Oligonukleotid reagiert hatten, wurden wie im Folgenden beschrieben, revers transkribiert. Eine reverse Transkription wurden mit Reverser Transkriptase nach den Anweisungen des Herstellers und 50 pmol Nonameren mit willkürlichen Sequenzen als Primern durchgeführt.
Um sicher zu stellen, dass die reverse Transkription über die Capstruktur hinweg ausgeführt wurde, wurden zwei Arten von Experimenten durchgeführt.
Im ersten Ansatz wurde nach der durch alkalische Hydrolyse erreichten Entfernung der RNA aus den cDNA:RNA-Heteroduplexen, die aus der reversen Transkriptionsreaktion erhalten worden waren, ein Teil der resultierenden einzelsträngigen cDNAs auf einer positiv geladenen Membran aufgetragen und unter Verwendung herkömmlicher Verfahren an eine ³²P-markierte Sonde mit identischer Sequenz zu der des derivatisierten Oligonukleotids hybridisiert. Kontrollspots, die 1 pmol, 100 fmol, 50 fmol, 10 fmol und 1 fmol eines Kontrolloligodeoxyribonukleotids mit einer Sequenz, die zu der des derivatisierten Oligonukleotids identisch war, enthielten, waren ebenfalls umfasst. Die von den cDNA enthaltenden Spots erhaltenen Signale zeigten, dass etwa 15 fmol des derivatisierten Oligonukleotids revers transkribiert worden waren. Diese Ergebnisse zeigen, dass die reverse Transkription über ein Cap hinweg durch geführt werden kann und sie zeigen insbesondere, dass Reverse Transkriptase die 5'-P-P-P-5'-Bindung des Caps eukaryotischer Messenger-RNAs überquert.
In der zweiten Art von Experiment wurden die einzelsträngigen cDNAs, die aus der obigen Erststrangsynthese erhalten worden waren, als Matrize für PCR-Reaktionen verwendet. Zwei Reaktionstypen wurden ausgeführt. Als erstes wurde eine spezifische Amplifikation der mRNAs für Alphaglobin, Dehydrogenase, pp15 und Elongationsfaktor E4 unter Verwendung der folgenden Paare an Oligodesoxyribonukleotid-Primern durchgeführt. Alphaglobin
Dehydrogenase
pp15
Elongationsfaktor E4
Als zweites wurden unspezifische Amplifikationen mit den Antisense-Oligodeoxyribonukleotiden der oben beschriebenen Paare und einem Primer durchgeführt, der aus der Sequenz des derivatisierten Oligodeoxyribonukleotids (5'-ATCAAGAATTCGCACGAGACCATTA-3' (SEQ ID NO: 13) abgeleitet worden war.
Ein Zwanzigstel der folgenden RT-PCR-Produktproben wurden auf einem 1,5% Agarosegel aufgetrennt und mit Ethidiumbromid angefärbt.
Probe 1: Die Produkte einer PCR-Reaktion unter Verwendung der Globinprimer gemäß SEQ ID NO: 5 und 6 in Gegenwart von cDNA.
Probe 2: Die Produkte einer PCR-Reaktion unter Verwendung der Globinprimer gemäß SEQ ID NO: 5 und 6 in Abwesenheit zugegebener cDNA.
Probe 3: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer gemäß SEQ ID NO: 7 und 8 in Gegenwart von cDNA.
Probe 4: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer gemäß SEQ ID NO: 7 und 8 in Abwesenheit zugegebener cDNA.
Probe 5: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer gemäß SEQ ID NO: 9 und 10 in Gegenwart von cDNA.
Probe 6: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer gemäß SEQ ID NO 9 und 10 in Abwesenheit zugegebener cDNA.
Probe 7: Die Produkte einer PCR-Reaktion unter Verwendung der EIF4-Primer gemäß SEQ ID NO: 11 und 12 in Gegenwart von zugegebener cDNA.
Probe 8: Die Produkte einer PCR-Reaktion unter Verwendung der EIF4-Primer gemäß SEQ ID NO: 11 und 12 in Abwesenheit zugegebener cDNA.
Eine Bande mit der für das PCR-Produkt erwarteten Größe wurde nur in den Proben 1, 3, 5 und 7 beobachtet und zeigt somit das Vorliegen der entsprechenden Sequenz in der cDNA-Population an.
Es wurden auch PCR-Reaktionen mit den Antisense-Oligonukleotiden der Globin- und Dehydrogenase-Primer (SEQ ID NO: 6 und 8) und einem Oligonukleotid, dessen Sequenz der des derivatisierten Oligonukleotids entsprach, durchgeführt. Das Vorliegen von PCR-Produkten mit der erwarteten Größe in den Proben, die den obigen Proben 1 und 3 entsprachen, zeigte, dass das derivatisierte Oligonukleotid mit mRNA verknüpft worden war.
Die obigen Beispiele fassen das chemische Verfahren zur Anreicherung von mRNAs zusammen für solche mRNAs, die intakte 5'-Enden aufweisen, wie es in 1 dargestellt ist. Weitere Einzelheiten, welche die chemischen Ansätze zum Erhalten solcher mRNAs betreffen, werden in der internationalen Anmeldung Nr. WO 96/34981, veröffentlicht 7. November 1996, offenbart. Strategien, die auf den oben beschriebenen chemischen Modifikationen der 5'-Capstruktur beruhen, können verwendet werden, um cDNAs zu erzeugen, die darauf hin selektiert wurden, dass sie die 5'-Enden der mRNAs, von denen sie abgeleitet wurden, umfassen. In einer Version derartiger Verfahren werden die mRNA 5'-Enden wie oben beschrieben modifiziert. Danach wird eine reverse Transkriptionsreaktion durchgeführt, um einen Primer zu verlängern, der komplementär ist zum 5'-Ende der mRNA. Einzelsträngige RNAs werden entfernt, um eine Population von cDNA/mRNA-Heteroduplexen zu erhalten, in denen die mRNA ein intaktes 5'-Ende umfasst. Die resultierenden Heteroduplexe können auf einer festen Phase, die mit einem Molekül beschichtet ist, das zur Wechselwirkung mit dem zur Derivatisierung des 5'-Endes der mRNA verwendeten Moleküls in der Lage ist, eingefangen werden. Danach werden die Stränge der Heteroduplexe getrennt, um einzelsträngige Erststrang-cDNAs zu gewinnen, die das mRNA 5'-Ende umfassen. Die Zweitstrang-cDNA-Synthese kann anschließend unter Verwendung herkömmlicher Techniken fortgeführt werden. Beispielsweise können die in WO 96/34981 oder in Carninci et al., Genomics 37:327-336, 1996, offenbarten Verfahren verwendet werden, um cDNAs zu selektieren, welche die Sequenz umfassen, die vom 5'-Ende der codierenden mRNA Sequenz abgeleitet ist.
Im Anschluss an die Ligation des Oligonukleotid-Tags an das 5'-Cap der mRNA wird eine reverse Transkriptionsreaktion ausgeführt, um einen Primer, der zu der mRNA komplementär ist, zum 5'-Ende der mRNA hin zu verlängern. Im Anschluss an die Entfernung der RNA-Komponente aus dem resultierenden Heteroduplex unter Verwendung von Standardtechniken, wird die cDNA-Zweitstrangsynthese mit einem Primer durchgeführt, der komplementär zum Oligonukleotid-Tag ist.
2. Enzymatische Verfahren zum Erhalten von mRNAs mit intakten 5'-Enden
Andere Techniken zur Selektion von cDNAs, die über das 5'-Ende der mRNA, von der sie abgeleitet sind, hinaus erweitert sind, sind vollständig enzymatisch. Einige Versionen dieser Techniken werden in Dumas Milne Edwards J.B. (Doktorarbeit der Paris VI Universität, „Le clonage des ADNc complets: difficultes et perspectives nouvelles. Apports pour l'etude de la regulation des l'expression de la tryptophane hydroxylase de rat„, 20. Dezember 1993), EP 0,625,572 und Kato et al., Gene 150:243-250, 1994, offenbart.
In Kürze, in derartigen Ansätzen wird isolierte mRNA mit alkalischer Phosphatase behandelt, um die Phosphatgruppen, die an den 5'-Enden unvollständiger mRNAs ohne Cap vorliegen, zu entfernen. Im Anschluss an dieses Verfahren wird das bei Volllängen-mRNAs vorliegende Cap mit einem Capentfernendem Enzym, wie beispielsweise T4-Polynukleotidgenase oder Tabaksäure-Pyrophosphatase enzymatisch entfernt. Ein Oligonukleotid, das entweder ein DNA-Oligonukleotid oder DNA-RNA-Hybridoligonukleotid mit RNA an seinem 3'-Ende sein kann, wird anschließend unter Verwendung von T4-RNA-Ligase an das Phosphat, das am 5'-Ende der mRNA ohne Cap vorliegt, ligiert. Das Oligonukleotid kann eine Schnittstelle umfassen, um das Klonieren der cDNAs im Anschluss an deren Synthese zu erleichtern. Beispiel 12 unten beschreibt ein enzymatisches Verfahren, das auf der Doktorarbeit von Dumas basiert.
Beispiel 12
Enzymatischer Ansatz zum Erhalten von 5'-ESTs
Zwanzig Mikrogramm von PolyA⁺-RNA wurden unter Verwendung von Phosphatase aus Rinderdarm (Calf Intestinal Phosphatase) (Biolabs) dephosphoryliert. Nach einer Phenolchloroformextraktion wurde die mRNA-Capstruktur unter Verwendung von Tabaksäure-Pyrophosphatase (gereinigt wie von Shinshi et al., Biochemstry 15:2185-2190, 1976 beschrieben) hydrolysiert und ein Halb-5'-DNA/RNA-3'-Oligonukleotid mit einem unphosphorylierten 5'-Ende, einem Adenosinribophosphatabschnitt am 3'-Ende und einer EcoRI-Stelle nahe dem 5'-Ende wurde unter Verwendung der T4 RNA-Ligase (Biolabs) an die 5'-P-Enden der mRNA ligiert. Oligonukleotide, die zur Verwendung in diesem Verfahren geeignet sind, weisen vorzugsweise eine Länge von 30 bis 50 Basen auf. Oligonukleotide mit einem unphosphorylierten 5'-Ende können durch Zugabe eines Fluorochroms an das 5'-Ende synthetisiert werden. Die Einbeziehung eines Adenosinribophosphatabschnitts am 3'-Ende der Oligonukleotide steigert die Effizienz der Ligation. Es wird erkannt, dass das Oligonukleotid außer EcoRI andere Klonierungsstellen enthalten kann.
Im Anschluss an die Ligation der Oligonukleotide an das Phosphat, das am 5'-Ende der mRNA ohne Cap vorliegt, wird die Erst- und Zweitstrang-cDNA-Synthese unter Verwendung herkömmlicher Verfahren oder unter Verwendung der Verfahren, die in EP 0,625,572 und Kato et al., supra, und Dumas Milne Edwards, supra offenbart sind, ausgeführt. Die resultierende cDNA kann anschließend in Vektoren ligiert werden, wie beispielsweise solche Vektoren, die in Kato et al., supra, offenbart sind oder andere dem Fachmann bekannte Nukleinsäurevektoren, wobei Techniken verwendet werden, wie sie beispielsweise in Sambrook et al., Molecular Cloning: A Laboratory Manual 2. Ausgabe, Cold Spring Harbor Laboratory Press, 1989 beschrieben sind.
II. Erhalten und Charakterisieren der erfindungsgemäßen 5'-ESTs
Die hierin beschriebenen 5'-ESTs wurden unter Verwendung der vorausgehend genannten chemischen und enzymatischen Ansätze zur Anreicherung von mRNAs im Hinblick auf mRNAs mit intakten 5'-Enden erhalten, wie es unten beschrieben wird.
1. Erhalten von 5'-ESTs unter Verwendung von mRNAs mit intakten 5'-Enden
Zuerst wurden mRNAs hergestellt, wie es in Beispiel 13 unten beschrieben wird.
Beispiel 13
Herstellung von mRNA mit intakten 5'-Enden
Humane Gesamt-RNAs oder PolyA⁺-RNAs, die aus 29 verschiedenen Geweben abgeleitet waren, wurden von LABIMO bzw. CLONTECH bezogen und verwendet, um 44 cDNA-Bibliotheken zu erstellen, wie es im Folgenden beschrieben wird. Die bezogene RNA war entweder aus Zellen oder Geweben unter Verwendung von saurer Guanidiumthiocyanat-Phenol-Chloroform-Extraktion isoliert worden (Chomczyniski und Sacchi, Analytical Biochemstry 162:156-159, 1987). Um die ribosomale RNA zu entfernen wurde PolyA⁺ RNA aus Gesamt-RNA (LABIMO) über zwei Durchläufe von Oligo-dT-Chromatografie isoliert, wie es von Aviv und Leder, Proc. Natl. Acad. Sci. USA 69:1408-1412, 1972 beschrieben wird.
Die Qualität und Integrität der PolyA⁺-RNAs wurde überprüft. Es wurden mit einer Globinsonde hybridisierte Northern Blots verwendet, um zu bestätigen, dass die mRNAs nicht degradiert waren. Verunreinigung der PolyA⁺-mRNAs durch ribosomale Sequenzen wurde unter Verwendung von Northern Blots und einer Sonde, die aus der Sequenz von 28S rRNA abgeleitet war, überprüft. mRNA-Präparationen mit weniger als 5% rRNAs wurden zur Herstellung einer Bibliothek verwendet. Um die Herstellung von Bibliotheken mit RNAs zu vermeiden, die mit exogenen Sequenzen verunreinigt waren (prokaryotisch oder aus einem Pilz), wurde das Vorliegen bakterieller 16S ribosomaler Sequenzen oder zweier stark exprimierter mRNAs aus Pilz unter Verwendung von PCR untersucht.
Im Anschluss an die Herstellung der mRNAs wurden die oben beschriebenen chemischen und/oder die enzymatischen Verfahren zur Anreicherung solcher mRNAs, die intakte 5'-Enden aufweisen, verwendet, um 5'-ESTs aus verschiedenen Geweben zu erhalten. In beiden Ansätzen wurde ein Oligonukleotid-Tag an die mRNA 5'-Enden angebracht. Der Oligonukleotid-Tag trug eine EcoRI-Stelle in sich, um spätere Klonierungsverfahren zu erleichtern. Um die Verarbeitung einzelsträngiger und doppelsträngiger cDNA, die bei der Erstellung der Bibliotheken erhalten wurde, zu erleichtern, wurde die gleiche Nukleotidsequenz verwendet, um das ligierte Oligonukleotid sowohl für den chemischen als auch den enzymatischen Ansatz zu konzipieren. Trotzdem war das im chemischen Verfahren verwendete Tag ein Oligodeoxyribonukleotid, das mit dem Cap der mRNA verknüpft war, wohingegen in der enzymatischen Ligation das Tag ein chimäres Halb-5'-DNA/RNA3'-Oligonukleotid war, das an das 5'-Ende von mRNA ohne Cap ligiert wurde, wie in Beispiel 12 beschrieben wird.
Bevor die Erststrangsynthese durchgeführt wurde, wie es in Beispiel 14 beschrieben wird, wurde im Anschluss an das Anbringen des Oligonukleotid-Tags an die mRNA durch entweder chemische oder enzymatische Verfahren die Integrität der mRNA durch Ausführung eines Northern Blots mit 200 bis 500 ng mRNA untersucht, wobei eine zum Oligonukleotid-Tag komplementären Sonde verwendet wurde.
Beispiel 14
cDNA-Synthese unter Verwendung von mRNA-Matrizen mit intakten 5'-Enden
Für die mRNAs, die unter Verwendung sowohl chemischer als auch enzymatischer Verfahren mit Oligonukleotid-Tags verknüpft worden waren, wurde die Erststrang-cDNA-Synthese unter Verwendung der Reversen Transkriptase Superscript II (Gibco BRL) oder Rnase H Minus M-MLV (Promega) mit willkürlichen Nonameren als Primern durchgeführt. Um die internen EcoRI-Stellen in der cDNA vor Verdau bei späteren Verfahrensschritten zu schützen, wurde für die Erststrangsynthese methyliertes dCTP verwendet. Nach Entfernung von RNA durch alkalische Hydrolyse wurde die Erststrang-cDNA unter Verwendung von Isopropanol präzipitiert, um verbliebene Primer zu entfernen.
Sowohl für die chemischen als auch die enzymatischen Verfahren wurde der cDNA-Zweitstrang mit einem Klenow-Fragment unter Verwendung eines Primers entsprechend dem 5'-Ende des ligierten Oligonukleotids synthetisiert, wie es in Beispiel 12 beschrieben wird. Der Primer ist vorzugsweise 20–25 Basen lang. Methyliertes dCTP wurde auch zur Zweitstrangsynthese verwendet, um während des Klonierungsverfahrens die internen EcoRI-Stellen in der cDNA vor Verdau zu schützen.
Im Anschluss an die cDNA-Synthese wurden die cDNAs in pBlueScript-Vektoren kloniert, wie es in Beispiel 15 unten beschrieben wird.
Beispiel 15
Klonierung von cDNAs, die aus mRNA mit intakten 5'-Enden abgeleitet sind in BlueScript
Im Anschluss an die Zweitstrangsynthese wurden die Enden der cDNA mit T4 DNA-Polymerase (Biolabs) geglättet und die cDNA wurde mit EcoRI verdaut. Da während der cDNA-Synthese methyliertes dCTP verwendet worden war, stellte die im Tag vorliegende EcoRI-Stelle die einzige halb-methylierte Stelle dar und war demzufolge die einzige Stelle, die einem EcoRI-Verdau zugänglich war. Die cDNA wurde anschließend unter Verwendung von Ausschlusschromatografie (AcA, Biosepra) größenfraktioniert und die Fraktionen, die cDNAs mit mehr als 150 bp entsprachen, wurden vereinigt und mit Ethanol präzipitiert. Die cDNA wurde direkt in die Smal- und EcoRI-Enden des Phagemid pBlueScript-Vektors (Stratagene) kloniert. Das Ligationsgemisch wurde in Bakterien elektroporiert und unter geeigneten antibiotischen Auswahlbedingungen vermehrt.
Klone, die den angefügte Oligonukleotid-Tag enthielten, wurden selektiert, wie es in Beispiel 16 unten beschrieben wird.
Beispiel 16
Selektion von Klonen mit daran angebrachtem Oligonukleotid-Tag
Die wie oben beschrieben hergestellten Plasmid-DNAs enthaltenden 5'-EST-Bibliotheken wurden gereinigt (Qiagen). Eine positive Selektion der Klone mit Tag wurde wie folgt durchgeführt. In Kürze, in diesem Selektionsverfahren wird die Plasmid-DNA unter Verwendung der Gen II-Endonuklease des Phagen F1 in Kombination mit einer Exonuklease (Chang et al., Gene 127:95-8, 1993), wie beispielsweise Exonuklease III oder T7 Gen 6 Exonuklease, in eine einzelsträngige DNA umgewandelt. Die resultierende einzelsträngige DNA wurde anschließend unter Verwendung paramagnetischer Beads, wie von Fry et al., Biotechniques, 13:124-131, 1992 beschrieben, aufgereinigt. In diesem Verfahren wird die einzelsträngige DNA mit einem biotinylierten Oligonukleotid, das eine Sequenz entsprechend dem 3'-Ende des in Beispiel 13 beschriebenen Oligonukleotids aufweist, hybridisiert. Der Primer weist vorzugsweise eine Länge von 20–25 Basen auf. Klone, die eine zum biotinylierten Oligonukleotid komplementäre Sequenz umfassen, wurden durch Inkubation mit Streptavidin-beschichteten magnetischen Beads eingefangen, wobei sich daran eine magnetische Selektion anschloss. Nach dem Einfangen der positiven Klone wurde die Plasmid-DNA von den magnetischen Beads abgelöst und unter Verwendung einer DNA-Polymerase, wie beispielsweise der von Amersham Pharmacia Biotech erhältlichen Thermo- Sequenase in doppelsträngige DNA umgewandelt. Alternativ können Protokolle, wie beispielsweise das im Gene Trapper Kit, der von Gibco BRL bezogen werden kann, beschriebene verwendet werden. Die doppelsträngige DNA wurde anschließend in Bakterien elektroporiert. Unter Verwendung einer Dot-Blot-Analyse wurde der Prozentanteil positiver Klone mit dem 5'-Tag Oligonukleotid dahingehend abgeschätzt, dass er sich normalerweise zwischen 90 und 98% bewegt.
Im Anschluss an die Elektroporation wurden die Bibliotheken in 384-Mikrotiterplatten (MTP) angeordnet. Für zukünftige Bedürfnisse wurde eine Kopie der MTP eingelagert. Anschließend wurden die Bibliotheken in 96 MTP überführt und wie unten beschrieben sequenziert.
Beispiel 17
Sequenzierung von Inserts in selektierten Klonen
Die Plasmidinserts wurden zuerst durch eine PCR-Reaktion in PE 9600 Thermocyclern (Perkin-Elmer, Applied Biosystems Divison, Foster City, CA) unter Verwendung von Standard-SETA-A- und SETA-B-Primern (Genset SA), AmpliTaqGold (Perkin-Elmer), dNTPs (Boehringer), Puffer und mit Zyklusbedingungen amplifiziert, wie von der Perkin-Elmer Corporation empfohlen.
Anschließend wurden die PCR-Produkte unter Verwendung automatischer ABI Prism 377 Sequenzierer (Perkin-Elmer) sequenziert. Die Sequenzierungsreaktionen wurden unter Verwendung von PE 9600 Thermocyclern mit Standardfarbstoffprimerchemie und ThermoSequenase (Amersham Pharmacia Biotech) durchgeführt. Die verwendeten Primer waren wie jeweils geeignet entweder T7 oder 21 M13 (erhältlich von Genset SA). Die Primer waren mit den JOE-, FAM-, ROX- und TAMRA-Farbstoffen markiert. Die für die Sequenzierungsreaktionen verwendeten dNTPs und ddNTPs wurden von Boehringer bezogen. Sequenzierungspuffer, Reagenzienkonzentrationen und Zyklusbedingungen waren wie von Amersham empfohlen.
Im Anschluss an die Sequenzierungsreaktion wurden die Proben mit Ethanol präzipitiert, in Formamidladepuffer aufgenommen und auf ein standardmäßiges 4% Acrylamidgel aufgetragen. Die Elektrophorese wurde für 2,5 Stunden bei 3000 V an einem ABI 377 Sequenzierungsgerät durchgeführt und die Sequenzdaten wurden gesammelt und unter Verwendung der ABI Prism DNA Sequencing Analysis Software, Version 2.1.2 analysiert.
2. Computeranalyse der erhaltenen 5'-ESTs: Erstellung von NetGene und SignalTag Datenbanken
Die Sequenzdaten der 44 wie oben beschrieben hergestellten cDNA-Bibliotheken wurden auf eine proprietäre Datenbank übertragen, wo Schritte zur Qualitätskontrolle und Validierung durchgeführt wurden. Ein proprietärer Base-Caller, der unter einem Unix-System arbeitet, kennzeichnete automatisch fehlerverdächtige Peakwerte, wobei die Form der Peaks, die Auflösung zwischen den Peaks und der Rauschpegel berücksichtigt wurden. Der proprietäre Base-Caller führte auch einen automatischen Abgleich durch. Jeder Abschnitt mit 25 oder weniger Basen und mehr als 4 fehlerverdächtigen Peakwerten wurde als unzuverlässig eingestuft und verworfen. Sequenzen, die dem Klonierungsvektor oder Ligationsoligonukleotiden entsprachen, wurden automatisch aus den EST-Sequenzen entfernt. Die resultierenden EST-Sequenzen können an ihrem 5'-Ende jedoch 1 bis 5 Basen enthalten, die zu den oben erwähnten Sequenzen zählen. Wenn Bedarf entsteht, können sie auf Grundlage einer Unterscheidung von Fall zu Fall einfach entfernt werden.
Im Anschluss an die oben beschriebene Sequenzierung wurden die 5'-EST-Sequenzen in NetGene^TM eingegeben, wobei es sich um eine proprietäre Datenbank handelt, die wie unten beschrieben zur Speicherung und Manipulierung aufgerufen wurde. Der Fachmann erkennt, dass die Daten auf einem beliebigen Medium, das von einem Computer gelesen werden kann und auf das ein Computer zugreifen kann, gespeichert und manipuliert werden können. Computerlesbare Medien umfassen magnetisch, optisch oder elektronisch lesbare Medien. Beispielsweise kann das computerlesbare Medium sowohl eine Hard Disc, eine Floppy Disc, ein magnetisches Band, einer CD-ROM, RAM oder ROM als auch andere dem Fachmann bekannte Medientypen sein.
Zusätzlich können die Daten in einer Vielfalt von Datenverarbeitungsprogrammen in unterschiedlichen Formaten gespeichert und manipuliert werden. Zum Beispiel können die Sequenzdaten als Text in einer Wortverarbeitungsdatei, wie beispielsweise Microsoft WORD oder WORDPERFECT oder als eine ASCII-Datei in einer Vielzahl von dem Fachmann bekannten Datenbankenprogrammen, wie beispielsweise DB2, SYBASE oder ORACLE, gespeichert werden.
Das computerlesbare Medium, auf dem die Sequenzinformation gespeichert ist, kann sich in einem Personal-Computer, einem Netzwerk, einem Server oder anderen, dem Fachmann bekannten Computersystemen befinden. Der Computer oder das andere System umfasst vorzugsweise das oben beschriebene Speichermedium und einen Prozessor für einen Zugriff auf und die Manipulation der Sequenzdaten. Sobald die Sequenzdaten gespeichert worden sind, können sie manipuliert und durchsucht werden, um diejenigen gespeicherten Sequenzen zu finden, die eine gewünschte Nukleinsäuresequenz enthalten oder die ein Protein mit einer bestimmten funktionalen Domäne codieren. Beispielsweise kann die gespeicherte Sequenzinformation mit anderen bekannten Sequenzen verglichen werden, um Homologien, Motive, die eine biologische Funktion implizieren, oder strukturelle Motive zu identifizieren.
Programme, die verwendet werden können, um die gespeicherten Sequenzen zu durchsuchen oder zu vergleichen, umfassen die MacPattern(EMBL), BLAST- und BLAST2-Programmserien (NCBI), einfache lokale Alignment Suchprogramme für Nukleotid-(BLASTN) und Peptid-(BLASTX) Vergleiche (Altschule et al., J. Mol. Biol. 215:403, 1990) sowie FASTA (Pearson und Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988). Die BLAST-Programme erweitern anschließend die Alignments auf Grundlage bestimmter Abgleich- und Fehlabgleichkriterien („Match"- und Mismatch"-Kriterien).
Motive, die unter Verwendung der oben und den in Beispiel 28 beschriebenen Programmen nachgewiesen werden können, umfassen Sequenzen, welche für Leucin-Zipper, Helix-Turn-Helix-Motive, Glycosylierungsstellen, Ubiquitinierungsstellen, Alphahelices und Betafaltblätter codieren, für Signalpeptide codierende Signalsequenzen, welche die Sekretion der codierten Proteine steuern, Sequenzen, die mit der Regulation von Transkription in Zusammenhang stehen, wie beispielsweise Homeoboxen, saure Abschnitte, enzymatisch aktive Stellen, Substratbindungsstellen und enzymatische Spaltstellen.
Bevor die cDNAs in der NetGene^TM Datenbank nach Sequenzmotiven von Interessen durchsucht wurden, wurden von mRNAs abgeleitete cDNAs, die nicht von Interesse waren, identifiziert und von weiteren Überlegungen ausgeschlossen, wie es in Beispiel 18 unten beschrieben wird.
Beispiel 18
Ausschluss unerwünschter Sequenzen von weiteren Überlegungen
5'-ESTs in der NetGene^TM-Datenbank, die von unerwünschten Sequenzen abgeleitet waren, wie beispielsweise Transfer-RNAs, ribosomale RNAs, mitochondrielle RNAs, prokaryotische RNAs, RNAs aus Pilzen, Alu-Sequenzen, L1-Sequenzen oder Repeatsequenzen, wurden unter Verwendung der FASTA- und BLASTN-Programme mit den in Tabelle 1 aufgelisteten Parametern identifiziert.
Um die für tRNAs codierenden 5'-ESTs von weiteren Überlegungen auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen von 1190 bekannten tRNAs verglichen, die aus EMBL Version 38 erhalten wurden, von denen 100 human waren. Der Vergleich wurde unter Verwendung von FASTA für beide Stränge der 5'-ESTs durchgeführt. Sequenzen mit mehr als 80% Homologie über mehr als 60 Nukleotide hinweg wurden als tRNAs identifiziert. Von den 144 341 gesceenten Sequenzen wurden 26 als tRNAs identifiziert und von weiteren Überlegungen ausgeschlossen.
Um die für rRNAs codierenden 5'-ESTs von weiteren Überlegungen auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen von 2497 bekannten rRNAs, die aus EMBL Version 38 erhalten wurden, verglichen, von denen 73 human waren. Der Vergleich wurde unter Verwendung von BLASTN für beide Stränge der 5'-ESTs mit dem Parameter S = 108 durchgeführt. Sequenzen mit mehr als 80% Homologie über Strecken, die länger als 40 Nukleotide waren, wurden als rRNAs identifiziert. Von den 144 341 durchmusterten Sequenzen wurden 3 312 als rRNAs identifiziert und von weiteren Überlegungen ausgeschlossen.
Um die für mtRNAs codierenden 5'-ESTs von weiteren Überlegungen auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen von zwei bekannten mitochondriellen Genomen, für welche die vollständige genomische Sequenz zur Verfügung steht, und allen Sequenzen, die von diesen mitochondriellen Genomen transkribiert werden, einschließlich tRNAs, rRNAs und mRNAs, in der Summe 38 Sequenzen, verglichen. Der Vergleich wurde unter Verwendung von BLASTN für beide Stränge der 5'-ESTs mit dem Parameter S = 108 durchgeführt. Sequenzen mit mehr als 80% Homologie über Strecken, die länger als 40 Nukleotide waren, wurden als mtRNAs identifiziert. Von den 144 341 durchmusterten Sequenzen wurden 6 110 als mtRNAs identifiziert und von weiteren Überlegungen ausgeschlossen.
Sequenzen, die von exogenen Kontaminanten herrühren könnten, wurden von weiteren Überlegungen durch Vergleich der 5'-EST-Sequenzen mit Version 46 der EMBL-Abteilungen für Bakterien und Pilze unter Verwendung von BLASTN mit dem Parameter S = 144 entfernt. Alle Sequenzen mit mehr als 90% Homologie über mindestens 40 Nukleotide hinweg wurden als exogene Kontaminanten identifiziert. Von den 42 untersuchten cDNA-Bibliotheken betrug der durchschnittliche Prozentanteil darin enthaltener prokaryotischer Sequenzen und darin enthaltener Pilzsequenzen 0,2% bzw. 0,5%. Von diesen Sequenzen konnte nur eine als pilzspezifische Sequenz identifiziert werden. Die anderen waren entweder Pilzsequenzen oder prokaryotische Sequenzen mit Homologien zu Wirbeltiersequenzen oder umfassten Repeatsequenzen, die während des elektronischen Vergleichs nicht maskiert worden waren.
Zusätzlich wurden die 5'-ESTs mit 6093 Alu-Sequenzen und 1115 L1-Sequenzen verglichen, um 5'-ESTs zu maskieren, die derartige Repeatsequenzen enthielten. 5'-ESTs, die THE- und MER-Repeats, SSTR-Sequenzen oder Satelliten, Mikrosatelliten oder telomerische Repeats umfassten, wurden ebenfalls von weiteren Überlegungen ausgeschlossen. Im Durchschnitt enthielten 11,5% der Sequenzen in den Bibliotheken Repeatsequenzen. Von diesen 11,5% enthielten 7% Alu-Repeats, 3,3% enthielten L1-Repeats und die übrigen 1,2% wurden von den anderen durchmusterten Typen repetitiver Sequenzen abgeleitet. Diese Prozentangaben stehen in Übereinstimmung mit denen, welche in cDNA-Bibliotheken nachgewiesen wurden, welche von anderen Gruppen hergestellt wurden. Beispielsweise enthielten die cDNA-Bibliotheken von Adams et al. in Abhängigkeit von der zur cDNA-Bibliothek-Herstellung verwendeten RNA-Quelle zwischen 0% und 7,4% Alu-Repeats (Adams et al., Nature 377:174, 1996).
Die Sequenzen derjenigen 5'-ESTs, die nach der Entfernung unerwünschter Sequenzen zurück blieben, wurden mit den Sequenzen bekannter humaner mRNAs verglichen, um die Genauigkeit der oben beschriebenen Sequenzierungsverfahren festzustellen.
Beispiel 19
Messen der Sequenzierungsgenauigkeit durch Vergleich mit bekannten Sequenzen
Um ferner die Genauigkeit des oben beschriebenen Sequenzierungsverfahrens zu bestimmen, wurden die 5'-EST-Sequenzen, die von bekannten Sequenzen abgeleitet waren, identifiziert und mit den ursprünglich bekannten Sequenzen verglichen. Als Erstes wurde bezüglich der 5'-ESTs eine FASTA-Analyse mit Überhängen, die kürzer als 5 bp waren, an beiden Enden durchgeführt, um diejenigen 5'-ESTs zu identifizieren, die mit einem Eintrag in der öffentlichen Human mRNA Datenbank übereinstimmen. Die 6655 5'-ESTs, die mit einer bekannten humanen mRNA übereinstimmten, wurden anschließend mit ihrer verwandten mRNA abgeglichen und eine dynamische Programmierung wurde verwendet, um Substitutionen, Insertionen und Deletionen in die Liste der zu erkennenden „Fehler" aufzunehmen. Fehler, die in den letzten 10 Basen der 5'-EST-Sequenzen auftraten, wurden ignoriert, um eine Einbeziehung von störenden Klonierungsstellen bei der Analyse der Sequenzierungsgenauigkeit zu vermeiden.
Die Analyse offenbarte, dass die Sequenzen, die in der NetGene^TM-Datenbank enthalten waren, eine Fehlerfreiheit von mehr als 99,5% aufwiesen.
Um die Effizienz zu bestimmen, mit der das obige Selektionsverfahren cDNAs selektiert, welche die 5'-Enden ihrer entsprechenden mRNAs umfassen, wurde die folgende Analyse durchgeführt.
Beispiel 20
Bestimmung der Effizienz der 5'-EST-Selektion
Um die Effizienz zu bestimmen, mit der die oben beschriebenen Selektionsverfahren 5'-ESTs isolierten, die Sequenzen nahe am 5'-Ende der mRNAs umfassten, aus denen sie abgeleitet waren, wurden die Sequenzender 5'-EST-Enden, die von den Genen für die Untereinheit α des Elongationsfaktors 1 und der schweren Kette von Ferritin abgeleitet waren, mit denen bekannter cDNA-Sequenzen dieser Gene verglichen. Da die Transkriptionsstartstellen beider Gene gut charakterisiert sind, können sie verwendet werden, um den Prozentanteil abgeleiteter 5'-ESTs zu bestimmen, welche die authentischen Transkriptionsstartstellen umfassten.
Für beide Gene umfassten tatsächlich mehr als 95% der erhaltenen 5'-ESTs Sequenzen, die nahe am oder stromaufwärts des 5'-Endes der entsprechenden mRNAs lagen.
Um die Analyse zur Verlässlichkeit der Isolierungsverfahren für 5'-ESTs aus ESTs in der NetGene^TM-Datenbank auszuweiten, wurde zum Vergleich eine ähnliche Analyse unter Verwendung einer Datenbank durchgeführt, die aus humanen mRNA-Sequenzen zusammengestellt worden war, wobei die humanen mRNA-Sequenzen aus der GenBank-Datenbank Version 97 entnommen worden waren. Die 5'-Enden von mehr als 85% der aus mRNAs abgeleiteten 5'-ESTs, die in der GenBank-Datenbank enthalten waren, waren nahe der 5'-Enden der bekannten Sequenz lokalisiert. Da einige der mRNA-Sequenzen, die in der GenBank-Datenbank zur Verfügung stehen, von genomischen Sequenzen abgeleitet sind, wird eine Übereinstimmung am 5'-Ende mit diesen Sequenzen als interne Übereinstimmung gerechnet. Daher unterschätzt das hier verwendete Verfahren die EST-Ausbeuten für ESTs, welche die authentischen 5'-Enden ihrer entsprechende mRNAs umfassen.
Die oben hergestellten EST-Bibliotheken umfassten mehrere 5'-ESTs, die von der gleichen mRNA abgeleitet waren. Die Sequenzen solcher 5'-ESTs wurden miteinander verglichen und die längsten 5'-ESTs für jede mRNA wurden identifiziert. Überlappende cDNAs wurden zu kontinuierlichen Sequenzen (Contigs) angeordnet. Die resultierenden kontinuierlichen Sequenzen wurden anschließend mit öffentlichen Datenbanken verglichen, um ihre Ähnlichkeit mit bekannten Sequenzen zu beurteilen, wie in Beispiel 21 unten beschrieben wird.
Beispiel 21
Clusterbildung der 5'-ESTs und Berechnung der Neuheitsindices für cDNA-Bibliotheken
Für jede sequenzierte EST-Bibliothek wurden die Sequenzen über das 5'-Ende in Clustern zusammengefasst. Jede Sequenz in der Bibliothek wurde über BLASTN2 (direkter Strang, Parameter S = 107) mit den anderen verglichen. ESTs mit Segmentpaaren von hohem Ergebniswert (high scoring segment pairs) (HSPs), die mindestens 25 bp lang waren, 95% identische Basen aufwiesen und näher als 10 bp von jedem EST 5'-Ende begannen, wurden gruppiert. Die längste Sequenz, die im Cluster nachgewiesen wurde, wurde als Vertreter der Gruppe herangezogen. Anschließend wurde eine Gesamtclusterbildung zwischen den Bibliotheken durchgeführt, was zur Bestimmung von Super-Contigs führte.
Um die Ausbeute an neuen Sequenzen innerhalb der EST-Bibliotheken zu bestimmen, wurde eine Neuheitsrate (NR) als: NR = 100 × (Zahl der neuen einmaligen Sequenzen, die in der Bibliothek nachgewiesen werden/Gesamtzahl der Sequenzen aus der Bibliothek) bestimmt. Normalerweise bewegte sich die Neuheitsrate in Abhängigkeit vom Gewebe, aus denen die EST-Bibliothek erhalten wurde, zwischen 10% und 41 %. Für die meisten Bibliotheken wurde die statistische Sequenzierung von 5'-EST-Bibliotheken fortgesetzt, bis die Neuheitsrate 20% erreichte.
Im Anschluss an die oben beschriebene Charakterisierung wurde die 5'-EST-Kollektion in NetGene^TM durchmustert, um diejenigen ESTs zu identifizieren, die potentielle Signalsequenzen trugen, wie es in Beispiel 22 unten beschrieben wird.
Beispiel 22
Identifizierung potentieller Signalsequenzen in 5'-ESTs
Die 5'-ESTs in der NetGene^TM-Datenbank wurden gescreent, um diejenigen 5'-ESTs zu identifizieren, die einen ununterbrochenen offenen Leserahmen (ORF) aufweisen, der länger als 45 Nukleotide ist, mit einem ATG-Codon beginnt und bis zum Ende des ESTs reicht. Etwa die Hälfte der cDNA-Sequenzen in NetGene^TM enthielt einen derartigen ORF. Die ORFs dieser 5'-ESTs wurden anschließend unter Verwendung leicht abgeänderter von Von Heijne offenbarter Verfahren (Nucleic Acids Res. 14:4683-4690, 1986) durchsucht, um mögliche Signalmotive zu identifizieren. Für diejenigen 5'-EST-Sequenzen, die einen mindestens 15 Aminosäuren langen Abschnitt mit einem Ergebnis von mindestens 3,5 in der Von Heijne Signalpeptid-Identifizierungsmatrix codierten, wurden in Betracht gezogen, ein Signalpeptid zu enthalten. Solche 5'-ESTs, die mit einer bekannten humanen mRNA oder einer EST-Sequenz übereinstimmten und ein 5'-Ende mit mehr als 20 Nukleotiden stromabwärts des bekannten 5'-Endes aufwiesen, wurden von der weiteren Analyse ausgeschlossen. Die verbleibenden cDNAs, die eine Signalsequenz enthielten, wurden in eine Datenbank, die als SignalTag^TM bezeichnet wird, aufgenommen.
Um die Fehlerfreiheit des obigen Verfahrens zur Identifizierung von Signalsequenzen zu bestätigen, wurde die Analyse aus Beispiel 23 durchgeführt.
Beispiel 23
Bestätigung der Genauigkeit zur Identifizierung möglicher Signalsequenzen in 5'-ESTs
Die Genauigkeit des obigen Verfahrens zur Identifizierung von Signalsequenzen, die Signalpeptide codieren, wurde durch Anwenden des Verfahrens auf 43 Aminosäuren, die am N-Terminus aller humanen SwissProt-Proteine lokalisiert sind, beurteilt. Der computerberechnete Von Heijnes-Score für jedes Protein wurde mit der bekannten Eigenschaft des Proteins, ein sekretiertes oder nicht sekretiertes Protein zu sein, verglichen. Auf diese Weise konnte die Zahl der nicht sekretierten Proteine mit einem Ergebnis höher als 3,5 (falsch-positiv) und die Zahl der sekretierten Proteine mit einem Ergebnis niedriger als 3,5 (falsch-negativ) berechnet werden.
Unter Verwendung der Ergebnisse aus der obigen Analyse wurde die Wahrscheinlichkeit berechnet, dass ein Peptid, das durch die 5'-Region der mRNA codiert wird, wirklich ein echtes Signalpeptid ist auf Grundlage seines Von Heijnes-Scores, wobei Annahme als Grundlage diente, dass entweder 10% der humanen Proteine sekretiert werden oder dass 20% der humanen Proteine sekretiert werden. Die Ergebnisse dieser Analyse sind in 2 und in Tabelle IV gezeigt.
Unter Verwendung des obigen Verfahrens zur Identifizierung von sekretorischen Proteinen wurden 5'-ESTs der nachfolgenden Polypeptide, für die bekannt ist, dass sie sekretiert werden, erhalten: humanes Glukagon, Gamma-Interferon induzierter Monokin-Vorläufer, sekretiertes Cyclophilin-ähnliches Protein, humanes Pleiotropin und humaner Biotinidase-Vorläufer. Somit identifizierte das obige Verfahren erfolgreich diejenigen 5'-ESTs, die ein Signalpeptid codieren.
Um zu bestätigen, dass das Signalpeptid, das durch die 5'-ESTs codiert wird, tatsächlich als Signalpeptid wirkt, können die Signalsequenzen aus den 5'-ESTs in einen Vektor kloniert werden, der zur Identifizierung von Signalpeptiden konzipiert ist. Solche Vektoren sind so konzipiert, dass sie die Fähigkeit in Selektionsmedium zu wachsen, ausschließlich solchen Wirtszellen verleihen, welche einen Vektor mit einer operativen verknüpften Signalsequenz enthalten. Um zu bestätigen, dass ein 5'-EST für ein wirkliches Signalpeptid codiert, kann die Signalsequenz des 5'-ESTs beispielsweise stromaufwärts und im Leserahmen mit einer nicht sekretorischen Form des Hefe-Invertasegens in Vektoren zur Signalpeptidselektion insertiert werden, wie denjenigen Vektoren, die in US-Patent Nr. 5,536,637 beschrieben sind. Das Wachstum von Wirtszellen, die Vektoren zur Signalsequenzselektion mit der korrekt insertierten 5'-EST-Signalsequenz enthalten, bestätigt, dass das 5'-EST für ein echtes Signalpeptid codiert.
Alternativ kann das Vorliegen eines Signalpeptid durch Klonierung der erweiterten cDNA, die unter Verwendung der ESTs erhalten wurden, in Expressionsvektoren, wie beispielsweise pXT1 (wie in Beispiel 30 unten beschrieben) bestätigt werden oder durch Konstruktion von Promotor-Signalsequenz-Reportergen-Vektoren, die Fusionsproteine zwischen dem Signalpeptid und einem Assay-fähigen Reportergen codieren. Nach Einführung dieser Vektoren in eine geeignete Wirtszelle, wie beispielsweise COS-Zellen oder NIH 3T3-Zellen, kann das Wachstumsmedium geerntet werden und im Hinblick auf das Vorliegen des sekretierten Proteins analysiert werden. Das Medium aus diesen Zellen wird mit dem Medium aus Kontrollzellen verglichen, die Vektoren ohne die Signalsequenz oder das erweiterte cDNA-Insert enthalten, um Vektoren zu identifizieren, die für ein funktionales Signalpeptid oder ein authentisches sekretiertes Protein codieren.
Diejenigen 5'-ESTs, die für ein Signalpeptid codieren, wie durch das Verfahren gemäß Beispiel 22 oben bestimmt, wurden ferner auf Grundlage ihrer Homologie zu bekannten Sequenzen in vier Kategorien eingruppiert, wie in Beispiel 24 unten beschrieben wird.
Beispiel 24
Kategorisierung 5'-ESTs, welche für ein Signalpeptid codieren
Diejenigen 5'-ESTs mit einer Sequenz, die weder mit einer beliebigen bekannten Vertebratensequenz noch mit einer beliebigen, öffentlich zugänglichen EST-Sequenz übereinstimmten, wurden als „neu" bezeichnet. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 947 der 5'-ESTs mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
Diejenigen Diejenigen 5'-ESTs, die eine Sequenz aufwiesen, die mit keiner Vertebratensequenz übereinstimmten, aber mit einem öffentlich bekannten EST übereinstimmten, wurden als „EST-ext" bezeichnet, vorausgesetzt, dass die bekannte EST-Sequenz mindestens um 40 Nukleotide in 5'-Richtung erweitert war. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 150 der 5'-ESTs mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
Diejenigen ESTs, die mit keiner Vertebratensequenz übereinstimmten, jedoch mit einem öffentlich bekannten EST übereinstimmten, wobei das bekannte EST nicht mindestens 40 Nukleotide in 5'-Richtung erweitert war, wurden als „EST" bezeichnet. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 599 der 5'-ESTs mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
Diejenigen 5'-ESTs, die mit einer humanen mRNA-Sequenz übereinstimmten, aber die bekannte Sequenz um mindestens 40 Nukleotide in 5'-Richtung erweiterten, wurden als „VERT-ext" bezeichnet. Unter den Sequenzen in der SignalTag^TM-Datenbank fielen 23 der 5'-ESTs mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie. Von dieser Kategorie war ein 5'-EST umfasst, das die bekannte Sequenzen der humanen Translokase-mRNA um mehr als 200 Basen in 5'-Richtung erweiterte. Es wurde auch ein 5'-EST identifiziert, das die Sequenz eines humanen Tumorsuppressor-Gens in 5'-Richtung erweiterte.
Tabelle V zeigt die Verteilung von 5'-ESTs in jeder Kategorie und die Zahl an 5'-ESTs in jeder Kategorie mit einem bestimmten minimalen von Heijne-Score.
3. Bewertung räumlicher und zeitlicher Expression von mRNAs, die den 5'-ESTs oder den erweiterten cDNAs entsprachen
Jeder der 5'-ESTs wurde auf Grundlage des Gewebes, aus welchem die entsprechende mRNA erhalten worden war, auch kategorisiert, wie es in Beispiel 25 unten beschrieben wird.
Beispiel 25
Kategorisierung von Expressionsmustern
Tabelle VI zeigt die Verteilung von 5'-ESTs in jeder der oben definierten Kategorien im Hinblick auf das Gewebe, aus dem die 5'-ESTs der entsprechenden mRNA erhalten wurden.
Tabelle II stellt die Sequenzidentifizierungsnummer von 5'-EST-Sequenzen bereit, die Kategorien, unter welche diese Sequenzen fallen, und den von Heijne-Score des Signalpeptids, das für sie codiert. Die 5'-EST-Sequenz und die Aminosäuresequenzen, für welche sie codieren, sind im angefügten Sequenzprotokoll bereitgestellt. Tabelle III stellt die Sequenz-ID-Nummern des 5'-ESTs und die Sequenz der Signalpeptide bereit, für welche sie codieren. Die Sequenzen der 5'-ESTs und der Polypeptide, für welche sie codieren, werden im hieran angefügten Sequenzprotokoll bereitgestellt.
Die DNA-Sequenz SEQ ID NO: 38-291 kann auf einfache Weise nach beliebigen darin enthaltenen Fehlern gescreent werden und jede Zweideutigkeit bezüglich der Sequenz kann durch Resequenzierung beider Stränge eines Fragments, das solche Fehler oder Zweideutigkeiten enthält, aufgelöst werden. Solche Fragmente können aus den Plasmiden, die im Labor der Erfinder gelagert sind, erhalten werden oder können unter Verwendung der hierin beschriebenen Techniken isoliert werden. Die Auflösung jeglicher derartiger Zweideutigkeiten oder Fehler kann durch Verwendung von Primern erleichtert werden, die mit Sequenzen hybridisieren, die nahe der zweideutigen oder fehlerhaften Sequenzen lokalisiert sind. Beispielsweise können die Primer an Sequenzen innerhalb von 50–75 Basen im Bereich der Zweideutigkeit oder des Fehlers hybridisieren. Nach Auflösung eines Fehlers oder einer Zweideutigkeit können in den Proteinsequenzen, die durch die DNA codiert werden, die den Fehler oder die Zweideutigkeit enthält, entsprechende Korrekturen vorgenommen werden.
Zusätzlich zur Kategorisierung der 5'-ESTs können im Hinblick auf ihr Ursprungsgewebe sowohl die räumlichen und zeitlichen Expressionsmuster der mRNAs, die den 5'-ESTs entsprechen, als auch ihre Expressionsmengen, bestimmt werden, wie es in Beispiel 26 unten beschrieben wird. Die Charakterisierung der räumlichen und zeitlichen Expressionsmuster und Expressionsmengen dieser mRNAs ist bei der Konzeption von Expressionsvektoren nützlich, die in räumlich oder zeitabhängig gewünschter Weise zur Herstellung einer gewünschten Menge eines Genprodukts in der Lage sind, und wird unten ausführlicher diskutiert.
Darüber hinaus können auch 5'-ESTs identifiziert werden, deren entsprechende mRNAs mit Erkrankungszuständen verbunden sind. Beispielsweise kann eine bestimmte Krankheit aus einem Expressionsmangel, Überexpression oder Unterexpression einer mRNA, die einem 5'-EST entspricht, herrühren. Durch Vergleich der mRNA-Expressionsmuster und -mengen in Proben, die von gesunden Individuen entnommen wurden, mit Proben von Individuen, die unter einer bestimmten Krankheit leiden, können für diese Krankheit verantwortliche 5'-ESTs identifiziert werden.
Es wird erkannt, dass die Ergebnisse der obigen Charakterisierungsverfahren für 5'-ESTs auch auf erweiterte cDNAs (die wie unten beschrieben erhalten werden können) angewendet werden können, die Sequenzen enthalten, die zu den 5'-ESTs benachbart sind. Es wird auch erkannt, dass anstelle einer Charakterisierung der ESTs selbst die Charakterisierung aufgeschoben werden kann, bis erweiterte cDNAs erhalten worden sind.
Beispiel 26
Bewertung von Expressionsmengen und -mustern von mRNAs, die 5'-ESTs oder erweiterten cDNAs entsprechen
Expressionsmengen und -muster von mRNAs, die 5'-ESTs oder erweiterten cDNAs (die wie unten in Beispiel 27 beschrieben erhältlich sind) entsprechen, können durch Lösungshybridisierung mit langen Sonden analysiert werden, wie es in der internationalen Patentanmeldung Nr. WO 97/05277 beschrieben wird. In Kürze, ein 5'-EST, eine erweiterte cDNA oder ein Fragment davon welche dem Gen entsprechen, das für die zu charakterisierende mRNA codiert, wird in eine Klonierungsstelle unmittelbar stromabwärts von einem Bakteriophagen (T3, T7 oder SP6) RNA-Polymerasepromotor insertiert, um Antisense-RNA zu erzeugen. Vorzugsweise weist das 5'-EST oder die erweiterte cDNA 100 oder mehr Nukleotide auf. Das Plasmid wird linearisiert und in Gegenwart von Ribonukleotiden transkribiert, die modifizierte Ribonukleotide (d.h. Biotin-UTP und DIG-UTP) umfassen. Ein Überschuss dieser doppelt markierten RNA wird in Lösung mit mRNA hybridisiert, die aus Zellen oder Gewebe von Interesse isoliert wurde. Die Hybridisierungen wurden unter stringenten Standardbedingungen durchgeführt (40–50°C für 16 Stunden in 80% Formamid, 0,4 M NaCl-Puffer, pH 7–8). Die nicht hybridisierte Sonde wird durch Verdau mit Ribonukleasen, die für einzelsträngige RNA spezifisch sind (d.h. RNasen CL3, TI, Phy M, U2 oder A), entfernt. Das Vorliegen der Biotin-UTP-Modifikation ermöglicht das Einfangen des Hybrids auf einer mit Streptavidin beschichteten Mikrotitrationsplatte. Das Vorliegen der DIG-Modifikation ermöglicht es, das Hybrid zu detektieren und unter Verwendung eines anti-DIG-Antikörpers, der mit alkalischer Phosphatase gekoppelt ist, mittels ELISA zu quantifizieren.
Die 5'-ESTs, erweiterten cDNAs oder Fragmente davon können für eine serielle Analyse der Genexpression (SAGE) auch mit Nukleotidsequenz-Tags versehen werden, wie es in der UK-Patentanmeldung No. 2 305 241 A beschrieben wird. In diesem Verfahren werden cDNAs aus einer Zelle, aus Gewebe, aus einem Organismus oder einer anderen Nukleinsäurequelle, für welche die Genexpressionsmuster bestimmt werden müssen, hergestellt. Die resultierenden cDNAs werden in zwei Pools aufgeteilt. In jedem Pool werden die cDNAs mit einer ersten Restriktionsendonuklease gespalten, die als Anchoring-Enzym bezeichnet wird und die eine Erkennungsstelle aufweist, für die es wahrscheinlich ist, dass sie in den meisten cDNAs mindestens einmal vorkommt. Die Fragmente, die den 5'- oder 3'-Hauptabschnitt der gespaltenen cDNA enthalten, werden durch Binden an ein Einfangmedium, wie beispielsweise Streptavidinbeschichtete Beads, isoliert. Ein erster Oligonukleotidlinker mit einer ersten Sequenz zur Hybridisierung an einen Amplifizierungsprimer und einer internen Restriktionsstelle für eine so genannte Tagging-Endonuklease wird an die verdauten cDNAs im ersten Pool ligiert. Ein Verdau mit der zweiten Endonuklease erzeugt kurze Tagfragmente aus den cDNAs.
Ein zweites Oligonukleotid mit einer zweiten Sequenz zur Hybridisierung eines Amplifikationsprimers und einer internen Restriktionsstelle wird mit den verdauten cDNAs im zweiten Pool ligiert. Die cDNA-Fragmente im zweiten Pool werden auch mit der Tagging-Endonuklease verdaut, um kurze Tag-Fragmente zu erzeugen, die von den cDNAs im zweiten Pool abgeleitet sind. Die Tags, die sich aus dem Verdau des ersten und zweiten Pools mit dem Anchoring-Enzym und der Tagging-Endonuklease ergeben, werden miteinander ligiert, um so genannte Ditags zu bilden. In einigen Ausführungsformen werden die Ditags hinter einander angeordnet (concatamerisiert), um Ligationsprodukte zu erzeugen, die 2 bis 200 Ditags enthalten. Anschließend werden die Tag-Sequenzen bestimmt und mit den Sequenzen der 5'-ESTs oder erweiterten cDNAs verglichen, um zu bestimmen, welche 5'-ESTs oder erweiterten cDNAs in der Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle, von denen die Tags abgeleitet waren, exprimiert werden. Auf diese Weise wird das Expressionsmuster der 5'-ESTs oder erweiterten cDNAs in der Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle erhalten.
Eine quantitative Analyse der Genexpression kann auch unter Verwendung von Arrays durchgeführt werden. Wie hierin verwendet, bezeichnet der Ausdruck Array eine eindimensionale, zweidimensionale oder multidimensionale Anordnung von Volllängen-cDNAs (z.B. erweiterte cDNAs, welche die codierende Sequenz für das Signalpeptid, die codierende Sequenz für das reife Protein und ein Stopcodon umfassen), erweiterten cDNAs, 5'-ESTs oder Fragmenten davon, die eine ausreichende Länge aufweisen, um eine spezifische Detektion der Genexpression zu ermöglichen. Vorzugsweise sind die Fragmente mindestens 15 Nukleotide lang. Mehr bevorzugt sind die Fragmente mindestens 100 Nukleotide lang, mehr bevorzugt sind die Fragmente mehr als 100 Nukleotide lang. In einigen Ausführungsformen können die Fragmente mehr als 500 Nukleotide lang sein.
Eine quantitative Analyse der Genexpression kann beispielsweise wie unten beschrieben mit Volllängen-cDNAs, erweiterten cDNAs, 5'-ESTs oder Fragmenten davon in einem Komplementär-DNA-Mikroarray durchgeführt werden, wie er von Schena et al. (Science 270:467-470, 1995; Proc. Natl. Acad. Sci. U.S.A. 93:10614-10619, 1996) beschrieben wird. Volllängen-cDNAs, erweiterte cDNAs, 5'-ESTs oder Fragmente davon werden durch PCR amplifiziert und aus 96 Well-Mikrotiterplatten auf silylierte Mikroskopdeckgläser unter Verwendung von Hochgeschwindigkeitsrobotertechnik angeordnet. Gedruckte Arrays werden in einer Feuchtigkeitskammer inkubiert, um eine Rehydrierung der Arrayelemente zu ermöglichen, und einmal in 0,2% SDS für 1 min, zweimal in Wasser für 1 min und einmal für 5 min in Natriumborhydridlösung gespült. Die Arrays werden in Wasser für 2 min bei 95°C eingetaucht, für 1 min in 0,2% SDS überführt, zweimal mit Wasser gespült, luftgetrocknet und in der Dunkelheit bei 25 C gelagert.
Zell- oder Gewebe-mRNA wird isoliert oder kommerziell bezogen und Sonden werden durch eine einzelne Runde reverser Transkription hergestellt. Die Sonden werden auf 1 cm² Mikroarrays unter einem 14 × 14 Deckglas aus Glas für 6–12 Stunden bei 60°C hybridisiert. Die Arrays werden für 5 min bei 25°C in Waschpuffer mit schwacher Stringenz (1 × SSC/0,2% SDS) und anschließend für 10 min bei Raumtemperatur in Waschpuffer mit hoher Stringenz (0,1 × SSC/0,2% SDS) gewaschen. Die Arrays werden in 0,1 × SSC unter Verwendung einer Fluoreszenzlaser-Scanningvorrichtung, die mit einem maßgeschneiderten Filterset ausgestattet ist, gescannt. Durch Bilden des Durchschnitts für die Verhältnisse von zwei unabhängigen Hybridisierungen werden genaue differentielle Expressionsmessungen erhalten.
Eine quantitative Analyse der Expression von Genen kann auch mit Volllängen-cDNAs, erweiterten cDNAs, 5'-ESTs oder Fragmenten davon in Komplementär-DNA-Arrays durchgeführt werden, wie es von Pietu et al. (Genome Research 6:492-503, 1996) beschrieben wird. Die Volllängen-cDNAs, erweiterten cDNAs, 5'-ESTs oder Fragmente davon werden durch PCR amplifiziert und auf Membranen punktförmig aufgetragen. Anschließend werden mRNAs, die aus verschiedenen Geweben oder Zellen stammen, mit radioaktiven Nukleotiden markiert. Nach der Hybridisierung und Waschen unter kontrollierten Bedingungen werden die hybridisierten mRNAs durch Phospho-Imaging oder Autoradiographie detektiert. Die Experimente werden zweifach ausgeführt und anschließend wird eine quantitative Analyse differentiell exprimierter mRNAs durchgeführt.
Alternativ kann die Expressionsanalyse der 5'-ESTs oder erweiterten cDNAs über Nukleotidarrays mit hoher Dichte durchgeführt werden, wie es von Lockhart et al. (Nature Biotechnology 14: 1675-1680, 1996) und Sosnowsky et al. (Proc. Natl. Acad. Sci. 94:1119-1123, 1997) beschrieben wird. Oligonukleotide mit 15–50 Nukleotiden, die den Sequenzen der 5'-ESTs oder erweiterten cDNAs entsprechen, werden direkt auf dem Chip synthetisiert (Lockhard et al., supra) oder synthetisiert und anschließend an den Chip adressiert (Sosnowsky et al., supra). Vorzugsweise sind die Oligonukleotide etwa 20 Nukleotide lang.
Die cDNA-Sonden, die mit einer geeigneten Verbindung, wie beispielsweise Biotin, Digoxigenin oder einem fluoreszierenden Farbstoff markiert sind, werden aus der geeigneten mRNA-Population synthetisiert und anschließend auf Zufallsbasis zu einer Durchschnittsgröße von 50–100 Nukleotiden fragmentiert. Die Sonden werden anschließend auf dem Chip hybridisiert. Nach Waschen, wie es in Lockhard et al., supra, beschrieben wird, und Anlegen verschiedener elektrischer Felder (Sonowsky et al., supra) werden die Farbstoffe oder markierten Verbindungen detektiert und quantifiziert. Die Hybridisierungen werden zweifach durchgeführt. Eine vergleichende Analyse der Signalintensitäten, die von cDNA-Sonden auf demselben Zieloligonukleotid in verschiedenen cDNA-Proben stammen, zeigt eine differentielle Expression der mRNA, die dem 5'-EST oder der erweiterten cDNA entspricht, woraus die Oligonukleotidsequenz konzipiert wurde.
III. Verwendung von 5'-ESTs zur Klonierung erweiterter cDNAs sowie zur Klonierung entsprechender genomischer DNAs
Nachdem die 5'-ESTs, die das 5'-Ende der entsprechenden mRNAs enthalten, unter Verwendung der oben beschriebenen Verfahren selektiert wurden, können sie verwendet werden, um erweiterte cDNAs zu isolieren, die Sequenzen enthalten, die zu den 5'-ESTs benachbart sind. Die erweiterten cDNAs können die vollständige codierende Sequenz des Proteins enthalten, das durch die entsprechende mRNA codiert wird, einschließlich der authentischen Translationsstartstelle, der Signalsequenz und der Sequenz, die für das reife Protein codiert, das zurückbleibt, nachdem das Signalpeptid abgespalten wurde. Solche erweiterten cDNAs werden hierin als „Volllängen-cDNAs" bezeichnet. Alternativ können die erweiterten cDNAs nur die Sequenz enthalten, die für das reife Protein codiert, das zurückbleibt, nachdem das Signalpeptid abgespalten wurde, oder nur die Sequenz, die für das Signalpeptid codiert.
Beispiel 27 unten beschreibt ein allgemeines Verfahren zum Erhalten erweiterter cDNAs unter Verwendung von 5'-ESTs. Beispiel 28 unten stellt unter Verwendung des in Beispiel 27 beschriebenen Verfahrens experimentelle Ergebnisse zur Verfügung, die einige erweiterte cDNAs beschreiben, einschließlich der vollständigen codierenden Sequenz und des authentischen 5'-Endes der entsprechenden mRNA für einige sekretierte Proteine.
Die Verfahren gemäß der Beispiele 27, 28 und 29 können auch verwendet werden, um erweiterte cDNAs zu erhalten, die für weniger als die vollständige codierende Sequenz der sekretierten Proteine codieren, die durch die Gene, die den 5'-ESTs entsprechen, codiert werden. In einigen Ausführungsformen codieren die gemäß diesem Verfahren isolierten cDNAs für mindestens 10 Aminosäuren des Proteins, das durch die Sequenz gemäß SEQ ID NO: 38-291 codiert wird. In weiteren Ausführungsformen codieren die erweiterten cDNAs für mindestens 20 Aminosäuren des Proteins, das durch die Sequenz gemäß SEQ ID NO: 38-291 codiert wird. In weiteren Ausführungsformen codieren die erweiterten cDNAs für mindestens 30 Aminosäuren der Sequenz gemäß SEQ ID NO: 38-291. In einer bevorzugten Ausführungsform codieren die erweiterten cDNAs für eine Volllängen-Proteinsequenz, welche die Protein codierende Sequenz gemäß SEQ ID NO: 38-291 umfasst.
Beispiel 27
Allgemeines Verfahren zur Verwendung von 5'-ESTs zur Klonierung und Sequenzierung von cDNAs, welche die vollständige codierende Region und das authentische 5'-Ende der entsprechenden mRNA umfassen
Das folgende allgemeine Verfahren wurde verwendet, um erweiterte cDNAs schnell und effizient zu isolieren, die sowohl die authentischen 5'-Enden ihrer entsprechenden mRNAs als auch die vollständige proteincodierende Sequenz aufweisen und die Sequenz umfassen, die neben den Sequenzen der 5'-ESTs liegt, welche zu deren Erhaltung die verwendet wurden. Dieses Verfahren kann auf erweiterte cDNAs für ein beliebiges 5'-EST in der NetGene^TM-Datenbank angewandt werden, einschließlich solcher 5'-ESTs, die für Polypeptide codieren, die zu sekretierten Proteinen gehören. Dieses Verfahren ist in 3 zusammengefasst.
I. Erhalten erweiterter cDNAs
a) Erststrangsynthese
Dieses Verfahren zieht seinen Vorteil aus der bekannten 5'-Sequenz der mRNA. Eine reverse Transkriptionsreaktion wird mit gereinigter mRNA mit einem Poly 14dT-Primer durchgeführt, der eine 49 Nukleotidsequenz an seinem 5'-Ende enthält, wobei die Reaktion die Addition einer bekannten Sequenz an das Ende der cDNA ermöglicht, die dem 3'-Ende der mRNA entspricht. Beispielsweise kann der Primer die folgende Sequenz aufweisen: 5'-ATC GTT GAG ACT CGT ACC AGC AGA GTC ACG AGA GAG ACT ACA CGG TAC TGG TTT TTT TTT TTT TTVN-3' (SEQ ID NO: 14). Der Fachmann erkennt, dass auch andere Sequenzen an die Poly dT-Sequenz addiert und verwendet werden können, um die Erststrangsynthese zu starten. Unter Verwendung dieses Primers und einer Reversen Transkriptase, wie beispielsweise dem Enzym Superscript II(Gibco BRL) oder Rnase H Minus M-MLV (Promega), wird ein reverses Transkript erzeugt, das an der 3'-PolyA-Stelle der RNAs verankert ist.
Nach Entfernung der an den cDNA-Erststrang hybridisierten mRNA durch alkalische Hydrolyse werden die Produkte der alkalischen Hydrolyse und der verbleibende Poly dT-Primer durch eine Ausschluss-Säule, wie beispielsweise einer AcA34 (Biosepra)-Matrix, entfernt, wie es in Beispiel 11 erläutert wird.
b) Zweitstrangsynthese
An jedem Ende wird auf Grundlage der bekannten 5'-Sequenz des 5'-ESTs und des bekannten 3'-Endes, das durch den während der Erststrangsynthese verwendeten Poly dT-Primer hinzugefügt wurde, ein Paar von Nested-Primern (verschachtelten Primern) konzipiert. Softwareprogramme, die zur Konzeption von Primern verwendet werden, basieren entweder auf dem GC-Gehalt und den Schmelztemperaturen von Oligonukleotiden, wie beispielsweise OSP (Illier und Green, PCR Meth. Appl. 1:124-128, 1991), oder beruhen auf dem Oktamerhäufigkeits-Disparitätsverfahren („octamer frequency disparity method") (Griffais et al., Nucleic Acids Res. 19:3887-3891, 1991), wie beispielsweise PC-Rare (http://bioinformatics.weizmann.ac.il/software/PC-Rare/doc/manuel.html).
Vorzugsweise sind die Nested-Primer am 5'-Ende durch vier bis neun Basen voneinander getrennt. Die 5'-Primersequenzen können im Hinblick darauf ausgewählt werden, dass sie Schmelztemperaturen und Spezifitäten aufweisen, die zur Verwendung in PCR-Reaktionen geeignet sind.
Vorzugsweise sind die Nested-Primer am 3'-Ende durch vier bis neun Basen voneinander getrennt. Beispielsweise können die Nested-3'-Primer die folgenden Sequenzen aufweisen: (5'-CCA GCA GAG TCA CGA GAG AGA CTA CAC GG-3' (SEQ ID NO: 15) und 5'-CAC GAG AGA GAC TAC ACG GTA CTG G-3' (SEQ ID NO: 16). Diese Primer wurden ausgewählt, da sie Schmelztemperaturen und Spezifitäten aufweisen, die mit ihrer Verwendung in PCR-Reaktionen kompatibel sind. Der Fachmann erkennt jedoch, dass auch andere Sequenzen als Primer verwendet werden können.
Der erste PCR-Lauf mit 25 Zyklen wird unter Verwendung des Advantage Tth Polymerase Mix (Clontech) und dem äußeren Primer von jedem der Nested-Paare durchgeführt. Anschließend wird eine zweite PCR-Reaktion mit 20 Zyklen unter Verwendung desselben Enzyms und dem inneren Primer von jedem der Nested-Paare mit 1/2500 des ersten PCR-Produkts durchgeführt. Danach werden die Primer und die Nukleotide entfernt.
2. Sequenzierung von erweiterten cDNAs mit voller Länge oder Fragmenten davon
Aufgrund des Fehlens von Positionsbeschränkungen bei der Konzeption der zur PCR-Verwendung geeigneten 5'-Nested-Primer werden unter Verwendung der OSP-Software zwei Typen von Amplicons erhalten. Vorzugsweise ist der zweite 5'-Primer stromaufwärts vom Translationsinitationscodon lokalisiert und ergibt so ein Nested-PCR-Produkt, das die vollständige codierende Sequenz enthält. Eine derartige erweiterte cDNA mit voller Länge wird direkt einem Klonierungsverfahren unterzogen, wie es in Abschnitt a beschreiben ist. In einigen Fällen ist der zweite 5'-Primer jedoch stromabwärts vom Translationsinitationscodon lokalisiert und führt so zu einem PCR-Produkt, das nur einen Teil des ORF enthält. Derartige unvollständige PCR-Produkte werden einem modifiziertem Verfahren, das in Abschnitt b beschrieben wird, unterzogen.
a) Nested PCR-Produkte, die vollständige ORFs enthalten
Wenn das resultierende Nested PCR-Produkt die vollständige codierende Sequenz enthält, wie es aus der 5'-EST-Sequenz vorhergesagt ist, wird es, wie es in Abschnitt 3 beschrieben wird, in einen geeigneten Vektor kloniert, wie beispielsweise pED6depc2.
b) Nested PCR-Produkte, die unvollständige ORFs enthalten
Wenn das Amplicon nicht die vollständige codierende Sequenz enthält, sind Zwischenschritte notwendig, um sowohl die vollständige codierende Sequenz als auch ein PCR-Produkt, das die vollständige codierende Sequenz enthält, zu erhalten. Die vollständige codierende Sequenz kann aus mehreren Teilsequenzen zusammengesetzt werden, die aus verschiedenen PCR-Produkten direkt bestimmt werden, wie es im folgenden Abschnitt beschrieben wird.
Nachdem die vollständige codierende Sequenz vollständig bestimmt worden ist, werden neue Primer, die zur PCR-Verwendung kompatibel sind, konzipiert, um Amplicons zu erhalten, welche die vollständige codierende Region umfassen. In solchen Fällen sind jedoch zur PCR-Verwendung kompatible 3'-Primer innerhalb der 3'UTR der entsprechenden mRNA lokalisiert und führen so zu Amplicons, denen ein Teil dieser Region fehlt, d.h. der PolyA-Teil und manchmal das Polyadenylierungssignal, wie es in 3 dargestellt ist. Solche erweiterten cDNAs mit voller Länge werden wie in Abschnitt 3 beschrieben anschließend in einen geeigneten Vektor kloniert.
c) Sequenzierung erweiterter cDNAs
Die Sequenzierung erweiterter cDNAs wird unter Verwendung eines Matritzen-Terminator-Ansatzes („Die Terminator approach") mit dem AmpliTaq-DNA-Polymerase FS Kit, der von Perkin Elmer erhältlich ist, durchgeführt.
Um die PCR-Fragmente zu sequenzieren wird Primer-Walking durchgeführt, wobei zur Auswahl der Primer Software, wie beispielsweise OSP und automatisierte Computersoftware wie etwa ASMG (Sutton et al., Genome Science Technol., 1:9-19, 1995) verwendet wird, um Contigs der Walking-Sequenzen zu konstruieren, wobei einschließlich des 5'-Tags am Start minimale Überlappungen von 32 Nukleotiden verwendet werden. Vorzugsweise wird das Primer-Walking solange durchgeführt, bis die Sequenzen der Volllängen-cDNAs erhalten werden.
Der Abschluss der Sequenzierung eines bestimmten erweiterten cDNA-Fragments wird wie folgt festgestellt. Da die Sequenzen, die nach dem PolyA-Teil lokalisiert sind, im Falle nicht klonierter Produkte nur schwer genau zu bestimmen sind, werden Verfahren zur Sequenzierung und zum Primer-Walking für PCR- Produkte unterbrochen, wenn ein PolyA-Teil in erweiterten cDNAs identifiziert wird, wobei die cDNAs erhalten wurden, wie es in Fall b beschrieben wird. Die Sequenzlänge wird mit der Größe des Nested PCR-Produkts verglichen, das wie oben beschrieben erhalten wurde. Aufgrund der beschränkten Genauigkeit der Bestimmung der PCR-Produktgröße durch Gelelektrophorese wird eine Sequenz dann als vollständig angesehen, wenn die Größe der erhaltenen Sequenz mindestens 70% der Größe des ersten Nested PCR-Produkts beträgt. Wenn die Länge der durch Computeranalyse bestimmten Sequenz nicht mindestens 70% der Länge des Nested PCR-Produkts beträgt, werden diese PCR-Produkte kloniert und die Sequenz der Insertion wird bestimmt. Wenn Northern Blot-Daten zur Verfügung stehen, wird die Größe der mRNA, die für ein bestimmtes PCR-Produkt detektiert wurde, verwendet, um abschließend zu bewerten, ob die Sequenz vollständig ist. Sequenzen, welche die obigen Kriterien nicht erfüllen, werden verworfen und einem neuen Isolierungsverfahren unterzogen.
Die Sequenzdaten aller erweiterten cDNAs werden anschließend auf eine proprietäre Datenbank überführt, wo Schritte zur Qualitätskontrolle und Validierung durchgeführt werden, wie es in Beispiel 15 beschrieben wird.
3. Klonierung von erweiterten cDNAs mit voller Länge
Das die vollständige codierende Sequenz enthaltende PCR-Produkt wird anschließend in einen geeigneten Vektor kloniert. Beispielsweise können die erweiterten cDNAs in den Expressionsvektor pED6dpc2 (DiscoverEase, Genetics Institute, Cambridge, MA) wie folgt kloniert werden. Die pED6dpc2-Vektor-DNA wird durch Durchführen eines EcoRI-Verdaus, woran sich eine Auffüllreaktion anschließt mit glatten Enden bereitgestellt. Der Vektor mit glatten Enden wird dephosphoryliert. Nach Entfernung der PCR-Primer und Ethanolpräzipitation wird das PCR-Produkt, das die vollständige codierende Sequenz oder die erweiterte cDNA wie oben beschrieben enthält, mit einer Kinase phosphoryliert, die anschließend durch Phenol-Sevag-Extraktion und Präzipitiation entfernt wird. Die doppelsträngige erweiterte cDNA wird anschließend in den Vektor ligiert und das resultierende Expressionsplasmid wird in geeignete Wirtszellen eingeführt.
Da die wie oben beschrieben erhaltenen PCR-Produkte Moleküle mit glatten Enden sind, die in beiden Richtungen kloniert werden können, wird für jedes PCR-Produkt die Orientierung mehrerer Klone bestimmt. Anschließend werden 4 bis 10 Klone in Mikrotiterplatten angeordnet und einer PCR-Reaktion unterzogen, wobei ein erster Primer verwendet wird, der nahe der Klonierungsstelle im Vektor lokalisiert ist, und ein zweiter Primer verwendet wird, der in dem Abschnitt der erweiterten cDNA lokalisiert ist, der dem 3'-Ende der mRNA entspricht. Dieser zweite Primer kann im Fall von direkter Klonierung (Fall a) der Antisense-Primer sein, der in der Anchored-PCR-Reaktion verwendet wurde, oder im Fall indirekter Klonierung (Fall b) der Antisense-Primer, der innerhalb der 3'UTR lokalisiert ist. Klone, in welchen das Startcodon der erweiterten cDNA operativ mit dem Promotor im Vektor verknüpft sind, um so die Expression des durch die erweiterte cDNA codierten Proteins zu ermöglichen, werden aufbewahrt und sequenziert. Zusätzlich zu den Enden der cDNA-Inserts werden auch etwa 50 bp Vektor-DNA auf jeder Seite des cDNA-Inserts sequenziert.
Die klonierten PCR-Produkte werden anschließend gemäß dem zuvor beschriebenen Verfahren vollständig sequenziert. In diesem Fall wird anschließend eine Anordnung langer Fragmente zu Contigs („Contigation") hinsichtlich von Walking-Sequenzen durchgeführt, die bereits für nicht klonierte PCR-Produkte während des Primerwanderns contigiert worden waren. Die Sequenzierung der klonierten Amplicons ist abgeschlossen, wenn die resultierenden Contigs sowohl die vollständige codierende Region als auch überlappende Sequenzen mit Vektor-DNA an beiden Enden umfassen.
4. Computeranalyse von erweiterter cDNA mit voller Länge
Sequenzen von erweiterten cDNAs mit voller Länge werden, wie unten beschrieben, einer weiteren Analyse unterzogen. Bevor die erweiterten cDNAs mit voller Länge nach Sequenzen von Interesse durchsucht werden, werden erweiterte cDNAs, die nicht von Interesse sind (Vektor-RNAs, Transfer-RNAs, ribosomale RNAs, mitochondrielle RNAs, prokaryotische RNAs und RNAs aus Pilzen), unter Verwendung von Verfahren, die im Wesentlichen ähnlich zu denen sind, die für 5'-ESTs in Beispiel 18 beschrieben wurden, verworfen.
a) Identifizierung struktureller Merkmale
Strukturelle Merkmale, z.B. PolyA-Schwanz und Polyadenylierungssignal, der Sequenzen der erweiterten cDNAs mit voller Länge werden anschließend wie folgt bestimmt.
Ein PolyA-Schwanz ist als homopolymerer Abschnitt von mindestens 11 A mit höchstens einer alternativen Base darin definiert. Die Suche nach einem PolyA-Schwanz ist auf die letzten 100 Nukleotide der Sequenz begrenzt und auf Abschnitte mit 11 aufeinander folgenden A beschränkt, da Sequenzierungsreaktionen nach einem solchen PolyA-Abschnitt oft nicht lesbar sind. Abschnitte mit mehr als 90% Homologie über 8 Nukleotide hinweg werden unter Verwendung von BLAST2N als PolyA-Schwänze identifiziert.
Um nach einem Polyadenylierungssignal zu suchen, wird der PolyA-Schwanz von der Volllängensequenz abgetrennt. Die 50 bp, die dem PolyA-Schwanz vorausgehen, werden als erstes nach dem kanonischen Polyadenylierungssignal AAUAAA durchsucht und wenn das kanonische Signal nicht detektiert wird, werden sie nach dem alternativen AUUAAA-Signal durchsucht (Sheets et al., Nuc. Acids Res. 18:5799-5805, 1990). Wenn keines dieser beiden Konsensus-Polyadenylierungssignale nachgewiesen wird, wird das kanonische Motiv erneut durchsucht, wobei eine Nichtübereinstimmung zugelassen wird, um möglichen Sequenzierungsfehlern Rechnung zu tragen. Mehr als 85% der identifizierten Polyadenylierungssignale beider Typen enden tatsächlich 10 bis 30 bp vom PolyA-Schwanz entfernt. Die alternativen AUUAAA-Signale stellen etwa 15% der Gesamtzahl der identifizierten Polyadenylierungssignale dar.
b) Identifizierung funktioneller Merkmale
Funktionelle Merkmale, z.B. ORFs und Signalsequenzen, der Sequenzen der erweiterten cDNAs mit voller Länge wurden anschließend wie folgt bestimmt.
Die 3 Leserahmen im oberen Strang erweiterter cDNAs werden nach ORFs durchsucht, die als die Fragmente mit maximaler Länge definiert sind, die mit einem Translationsinitatinoscodon beginnen und mit einem Stopcodon enden. ORFs, die mindestens 20 Aminosäuren codieren, sind bevorzugt.
Jeder nachgewiesene ORF wird anschließend auf das Vorliegen eines Signalpeptids in den ersten 50 Aminosäuren oder wo angebracht ist in kürzeren Regionen bis hin zu 20 Aminosäuren oder weniger im ORF unter Verwendung des Matrixverfahrens nach von Heijne (Nuc. Acids Res. 14:4683-4690, 1986) durchsucht, wie es in Beispiel 22 beschrieben wird.
c) Homologie entweder zu Nukleotid- oder Proteinsequenzen
Eine Kategorisierung von Volllängen-Sequenzen kann unter Verwendung von Verfahren, die im Wesentlichen zu denjenigen ähnlich sind, die in Beispiel 24 für 5'-ESTs beschrieben wurden, erreicht werden.
Erweiterte cDNAs, die wie oben beschrieben hergestellt wurden, können anschließend bearbeitet werden, um Nukleinsäuren zu erhalten, die gewünschte Abschnitte der erweiterten cDNA umfassen, wobei herkömmliche Techniken, wie beispielsweise Subklonierung, PCR oder in vitro-Oligonukleotidsynthese verwendet werden. Beispielsweise können Nukleinsäuren, die nur die vollständig codierenden Sequenzen umfassen (d.h. die Sequenzen, die für das Signalpeptid und das reife Protein codieren, das zurückbleibt, nachdem das Signalpeptid abgespalten worden ist), unter Verwendung von dem Fachmann bekannten Techniken erhalten werden. Alternativ können herkömmliche Techniken verwendet werden, um Nukleinsäuren zu erhalten, die nur die codierenden Sequenzen für das reife Protein enthalten, das zurückbleibt, wenn das Signalpeptid abgespalten wurde, oder um Nukleinsäuren zu erhalten, die nur die codierenden Sequenzen für die Signalpeptide enthalten.
In gleicher Weise können Nukleinsäuren, die einen anderen beliebigen Abschnitt der für das sekretierte Protein codierenden Sequenzen enthalten, erhalten werden. Beispielsweise kann die Nukleinsäure mindestens 10 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise eine der hierin unten beschriebenen erweiterten cDNAs. In einer anderen Ausführungsform kann die Nukleinsäure mindestens 15 aufeinander folgende Basen einer erweiterten cDNA, enthalten, wie beispielsweise einer der unten beschriebenen erweiterten cDNAs. Alternativ kann die Nukleinsäure mindestens 20 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise einer der unten beschriebenen erweiterten cDNAs. In einer anderen Ausführungsform kann die Nukleinsäure mindestens 25 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise einer der unten beschriebenen erweiterten cDNAs. In noch einer anderen Ausführungsform kann die Nukleinsäure mindestens 40 aufeinander folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise einer der unten beschriebenen erweiterten cDNAs.
Nachdem eine erweiterte cDNA erhalten wurde, kann sie sequenziert werden, um die Aminosäuresequenz zu bestimmen, für die sie codiert. Nachdem die codierte Aminosäuresequenz einmal bestimmt worden ist, kann jede der vielen denkbaren cDNAs, die für das Protein codieren, durch einfache Anwendung der Degeneration des genetischen Codes erzeugt und identifiziert werden. Beispielsweise können allelische Varianten und andere homologe Nukleinsäuren, wie unten beschrieben, identifiziert werden. Alternativ können die Nukleinsäuren, welche die gewünschte Aminosäuresequenz codieren, in vitro synthetisiert werden.
In einer bevorzugten Ausführungsform kann die codierende Sequenz unter Verwendung der bekannten Codon- und Codonpaar-Präferenzen des Wirtsorganismus, in dem die cDNA exprimiert werden soll, ausgewählt werden.
Die aus den erfindungsgemäßen 5'-ESTs abgeleiteten erweiterten cDNAs wurden wie in Beispiel 28 unten beschrieben erhalten.
Beispiel 28
Charakterisierung von klonierten erweiterten cDNAs, die unter Verwendung von 5'-ESTs erhalten wurden
Das oben in Beispiel 27 beschriebene Verfahren wurden verwendet, um die erweiterten cDNAs, die von den hierin beschriebenen 5'-ESTs für eine Vielfalt von Geweben abgeleitet wurden, zu erhalten. Die folgende Liste stellt einige Beispiele der so erhaltenen erweiterten cDNAs zusammen.
Unter Verwendung dieses Ansatzes wurde die Volllängen-cDNA gemäß SEQ ID NO: 17 erhalten (interne Identifizierungsnummer 48-19-3-G1-FL1). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und codiert das Signalpeptid MKKVLLLITAILAVAVG (SEQ ID NO: 18) mit einem von Heijne-Score von 8.2.
Die Volllängen-cDNA gemäß SEQ ID NO: 19 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten (interne Identifizierungsnummer 58-34-2-E7-FL2). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und codiert das Signalpeptid MWWFQQGLSFLPSALVIWTSA (SEQ ID NO: 20) mit einem von Heijne-Score von 5.5.
Eine andere unter Verwendung des oben beschriebenen Verfahrens erhaltene Volllängen-cDNA weist die Sequenz gemäß SEQ ID NO: 21 auf (interne Identifizierungsnummer 51-27-1-E8-FL1). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und codiert das Signalpeptid MVLTTLPSANSANSPVNMPTTGPNSLSYASSALSPCLT (SEQ ID NO: 22) mit einem von Heijne-Score von 5.9.
Das obige Verfahren wurde ebenfalls verwendet, um eine Volllängen-cDNA mit der Sequenz gemäß SEQ ID NO: 23 zu erhalten (interne Identifizierungsnummer 76-4-1-G5-FL1). Diese cDNA fällt in die oben beschriebene „EST-ext" Kategorie und codiert das Signalpeptid ILSTVTALTFAXA (SEQ ID NO: 24) mit einem von Heijne-Score von 5.5.
Die Volllängen-cDNA gemäß SEQ ID NO: 25 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten (interne Identifizierungsnummer 51-3-3-B10-FL3). Diese cDNA fällt in die oben beschriebene Kategorie „neu" und codiert ein Signalpeptid LVLTLCTLPLAVA (SEQ ID NO: 26) mit einem von Heijne-Score von 10.1.
Die Volllängen-cDNA gemäß SEQ ID NO: 27 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten (interne Identifizierungsnummer 58-35-2-F10-FL2). Diese cDNA fällt in die oben beschriebene Kategorie „neu" und codiert ein Signalpeptid LWLLFFLVTAIHA (SEQ ID NO: 28) mit einem von Heijne-Score von 10.7.
Bakterienklone, die Plasmide enthalten, welche die oben beschriebenen Volllängen-cDNAs enthalten, werden gegenwärtig in den Laboren des Erfinders unter den oben bereitgestellten internen Identifizierungsnummern gelagert. Die Inserts können aus den gelagerten Materialien durch Anzucht eines Aliquots des entsprechenden Bakterienklons im geeigneten Medium gewonnen werden. Anschließend kann die Plasmid-DNA unter Verwendung von dem Fachmann bekannten Verfahren zur Plasmidisolierung, wie beispielsweise alkalische Lyse von Minipreps oder alkalische Lyse im Großmaßstab als Verfahren zur Plasmidisolierung, isoliert werden. Wenn gewünscht, kann die Plasmid-DNA ferner mittels Zentrifugation auf einem Cäsiumchloridgradienten, Größenausschlusschromatografie oder Anionenaustauschchromatografie weiter angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden. Alternativ kann eine PCR mit Primern, die hinsichtlich beider Enden der cDNA-Insertion konzipiert sind, durchgeführt werden. Das der cDNA entsprechende PCR-Produkt kann anschließend unter Verwendung von dem Fachmann vertrauten Standardklonierungstechniken manipuliert werden.
Die durch die erweiterten cDNAs codierten Polypeptide können auf das Vorliegen bekannter struktureller oder funktioneller Motive oder auf das Vorliegen von Signaturen, kleiner Aminosäuresequenzen, die unter den Mitgliedern einer Proteinfamilie konserviert sind, durchsucht werden. Die konservierten Regionen sind verwendet worden, um Konsensusmuster oder Matrizen abzuleiten, die in der PROSITE-Datenbank erfasst sind, insbesondere die Datei Prosite.dat (Version 13.0 vom November 1995, die sich unter http://expasy.hcuge.ch/sprot/prosite.html befindet). Die Programme Prosite_convert und Prosite_scan (http://ulrec3.unil.ch/ftpserveur/prosite_scan) können verwendet werden, um Signaturen auf erweiterten cDNAs zu finden.
Für jedes Muster, das mit dem Prosite_convert-Programm aus der Prosite.dat-Datei erhalten wurde, kann die Genauigkeit der Detektion einer neuen Proteinsequenz durch Bewertung der Häufigkeit irrelevanter Treffer im Hinblick auf die Population humaner sekretierter Proteine, die von der SWISSPROT-Datenbank umfasst sind, beurteilt werden. Das Verhältnis zwischen der Trefferzahl im Hinblick auf verschobene bzw. durcheinander gemischte Proteine (mit einer Fenstergröße von 20 Aminosäuren) und der Trefferzahl Hinblick auf native (nicht verschobene bzw. durcheinander gemischte) Proteine kann als Index verwendet werden. Jedes Muster, für das das Verhältnis größer als 20% ist (ein Treffer in Bezug auf verschobene Proteine gegenüber 5 Treffern in Bezug auf native Proteine) kann während der Suche mit Prosite_scan übergangen werden. Das Programm, das verwendet wurde, um Proteinsequenzen zu verschieben (db_shuffled) und das Programm, das verwendet wurde, um Statistiken für jedes Muster in den Proteindatenbanken zu bestimmen (Prosite_statistics), stehen auf der ftp-Seite httpa/ulrec3.unil.ch/ftpserveur/prosite_scan zur Verfügung.
Zusätzlich zu den auf PCR basierenden Verfahren zum Erhalten erweiterter cDNAs können auch traditionelle Verfahren auf Grundlage von Hybridisierung verwendet werden. Diese Verfahren können auch verwendet werden, um genomische DNAs zu erhalten, die für mRNAs codieren, von denen die 5'-ESTs abgeleitet sind, mRNAs, die den erweiterten cDNAs entsprechen oder Nukleinsäuren, die zu den erweiterten cDNAs oder 5'-ESTs homolog sind. Beispiel 29 stellt unten Beispiele für solche Verfahren bereit.
Beispiel 29
Verfahren zum Erhalten von cDNAs, welche die vollständige codierende Region und das authentische 5'-Ende der entsprechenden mRNA umfassen
Eine Volllängen-cDNA-Bibliothek kann unter Verwendung der Strategien, die in den Beispielen 13,14,15 und 16 oben beschrieben sind, durch Austausch des in Beispiel 14 verwendeten willkürlichen Nonamers mit einem Oligo-dT-Primer hergestellt werden. Beispielsweise kann das Oligonukleotid gemäß SEQ ID NO: 14 verwendet werden.
Alternativ kann eine cDNA-Bibliothek oder genomische DNA-Bibliothek von einer kommerziellen Bezugsquelle bezogen oder durch Verwendung von dem Fachmann bekannten Techniken hergestellt werden. Solche cDNA- oder genomische DNA-Bibliotheken können wie folgt verwendet werden, um erweiterte cDNAs zu isolieren, die aus einem 5'-EST oder von zu den erweiterten cDNAs oder 5'-ESTs homologen Nukleinsäuren erhalten wurden. Die cDNA-Bibliothek oder genomische DNA-Bibliothek wird mit einer detektierbaren Sonde hybridisiert, die mindestens 10 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA umfasst, wobei herkömmliche Techniken verwendet werden. Vorzugsweise umfasst die Probe mindestens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA. Mehr bevorzugt umfasst die Probe mindestens 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA. In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide des 5'-ESTs oder der erweiterten cDNA.
Techniken zur Identifizierung von cDNA-Klonen in einer cDNA-Bibliothek, die mit einer bestimmten Sondensequenz hybridisieren, sind in Sambrook et al., Molecular Cloning: A Laboratory Manual 2. Ausgabe, Cold Spring Harbor Laboratory Press, 1989, offenbart. Die gleichen Techniken können verwendet werden, um genomische DNAs zu isolieren.
In Kürze, cDNA- oder genomische DNA-Klone, die an die detektierbare Sonde hybridisieren, werden identifiziert und zur weiteren Manipulierung wie folgt isoliert. Eine Sonde, die mindestens 10 aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA umfasst, wird mit einer detektierbaren Markierung, wie beispielsweise einem Radioisotop oder einem Fluoreszenzmolekül, markiert. Die Probe umfasst vorzugsweise mindestens 12, 15 oder 17 aufeinander folgende Nukleotide aus dem 5'-EST oder der erweiterten cDNA. Mehr bevorzugt umfasst die Sonde 20 bis 30 aufeinander folgende Nukleotide aus dem 5'-EST oder der erweiterten cDNA. In einigen Ausführungsformen umfasst die Probe mehr als 30 Nukleotide aus dem 5'-EST oder der erweiterten cDNA.
Techniken zur Markierung der Sonde sind allgemein bekannt und umfassen Phosphorylierung mit Polynukleotidkinase, Nick-Translation, in vitro-Transkription und nicht radioaktive Techniken. Die cDNAs oder genomischen DNAs in der Bibliothek werden auf Nitrocellulose- oder Nylonfilter überführt und denaturiert. Nach Blockierung unspezifischer Stellen wird der Filter mit der markierten Sonde für eine ausreichende Zeitspanne inkubiert, um das Binden der Sonde an cDNAs oder genomische DNAs, die eine Sequenz enthalten, die daran hybridisieren kann zu ermöglichen.
Durch Verändern der Stringenz der Hybridisierungsbedingungen, die verwendet werden, um erweiterte cDNAs oder genomische DNAs, die an die detektierbare Sonde hybridisieren, zu identifizieren, können erweiterte cDNAs mit unterschiedlichen Graden von Homologie gegenüber der Sonde identifiziert und isoliert werden, wobei dies unten beschrieben wird.
1. Identifizierung erweiterter cDNA- oder genomischer cDNA-Sequenzen mit einem hohen Maß an Homologie zur markierten Sonde
Um die erweiterten cDNAs oder genomischen DNAs mit einem hohen Grad an Homologie zur Sondensequenz zu identifizieren, kann die Schmelztemperatur der Sonde unter Verwendung der folgenden Formel berechnet werden: Für Sonden mit einer Länge zwischen 14 und 70 Nukleotiden wird die Schmelztemperatur (Tm) unter Verwendung der Gleichung Tm = 81,5 + 16,6(log [Na⁺]) + 0,41 (Fraktion G + C) – (600/N) berechnet, wobei N die Länge der Sonde ist.
Wenn die Hybridisierung in einer Formamid-haltigen Lösung durchgeführt wird, kann die Schmelztemperatur unter Verwendung der Gleichung Tm = 81,5 + 16,6(log[Na⁺]) + 0,41 (Fraktion G + C) – (0,63% Formamid) – (600/N) berechnet werden, wobei N die Länge der Sonde ist.
Eine Vorhybridisierung kann in 6 × SSC, 5 × Denhardt-Reagenz, 0,5% SDS, 100 μg denaturierter fragmentierter Lachssperma-DNA oder 6 × SSC, 5 × Denhardt-Reagenz, 0,5% SDS, 100 μg denaturierter fragmentierter Lachssperma-DNA, 50% Formamid durchgeführt werden. Die Rezepte für SSC und Denhardt-Lösungen sind in Sambrook et al., supra, aufgeführt.
Die Hybridisierung wird durch Zugabe der detektierbaren Sonde zu den oben aufgeführten Vorhybridisierungslösungen durchgeführt. Wenn die Sonde eine doppelsträngige DNA umfasst, wird sie vor der Zugabe zur Hybridisierungslösung denaturiert. Der Filter wird mit der Hybridisierungslösung für eine ausreichend lange Zeitspanne in Kontakt gebracht, um es der Sonde zu ermöglichen, an erweiterte cDNAs oder genomische DNAs, die zur Sonde komplementäre Sequenzen oder Homologe enthalten, zu hybridisieren. Für Sonden mit einer Länge von über 200 Nukleotiden kann die Hybridisierung 15–25°C unterhalb des Tm durchgeführt werden. Für kürzere Sonden, wie beispielsweise Oligonukleotidsonden, kann die Hybridisierung 15–25°C unterhalb des Tm durchgeführt werden. Für Hybridisierungen in 6 × SSC wird die Hybridisierung vorzugsweise bei etwa 68°C ausgeführt. Für Hybridisierungen in 50% Formamid enthaltenden Lösungen wird die Hybridisierung vorzugsweise bei etwa 42°C ausgeführt.
Alle vorausgehenden Hybridisierungen werden als „stringente" Bedingungen betrachtet.
Im Anschluss an die Hybridisierung wird der Filter in 2 × SSC, 0,1% SDS bei Raumtemperatur für 15 Minuten gewaschen. Anschließend wird der Filter mit 0,1 × SSC, 0,5% SDS bei Raumtemperatur für 30 Minuten bis zu 1 Stunde gewaschen. Danach wird die Lösung bei der Hybridisierungstemperatur in 0,1 × SSC, 0,5% SDS gewaschen. Ein abschließender Waschschritt wird in 0,1 × SSC bei Raumtemperatur durchgeführt.
Erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder 5'-ESTs oder genomische DNAs, die an die Sonde hybridisierten, werden durch Autoradiographie oder andere herkömmliche Techniken identifiziert.
2. Erhalten erweiterter cDNA- oder genomischer cDNA-Sequenzen mit einem niedrigeren Maß an Homologie zur markierten Sonde
Das obige Verfahren kann modifiziert werden, um erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder genomische DNAs mit einem abnehmenden Maß an Homologie zur Sondensequenz zu identifizieren. Beispielsweise können weniger stringente Bedingungen verwendet werden, um erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder genomische DNAs mit abnehmender Homologie zu der detektierbaren Sonde zu erhalten. Beispielsweise kann die Hybridisierungstemperatur in Schrittgrößen von 5°C von 68°C bis auf 42°C in einem Hybridisierungspuffer mit einer Natriumkonzentration von etwa 1 M abgesenkt werden. Im Anschluss an die Hybridisierung kann der Filter mit 2 × SSC, 0,5% SDS bei der Hybridisierungstemperatur gewaschen werden. Diese Bedingungen werden über 50°C als „moderate" Bedingungen und unter 50°C als „schwache" Bedingungen betrachtet.
Alternativ kann die Hybridisierung in Puffern, wie beispielsweise Formamid enthaltender 6 × SSC-Puffer bei einer Temperatur von 42°C durchgeführt werden. In diesem Fall kann die Konzentration an Formamid im Hybridisierungspuffer in 5%-Schritten von 50% auf 0% verringert werden, um Klone mit einem niedrigeren Maß an Homologie zu der Sonde zu identifizieren. Im Anschluss an die Hybridisierung kann der Filter mit 6 × SSC, 0,5% SDS bei 50°C gewaschen werden. Über 25% Formamid werden die Bedingungen als „moderate" Bedingungen und unter 25% Formamid als „schwache" Bedingungen betrachtet.
Erweiterte cDNAs, Nukleinsäurehomologe zu erweiterten cDNAs oder genomische DNAs, die an die Sonde hybridisiert haben, werden durch Autoradiographie identifiziert.
3. Bestimmung des Grades an Homologie zwischen den erhaltenen erweiterten cDNAs und der markierten Sonde
Wenn es erwünscht ist, Nukleinsäurehomologe zu erweiterten cDNAs zu erhalten, wie beispielsweise allelische Varianten davon, oder Nukleinsäuren, die für Proteine codieren, die mit den Proteinen, die durch die erweiterten cDNAs codiert werden, in Zusammenhang stehen, kann der Grad an Homologie zwischen der hybridisierten Nukleinsäure und der erweiterten cDNA oder dem 5'-EST, die als Sonde verwendet werden, unter Verwendung von BLAST2N weiter bestimmt werden; die Parameter können abhängig von der Sequenzlänge und dem untersuchten Grad an Homologie angepasst werden. Um den Grad an Homologie zwischen der hybridisierten Nukleinsäure und der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet wurde, zu bestimmen, werden die Nukleotidsequenzen der hybridisierten Nukleinsäure und die der erweiterten cDNA oder des 5'-ESTs, von denen die Sonde abgeleitet wurde, verglichen. Beispielsweise können unter Verwendung der obigen Verfahren Nukleinsäuren mit wenigsten 95% Nukleinsäurehomologie zu der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet wurde, erhalten und identifiziert werden. In ähnlicher Weise kann man unter Verwendung fortschreitend weniger stringenter Hybridisierungsbedingungen Nukleinsäuren mit mindestens 90%, mindestens 85%, mindestens 80% oder mindestens 75% Homologie zu der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet wurde, erhalten und identifizieren.
Um zu bestimmen, ob ein Klon ein Protein mit einem gegebenen Maß an Homologie zu dem Protein, das durch die erweiterte cDNA oder das 5'-EST codiert wird, codiert, wird die Aminosäuresequenz, die durch die erweiterte cDNA oder das 5'-EST codiert wird, mit der Aminosäuresequenz, die durch die hybridisierende Nukleinsäure codiert wird, verglichen. Es wird festgestellt, dass Homologie vorliegt, wenn eine Aminosäuresequenz in der erweiterten cDNA oder dem 5'-EST mit einer Aminosäuresequenz in der hybridisierenden Nukleinsäure in enger Beziehung steht. Eine Sequenz steht in enger Beziehung, wenn sie mit der Sequenz der erweiterten cDNA oder der des 5'-ESTs identisch ist oder wenn sie eine oder mehrere Aminosäuresubstitutionen enthält, in denen Aminosäuren mit ähnlichen Charaktereigenschaften untereinander substituiert worden sind. Unter Verwendung der obigen Verfahren und Algorithmen, wie beispielsweise FASTA, mit Parametern, die von der Sequenzlänge und dem untersuchten Grad an Homologie abhängig sind, kann man Nukleinsäuren erhalten, die für Proteine codieren, die mindestens 95%, mindestens 90%, mindestens 85%, mindestens 80% oder mindestens 75% Homologie zu den Proteinen aufweisen, die von der erweiterten cDNA oder dem 5'-EST codiert werden, von der/dem die Sonde abgeleitet wurde.
Um erweiterte cDNAs unter Verwendung von 5'-ESTs zu erhalten stehen über die oben beschriebenen Verfahren hinausgehend andere Protokolle zur Verfügung, wie es in den nachfolgenden Absätzen ausgeführt wird.
Erweiterte cDNAs können durch das Erhalten von mRNA aus dem Gewebe, aus der Zelle oder dem Organismus von Interesse hergestellt werden, wobei auf PolyA-Selektionsverfahren zurückgreifende mRNA-Herstellungsverfahren oder andere dem Fachmann bekannten Techniken verwendet werden. Ein erster Primer, der zur Hybridisierung mit dem PolyA-Schwanz der mRNA in der Lage ist, wird an die mRNA hybridisiert und eine reverse Transkriptionsreaktion wird durchgeführt, um einen cDNA-Erststrang zu erzeugen.
Der erste cDNA-Strang wird mit einem zweiten Primer, der mindestens 10 aufeinander folgende Nukleotide der Sequenz SEQ ID NO: 38-291 enthält, hybridisiert. Vorzugsweise umfasst der Primer mindestens 12, 15 oder 17 aufeinander folgende Nukleotide der Sequenz SEQ ID NO: 38-291. Mehr bevorzugt umfasst der Primer 20 bis 30 aufeinander folgende Nukleotide der Sequenz SEQ ID NO: 38-291. In einigen Ausführungsformen umfasst der Primer mehr als 30 Nukleotide der Sequenz SEQ ID NO: 38-291. Wenn es gewünscht ist, erweiterte cDNAs zu erhalten, welche die für das gesamte Protein codierende Sequenz einschließlich der authentischen Translationsinitiationsstelle enthalten, enthält der verwendete zweite Primer Sequenzen, die stromaufwärts der Translationsinitiationsstelle lokalisiert sind. Zur Erzeugung eines zum cDNA-Erststrang komplementären zweiten cDNA-Strangs ist der zweite Primer erweitert. Alternativ kann wie oben beschrieben wird, eine RT-PCR-Reaktion durchgeführt werden, wobei Primer von beiden Enden der cDNA, die erhalten werden soll, eingesetzt werden.
Erweiterte cDNAs, die 5'-Fragmente der mRNA enthalten, können durch Hybridisierung einer mRNA, welche die Sequenz für das 5'-EST umfasst, für das eine erweiterte cDNA erwünscht ist, mit einem Primer, der mindestens 10 aufeinander folgende Nukleotide der Sequenzen umfasst, die komplementär zu dem 5'-EST sind, und reverses Transkribieren des hybridisierten Primers zur Erstellung eines cDNA-Erststrang der mRNAs, erzeugt werden. Vorzugsweise umfasst der Primer mindestens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs. Mehr bevorzugt umfasst der Primer 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs.
Danach wird ein cDNA-Zweitstrang, der komplementär zum cDNA-Erststrang ist, synthetisiert. Der cDNA-Zweitstrang kann durch Hybridisierung eines Primers, der komplementär zu Sequenzen im cDNA-Erststrang ist, an den cDNA-Erststrang und Verlängern des Primers zur Erzeugung des cDNA-Zweitstrangs hergestellt werden.
Die doppelsträngigen erweiterten cDNAs, die unter Verwendung der oben beschriebenen Verfahren hergestellt wurden, werden isoliert und kloniert. Die erweiterten cDNAs können in Vektoren, wie beispielsweise Plasmide, oder virale Vektoren kloniert werden, die zur Replikation in einer entsprechenden Wirtszelle fähig sind. Die Wirtszelle kann beispielsweise eine Bakterienzelle, eine Säugerzelle, eine Geflügelzelle oder eine Insektenzelle sein.
Techniken zur Isolierung von mRNA, zum reversen Transkribieren eines Primers, der mit mRNA hybridisiert wird, um einen cDNA-Erststrang zu erzeugen, Verlängern eines Primers, um einen cDNA-Zweitstrang zu erzeugen, der komplementär zum cDNA-Erststrang ist, Isolieren der doppelsträngigen cDNA und Klonieren der doppelsträngigen cDNA sind einem Fachmann allgemein bekannt und in „Current Protocols in Molecular Biology", John Wiley and Sons, Inc. 1997 und Sambrook et al., Molecular Cloning: A Laboratory Manual, zweite Ausgabe, Cold Spring Harbor Laboratory Press, 1989, beschrieben.
Alternativ können Verfahren, wie beispielsweise das in Beispiel 29 beschriebene, zum Erhalten von Volllängen-cDNAs oder erweiterten cDNAs verwendet werden. In diesem Ansatz werden Volllängen- oder erweiterte cDNAs aus mRNA hergestellt und wie folgt in doppelsträngige Phagemide kloniert. Die cDNA-Bibliothek in den doppelsträngigen Phagemiden wird anschließend durch Behandlung mit einer Endonuklease, wie beispielsweise dem Gene II-Produkt des Phagen F1, und einer Exonuklease (Chang et al., Gene 127:95-8, 1993) in eine einzelsträngige Form gebracht. Ein biotinyliertes Oligonukleotid, das die Sequenz eines 5'-ESTs oder die Sequenz eines mindestens 10 Nukleotide davon enthaltenden Fragments umfasst, wird an die einzelsträngigen Phagemide hybridisiert. Vorzugsweise umfasst das Fragment mindestens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs. Mehr bevorzugt umfasst das Fragment 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs. In einigen Verfahren kann das Fragment mehr als 30 aufeinander folgende Nukleotide des 5'-ESTs umfassen.
Hybride zwischen dem biotinylierten Oligonukleotid und Phagemiden mit Inserts, welche die 5'-EST-Sequenz enthalten, werden durch Inkubation der Hybride mit Streptavidin beschichteten paramagnetischen Beads und Gewinnung der Beads mit einem Magneten isoliert (Fry et al., Biotechniques, 13:124-131, 1992). Danach werden die resultierenden Phagemide, welche die 5'-EST-Sequenz enthalten, von den Beads abgelöst und unter Verwendung eines Primers, der für die 5'-EST-Sequenz spezifisch ist, in doppelsträngige DNA umgewandelt. Alternativ können Protokolle, wie beispielsweise der Gene Trapper Kit (Gibco BRL) verwendet werden. Die so erhaltene doppelsträngige DNA wird in Bakterien transformiert. Erweiterte cDNAs, welche die 5'-EST-Sequenz enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
Unter Verwendung eines beliebigen der oben in Abschnitt III beschriebenen Verfahren kann eine Vielzahl erweiterter cDNAs, die für Volllängenprotein codierende Sequenzen oder Sequenzen enthalten, die nur für das reife Protein codieren, das zurückbleibt nachdem das Signalpeptid abgespalten wurde, als cDNA-Bibliotheken für eine nachfolgende Bewertung der codierten Proteine oder zur Verwendung in diagnostischen Assays, wie es unten beschrieben wird, bereitgestellt werden.
IV. Expression von Proteinen, die durch erweiterte cDNAs codiert werden, welche unter Verwendung von 5'-ESTs isoliert wurden
Erweiterte cDNAs, welche die für das Gesamtprotein codierenden Sequenzen ihrer entsprechenden mRNAs oder Abschnitte davon enthalten, wie beispielsweise cDNAs, die für das reife Protein codieren, können verwendet werden, um die codierten sekretierten Proteine oder Abschnitte davon zu exprimieren, wie es in Beispiel 30 unten beschrieben wird. Wenn gewünscht, können die erweiterten cDNAs die Sequenzen enthalten, die für das Signalpeptid codieren, um so die Sekretion des exprimierten Proteins zu vereinfachen. Es wird erkannt, dass eine Vielzahl von erweiterten cDNAs, die Gesamtprotein codierende Sequenzen oder Abschnitte davon enthalten, gleichzeitig in Expressionsvektoren kloniert werden können, um so eine Expressionsbibliothek zur Analyse der codierten Proteine zu erzeugen, wie es unten beschrieben wird.
Beispiel 30
Expression der Proteine, die durch die Gene codiert werden, welche 5'-ESTs oder Teilen davon entsprechen
Um die Proteine zu exprimieren, die durch die Gene codiert werden, welche 5'-ESTs (oder Teilen davon) entsprechen, werden Volllängen-cDNAs erhalten, welche die vollständige proteincodierende Region enthalten, oder erweiterte cDNAs, die Sequenzen in Nachbarschaft zu den 5'-ESTs (oder Abschnitten davon) enthalten, wie es in den Beispielen 27–29 beschrieben wird, und in einen geeigneten Expressionsvektor kloniert. Wenn gewünscht, können die Nukleinsäuren die Sequenzen enthalten, die für das Signalpeptid codieren, um so die Sekretion des exprimierten Proteins zu erleichtern. Die Nukleinsäuren, die in die Expressionsvektoren insertiert werden, können auch Sequenzen enthalten, die sich stromaufwärts der Sequenzen befinden, die für das Signalpeptid codieren, wie beispielsweise Sequenzen, die Expressionsmengen regulieren oder Sequenzen, die eine gewebespezifische Expression übertragen.
Die Nukleinsäure, die für das zu exprimierende Protein oder das Polypeptid codiert, wird operativ mit einem Promotor in einem Expressionsvektor verknüpft, wobei hierzu herkömmliche Klonierungstechnologien verwendet werden. Der Expressionsvektor kann ein beliebiges, im Fachbereich bekanntes Säuger-, Hefe-, Insekten- oder bakterielles Expressionssystem sein. Kommerziell erhältliche Vektoren und Expressionssysteme stehen von einer Vielzahl von Lieferanten zur Verfügung, einschließlich Genetics Institut (Cambridge, MA), Stratagene (La Jolla, Kalifornien), Promega (Madison, Wisconsin) und Invitrogen (San Diego, Kalifornien). Wenn gewünscht, kann der Codonkontext und die Codonpaarung der Sequenz für den bestimmten Expressionsorganismus, in den der Expressionsvektor eingeführt wird, optimiert werden, wie es von Hatfield, et al., US-Patent Nr. 5,082,767 erläutert wird, um so die Expression zu steigern und um eine passende Proteinfaltung zu ermöglichen.
Die in den Expressionsvektor einklonierte cDNA kann das vollständige Protein (d.h. das Signalpeptid und das reife Protein), das reife Protein (d.h. das Protein, das durch Abspalten des Signalpeptids erzeugt wurde), nur das Signalpeptid oder einen anderen beliebigen Abschnitt davon enthalten.
Das folgende Verfahren wird als ein beispielhaftes Verfahren zur Expression der Proteine bereitgestellt, die durch die erweiterten cDNAs codiert werden, die den 5'-ESTs oder den Nukleinsäuren entsprechen, wie oben beschrieben wird. Zuerst werden das Methionininitiationscodon für das Gen und das PolyA-Signal des Gens identifiziert. Wenn die Nukleinsäure, die das zu exprimierende Polypeptid codiert, kein Methionin aufweist, das als Initiationsstartstelle dient, kann ein initiierendes Methionin neben dem ersten Codon der Nukleinsäure eingefügt werden, wobei herkömmliche Techniken verwendet werden. In gleicher Weise kann, wenn die erweiterte cDNA kein PolyA-Signal aufweist, diese Sequenz an das Konstrukt angefügt werden, beispielsweise durch Spleißen des PolyA-Signals aus pSG5 (Stratagene), wobei BgIII- und SaII-Restriktionsendonukleaseenzyme verwendet werden, und Einfügen dieses PolyA-Signals in den Säugerexpressionsvektor pXT1 (Stratagene). pXT1 enthält die LTRs und einen Teil des gag-Gens des Moloney Murine Leukemia-Virus. Die Position der LTRs im Konstrukt ermöglicht eine effiziente stabile Transfektion. Der Vektor umfasst den Herpes Simplex-Tymidinkinasepromotor und das selektierbare Neomycingen. Die erweiterte cDNA oder ein Abschnitt davon, die bzw. der für das zu exprimierende Polypeptid codiert, wird durch eine PCR-Reaktion aus dem bakteriellen Vektor erhalten, wobei Oligonukleotidprimer verwendet werden, die komplementär zu der erweiterten cDNA oder einem Abschnitt davon sind und die Restriktionsendonuklease-Sequenzen für PstI enthalten, die in den 5'-Primer eingebracht sind, und für BgIII am 5'-Ende des entsprechenden cDNA 3'-Primers, wobei darauf geachtet wird, sicherzustellen, dass die erweiterte cDNA mit dem PolyA-Signal positioniert ist. Das gereinigte Fragment, das aus der entsprechenden PCR-Reaktion erhalten wird, wird mit PstI verdaut, mit einer Exonuklease mit glatten Enden versehen, mit BgIII verdaut, gereinigt und in den pXT1-Vektor ligiert, der ein PolyA-Signal enthält und für diese Ligation (glatt/BgIII) vorbereitet wurde.
Das ligierte Produkt wird unter Verwendung von Lipofectin (Life Technologies, Inc., Grand Island, New York) in NIH 3T3-Mauszellen transfiziert, wobei Bedingungen wie sie in der Produktbeschreibung beschrieben sind, eingehalten werden. Nach Aufzucht der transfizierten Zellen in 600 μg/ml G418 (Sigma, St. Louis, Missouri) werden positive Transfektanten selektiert. Das exprimierte Protein wird vorzugsweise in das Kulturmedium abgegeben, wodurch die Aufreinigung vereinfacht wird.
Alternativ können die erweiterten cDNAs, wie es oben beschrieben wird, in pED6dpc2 kloniert werden. Die resultierenden pED6dpc2-Konstrukte können in eine geeignete Wirtszelle, wie beispielsweise COS 1-Zellen, transfiziert werden. Methotrexat-resistente Zellen werden selektiert und expandiert. Vorzugsweise wird das Protein, das von der erweiterten cDNA exprimiert wird, in das Kulturmedium abgegeben, wodurch die Aufreinigung vereinfacht wird.
Proteine im Kulturmedium werden durch Gelelektrophorese abgetrennt. Falls gewünscht, können die Proteine durch Ammoniumsulfat präzipitiert werden oder vor der Elektrophorese auf Grundlage ihrer Größe oder Ladung getrennt werden.
Als Kontrolle wird der Expressionsvektor, der kein cDNA-Insert aufweist, in Wirtszellen oder Organismen eingebracht und die Proteine im Medium werden geerntet. Die sekretierten Proteine, die im Medium vorliegen, werden unter Verwendung von dem Fachmann bekannten Techniken detektiert, wie beispielsweise Coomassie Blau- oder Silberfärbung, oder unter Verwendung von Antikörpern gegen das durch die erweiterte cDNA codierte Protein.
Antikörper, die in der Lage sind, das Protein von Interesse spezifisch zu erkennen, können unter Verwendung synthetischer 15-mer Peptide erzeugt werden, die eine Sequenz aufweisen, die durch das geeignete 5'-EST, die geeignete erweiterte cDNA oder einen Abschnitt davon codiert wird. Die synthetischen Peptide werden in Mäuse injiziert, um einen Antikörper zu dem Polypeptid, das durch das 5'-EST, die erweiterte cDNA oder den Abschnitt davon codiert wird, zu erzeugen.
Sekretierte Proteine aus den Wirtszellen oder Organismen, die einen Expressionsvektor enthalten, der die erweiterte cDNA enthält, die aus einem 5'-EST oder einem Abschnitt davon abgeleitet ist, werden mit denen aus den Kontrollzellen oder dem Kontrollorganismus verglichen. Die Gegenwart einer Bande im Medium von den Zellen, die den Vektor enthalten, die im Medium aus Kontrollzellen nicht vorliegt, zeigt, dass die erweiterte cDNA für ein sekretiertes Protein codiert. Im Allgemeinen hat die Bande, die dem Protein entspricht, das von der erweiterten cDNA codiert wird, eine Mobilität nahe bei der erwarteten Mobilität, wobei dies auf der Zahl der Aminosäuren im offenen Leserahmen der erweiterten cDNA beruht. Jedoch kann die Bande in Folge von Modifikationen, wie beispielsweise Glykosylierung, Ubiquitinierung oder enzymatischer Spaltung, eine Mobilität aufweisen, die sich von der erwarteten Mobilität unterscheidet.
Wenn das durch die obigen Expressionsvektoren exprimierte Protein keine Sequenzen enthält, welche seine Sekretion steuern, können alternativ die von den Wirtszellen exprimierten Proteine, wobei die Wirtszellen einen Expressionsvektor mit einem Insert enthalten, das für ein sekretiertes Protein oder einen Abschnitt davon codiert, mit den Proteinen verglichen werden, die in Kontrollwirtszellen exprimiert werden, die den Expressionsvektor ohne Insert enthalten. Das Vorliegen einer Bande in Proben von Zellen, die den Expressionsvektor mit einem Insert enthalten, die in Proben von Zellen, die den Expressionsvektor ohne Insert enthalten, nicht vorliegt, zeigt, dass das gewünschte Protein oder der Abschnitt davon exprimiert wird. Im Allgemeinen weist die Bande die Mobilität auf, welche für das sekretierte Protein oder den Abschnitt davon erwartet wird. Jedoch kann die Bande in Folge von Modifizierungen, wie beispielsweise Glykosylierung, Ubiquitinierung oder enzymatischer Spaltung, eine von der erwarteten Mobilität abweichende Mobilität aufweisen.
Das durch die erweiterte cDNA codierte Protein kann unter Verwendung von standardmäßigen Immunochromatografie-Techniken gereinigt werden. In derartigen Verfahren wird eine Lösung, die das sekretierte Protein enthält, wie beispielsweise Kulturmedium oder Zellextrakt, auf eine Säule aufgebracht, die Antikörper gegen das sekretierte Protein aufweist, wobei die Antikörper an der Chromatografiematrix angebracht sind. Man lässt das sekretierte Protein an die Immunochromatografiesäule binden. Danach wird die Säule gewaschen, um nicht spezifisch gebundene Proteine zu entfernen. Das spezifisch gebundene sekretierte Protein wird anschließend von der Säule freigesetzt und unter Verwendung von Standardtechniken gewonnen.
Falls eine Antikörperherstellung nicht möglich ist, kann die erweiterte cDNA-Sequenz oder der Abschnitt davon in Expressionsvektoren eingebracht werden, die zur Verwendung in Reinigungsschemata konzipiert worden sind, die auf chimäre Polypeptide zurückgreifen. In derartigen Strategien ist die codierende Sequenz der erweiterten cDNA oder des Abschnitts davon im Rahmen mit einem Gen insertiert, das die andere Hälfte der Chimäre codiert. Die andere Hälfte der Chimäre kann β-Globin oder ein nickelbindendes Polypeptid sein. Eine Chromatografiematrix mit einem daran angebrachten Antikörper gegen β-Globin oder Nickel wird anschließend verwendet, um das chimäre Protein zu reinigen. Proteasespaltstellen können zwischen dem β-Globin-Gen oder dem nickelbindendem Polypeptid und der erweiterten cDNA oder dem Abschnitt davon konstruiert sein. Daher können die zwei Polypeptide der Chimäre durch Proteaseverdau voneinander getrennt werden.
Ein zur Erzeugung von β-Globin-Chimären nützlicher Expressionsvektor ist pSG5 (Stratagene), der für Kaninchen-β-Globin codiert. Intron II des Kaninchen-β-Globin-Gens ermöglicht das Spleißen des exprimierten Transkripts und das in dieses Konstrukt eingebrachte Polyadenylierungssignal erhöht die Expressionsmenge. Diese Verfahren sind so wie beschrieben dem Fachmann im Bereich der Molekularbiologie allgemein bekannt. Standardverfahren sind in Texten über Verfahren, wie beispielsweise Davis et al., („Basic Methods in Molecular Biology", Davis, Dibner und Battex, Hg., Elsevier Press, NY, 1986) beschrieben und viele andere Verfahren stehen von Stratagene, Life Technologies, Inc. oder Promega zur Verfügung. Zusätzlich können von dem Konstrukt Polypeptide hergestellt werden unter Verwendung von in vitro-Translationssystemen, wie beispielsweise dem In vitro-Express^TM-Translations-Kit (Stratagene).
Im Anschluss an die Expression und Reinigung der sekretierten Proteine, die durch die 5'-ESTs, erweiterten cDNAs oder Fragmente davon codiert werden, können die gereinigten Proteine auf ihre Fähigkeit, an die Oberfläche verschiedener Zelltypen zu binden, getestet werden, wie es in Beispiel 31 unten beschrieben wird. Es wird erkannt, dass eine Vielzahl von Proteinen, die durch diese cDNAs exprimiert werden, von einem Panel von Proteinen umfasst sein kann, um so gleichzeitig sowohl hinsichtlich ihrer unten genau beschrieben Aktivitäten, als auch im Hinblick auf andere biologische Rollen, für die Assays zur Aktivitätsbestimmung zur Verfügung stehen, beurteilt zu werden.
Beispiel 31
Analyse sekretierter Proteine zur Bestimmung, ob die Proteine an die Zelloberfläche binden
Die durch die 5'-ESTs, erweiterten cDNAs oder Fragmente davon codierten Proteine werden in Expressionsvektoren, wie diejenigen, die in Beispiel 30 beschrieben sind, kloniert. Die Proteine werden über Größe, Ladung, Immunchromatografie oder andere dem Fachmann vertraute Techniken gereinigt. Im Anschluss an die Reinigung werden die Proteine unter Verwendung von dem Fachmann bekannten Techniken markiert. Die markierten Proteine werden mit Zellen oder Zelllinien inkubiert, die aus einer Vielfalt von Organismen oder Geweben abgeleitet sind, um es den Proteinen zu ermöglichen, an einen beliebigen Rezeptor auf der Zelloberfläche zu binden. Im Anschluss an die Inkubation werden die Zellen gewaschen, um unspezifisch gebundenes Protein zu entfernen. Die markierten Proteine werden durch Autoradiografie detektiert. Alternativ können nicht markierte Proteine mit den Zellen inkubiert werden und unter Verwendung von daran anhaftenden Antikörpern, die eine detektierbare Markierung aufweisen, wie beispielsweise ein fluoreszierendes Molekül, detektiert werden.
Die Spezifität der Zelloberflächenbindung kann durch Durchführung einer Kompetitionsanalyse analysiert werden, wobei verschiedene Mengen an nicht markiertem Protein zusammen mit dem markierten Protein inkubiert werden. Die Menge an markiertem Protein, das an die Zelloberfläche gebunden ist, nimmt ab, wenn die Menge an kompetitivem unmarkiertem Protein ansteigt. Als Kontrolle sind in einigen Bindereaktionen verschiedene Mengen an nicht markiertem Protein umfasst, das mit dem markierten Protein nicht in Beziehung steht. Die Mengen an markiertem Protein, das an die Zelloberfläche gebunden ist, sinkt in solchen Bindereaktionen nicht ab, die steigende Mengen an nicht verwandten nicht markierten Proteinen enthalten, was zeigt, dass das Protein, das durch die cDNA codiert wird, spezifisch an die Zelloberfläche bindet.
Wie oben diskutiert, zeigen sekretierte Proteine eine Vielzahl von wichtigen physiologischen Effekten und stellen in der Konsequenz eine wertvolle therapeutische Quelle dar. Die sekretierten Proteine, die durch die erweiterten cDNAs oder Teile davon codiert werden, die gemäß den Beispielen 27–29 hergestellt wurden, können wie unten beschrieben beurteilt werden, um ihre physiologischen Wirkungen zu bestimmen.
Beispiel 32
Untersuchen der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich der Zytokin-, Zellproliferations- oder Zelldifferenzierungs-Aktivität
Wie oben diskutiert, können sekretierte Proteine als Zytokine wirken oder können die zelluläre Proliferation oder Differenzierung beeinflussen. Viele bis heute entdeckte Proteinfaktoren, einschließlich aller bekannten Zytokine, weisen in einem oder mehreren faktorabhängigen Zellproliferationsassays Aktivität auf und daher dienen diese Assays als zweckmäßige Bestätigung der Zytokinaktivität. Die Aktivität eines Proteins, das durch die erweiterten cDNAs codiert wird, wird durch einen beliebigen aus einer Reihe von routinemäßigen faktorabhängigen Zellproliferationsassays für Zelllinien, einschließlich, ohne Beschränkung, 32D, DA2, DA1G, T10, B9, B9/11, BaF3, MC9/G, M⁺ (preB M⁺), 2E8, RB5, DA1, 123, T1165, HT2, CTLL2, TF-1, Mo7c und CMK, bewiesen. Die Proteine, die durch die oben beschriebenen erweiterten cDNAs oder Abschnitte davon codiert werden, können bezüglich ihrer Fähigkeit, die T-Zell- oder Thymozytproliferation in Assays, wie beispielsweise diejenigen, die oben oder in den folgenden Referenzen beschrieben sind, beurteilt werden: „Current Protocols in Immunology", Hrsg. von Coligan et al., Greene Publishing Associates and Wiley-Interscience; Takai et al., J. Immunol. 137:3494-3500, 1986; Bertagnolli et al., J. Immunol. 145:1706-1712, 1990; Bertagnolli et al., Cell. Immunol. 133:327-341, 1991; Bertagnolli et al., J. Immunol. 149:3778-3783 1992; Bowman et al., J. Immunol. 152:1756-1761, 1994.
Zusätzlich sind zahlreiche Assays zur Zytokinproduktion und/oder der Proliferation von Milzzellen, Lymphknotenzellen und Thymozyten bekannt. Diese umfassen die Techniken, die in „Current Protocols in Immunology", supra, 1:3.12.1-3.12.14 und von Schreiber in „Current Protocols in Immunology", supra, 1:6.8.1-6.8.8 offenbart werden.
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihrer Fähigkeit, Proliferation und Differenzierung hämatopoetischer oder lymphopoetischer Zellen zu regulieren, untersucht werden. Viele Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays in den folgenden Referenzen: Bottomly et al., in „Current Protocols in Immunology", supra, 1:6.3.1-6.3.12; de Vries et al., J. Exp. Med. 173:1205-1211, 1991; Moreau et al., Nature 36:690-692, 1988; Greenberger et al., Proc. Natl. Acad. Sci. U.S.A., 80:2931-2938, 1983; Nordan, R., in Current Protocols in Immunology, supra 1:6.6.1-6.6.5; Smith et al., Proc. Natl. Acad. Sci. U.S.A., 83:1857-1861, 1986; Bennett et al., in "Current Protocols Immunology", supra, 1:6.15.1; Ciarletta et al., in "Current Protocols Immunology", supra, 1:6.13.1.
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihrer Fähigkeit, die Antworten von T-Zellen auf Antigene zu regulieren, untersucht werden. Viele Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, welche in den folgenden Referenzen beschrieben werden: Kapitel 3 (In vitro-Assays zur Maus Lymphozytenfunktion), Kapitel 6 (Zytokine und ihre zellulären Rezeptoren) und Kapitel 7 (Immunologische Studien in Menschen) in „Current Protocols in Immunology" supra, Weinberger et al., Proc. Natl. Acad. Sci. USA 77:6091-6095, 1980; Weinberger et al., Eur. J. Immun. 11:405-411, 1981; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988.
Derartige, eine Zytokin-, Zellproliferations- oder Zelldifterenzierungsaktivität aufweisende Proteine können anschließend als Pharmazeutika formuliert oder verwendet werden, um klinische Beschwerden zu behandeln, bei welchen die Induktion von Zellproliferation oder -differenzierung günstig ist. Alternativ können Gene, welche diese Proteine codieren oder Nukleinsäuren, welche die Expression dieser Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen, wobei dies unten ausführlicher beschrieben wird.
Beispiel 33
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich einer Aktivität als Regulatoren des Immunsystems
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihrer Wirkungen als Immunregulatoren beurteilt werden. Beispielsweise können diese Proteine bezüglich ihrer Aktivität, die Thymozyten- oder Splenozyten-Zytotoxizität zu beeinflussen, beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Kapitel 3 (In vitro-Assays zur Maus-Lymphozytenfunktion 3.1-3.19) und Kapitel 7 (Immunologische Studien in Menschen) in „Current Protocols in Immunology", Coligan et al., Hrsg., Greene Publishing Associates and Wiley-Interscience; Herrmann et al., Proc. Natl. Acad. Sci. USA 78:2488-2492, 1981; Herrmann et al., J. Immunol. 128:1968-1974, 1982; Handa et al., J. Immunol. 135:1564-1572, 1985; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988; Bowman et al., J. Virology 61:1992-1998; Bertagnolli et al., Cell. Immunol. 133:327-341, 1991; Brown et al., J. Immunol. 153:3079-3092, 1994.
Die durch die cDNAs codierten Proteine können auch bezüglich ihrer Wirkungen auf T-Zell abhängige Immunglobulinreaktionen und Isotyp-Switching beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Maliszewski, J. Immunol. 144:3028-3033, 1990; Mond et al., in Current Protocols in Immunology, 1:3.8.1-3.8.16, supra.
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihrer Wirkung auf Immuneffektorzellen, einschließlich ihrer Wirkung auf Th1-Zellen und zytotoxische Lymphozyten beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Kapitel 3 (in vitro-Assays zur Maus-Lymphozytenfunktion 3.1-3.19) und Kapitel 7 (Immunologische Studien in Menschen) in „Current Protocols in Immunology", supra; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512, 1988; Bertagnolli et al., J. Immunol. 149:3778-3783, 1992.
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihrer Wirkung auf die durch dendritische Zellen vermittelte Aktivierung von naiven T-Zellen beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Guery et al., J. Immunol., 134:536-544, 1995; Inaba et al., J. Exp. Med. 173:549-559, 1991; Macatonia et al., J. Immunol. 154:5071-5079, 1995; Porgador et al., J. Exp. Med. 182:255-260, 1995; Nair et al., J. Virol. 67:4062-4069, 1993; Huang et al., Science 264:961-965, 1994; Macatonia et al., J. Exp. Med. 169:1255-1264, 1989; Bhardwaj et al., Journal of Clinical Investigation 94:797-807, 1994 und Inaba et al., J. Exp. Med. 172:631-640, 1990.
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihres Einflusses auf die Lebensdauer von Lymphozyten beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Darzynkiewicz et al., Cytometry 13:795-808, 1992; Gorczyca et al., Leukemia 7:659-670, 1993; Gorczyca et al., Cancer Res. 53:1945-1951, 1993; Itoh et al., Cell 66:233-243, 1991; Zacharchuk, J. Immunol. 145:4037-4045, 1990; Zamai et al., Cytometry 14:891-897, 1993; Gorczyca et al., Int. J. Oncol. 1:639-648, 1992.
Die durch die cDNAs codierten Proteine können auch hinsichtlich ihres Einflusses auf frühe Stufen des T-Zell-Deteminierung und der T-Zell-Entwicklung beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich aber ohne Beschränkung auf die Assays, die in den folgenden Referenzen beschrieben werden: Antica et al., Blood 84:111-117, 1994; Fine et al., Cell. Immunol. 155:111-122, 1994; Galy et al., Blood 85:2770-2778, 1995; Toki et al., Proc. Natl. Acad. Sci. USA 88:7548-7551, 1991.
Diejenigen Proteine, die eine Aktivität als Regulatoren der Aktivität des Immunsystems zeigen, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Erkrankungen zu behandeln, bei welchen die Regulation der Immunaktivität günstig ist. Beispielsweise kann das Protein bei der Behandlung verschiedener Immunschwächen und Erkrankungen nützlich sein (einschließlich schwerer kombinierter Immunschwächen), z.B. sowohl beim Regulieren (nach oben oder nach unten) von Wachstum und Proliferation von T- und/oder B-Lymphozyten als auch beim Einwirken auf die zytolytische Aktivität von NK-Zellen und anderen Zellpopulationen. Diese Immunschwächen können genetischen Ursprungs sein oder können sowohl durch virale (z.B. HIV) als auch durch bakterielle Infektionen oder von Pilzinfektionen verursacht werden oder können sich aus Autoimmunerkrankungen ergeben. Insbesondere können infektiöse Erkrankungen behandelt werden, die durch virale oder bakterielle Infektionen oder durch Pilze oder andere Infektionen verursacht werden, unter Verwendung eines Proteins, das durch erweiterte cDNAs codiert wird, die von den 5'-ESTs der vorliegenden Erfindung abgeleitet sind, einschließlich Infektionen mit HIV, Hepatitis-Viren, Herpes-Viren, Mycobakterien, Leishmania spp., Plasmodium und verschiedenen Pilzinfektionen, wie zum Beispiel Candidiasis. In diesem Zusammenhang kann ein Protein, das durch erweiterte cDNAs codiert wird, die von den 5'-ESTs der vorliegenden Erfindung abgeleitet sind, selbstverständlich ebenfalls nützlich sein, wenn eine Stimulierung des Immunsystems im Allgemeinen wünschenswert ist, d.h. bei der Behandlung von Krebs.
Alternativ können Proteine, die von erweiterten cDNAs codiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, bei der Behandlung von Autoimmunerkrankungen verwendet werden, einschließlich beispielsweise Bindegewebserkrankungen, Multiple Sklerose, systemischer Lupus erythematosus, Rheumatoide Arthritis, Autoimmun-Lungenentzündung, Guillian Barre-Syndrom, autoimmune Thyroiditis, insulinabhängiger Diabetes mellitus, Myasthenia gravis, Transplantat-Wirt-Reaktion („graft-versus-host disease", GVHD) und autoimmune entzündliche Augenerkrankungen. Ein derartiges Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann auch bei der Behandlung allergischer Reaktionen und Erkrankungen, wie zum Beispiel Asthma (insbesondere allergisches Asthma) oder anderen Atemwegserkrankungen, nützlich sein. Andere Erkrankungen, bei denen eine Immunsuppression wünschenswert ist (einschließlich beispielsweise Organtransplantation), können auch unter Verwendung eines Proteins behandelbar sein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind.
Unter Verwendung der erfindungsgemäßen Proteine kann es ebenfalls möglich sein, Immunantworten nach oben oder nach unten zu regulieren.
Eine Regulation nach unten kann das Hemmen oder Blockieren einer Immunantwort, die bereits abläuft, umfassen, oder kann das Verhindern der Induktion einer Immunantwort umfassen. Die Funktionen aktivierter T-Zellen können durch Supprimieren der T-Zell-Antworten oder durch Induzieren spezifischer Toleranz in T-Zellen oder durch beides gehemmt werden. Die Immunsuppression von T-Zell-Antworten ist im Allgemeinen ein aktiver, nicht antigenspezifischer Prozess, der einer kontinuierlichen Exposition von T-Zellen gegenüber dem suppressiven Mittel bedarf. Toleranz, die eine Induktion von Unempfindlichkeit oder Anergie in T-Zellen umfasst, ist von Immunsuppression dadurch unterscheidbar, dass sie im Allgemeinen antigenspezifisch ist und nach dem Ende der Exposition gegenüber dem toleranzverleihenden Mittel andauert. Praktisch kann Toleranz durch das Fehlen einer T-Zell-Antwort auf Reexposition gegenüber einem spezifischen Antigen in der Abwesenheit eines Toleranz verleihenden Mittels gezeigt werden.
Regulierung nach unten oder Verhinderung einer oder mehrerer Antigenfunktionen (einschließlich aber ohne Beschränkung auf B-Lymphozyt-Antigenfunktionen, wie zum Beispiel B7-Costimulation), z.B. Verhinderung eines hohen Grads an Lymphokinsynthese durch aktivierte T-Zellen, sind unter den Umständen einer Gewebe-, Haut- und Organtransplantation und bei einer Transplantat-Wirt-Reaktion (GVHD) nützlich. Beispielsweise sollte die Blockierung der T-Zell-Funktion bei einer Gewebetransplantation zu einer verringerten Zerstörung von Gewebe führen. Normalerweise wird in Gewebetransplantaten die Abstoßung des Transplantats über seine Fremderkennung durch T-Zellen initiiert, woran sich eine Immunreaktion anschließt, die das Transplantat zerstört. Die Verabreichung eines Moleküls vor der Transplantation, das die Wechselwirkung eines B-7-Lymphozyt-Antigens mit seinem natürlichen Ligand (seinen natürlichen Liganden) auf Immunzellen hemmt oder blockiert (wie beispielsweise eine lösliche, monomere Form eines Peptids mit B7-2-Aktivität allein oder in Verbindung mit einer monomeren Form eines Peptids mit einer Aktivität eines anderen B-Lymphozyt-Antigens (z.B. B7-1, B7-3) oder einem blockierenden Antikörper), kann zum Binden des Moleküls an den/die natürlichen Ligand(en) auf den Immunzellen führen, ohne das entsprechende kostimulatorische Signal zu übertragen. In diesem Fall verhindert die Blockierung der B-Lymphozyt-Antigenfunktion eine Zytokinsynthese durch Immunzellen, wie beispielsweise T-Zellen, und wirkt daher als ein Immunsuppressor. Darüber hinaus kann das Fehlen der Costimulation auch ausreichen, zu einem Nichtreagieren der T-Zellen bei herabgesetzter Immunlage zu führen, wodurch in einem Probanden Toleranz induziert wird. Durch Induktion einer lang andauernden Toleranz durch mittel, welche B-Lymphozyt-Antigene blockieren, kann durch das Bedürfnis nach einer wiederholten Verabreichung dieser blockierenden Mittel vermieden werden. Um eine ausreichende Immunsuppression oder Toleranz in einem Probanden zu erreichen, kann es auch notwendig sein, die Funktion einer Kombination von B-Lymphozyt-Antigenen zu blockieren.
Die Wirksamkeit bestimmter blockierender Mittel beim Verhindern der Abstoßung eines Organtransplantats oder von GVHD kann unter Verwendung von Tiermodellen beurteilt werden, die zur Vorhersage über die Wirksamkeit in Menschen geeignet sind. Beispiele geeigneter Systeme, die verwendet werden können, umfassen allogene Herztransplantate in Ratten und xenogene Bauchspeicheldrüsen-Inselzelltransplantate in Mäusen, wobei beide Transplantate eingesetzt wurden, um die immunsuppressiven Wirkungen des CTLA4Ig-Fusionsproteins in vivo zu untersuchen, wie es in Lenschow et al., Science 257:789-792, 1992 und Turka et al., Proc. Natl. Acad. Sci. USA, 89:11102-11105, 1992, beschrieben wird. Zusätzlich können GVHD-Mausmodelle (siehe Paul, Hrsg., Fundamental Immunology. Raven Press, New York, 1989, Seiten 846–847) verwendet werden, um in vivo die Wirkung der Blockierung der B-Lymphozyt-Antigenfunktion auf die Entwicklung dieser Erkrankung zu untersuchen.
Eine Blockierung der Antigenfunktion kann auch bei der Behandlung von Autoimmunerkrankungen therapeutisch nützlich sein. Viele Autoimmunerkrankungen sind das Ergebnis einer unpassenden Aktivierung von T-Zellen, die gegen Eigengewebe reaktiv sind, und welche die Herstellung von Zytokinen und Autoantikörpern fördern, die an der Pathologie dieser Erkrankungen beteiligt sind. Die Verhinderung der Aktivierung autoreaktiver T-Zellen kann Krankheitssymptome verringern oder beseitigen. Eine Verabreichung von Mitteln, die auf die Kostimulierung von T-Zellen durch Stören der Rezeptor/Ligandwechselwirkungen der B-Lymphozyt-Antigene blockierend wirken, können verwendet werden, um die T-Zell-Aktivierung zu hemmen und um die Erzeugung von Autoantikörpern oder T-Zell abgeleiteten Zytokinen zu verhindern, die am Krankheitsprozess möglicherweise beteiligt sind. Zusätzlich können blockierende Mittel eine antigenspezifische Toleranz autoreaktiver T-Zellen induzieren, die zu einer langfristigen Entlastung von der Krankheit führen könnte. Die Wirksamkeit blockierender Mittel bei der Verhinderung oder Linderung von Autoimmunerkrankungen kann unter Verwendung einer Vielzahl gut charakterisierter Tiermodelle für humane Autoimmunerkrankungen bestimmt werden. Beispiele umfassen experimentelle murine Autoimmunencephalitis, systemischen Lupus erythematosis in MRL/pr/pr-Mäusen oder NZB-Hybridmäusen, murine Autoimmuncollagenarthritis, Diabetes mellitus in OD-Mäusen und BB-Ratten und experimentelle murine Myasthenia gravis. (siehe Paul Ed., supra, Seiten 840–856).
Eine Hochregulierung einer Antigenfunktion (vorzugsweise einer B-Lymphozyt-Antigenfunktion) als Mittel zur Hochregulierung von Immunantworten kann in der Therapie auch nützlich sein. Die Hochregulierung von Immunantworten kann entweder eine Steigerung einer bestehenden Immunantwort oder das Auslösen einer Inititalimmunantwort umfassen, wie es durch die folgenden Beispiele gezeigt wird. Beispielsweise kann das Steigern einer Immunantwort durch Stimulierung der B-Lymphozyt-Antigenfunktion in Fällen viraler Infektionen nützlich sein. Zusätzlich können systemische virale Erkrankungen, wie beispielsweise Grippe, Schnupfen und Encephalitis durch Verabreichung einer stimulatorischen Form von B-Lymphozyt-Antigenen systemisch gelindert werden.
Alternativ können antivirale Immunantworten in einem infizierten Patienten dgesteigert werden durch Entfernen der T-Zellen aus dem Patienten, Kostimulieren der T-Zellen in vitro mit viral antigen-gepulsten APCs, wobei entweder ein Peptid exprimiert wird, das durch die erweiterten cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, oder zusammen mit einer stimulatorischen Form eines löslichen Peptids, das durch die erweiterten cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet ist, und Wiedereinführen der in vitro präparierten T-Zellen in den Patienten. Die infizierten Zellen sind nun in der Lage, ein kostimulatorisches Signal an T-Zellen in vivo abzugeben, wodurch die T-Zellen aktiviert werden.
In einer anderen Anwendung kann die Hochregulierung oder Steigerung der Antigenfunktion (vorzugsweise B-Lymphozyt-Antigenfunktion) bei der Induktion von Tumorimmunität nützlich sein. Tumorzellen (z.B. Sarcom, Melanom, Lymphom, Leukämie, Neuroblastom, Carcinom), die mit einer Nukleinsäure transfiziert sind, die für mindestens ein Peptid codiert, das durch cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, können einem Probanden verabreicht werden, um eine tumorspezifische Toleranz in dem Probanden zu überwinden. Wenn gewünscht, kann die Tumorzelle transfiziert werden, um eine Kombination von Peptiden zu exprimieren. Beispielsweise können von einem Patienten erhaltene Tumorzellen ex vivo mit einem Expressionsvektor transfiziert werden, der die Expression eines Peptids mit ausschließlich B7-2-artiger Aktivität oder in Verbindung mit einem Peptid mit B7- 1-artiger Aktivität und/oder B7-3-artiger Aktivität steuert. Die transfizierten Tumorzellen werden an den Patienten zurückgegeben, um eine Expression der Peptide auf der Oberfläche der transfizierten Zelle zu bewirken. Alternativ können Gentherapietechniken verwendet werden, um eine Tumorzelle als Zielstruktur für eine Transfektion in vivo anzusprechen.
Das Vorliegen der durch die erweiterten cDNAs codierten Peptide, die von den erfindungsgemäßen 5'-ESTs abgeleitet sind, mit der Aktivität eines/von B-Lymphozyt-Antigens/Antigenen auf der Tumorzellenoberfläche stellt das notwendige Kostimulierungssignal für T-Zellen bereit, um eine T-Zell vermittelte Immunantwort gegen die transfizierten Tumorzellen zu induzieren. Darüber hinaus können Tumorzelyen, die keine MWC Klasse I- oder MHC Klasse II-Moleküle reexprimieren können oder unzureichende Mengen davon reexprimieren, mit Nukleinsäuren transfiziert werden, die eine vollständige oder einen Teil (z.B. ein verkürzter Abschnitt einer zytoplasmatischen Domäne) einer MHC Klasse I α-Kette und β₂-Microglobulin oder einer MHC Klasse II α-Kette und einer MHC Klasse II β-Kette codieren, um so MHC Klasse I- bzw. MHC Klasse II-Proteine auf der Zelloberfläche zu exprimieren. Die Expression geeigneter MHC Klasse I- oder MHC Klasse II-Moleküle in Verbindung mit einem Peptid, das die Aktivität eines B-Lymphozyten-Antigens aufweist (z.B. B7-1, B7-2, B7-3), induziert eine T-Zell vermittelte Immunantwort gegen die transfizierte Tumorzelle. Gegebenenfalls kann auch ein für ein Antisense-Konstrukt codierendes Gen, das die Expression eines MHC Klasse II assoziierten Proteins blockiert, wie beispielsweise die Invariante Kette, ebenfalls mit einer für ein Peptid codierenden DNA kotransfiziert werden, wobei dieses Peptid die Aktivität eines B-Lymphozyten-Antigens aufweist, um so die Präsentation tumorassoziierter Antigene zu fördern und die tumorspezifische Immunität zu induzieren. Daher kann die Induktion einer T-Zell vermittelten Immunantwort in einem humanen Probanden ausreichen, um die tumorspezifische Toleranz in dem Probanden zu überwinden. Alternativ können, wie unten ausführlicher beschrieben wird, Gene, welche für diese Immunsystemregulatorproteine codieren, oder Nukleinsäuren, welche für die Expression derartiger Proteine regulieren, in eine geeignete Wirtszelle eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 34
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich einer Blutdruck-regulierenden Aktivität
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch hinsichtlich ihrer Blutdruck-regulierenden Aktivität beurteilt werden. Beispielsweise kann die Wirkung der Proteine auf die embryonale Stammzelldifferenzierung beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben sind: Johansson et al., Cell. Biol. 15:141-151, 1995; Keller et al., Mol. Cell. Biol. 13:473-486, 1993; McClanahan et al., Blood 81:2903-2915, 1993.
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine, können auch hinsichtlich ihres Einflusses auf die Lebensdauer von Stammzellen und die Stammzelldifferenzierung beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben sind: Freshney, Methylzellulosekoloniebildende Assays, in „Culture of Hematopoietic Cells", Freshney et al., Hrsg., Seiten 265–268, Wiley-Liss, Inc., New York, NY. 1994; Hirayama et al., Proc. Natl. Acad. Sci. USA 89:5907–5911, 1992; McNiece und Briddell, in "Culture of Hematopoietic Cells", supra; Neben et al., Exp. Hematol. 22:353-359, 1994; Ploemacher und Cobblestone in "Culture of Hematopoietic Cells", supra, 1–21; Spooncer et al., in "Culture of Hematopoietic Cells", supra 163–179 und Sutherland in Culture of Hematopoietic Cells, supra, 139–162.
Diejenigen Proteine, welche eine Blutdruck-regulierende Aktivität aufweisen, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Erkrankungen zu behandeln, bei welchen eine Regulierung des Blutdrucks günstig ist, wie beispielsweise bei der Behandlung von Knochenmark- oder Lymphoidzellmängeln. Eine Beteiligung bei der Regulierung von Blutdruck wird sogar auch durch eine geringfügige biologische Aktivität zugunsten von koloniebildenden Zellen oder von faktorabhängigen Zelllinien deutlich. Zum Beispiel zeigen Proteine einen Nutzen, die das Wachstum und die Proliferation von Erythroidvorläuferzellen allein oder in Kombination mit anderen Zytokinen stimulieren, beispielsweise bei der Behandlung verschiedener Anämien oder zur Verwendung in Verbindung mit Bestrahlung/Chemotherapie, um die Produktion von Erythroidvorläufer und/oder Erythroidzellen zu stimulieren. Proteine, die das Wachstum und die Proliferation von Knochenmarkszellen stimulieren, wie beispielsweise Granulozyten und Monozyten/Macrophagen (d.h. herkömmliche CSF-Aktivität), können beispielsweise in Verbindung mit Chemotherapie nützlich sein, um einer nachfolgenden Knochenmarksdepression vorzubeugen oder diese zu behandeln. Proteine, die das Wachstum und die Proliferation von Megakaryozyten und infolge dessen von Plättchen unterstützen, ermöglichen die Vorbeugung oder die Behandlung verschiedener Plättchenerkrankungen, wie beispielsweise von Thrombozytopenie, und können im Allgemeinen anstelle von oder ergänzend zu Plättchentransfusionen verwendet werden. Proteine, die das Wachstum und die Proliferation von hämatopoetischen Stammzellen unterstützen, die in der Lage sind, zu beliebigen und allen oben erwähnten hämatopoetischen Zellen zu reifen, können deshalb sowohl bei verschiedenen Stammzellerkrankungen ihren therapeutischen Nutzen finden (wie beispielsweise denjenigen, die gewöhnlich mit Transplantation behandelt werden, einschließlich aber ohne Beschränkung auf aplastische Anämie und paroxysmale nächtliche Hämoglobinurie), als auch bei der Neubesiedlung des Stammzellkompartiments nach Bestrahlung/Chemotherapie entweder in vivo oder ex vivo (d.h. in Verbindung mit einer Knochenmarktransplantation oder mit einer peripheren Stammzelltransplantation (homolog oder heterolog)), als auch als normale oder genetisch veränderte Zellen zur Gentherapie. Alternativ können, wie es unten ausführlicher beschrieben wird, Gene, die für Proteine mit Blutdruck-regulierender Aktivität codieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingebracht werden, um wie gewünscht die Expression der Proteine zu steigern oder zu verringern.
Beispiel 35
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich der Regulation von Gewebewachstum
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch hinsichtlich ihrer Wirksamkeit auf Gewebewachstum beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in der internationalen Patentveröffentlichung Nr. WO 95/16035, der internationalen Patentveröffentlichung Nr. WO 95/05846 und der internationalen Patentveröffentlichung Nr. WO 91/07491 offenbart sind.
Assays zur Wundheilungsaktivitätumfassen ohne Beschränkung die Assays, die beschrieben sind in: Winter, Epidermal Wound Healing, Seiten 71–112, Maibach und Rovee, Hrsg., Year Book Medical Publishers, Inc., Chicago, modifiziert von Eaglstein und Mertz, J. Invest. Dermatol. 71:382-84, 1978.
Diejenigen Proteine, die an der Regulation von Gewebewachstum beteiligt sind, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Erkrankungen zu behandeln, bei denen die Regulation von Gewebewachstum günstig ist. Beispielsweise kann ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, sowohl in Zusammensetzungen nützlich sein, die zum Knochen-, Knorpel-, Sehnen-, Bänder- und/oder Nervengewebewachstum oder zur Regeneration verwendet werden, als auch bei der Wundheilung und zur Erneuerung und zum Ersatz von Gewebe, sowie bei der Behandlung von Verbrennungen, Schnittwunden und Entzündungen Verwendung finden.
Ein Protein, das durch erweiterte cDNAs codiert wird, die aus den hierin beschriebenen 5'-ESTs abgeleitet sind, das Knorpel- und/oder Knochenwachstum unter Umständen induziert, unter denen Knochen normalerweise nicht gebildet wird, findet bei der Heilung von Knochenbrüchen und eines Knorpelschadens oder Defektes bei Menschen oder anderen Tieren Anwendung. Eine derartige Präparation, die auf ein erfindungsgemäßes Protein zurückgreift, kann prophylaktisch zur Linderung sowohl von geschlossenen als auch offenen Brüchen und auch für eine verbesserte Fixierung künstlicher Verbindungsstücke verwendet werden. Eine de novo-Knochensynthese, die durch ein osteogenes Mittel induziert wird, trägt zur Reparatur congenitaler, traumainduzierter oder onkologischer resektionsinduzierter, den Schädel betreffender Defekte bei und ist in der kosmetisch-plastischen Chirurgie ebenfalls nützlich.
Ein erfindungsgemäßes Protein kann auch bei der Behandlung peridontaler Erkrankungen und anderen Verfahren zur Zahnreparatur verwendet werden. Solche Mittel können eine Umgebung bereitstellen, um knochenbildende Zellen anzuziehen, das Wachstum knochenbildender Zellen zu stimulieren oder die Differenzierung von Vorläufern knochenbildender Zellen zu induzieren. Ein erfindungsgemäßes Protein kann auch bei der Behandlung von Osteoporose und Osteoarthritis nützlich sein, wie beispielsweise durch Stimulation der Knochen- und/oder Knorpelreparatur oder durch Blockieren von Entzündungen oder Prozessen des Gewebeabbaus (Collagenaseaktivität, Osteoklastenaktivität etc.), die durch Entzündungsprozesse vermittelt werden.
Eine andere Kategorie geweberegenerierender Aktivität, die dem Protein zugeschrieben werden kann, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, ist die Sehnen/Bänderbildung. Ein Protein, das von erweiterten cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, das sehnen/bänderartiges Gewebe oder andere Gewebebildung unter Umständen induziert, unter welchen sich Gewebe normalerweise nicht bildet, findet beim Heilen von Sehnen- oder Bänderrissen, Fehlbildungen oder anderen Sehnen- oder Bänderdefekten bei Menschen oder anderen Tieren Anwendung. Eine derartige Präparation, die ein Protein verwendet, welches sehnen/bänderartiges Gewebe induziert, kann sowohl bei der Schadensvorbeugung für Sehnen- oder Bändergewebe prophylaktische Anwendung finden als auch für eine verbesserten Fixierung von Sehnen oder Bändern gegenüber Knochen oder anderen Geweben, sowie beim Reparieren von Defekten von Sehnen- oder Bändergewebe verwendet werden. Eine de novo-Bildung von sehnen/bänderartigen Geweben, das durch eine Zusammensetzung induziert wird, die durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, trägt zur Reparatur von Sehnen- oder Bänderdefekten mit congenitalem, traumatischem oder anderem Ursprung bei und ist in der kosmetisch-plastischen Chirurgie zum Anbringen oder Reparieren von Sehnen oder Bändern ebenfalls anwendbar. Die Zusammensetzungen, die durch erweiterte cDNAs codiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, können eine Umgebung bereitstellen, um bänder- oder sehnenbildende Zellen anzuziehen, das Wachstum von bänder- oder sehnenbildenden Zellen zu stimulieren, die Differenzierung von Vorläufern von bänder- oder sehnenbildenden Zellen zu induzieren oder das Wachstum von Bänder-/Sehnenzellen oder Vorläuferzellen ex vivo für eine Rückgabe in vivo zu induzieren, um dort eine Gewebereparatur zu bewirken. Die hierin beschriebenen Zusammensetzungen können auch bei der Behandlung von Tendinitis, Carpaltunnelsyndrom und anderen Sehnen- oder Bänderdefekten nützlich sein. Die Zusammensetzungen können wie im Fachbereich bekannt auch eine geeignete Matrix und/oder ein absonderndes Mittel als Träger enthalten.
Das Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann auch bei der Proliferation neuraler Zellen und zur Regenerierung von Nerven- und Gehirngewebe anwendbar sein, d.h. sowohl zur Behandlung von Erkrankungen des zentralen und peripheren Nervensystems und Neuropathien als auch von mechanischen und traumatischen Erkrankungen, die eine Degenerierung, ein Absterben oder Trauma von neuralen Zellen oder Nervengewebe umfassen. Insbesondere kann ein Protein zur Behandlung von Erkrankungen des peripheren Nervensystems verwendet werden, wie beispielsweise Verletzungen peripherer Nerven, peripherer Neuropathie und lokalisierten Neuropathien und Erkrankungen des zentralen Nervensystems, wie beispielsweise Alzheimer-Erkrankung, Parkinson-Erkrankung, Huntington-Erkrankung, amyotropher Lateralsklerose und Shy-Drager-Syndrom. Weitere Erkrankungen, die in Übereinstimmung mit der vorliegenden Erfindung behandelt werden können, umfassen mechanische und traumatische Erkrankungen, wie beispielsweise Rückenmarkserkrankungen, Schädeltrauma und cerebrovaskuläre Erkrankungen, wie beispielsweise Apoplexie. Periphere Neuropathien, die von einer Chemotherapie oder anderen medizinischen Therapien herrühren, können ebenfalls unter Verwendung eines erfindungsgemäßen Proteins behandelbar sein.
Erfindungsgemäße Proteine können auch nützlich sein, um ein besseres Verschließen von nicht heilenden Wunden zu fördern, einschließlich aber ohne Beschränkung auf Druckgeschwüre, mit vaskulärer Insuffizienz im Zusammenhang stehende Geschwüre, chirurgische und traumatische Wunden und dergleichen.
Es wird erwartet, dass ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch eine Aktivität hinsichtlich der Erzeugung oder Regenerierung anderer Gewebe aufweist, wie beispielsweise von Organen (einschließlich zum Beispiel Bauchspeicheldrüse, Leber, Darm, Niere, Haut, Endothel), Muskeln (glatt, quergestreift oder Herz) und vaskulärem Gewebe (einschließlich vaskulärem Endothel) oder zur Wachstumsförderung von Zellen dient, die solches Gewebe umfassen. Ein Teil der gewünschten Wirkungen kann durch Hemmung oder Veränderung fibrotischer Narbenbildung erreicht werden, um so eine Bildung von normalem Gewebe zu ermöglichen. Ein erfindungsgemäßes Protein kann auch angiogenetische Aktivität aufweisen.
Ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann ebenfalls zum Schutz oder zur Regeneration des Darms, sowie zur Behandlung von Lungen- oder Leberfibrose, für Reperfusionsverletzungen in verschiedenen Geweben und Zuständen, die aus einem systemischen Zytokinschaden herrühren, anwendbar sein.
Ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, kann auch beim Fördern oder Hemmen der Differenzierung von oben beschriebenen Geweben aus Vorläufergeweben oder -zellen oder zur Hemmung des Wachstums von oben beschriebenen Geweben nützlich sein.
Alternativ können, wie unten ausführlicher beschrieben wird, Gene, die für Proteine mit wachstumsregulierender Aktivität codieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingebracht werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 36
Untersuchung der durch die erweiterten cDNAs oder durch Abschnittn davon exprimierten Proteine hinsichtlich der Regulation von Fortpflanzungshormonen
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch hinsichtlich ihrer Fähigkeit beurteilt werden, Fortpflanzungshormone, wie beispielsweise Follikel stimulierende Hormone, zu regulieren. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen beschrieben werden: Vale et al., Endocrinol. 91:562-572, 1972; Ling et al., Nature 321:779-782, 1986; Vale et al., Nature 321:776-779, 1986; Mason et al., Nature 318:659-663, 1985; Forage et al., Proc. Natl. Acad. Sci. USA 83:3091-3095, 1986, Kapitel 6.12 in "Current Protocols in Immunology", Coligan et al. Hrsg. Greene Publishing Associates and Wiley-Interscience; Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:140-146, 1995; Muller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol. 153:1762-1768, 1994.
Diejenigen Proteine, welche eine Aktivität wie Fortpflanzungshormone oder wie Regulatoren der Zellbewegung aufweisen, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Erkrankungen zu behandeln, bei welchen die Regulation von Fortpflanzungshormonen günstig ist. Beispielsweise kann ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch mit Activin oder Inhibin in Zusammenhang stehende Aktivitäten aufweisen. Inhibine sind durch ihre Fähigkeit gekennzeichnet, die Freisetzung des follikelstimulierenden Hormons (FSH) zu hemmen, während Activine durch ihre Fähigkeit gekennzeichnet sind, die Freisetzung von FSH zu stimulieren. Daher kann ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, allein oder in Form von Heterodimeren mit einem Mitglied der Inhibin α-Familie als Verhütungsmittel anwendbar sein, wobei dies auf der Fähigkeit der Inhibine basiert, die Fruchtbarkeit in weiblichen Säugern sowie die Spermatogenese in männlichen Säugern zu senken. Die Verabreichung ausreichender Mengen anderer Inhibine kann in diesen Säugern Unfruchtbarkeit induzieren. Alternativ kann das erfindungsgemäße Protein als Homodimer oder Heterodimer mit anderen Proteinuntereinheiten der Inhibin-B-Gruppe als Fruchtbarkeitinduzierendes Therapeutikum verwendet werden, wobei dies auf der Fähigkeit von Activinmolekülen basiert, die FSH-Freisetzung aus Zellen des Hypophysenvorderlappens zu stimulieren. Siehe zum Beispiel US-Patent 4,798,885. Ein erfindungsgemäßes Protein kann auch zur Förderung des Beginns der Fruchtbarkeit in nicht geschlechtsreifen Säugetieren anwendbar sein, um so die reproduktive Lebensleistung von Haustieren, wie beispielsweise Kühen, Schafen und Schweinen, zu erhöhen.
Alternativ können, wie es unten ausführlicher beschrieben wird, Gene, die für Proteine mit regulierender Aktivität im Hinblick auf Fortpflanzungshormone codieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 37
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich ihrer chemotaktischen/chemokinetischen Aktivität
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch bezüglich ihrer chemotaktischen/chemokinetischen Aktivität beurteilt werden. Beispielsweise kann ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, chemotaktische oder chemokinetische Aktivität für Säugetierzellen aufweisen (z.B. als ein Chemokin wirken), einschließlich zum Beispiel Monozyten, Fibroblasten, Neutrophile, T-Zellen, Mastzellen, Eosinophile, Epithel- und/oder Endothelzellen. Chemotaktische und chemokinetische Proteine können verwendet werden, um eine gewünschte Zellpopulation zu einen gewünschten Wirkungsort hin zu mobilisieren oder anzuziehen. Chemotaktische oder chemokinetische Proteine stellen sowohl bestimmte Vorteile bei der Behandlung von Wunden und anderen Gewebetrauma als auch bei der Behandlung lokalisierter Infektionen bereit. Beispielsweise kann das Anziehen von Lymphozyten, Monozyten oder Neutrophilen zu Tumoren oder Infektionsstellen zu verbesserten Immunantworten gegen den Tumor oder das infektiöse Mittel führen.
Ein Protein oder Peptid weist für eine bestimmte Zellpopulation chemotaktische Aktivität auf, wenn es die gerichtete Orientierung oder Bewegung einer solchen Zellpopulation direkt oder indirekt stimulieren kann. Vorzugsweise weist das Protein oder Peptid die Fähigkeit auf, die gerichtete Bewegung der Zellen direkt zu stimulieren. Ob ein bestimmtes Protein chemotaktische Aktivität für eine Zellpopulation aufweist, kann unter Verwendung eines derartigen Proteins oder Peptids auf einfache Weise in jedem bekannten Assay zur Chemotaxis von Zellen bestimmt werden.
Die Aktivität eines erfindungsgemäßen Proteins kann neben anderen Möglichkeiten durch die folgenden Verfahren gemessen werden: Assays zur chemotaktischen Aktivität (die Proteine identifizieren, die Chemotaxis induzieren oder verhindern) bestehen aus Assays, die sowohl die Fähigkeit eines Proteins messen, die Wanderung von Zellen über eine Membran hinweg zu induzieren als auch die Fähigkeit eines Proteins, die Adhäsion einer Zellpopulation an eine andere Zellpopulation zu induzieren. Geeignete Assays zur Bewegung und Adhäsion umfassen ohne Beschränkung diejenigen, welche beschrieben sind in: „Current Protocols in Immunology", Hrsg. von Coligan, Kruisbeek, Margulies, Shevach und Strober, Pub. Greene Publishing Associates and Wiley-Interscience, Kapitel 6.12:6.12.1-6.12.28; Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:140-146, 1995; Mueller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol., 153:1762-1768, 1994.
Beispiel 38
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich der Regulation der Blutgerinnung
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch hinsichtlich ihrer Wirkungen auf die Blutgerinnung beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen offenbart sind: Linet et al., J. Clin. Pharmacol. 26:131-140, 1986; Burdick et al., Thrombosis Res. 45:413-419, 1987; Humphrey et al., Fibrinolysis 5:71-79, 1991; Schaub, Prostaglandins 35:467-474, 1988.
Diejenigen Proteine, welche an der Regulierung der Blutgerinnung beteiligt sind, können dann als Pharmazeutika formuliert werden und verwendet werden, um klinische Erkrankungen zu behandeln, bei welchen die Regulierung der Blutgerinnung günstig ist. Beispielsweise kann ein erfindungsgemäßes Protein hämostatische oder thrombolytische Aktivität aufweisen. Im Ergebnis wird von einem derartigen Protein erwartet, dass es bei der Behandlung verschiedener Gerinnungskrankheiten (einschließlich Erbrankheiten, wie zum Beispiel Bluterkrankheiten) oder zur Steigerung der Gerinnung und anderen hämostatischen Ereignissen beim Behandeln von Wunden, die aus Trauma, chirurgischen Eingriffen oder anderen Gründen herrühren, nützlich ist. Ein erfindungsgemäßes Protein kann auch nützlich sein zur Auflösung oder zur Hemmung der Bildung von Thrombosen und zur Behandlung und Vorbeugung von Erkrankungen, die sich daraus ergeben (wie beispielsweise Herzinfarkt und Infarkt von Gefäßen des zentralen Nervensystems (z.B. Apoplexie)). Alternativ können, wie unten ausführlicher beschrieben wird, Gene, die für Proteine mit Blutgerinnungsaktivität codieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingefügt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 39
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich ihrer Beteiligung bei Rezeptor/Ligand-Wechselwirkungen
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch hinsichtlich ihrer Beteiligung bei Rezeptor/Ligandwechselwirkungen beurteilt werden. Zahlreiche Assays im Hinblick auf eine derartige Beteiligung sind dem Fachmann bekannt, einschließlich der Assays, die in den folgenden Referenzen offenbart werden: Kapitel 7. 7.28.1-7.28.22 in "Current Protocols in Immunology", Coligan et al. Hrsg. Greene Publishing Associates and Wiley-Interscience; Takai et al., Proc. Natl. Acad. Sci. USA 84:6864-6868, 1987; Bierer et al., J. Exp. Med. 168:1145-1156, 1988; Rosenstein et al., J. Exp. Med. 169:149-160, 1989; Stoltenborg et al., J. Immunol. Methods 175:59-68, 1994; Stitt et al., Cell 80:661-670, 1995; Gyuris et al., Cell 75:791-803, 1993.
Beispielsweise können die Proteine, die durch erweiterte cDNAs codiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch eine Aktivität als Rezeptoren, Rezeptorliganden oder Inhibitoren oder als Agonisten von Rezeptor/Ligandwechselwirkungen aufweisen. Beispiele für solche Rezeptoren und Liganden umfassen ohne Beschränkung Zytokinrezeptoren und ihre Liganden, Rezeptorkinasen und ihre Liganden, Rezeptorphosphatasen und ihre Liganden, Rezeptoren, die an Zell-Zell-Wechselwirkungen beteiligt sind und ihre Liganden (einschließlich aber ohne Beschränkung auf zelluläre Adhäsionsmoleküle (wie beispielsweise Selektine, Integrine und ihre Liganden) und Rezeptor/Ligandpaare, die bei der Antigenpräsentation, Antigenerkennung und an der Entwicklung zellulärer und humoraler Immunantworten beteiligt sind). Rezeptoren und Liganden sind auch zum Screening nach möglichen Peptiden oder kleinen Molekülen, die als Inhibitoren der relevanten Rezeptor/Ligandwechselwirkung wirken, nützlich. Ein Protein, das durch erweiterte cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind (einschließlich aber ohne Beschränkung auf Fragmente von Rezeptoren und Liganden), kann selbst als Inhibitor von Rezeptor/Ligandwechselwirkungen verwendet werden. Alternativ, wie es unten ausführlicher beschrieben wird, können Gene, die für Proteine codieren, die bei Rezeptor/Ligandwechselwirkungen beteiligt sind, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 40
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich entzündungshemmender Aktivität
Die durch die erweiterten cDNAs oder einen Abschnitt davon codierten Proteine können auch hinsichtlich ihrer entzündungshemmenden Aktivität beurteilt werden. Die entzündungshemmenden Aktivität kann erreicht werden durch Bereitstellen eines Stimulus für an der Entzündungsreaktion beteiligte Zellen, durch Hemmung oder Förderung von Zell-Zell-Wechselwirkungen (wie zum Beispiel Zelladhäsion), durch Hemmung oder Förderung von am Entzündungsprozess beteiligter Zellchemotaxis, durch Hemmung oder Förderung von Flüssigkeitsaustritt aus der Zelle oder durch Stimulierung oder Unterdrückung der Produktion anderer Faktoren, die eine Entzündungsreaktion auf direktere Weise hemmen oder fördern. Proteine, die solche Aktivitäten aufweisen, können verwendet werden, um entzündliche Zustände zu behandeln, einschließlich chronischer oder akuter Zustände, einschließlich aber ohne Beschränkung auf Entzündungen, die im Zusammenhang stehen mit einer Infektion (wie zum Beispiel einem septischen Schock, einer Sepsis oder einem systemischem Entzündungsreaktionssyndrom), Ischämie-Reperfusionsverletzung, Endotoxin-Sterblichkeit, Arthritis, komplementvermittelte hyperakute Abstoßungsreaktion, Nephritis, Zytokin- oder chemokininduzierte Lungenverletzung, entzündliche Darmerkrankung, Crohn-Erkrankung oder Erkrankungen, welche sich aus einer Überproduktion von Zytokinen ergeben, wie beispielsweise TNF oder IL-1. Erfindungsgemäße Proteine können auch nützlich sein, um Anaphylaxie und Hyperempfindlichkeit gegenüber einer anti genen Substanz oder einem antigenen Material zu behandeln. Alternativ können, wie unten ausführlicher beschrieben wird, Gene, die für Proteine mit entzündungshemmender Aktivität codieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 41
Untersuchung der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine hinsichtlich einer Aktivität bei der Hemmung von Tumoren
Die durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine können auch hinsichtlich ihrer Aktivität bei der Hemmung von Tumoren beurteilt werden. Zusätzlich zu den oben beschriebenen Aktivitäten zur immunologischen Behandlung oder Vorbeugung von Tumoren kann ein erfindungsgemäßes Protein eine andere Antitumoraktivität aufweisen. Ein Protein kann Tumorwachstum direkt oder indirekt (wie zum Beispiel durch ADCC) hemmen. Ein Protein kann seine Wirkung bei der Tumorhemmung zeigen durch Einwirken auf Tumorgewebe oder Tumorvorläufergewebe, durch Hemmung der Bildung von Geweben, die notwendig sind, um das Tumorwachstum zu unterstützen (wie beispielsweise durch Hemmung von Angiogenese), durch Auslösen der Produktion anderer Faktoren, Mittel oder Zelltypen, welche das Tumorwachstum hemmen, oder durch Unterdrücken, Entfernen oder Hemmen von Faktoren, Mitteln oder Zelltypen, welche das Tumorwachstum fördern. Alternativ können, wie unten ausführlicher beschrieben wird, Gene, die für Proteine mit einer Tumor hemmenden Aktivität codieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Ein erfindungsgemäßes Protein kann auch eine oder mehrere der folgenden zusätzlichen Aktivitäten oder Wirkungen aufweisen: Hemmung des Wachstums, Infektion oder Funktion von, oder das Abtöten von infektiösen Mitteln, einschließlich, aber ohne Beschränkung auf Bakterien, Viren, Pilze und andere Parasiten; Einwirkung auf körperliche Merkmale (unterdrückend oder verstärkend), einschließlich, aber ohne Beschränkung auf Größe, Gewicht, Haarfarbe, Augenfarbe, Haut, Fett-zu-Fettfreiverhältnis oder eine andere Gewebepigmentierung oder Größe oder Form von Organen oder des Körpers (beispielsweise Brustvergrößerung oder -verkleinerung, Änderung der Knochenform oder -gestalt); Einwirken auf den Biorhythmus oder 24-Stunden-Zyklen oder Rhythmen: Einwirken auf die Fruchtbarkeit von männlichen oder weiblichen Probanden; Einwirken auf den Metabolismus, Katabolismus, Anabolismus, die Verarbeitung, die Verwertung, Speicherung oder Entfernung von diätischem Fett, Lipid, Protein, Kohlenhydrat, Vitaminen, Mineralien, Cofaktoren oder anderen Ernährungsfaktoren oder -komponente(n); Einwirken auf Verhaltensmerkmale, einschließlich, aber ohne Beschränkung auf Appetit, Libido, Stress, Denkfähigkeit (einschließlich kognitiver Erkrankungen), Depression (einschließlich depressiver Erkrankungen) und gewalttätigen Verhaltensmustern; Bereitstellung analgetischer Wirkungen oder anderer schmerzverringernder Wirkungen; Förderung von Differenzierung und Wachstum von embryonalen Stammzellen in Linien, die sich von hämotopoetischen Linien unterscheiden; hormonelle oder endokrine Aktivität; im Fall von Enzymen Korrektur von Mangelfunktionen des Enzyms und Behandlung von Erkrankungen, die mit einer Mangelfunktion im Zusammenhang stehen; Behandlung hyperproliferativer Erkrankungen (wie beispielsweise Psoriasis); immunglobulinartiger Aktivität (wie beispielsweise die Fähigkeit, Antigene oder ein Komplement zu binden); und die Fähigkeit, als Antigen in einer Impfstoffzusammensetzung zu wirken, um eine Immunantwort gegen ein derartiges Protein oder ein anderes Material oder eine Einheit, die mit einem derartigen Protein kreuzreaktiv ist, hervorzurufen. Alternativ können, wie es unten ausführlicher beschrieben wird, Gene, die für Proteine codieren, die mit einer der oben dargelegten Aktivitäten in Zusammenhang stehen, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu erniedrigen.
Beispiel 42
Identifizierung von Proteinen, welche mit Polypeptiden wechselwirken, welche durch erweiterte cDNAs codiert werden
Proteine, die mit den Polypeptiden wechselwirken, die durch erweiterte cDNAs codiert werden, die von den 5'-ESTs oder Fragmenten davon abgeleitet sind, wie beispielsweise Rezeptorproteine, können unter Verwendung von zwei Hybridsystemen identifiziert werden, wie beispielsweise dem Matchmaker Two Hybrid System 2 (Katalog Nr. K1604-1, Clontech). Wie es im dem Kit beigelegten Handbuch beschrieben wird, welches hierin durch Bezugnahme umfasst ist, werden die cDNAs, die von den 5'-ESTs abgeleitet sind, oder Fragmente davon in einen Expressionsvektor insertiert, so dass sie sich im Leserahmen mit DNA befinden, welche für die DNA-Bindungsdomäne des Hefetranskriptionsaktivators GAL4 codiert. cDNAs in einer cDNA-Bibliothek, die für Proteine codiert, die mit den Polypeptiden, die durch die erweiterten cDNAs oder Abschnitte davon codiert werden, wechselwirken könnten, werden in einen zweiten Expressionsvektor insertiert, so dass sie sich im Leserahmen mit der DNA befinden, welche für die Aktivierungsdomäne von GAL4 codiert. Die zwei Expressionsplasmide werden in Hefe transformiert und die Hefe wird auf Selektionsmedium ausplattiert, das sowohl hinsichtlich einer Expression selektierbarer Marker auf jedem der beiden Expressionsvektoren als auch hinsichtlich der GAL4-abhängigen Expression des HIS3-Gens selektiert. Transformanten, die in der Lage sind, auf Medium ohne Histidin zu wachsen, werden hinsichtlich GAL4-abhängiger IacZ-Expression gescreent. Solche Zellen, die sowohl bezüglich der Histidinselektion und des IacZ-Assays positiv sind, enthalten Plasmide, die für Proteine codieren, die mit den Polypeptiden wechselwirken, die durch die erweiterten cDNAs oder Abschnitte codiert werden.
Alternativ kann das System, das in Lustig et al., Methods in Enzymology 283:83-99, 1997 und im US-Patent Nr. 5,654,150 beschrieben wird, verwendet werden, um Moleküle zu identifizieren, die mit den Polypeptiden wechselwirken, die durch erweiterte cDNAs codiert werden. In solchen Systemen werden in vitro-Transkriptionsreaktionen bezüglich eines Pools von Vektoren durchgeführt, die erweiterte cDNA-Inserts enthalten, die stromabwärts eines Promotors kloniert sind, der die in vitro-Transkription lenkt. Die resultierenden mRNA-Pools werden in Xenopus laevis-Oozyten eingeführt. Die Oozyten werden anschließend hinsichtlich einer gewünschten Aktivität untersucht.
Alternativ können die vereinigten, wie oben beschrieben hergestellten in vitro-Transkriptionsprodukte in vitro translatiert werden. Die vereinigten in vitro-Translationsprodukte können hinsichtlich einer gewünschten Aktivität oder hinsichtlich einer Wechselwirkung mit einem bekannten Polypeptid untersucht werden.
Proteine oder andere Moleküle, die mit Polypeptiden wechselwirken, die durch erweiterte cDNAs codiert werden, können durch eine Vielfalt zusätzlicher Techniken nachgewiesen werden. In einem Verfahren können Affinitätssäulen erstellt werden, die das Polypeptid enthalten, das durch die erweiterte cDNA oder einen Abschnitt davon codiert wird. In einigen Versionen dieses Verfahrens enthält die Affinitätssäule chimäre Proteine, in denen das Protein, das durch die erweiterten cDNAs oder einen Abschnitt davon codiert wird, mit einer Glutathion-S-Transferase fusioniert ist. Ein Gemisch zellulärer Proteine oder ein Pool wie oben beschrieben exprimierter Proteine wird auf die Affinitätssäule aufgetragen. Proteine, die mit dem Polypeptid wechselwirken, das an die Säule angefügt ist, können anschließend isoliert und auf einem 2-D-Elektrophoresegel analysiert werden, wie es in Rasmunsen et al., Electrophoresis 18:588-598, 1997, beschrieben wird. Alternativ können die Proteine, die auf der Affinitätssäule zurückgehalten werden, durch Verfahren, die auf Elektrophorese basieren, gereinigt und sequenziert werden. Das gleiche Verfahren kann verwendet werden, um Antikörper zu isolieren, um Phagen-Display-Produkte zu screenen oder um humane Phagen-Display-Antikörper zu screenen.
Proteine, die mit Polypeptiden wechselwirken, die durch erweiterte cDNAs oder Abschnitte davon codiert werden, können auch unter Verwendung eines optischen Biosensors durchmustert werden, wie er in Edwards und Leatherbarrow, Analytical Biochemistry 246:1-6,1997, beschrieben wird. Der Hauptvorteil des Verfahrens ist, dass es die Bestimmung der Assoziierungsrate zwischen dem Protein und anderen wechselwirkenden Molekülen ermöglicht. Daher ist es möglich, spezifisch wechselwirkende Moleküle mit einer hohen oder niedrigen Assoziierungsrate zu selektieren. Normalerweise wird ein Zielmolekül mit einer Sensoroberfläche verknüpft (über eine Carboxymethyldextranmatrix) und eine Probe mit Testmolekülen wird mit den Zielmolekülen in Kontakt gebracht. Das Binden eines Testmoleküls an das Zielmolekül führt zu einer Veränderung hinsichtlich des Brechungsindex und/oder der Dicke. Diese Veränderung wird durch den Biosensor detektiert, vorausgesetzt sie vollzieht sich im evaneszenten Feld (das sich einige hundert Nanometer von der Sensoroberfläche ausdehnt). In diesen Screening-Assays kann das Zielmolekül eines der Polypeptide sein, die durch erweiterte cDNAs oder einen Abschnitt davon codiert werden, und die Testprobe kann eine Sammlung von Proteinen sein, die aus Geweben oder Zellen extrahiert wurde, ein Pool exprimierter Proteine, kombinatorische Peptide und/oder chemische Bibliotheken oder Peptide aus einem Phagen-Display. Die Gewebe oder Zellen, von welchen die Testproteine extrahiert werden, können von jeder beliebigen Spezies stammen.
In anderen Verfahren wird ein Zielmolekül immobilisiert und die Testpopulation ist eine Kollektion einzelner Polypeptide, die durch die erweiterten cDNAs oder Abschnitte davon codiert wird.
Um die Wechselwirkung der Proteine, die durch die erweiterten cDNAs oder Abschnitte davon codiert werden, mit Arzneimitteln zu untersuchen, kann das mit Mikrodialyse gekoppelte HPLC-Verfahren, das von Wang et al., Chromatographia 44:205-208, 1997, beschrieben wurde, oder das Affinitätskapillarelektrophoreseverfahren, das von Busch et al., J. Chromatogr. 777:311-328, 1997, beschrieben wurde, verwendet werden.
Es wird vom Fachmann erkannt, dass die von den erweiterten cDNAs oder Abschnitten davon exprimierten Proteine zusätzlich zu den oben spezifisch aufgezählten Aktivitäten hinsichtlich zahlreicher anderer Aktivitäten untersucht werden können. Beispielsweise können die exprimierten Proteine im Hinblick auf Anwendungen beurteilt werden, die Kontrolle und Regulierung von Entzündungen, Tumorproliferation oder Metastasis, Infektionen oder andere klinische Zustände umfassen. Zusätzlich können die von den erweiterten cDNAs oder Abschnitten davon exprimierten Proteine als Nahrungsmittel oder kosmetische Mittel nützlich sein.
Die von den cDNAs oder Abschnitten davon exprimierten Proteine können verwendet werden, um Antikörper zu erzeugen, die in der Lage sind, spezifisch an das exprimierte Protein oder Fragmente davon zu binden, wie es in Beispiel 40 unten beschrieben wird. Die Antikörper können in der Lage sein, an ein Volllängenprotein, das durch eine cDNA codiert wird, die von einem 5'-EST abgeleitet ist, an ein reifes Protein (d.h. das Protein, das durch Abspaltung des Signalpeptids erzeugt wird), das durch eine cDNA codiert ist, die von einem 5'-EST abgeleitet ist, oder an ein Signalpeptid zu binden, das durch eine cDNA codiert wird, die von einem 5'-EST abgeleitet ist. Alternativ können die Antikörper in der Lage sein, Fragmente mit mindestens 10 Aminosäuren der Proteine, die durch die obigen cDNAs codiert werden, zu binden. In einigen Ausführungsformen können die Antikörper in der Lage sein, Fragmente mit mindestens 15 Aminosäuren der durch die obigen cDNAs codierten Proteine zu binden. In anderen Ausführungsformen können die Antikörper in der Lage sein, Fragmente mit mindestens 25 Aminosäuren der Proteine, die durch die erweiterten cDNAs exprimiert werden, die mindestens 25 Aminosäuren der Proteine umfassen, die durch die obigen cDNAs codiert werden, zu binden. In anderen Ausführungsformen können die Antikörper in der Lage sein, Fragmente von mindestens 40 Aminosäuren der durch die obigen cDNAs codierten Proteine zu binden.
Beispiel 43
Herstellung eines Antikörpers für ein humanes Protein
Ein im Wesentlichen reines Protein oder Polypeptid wird, wie in Beispiel 30 beschrieben, aus den transfizierten und transformierten Zellen isoliert. Die Konzentration des Proteins in der Endpräparation wird auf einen Wert im Bereich von wenigen μg/ml angepasst, beispielsweise durch Konzentrierung auf einer Amicon-Filtervorrichtung. Ein monoklonaler oder polyklonaler Antikörper gegen das Protein kann anschließend wie folgt hergestellt werden:
1. Herstellung monoklonaler Antikörper durch Hybridom-Fusion
Monoklonale Antikörper gegen Epitope beliebiger Peptide, die wie oben beschrieben identifiziert und isoliert worden sind, können gemäß dem klassischen Verfahren von Kohler und Milstein, Nature 256:495, 1975, oder davon abgeleiteten Verfahren aus murinen Hybridomen hergestellt werden. In Kürze, eine Maus wird wiederholt mit wenigen Mikrogramm des ausgewählten Proteins oder davon abgeleiteter Peptide über einen Zeitraum von wenigen Wochen beimpft. Die Maus wird anschließend getötet und die Antikörper erzeugenden Milzzellen werden isoliert. Die Milzzellen werden mittels Polyethylenglycol mit Mausmyelomzellen fusioniert und der Überschuss an unfusionierten Zellen wird zerstört durch Anzucht des Systems auf selektiven Medien, die Aminopterin umfassen (HAT-Medien). Die erfolgreich fusionierten Zellen werden verdünnt und Aliquote der Verdünnung werden in Wells einer Mikrotiterplatte platziert, wobei das Kulturwachstum dort fortgeführt wird. Antikörper-erzeugende Klone werden durch Immunoassayverfahren über die Detektion eines Antikörpers im Überstandfluid der Wells und davon abgeleiteten Verfahren identifiziert, wie beispielsweise durch einen ELISA, der ursprünglich von Engvall, Meth. Enzymol. 70:419, 1980, beschrieben wird. Ausgewählte positive Klone können expandiert werden und ihr monoklonales Antikörperprodukt kann zur Verwendung geerntet werden. Ausführliche Verfahren zur Herstellung monoklonaler Antikörper werden in Davis et al., in Basic Methods in Molecular Biology Elsevier, New York, Abschnitt 21-2 beschrieben.
2. Erzeugung polyklonaler Antikörper durch Immunisierung
Polyklonales Antiserum, das Antikörper für heterogene Epitope eines einzelnen Proteins enthält, kann durch Immunisierung geeigneter Tiere mit dem exprimierten Protein oder davon abgeleiteten Peptiden hergestellt werden, wobei diese unverändert oder verändert sein können, um die Immunogenität zu steigern. Eine effektive Herstellung polyklonaler Antikörper wird durch viele Faktoren beeinflusst, die sowohl mit dem Antigen als auch der Wirtsspezies im Zusammenhang stehen. Beispielsweise neigen kleine Moleküle dazu, weniger immunogen als andere zu sein und können die Verwendung von Trägern und Adjuvantien erfordern. Die Reaktion der Wirtstiere kann in Abhängigkeit von der Impfstelle und den Dosierungen ebenfalls variieren, wobei sowohl unzureichende als auch überschüssige Dosen an Antigen zu Antiseren mit niedrigem Titer führen. Geringe Dosen (ng-Mengen) an Antigen, die an mehreren intradermalen Stellen verabreicht werden, scheinen am verlässlichsten zu sein. Ein effektives Immunisierungsprotokoll für Kaninchen kann Vaitukaitis et al., J. Clin. Endocrinol. Metab. 33:988-991 (1971) entnommen werden.
Auffrischungsinjektionen können in regelmäßigen Abständen verabreicht werden und Antiserum kann geerntet werden, wenn der Antikörpertiter des Antiserums zu fallen beginnt, wobei dies halb quantitativ bestimmt wird, wie beispielsweise durch doppelte Immunodiffusion in Agar gegen bekannte Konzentrationen des Antigens. Siehe zum Beispiel Ouchterlony et al., Kapitel 19 in: Handbook of Experimental Immunology D. Wier (Hrsg.) Blackwell (1973). Die Plateaukonzentration des Antikörpers liegt gewöhnlich im Bereich von 0,1 bis 0,2 mg/ml Serum (etwa 12 μM). Die Affinität der Antiseren für das Antigen wird durch Erstellung kompetetiver Bindungskurven bestimmt, wie es beispielsweise durch Fisher, D., Kapitel 42 in: Manual of Clinical Immunology, 2. Ausgabe (Rose und Friedman, Hrsg.) Amer. Soc. For Microbiol., Washington, D.C. (1980) beschrieben wird.
Nach einem der beiden Protokolle hergestellte Antikörperpräparationen sind in quantitativen Immunoassays zur Konzentrationsbestimmung von antigentragenden Substanzen in biologischen Proben nützlich; sie werden halb-quantitativ oder qualitativ verwendet, um das Vorliegen eines Antigens in einer biologischen Probe zu identifizieren. Die Antikörper können auch in therapeutischen Zusammensetzungen zum Abtöten von Zellen verwendet werden, die das Protein exprimieren, oder sie können zur Verringerung der Menge an Protein im Körper verwendet werden.
V. Verwendung von 5'-ESTs oder Sequenzen, die davon erhältlich sind oder Abschnitten davon, als Reagenzien
Die hierin beschriebenen 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können als Reagenzien in Isolierungsverfahren, diagnostischen Assays und forensischen Verfahren verwendet werden. Beispielsweise können Sequenzen aus den 5'-ESTs (oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind) detektierbar markiert werden und als Sonden verwendet werden, um andere Sequenzen zu isolieren, die mit ihnen hybridisieren können. Zusätzlich können Sequenzen aus 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) verwendet werden, um PCR- Primer zu konzipieren, die in Isolierungsverfahren, diagnostischen und forensischen Verfahren verwendet werden.
I. Verwendung von 5'-ESTs oder davon erhältlichen Sequenzen oder Abschnitten davon in Isolierungsverfahren, diagnostischen und forensischen Verfahren
Beispiel 44
Herstellung von PCR-Primern und Amplifizierung von DNA
Die 5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können verwendet werden, um PCR-Primer für eine Vielfalt von Anwendungen herzustellen, einschließlich Isolierungsverfahren zur Klonierung von Nukleinsäuren, die in der Lage sind, an derartigen Sequenzen zu hybridisieren, diagnostischen Techniken und forensischen Techniken. Die PCR-Primer sind mindestens 10 Basen und vorzugsweise mindestens 12, 15 oder 17 Basen lang. Mehr bevorzugt sind die PCR-Primer mindestens 20–30 Basen lang. In einigen Ausführungsformen können die PCR-Primer mehr als 30 Basen lang sein. Es ist bevorzugt, dass die Primerpaare in etwa das gleiche G/C-Verhältnis aufweisen, so dass die Schmelztemperaturen in etwa die gleichen sind. Eine Vielfalt an PCR-Techniken ist dem Fachmann bekannt. Für eine Übersicht zur PCR-Technologie siehe Molecular Cloning to Genetic Engineering, White Hrsg. In Methods in Molecular Biology 67:Humana Press, Totowa 1997. In jedem dieser PCR-Verfahren werden PCR-Primer an beiden Seiten der zu amplifizierenden Nukleinsäuresequenzen zusammen mit dNTPs und einer thermostabilen Polymerase, wie beispielsweise Taq-Polymerase, Pfu-Polymerase oder Vent-Polymerase, zu einer geeignet hergestellten Nukleinsäureprobe zugegeben. Die Nukleinsäure in der Probe wird denaturiert und die PCR-Primer werden spezifisch an komplementäre Nukleinsäuresequenzen in der Probe hybridisiert. Die hybridisierten Primer werden verlängert. Danach wird ein weiterer Zyklus aus Denaturierung, Hybridisierung und Verlängerung begonnen. Zur Erzeugung eines amplifizierten Fragments, das die Nukleinsäuresequenz zwischen den Primerstellen enthält, werden die Zyklen mehrmals wiederholt.
Beispiel 45
Verwendung von 5'-ESTs als Sonden
Sonden, die von 5'-ESTs abgeleitet sind (oder von cDNAs oder genomischen DNAs, die davon erhältlich sind), einschließlich Volllängen-cDNAs oder genomischen Sequenzen, können mit dem Fachmann bekannten detektierbaren Markierungen, einschließlich Radioisotopen und nicht radioaktiven Markierungen, markiert werden, um eine detektierbare Sonde bereitzustellen. Die detektierbare Sonde kann einzelsträngig oder doppelsträngig sein und kann unter Verwendung von dem Fachmann bekannten Techniken hergestellt werden, einschließlich in vitro-Transkription, Nick-Translation oder Kinasereaktionen. Eine Nukleinsäureprobe, die eine Sequenz enthält, die in der Lage ist, mit der markierten Sonde zu hybridisieren, wird mit der markierten Sonde in Kontakt gebracht. Wenn die Nukleinsäure in der Probe doppelsträngig ist, kann sie vor dem Inkontaktbringen mit der Sonde denaturiert werden. In einigen Anwendungen kann die Nukleinsäureprobe auf einer Oberfläche, wie beispielsweise einer Nitrozellulose- oder einer Nylonmembran, immobilisiert werden. Die Nukleinsäureprobe kann Nukleinsäuren umfassen, die aus einer Vielfalt an Quellen erhalten wurden, einschließlich genomischer DNA, cDNA-Bibliotheken, RNA oder Gewebeproben.
Verfahren, die verwendet werden, um das Vorliegen von Nukleinsäuren zu detektieren, die in der Lage sind, an die detektierbare Sonde zu hybridisieren, umfassen allgemein bekannte Techniken, wie beispielsweise Southern Blotting, Northern Blotting, Dot Blotting, Koloniehybridisierung und Plaquehybridisierung. In einigen Anwendungen kann die Nukleinsäure, die zur Hybridisierung an die markierte Sonde fähig ist, in Vektoren kloniert werden, wie beispielsweise Expressionsvektoren, Sequenzierungsvektoren oder in vivo-Transkriptionsvektoren, um die Charakterisierung und Expression der hybridisierenden Nukleinsäuren in der Probe zu ermöglichen. Beispielsweise können derartige Techniken verwendet werden, um Sequenzen in einer genomischen Bibliothek oder einer cDNA-Bibliothek zu isolieren und zu klonieren, die in der Lage sind, an die detektierbare Probe zu hybridisieren, wie es in Beispiel 30 oben beschrieben wird.
PCR-Primer, die, wie in Beispiel 44 oben beschrieben, hergestellt wurden, können in forensischen Analysen verwendet werden, wie beispielsweise den DNA-Fingerprint-Techniken, wobei dies in den Beispielen 46–50 unten beschrieben wird. In solchen Analysen können detektierbare Sonden oder Primer verwendet werden, die auf den Sequenzen der 5'-ESTs oder der cDNAs oder der genomischen DNAs, die unter Verwendung der 5'-ESTs isoliert wurden, basieren.
Beispiel 46
Forensischer Abgleich durch DNA-Sequenzierung
In einem beispielhaften Verfahren werden DNA-Proben, die aus forensischen Einzelproben isoliert wurden, zum Beispiel Haar-, Sperma-, Blut- oder Hautzellen, durch herkömmliche Verfahren isoliert. Ein Panel an PCR-Primern, welche basieren auf einer Anzahl der 5'-ESTs aus Beispiel 25 oder cDNAs oder genomischen DNAs, die daraus wie oben beschrieben isoliert wurden, wird anschließend in Übereinstimmung mit Beispiel 44 verwendet, um DNA mit einer Länge von etwa 100–200 Basen aus den forensischen Einzelproben zu amplifizieren. Entsprechende Sequenzen werden aus einem Testprobanden erhalten. Jede dieser Identifizierungs-DNAs wird anschließend unter Verwendung von Standardtechniken sequenziert und ein einfacher Datenbankvergleich bestimmt die Unterschiede, falls vorhanden, zwischen den Sequenzen aus dem Probanden und denen aus der Probe. Statistisch signifikante Unterschiede zwischen DNA-Sequenzen des Verdächtigen und denen aus der Probe belegen beweiskräftig ein Fehlen von Identität. Dieses Fehlen an Identität kann beispielsweise mit nur einer Sequenz bestätigt werden. Andererseits sollte Identität mit einer großen Zahl von Sequenzen, die alle übereinstimmen, gezeigt werden. Vorzugsweise wird ein Minimum von 50 statistisch identischen Sequenzen mit 100 Basen Länge verwendet, um die Identität zwischen dem Verdächtigen und der Probe zu beweisen.
Beispiel 47
Positive Identifizierung durch DNA-Sequenzierung
Die im vorausgehenden Beispiel aufgezeigte Technik kann in einem größeren Maßstab auch verwendet werden, um eine eindeutige Identifizierung in der Art eines Fingerabdrucks von einem beliebigen Individuum bereitzustellen. In dieser Technik werden Primer aus einer großen Anzahl von 5'-EST-Sequenzen aus Beispiel 25 oder cDNA oder genomische DNA-Sequenzen, die davon erhältlich sind, hergestellt. Vorzugsweise werden 20 bis 50 verschiedene Primer verwendet. Diese Primer werden verwendet, um eine entsprechende Anzahl PCR-generierter DNA-Segmente des fraglichen Individuums in Übereinstimmung mit Beispiel 44 zu erzeugen. Jedes dieser DNA-Segmente wird unter Verwendung der in Beispiel 46 dargelegten Verfahren sequenziert. Die Sequenzdatenbanken, die durch dieses Verfahren erzeugt wurden, identifizieren eindeutig das Individuum, von dem die Sequenzen erhalten wurden. Das gleiche Panel an Primern kann dann zu einem beliebigen späteren Zeitpunkt verwendet werden, um Gewebe oder andere biologische Einzelproben mit diesem Individuum in absoluten Bezug zu setzen.
Beispiel 48
Forensische Southern Blotting-Identifizierung
Das Verfahren gemäß Beispiel 47 wird wiederholt, um ein Panel von mindestens 10 amplifizierten Sequenzen aus einem Individuum und einer Einzelprobe zu erhalten. Vorzugsweise enthält das Panel mindestens 50 amplifizierte Sequenzen. Mehr bevorzugt enthält das Panel 100 amplifizierte Sequenzen. In einigen Ausführungsformen enthält das Panel 200 amplifizierte Sequenzen. Diese PCR-erzeugte DNA wird anschließend mit einem oder einer Kombination, vorzugsweise 4 basenspezifischen Restriktionsenzymen verdaut. Solche Enzyme sind kommerziell erhältlich und dem Fachmann bekannt. Nach dem Verdau werden die resultierenden Genfragmente bezüglich ihrer Größe in mehreren doppelten Wells auf einem Agarosegel aufgetrennt und auf Nitrozellulose unter Verwendung von dem Fachmann bekannten Southern Blotting-Techniken übertragen. Für eine Übersicht bezüglich Southern Blotting-Übertragung siehe Davis et al. (Basic Methods in Molecular Biology, 1986, Elsevier Press, Seiten 62–65).
Ein Panel an Proben, die auf den 5'-EST-Sequenzen (oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind) oder Fragmenten davon mit mindestens 10 Basen basieren, werden radioaktiv oder colorimetrisch markiert unter Verwendung von dem Fachmann bekannten Verfahren, wie beispielsweise Nick-Translation oder Endmarkierung, und auf dem Southern Blot unter Verwendung von im Fachbereich bekannten Techniken hybridisiert (Davis et al., supra). Vorzugsweise umfasst die Sonde mindestens 12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind). Mehr bevorzugt umfasst die Sonde mindestens 20–30 aufeinander folgende Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind).
Vorzugsweise werden mindestens 5 bis 10 dieser markierten Sonden verwendet und mehr bevorzugt werden mindestens etwa 20 oder 30 verwendet, um ein eindeutiges Muster bereitzustellen. Die resultierenden Banden, die in Folge der Hybridisierung einer großen 5'-EST-Probe (oder einer cDNA-Probe oder einer genomischen DNA-Probe, die davon erhältlich sind) erscheinen, sind ein eindeutiger Identifikator. Da die Restriktionsenzymspaltung für jedes Individuum unterschiedlich ist, ist auch das Bandenmuster auf dem Southern Blot eindeutig. Eine Erhöhung der Zahl an 5'-EST-Sonden (oder an cDNA- oder genomischen DNA-Sonden, die davon erhältlich sind) stellt ein statistisch höheres Maß an Zuverlässigkeit bezüglich der Identifizierung bereit, da eine erhöhte Zahl an Bandensätzen zur Identifizierung verwendet wird.
Beispiel 49
Dot Blot-Identifizierungsverfahren
Eine andere Technik zur Identifizierung von Individuen unter Verwendung der hierin offenbarten 5'-EST-Sequenzen greift auf eine Dot Blot-Hybridisierungstechnik zurück.
Genomische DNA wird aus dem Kern eines Probanden, der identifiziert werden soll, isoliert. Oligonukleotidsonden mit einer Länge von etwa 30 bp werden synthetisiert, die mindestens 10, vorzugsweise 50 Sequenzen der 5'-ESTs oder cDNAs oder genomischen DNAs, die davon erhältlich sind, entsprechen. Die Sonden werden verwendet, um die genomische DNA unter dem Fachmann bekannten Bedingungen zu hybridisieren. Die Oligonukleotide werden unter Verwendung von Polynukleotidkinase (Pharmacia) mit P³² endmarkiert. Die Dot Blots werden durch Platzieren der genomischen DNA auf Nitrozellulose oder ähnlichem unter Verwendung eines Vakuum Dot Blot-Manifolds (BioRad, Richmond, Kalifornien) aufgetragen. Der Nitrozellulosefilter, der die genomischen Sequenzen enthält, wird gebacken oder die Sequenzen werden mittels UV mit dem Filter verknüpft, prehybridisiert und unter Verwendung von im Fachbereich bekannten Techniken (Davis et al., supra) hybridisiert. Die ³²P markierten DNA-Fragmente werden anschließend nacheinander unter stufenweise veränderten stringenten Bedingungen hybridisiert, um minimale Unterschiede zwischen der 30 bp Sequenz und der DNA zu detektieren. Tetramethylammoniumchlorid ist bei der Identifizierung von Klonen, die eine geringe Zahl an Nukleotid-Fehlabgleichen enthalten, nützlich (Wood et al., Proc. Natl. Acad. Sci. USA 82(6):1585-1588, 1985). Ein einzigartiges Muster der Dots unterscheidet ein Individuum von einem anderen Individuum.
5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind) oder Oligonukleotide, die mindestens 10 aufeinander folgende Basen aus diesen Sequenzen enthalten, können als Sonden in der nachfolgend beschriebenen alternativen Fingerprint-Technik verwendet werden. Vorzugsweise umfasst die Sonde mindestens 12, 15 oder 17 aufeinander folgende Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind). Mehr bevorzugt umfasst die Sonde mindestens 20–30 aufeinander folgende Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind).
Vorzugsweise wird in dieser alternativen Fingerprinting-Technik eine Vielzahl an Sonden mit Sequenzen aus verschiedenen Genen verwendet. Beispiel 50 unten stellt ein repräsentatives alternatives Fingerprint-Verfahren bereit, in dem die Sonden von 5'-EST abgeleitet sind.
Beispiel 50
Alternative „Fingerprint"-Identifizierungstechnik
20-mer Oligonukleotide werden aus einer großen Anzahl, z.B. 50, 100 oder 200 von 5'-ESTs, unter Verwendung kommerziell zur Verfügung stehender Oligonukleotid-Dienstleistungsunternehmen, wie beispielsweise Genset, Paris, Frankreich, hergestellt. Zellproben aus dem Testprobanden werden unter Verwendung von im Fachbereich bekannten Techniken auf DNA hin aufgereinigt. Die Nukleinsäure wird mit Restriktionsenzymen, wie beispielsweise EcoRI und XbaI, verdaut. Nach dem Verdau werden die Proben auf Wells zur Elektrophorese aufgetragen. Dieses im Fachbereich bekannte Verfahren kann abgeändert werden, um Polyacrylamidelektrophorese einsetzen zu können, jedoch werden in diesem Beispiel Proben, die 5 μg DNA enthalten, in Wells aufgetragen und auf 0,8% Agarosegel aufgetrennt. Die Gele werden unter Verwendung von standardmäßigen Southern Blotting auf Nitrozellulose überführt.
10 ng von jedem der Oligonukleotide werden vereinigt und mit ³²P endmarkiert. Die Nitrozellulose wird mit Blockierlösung prehybridisiert und mit den markierten Sonden hybridisiert. Im Anschluss an die Hybridisierung und Waschen wird der Nitrozellulosefilter gegenüber einem X-Omat AR-Röntgenfilm exponiert. Das resultierende Hybridisierungsmuster ist für jedes Individuum eindeutig.
Es wird im Rahmen dieses Beispiels zusätzlich in Erwägung gezogen, dass die Anzahl der verwendeten Probensequenzen zum Zwecke zusätzlicher Genauigkeit und Klarheit verändert werden kann.
Die Proteine, die durch die erweiterten cDNAs codiert werden, können auch verwendet werden, um Antikörper zu erzeugen, wie es in den Beispielen 30 und 43 erklärt wird, um so den Gewebetyp oder die Zellspezies, von dem/der die Probe abgeleitet wurde, zu identifizieren, wobei dies in Beispiel 51 beschrieben wird.
Beispiel 51
Identifizierung von Gewebetypen oder Zellspezies mittels markierter gewebespezifischer Antikörper
Die Identifizierung spezifischer Gewebe wird durch die Visualisierung gewebespezifischer Antigene mittels Antikörperpräparationen gemäß den Beispielen 30 und 43 ermöglicht, die mit einem detektierbaren Marker direkt oder indirekt konjugiert sind. Ausgewählte markierte Antikörperspezies binden an ihren spezifischen Antigenbindepartner in Gewebeabschnitten, Zellsuspensionen oder in Extrakten löslicher Proteine aus einer Gewebeprobe, um so ein Muster für eine qualitative oder halb-qualitative Interpretation bereitzustellen.
Für diese Verfahren müssen Antiseren einen Wirkstoffgehalt aufweisen, der über dem der nativen Präparation liegt, und deshalb werden Antikörper durch Isolierung der Gammaglobulinfraktion bis zu einer Menge von mg/ml aufkonzentriert, beispielsweise durch Ionenaustauschchromatografie oder durch Ammoniumsulfatfraktionierung. Um die spezifischsten Antiseren bereitzustellen, müssen unerwünschte Antikörper, zum Beispiel gegen gewöhnliche Proteine, aus der Gammaglobulinfraktion entfernt werden, beispielsweise mittels unlöslicher Immunoabsorbentien, bevor die Antikörper mit dem Marker markiert werden. Sowohl monoklonale als auch heterologe Antikörper sind für beide Verfahren geeignet.
A. Immunohistochemische Techniken
Gereinigte Antikörper mit hohem Titer, die wie oben beschrieben hergestellt wurden, werden mit einem detektierbaren Marker konjugiert, wie es beispielsweise von Fudenberg, Kapitel 26 in: Basic and Clinical Immunology, 3. Ausgabe, Lange, Los Altos, Kalifornien, 1980 oder Rose et al., Kapitel 12 in: Methods in Immunodiagnosis, 2. Ausgabe John Wiley and Sons, New York (1980) beschrieben wird.
Ein Fluoreszenzmarker, entweder Fluorescein oder Rhodamin, ist bevorzugt, aber die Antikörper können auch mit einem Enzym markiert sein, das eine farberzeugende Reaktion mit einem Substrat unterstützt, wie beispielsweise Meerrettich-Peroxidase. Wie unten beschrieben wird, können in einem zweiten Schritt Marker zu einem gewebegebundenen Antikörper hinzugegeben werden. Alternativ können spezifische Antigewebe-Antikörper mit Ferritin oder anderen Partikeln mit hoher Elektronendichte markiert werden und die Lokalisierung der Ferritin-gekoppelten Antigen-Antikörper-Komplexe kann mittels eines Elektronenmikroskops erfolgen. In noch einem weiteren Ansatz können die Antikörper radiomarkiert werden, beispielsweise mit ¹²⁵I, und durch Überschichten der mit Antikörper behandelten Präparation mittels einer fotografischen Emulsion detektiert werden.
Präparationen zur Ausführung der Verfahren können monoklonale oder polyklonale Antikörper für ein einzelnes Protein oder Peptid umfassen, deren Spezifität für einen Gewebetyp, wie beispielsweise Hirngewebe, identifiziert worden ist, oder es können Antikörperpräparationen für mehrere antigenisch unterschiedliche gewebespezifische Antigene in Panelen verwendet werden, je nach dem wie erforderlich, unabhängig voneinander oder in Gemischen.
Gewebeabschnitte und Zellsuspensionen zur immunohistochemischen Untersuchung werden gemäß herkömmlichen histologischen Techniken hergestellt. Mehrere Cryostatabschnitte (etwa 4 μm, nicht fixiert) des unbekannten Gewebes und der bekannten Kontrolle werden montiert und jeder Objektträger wird mit unterschiedlichen Verdünnungen der Antikörperpräparation bedeckt. Abschnitte bekannter und unbekannter Gewebe sollten auch mit Präparationen behandelt werden, um eine Positivkontrolle, eine Negativkontrolle, beispielsweise Pre-Immunseren, und eine Kontrolle für unspezifische Färbung, beispielsweise Puffer, bereitzustellen.
Die behandelten Abschnitte werden in einer feuchten Kammer für etwa 30 min bei Raumtemperatur inkubiert, gespült und anschließend in Puffer für 30–45 min gewaschen. Überschüssige Flüssigkeit wird abgetupft und der Marker wird entwickelt.
Falls der gewebespezifische Antikörper während der ersten Inkubation nicht markiert wurde, kann er zu diesem Zeitpunkt in einer zweiten Antikörper-Antikörper-Reaktion markiert werden, beispielsweise durch Zugabe von Fluorescein- oder Enzym-konjugiertem Antikörper gegen die Immunoglobulinklasse der das Antiserum erzeugenden Spezies, zum Beispiel Fluoresceinmarkierter Antikörper gegen Maus-IgG. Derartige markierte Seren sind kommerziell erhältlich.
Das Antigen, das durch das obige Verfahren in den Geweben nachgewiesen worden ist, kann durch Messung der Farb- oder Fluoreszenz-Intensität im Gewebeabschnitt und Kalibrierung des Signals unter Verwendung von geeigneten Standards quantifiziert werden.
B. Identifizierung gewebespezifischer löslicher Proteine
Die Visualisierung gewebespezifischer Proteine und die Identifizierung unbekannter Gewebe gemäß diesem Verfahren wird unter Verwendung markierter Antikörperreagenzien und einer Detektionsstrategie, wie sie für die Immunohistochemie beschrieben wurde, durchgeführt; jedoch wird die Probe nach einer elektrophoretischen Technik hergestellt, um die Proteine, die aus dem Gewebe extrahiert wurden, zur Detektion in einem systematischen Array auf Grundlage des Molekulargewichts zu verteilen.
Eine Gewebeprobe wird unter Verwendung einer Virtis-Vorrichtung homogenisiert; Zellsuspensionen werden, wie im Fachbereich üblich, durch Dounce-Homogenisierung oder osmotische Lyse aufgebrochen, wobei in beiden Fällen, falls nötig, Detergenzien verwendet werden, um Zellmembranen aufzubrechen. Unlösliche Zellkomponenten, wie beispielsweise Zellkerne, Microsomen und Membranfragmente, werden durch Ultrazentrifugation entfernt und die lösliche proteinenthaltende Fraktion, falls nötig, aufkonzentriert und zur Analyse zurückbehalten.
Eine Probe der Lösung mit löslichen Proteinen wird durch herkömmliche SDS-Polyacrylamidelektrophorese in einzelne Proteinspezies aufgelöst, wie es beispielsweise durch Davis et al., Abschnitt 19-2 in: Basic Methods in Molecular Biology, Leder Hrsg., Elsevier, New York, 1986 beschrieben wird, wobei in einem Satz von Gelen ein Bereich von Polyacrylamidmengen verwendet wird, um den vollständigen Molekulargewichtsbereich der Proteine, die in der Probe detektiert werden sollen, aufzulösen. Ein Größenmarker wird parallel aufgetrennt, um so die Molekulargewichte der einzelnen Proteine abschätzen zu können. Die zu analysierende Probengröße entspricht einem zweckmäßigen Volumen von 5 bis 55 μl und enthält etwa 1 bis 100 μg Protein. Ein Aliquot von jedem der aufgelösten Proteine wird durch Blotting auf ein Nitrozellulosefilterpapier übertragen, wobei dieses Verfahren das Auflösungsmuster erhält. Es werden mehrere Kopien hergestellt. Das Verfahren, das als Western Blotting-Analyse bekannt ist, ist in Davis, L. Et al., supra Abschnitt 19-3, gut beschrieben. Ein Satz der Nitrozelluloseblots wird mit Coomassie Blau-Farbstoff angefärbt, um den vollständigen Satz an Proteinen zum Vergleich mit den antikörpergebundenen Proteinen sichtbar zu machen. Die verbleibenden Nitrozellulosefilter werden anschließend mit einer Lösung aus einem oder mehreren spezifischen Antiseren von gewebespezifischen Proteinen, die wie in den Beispielen 30 und 43 beschrieben hergestellt wurden, inkubiert. In diesen Verfahren werden, wie in Verfahren A oben beschrieben, geeignete Positiv- und Negativproben und Reagenzkontrollen mitgeführt.
In beiden Verfahren A oder B kann eine detektierbare Markierung an den Primärgewebeantigen-Primärantikörper-Komplex angebracht werden, gemäß verschiedener Strategien und Abänderungen der Verfahren. In einem direkten Ansatz kann der primärspezifische Antikörper markiert werden; alternativ kann der unmarkierte Komplex durch einen markierten sekundären Anti-IgG-Antikörper gebunden werden. In anderen Ansätzen ist entweder der primäre oder der sekundäre Antikörper mit einem Biotinmolekül konjugiert, das in einem nachfolgenden Schritt an einen avidinkonjugierten Marker binden kann. Gemäß noch einer weiteren Strategie wird ein enzymmarkiertes oder radioaktives Protein A, das die Fähigkeit besitzt, an jedes beliebige IgG zu binden, in einem abschließenden Schritt entweder an den primären oder den sekundären Antikörper gebunden.
Das Sichtbarmachen gewebespezifischer Antigenbindung in einem Ausmaß, das über dem liegt, das in Kontrollgeweben für einen oder mehrere gewebespezifische Antikörper beobachtet wird, wobei die Antikörper aus den Gensequenzen hergestellt wurden, die aus erweiterten cDNA-Sequenzen identifiziert wurden, kann Gewebe unbekannten Ursprungs identifizieren, wie beispielsweise forensische Proben oder differenziertes Tumorgewebe, das an fremden Körperstellen metastasiert hat.
Zusätzlich zu ihren Anwendungen in der Forensik und bei der Identifizierung können 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) bezüglich ihrer Lage auf den Chromosomen kartiert werden. Beispiel 52 unten beschreibt RH („Radiation Hybrid")-Kartierung von humanen chromosomalen Abschnitten unter Verwendung von 5'-ESTs. Beispiel 53 unten beschreibt ein repräsentatives Verfahren zur Kartierung eines 5'-ESTs bezüglich seiner Lage auf einem humanen Chromosom. Beispiel 54 beschreibt die Kartierung von 5'-ESTs bezüglich Chromosomen in der Metaphase durch Fluoreszenz-in-situ-Hybridisierung (FISH). Der Fachmann erkennt, dass die Verfahren gemäß den Beispielen 52–54 auch verwendet werden können, um cDNAs oder genomische DNAs, die aus den 5'-ESTs erhalten werden können, bezüglich ihrer chromosomalen Lage zu kartieren.
2. Verwendung von 5'-ESTs oder Sequenzen, die daraus erhältlich sind oder Abschnitten davon, bei der Chromosomenkartierung
Beispiel 52
Strahlungshybrid-Kartierung von 5'-ESTs hinsichtlich des humanen Genoms
RH („Radiation Hybrid")-Kartierung ist ein genetischer Ansatz für somatische Zellen, der zur hochaufgelösten Kartierung des humanen Genoms verwendet werden kann. In diesem Verfahren werden Zelllinien, die eines oder mehrere humane Chromosomen enthalten, in einem tödlichen Ausmaß bestrahlt, wobei jedes Chromosom in Fragmente zerbricht, deren Größe von der Strahlendosis abhängig ist. Diese Fragmente werden durch Fusion mit kultivierten Nagerzellen gewonnen, was zu Subklonen führt, die verschiedene Abschnitte des humanen Genoms enthalten. Dieses Verfahren wird von Benham et al., Genomics 4:509-517, 1989, und Cox et al., Science 250:245-250, 1990, beschrieben. Die zufällige und unabhängige Art der Subklone ermöglicht eine effiziente Kartierung eines beliebigen humanen Genommarkers. Humane DNA, die aus einem Panel von 80–100 Zelllinien isoliert wurde, stellt ein Kartierungsreagenz zur 5'-EST-Anordnung bereit. In diesem Verfahren wird die Bruchhäufigkeit zwischen Markern herangezogen, um den Abstand zu bestimmen, wobei dies die Konstruktion hochaufgelöster Karten ermöglicht, wie es für die Verwendung herkömmlicher ESTs bereits ausgeführt wurde (Schuler et al.; Science 274:540-546, 1996).
Die RH-Kartierung wurde verwendet, um eine hochaufgelöste Strahlungshybridkarte des vollständigen Genoms des humanen Chromosoms 17q22-q25.3 über die Gene für das Wachstumshormon (GH) und die Tymidinkinase (TK) (Foster et al., Genomics 33:185-192, 1996), den Abschnitt, der das Gorlin-Syndromgen umgibt (Obermayr et al., Eur. J. Hum. Genet. 4:242-245, 1996), die Loci, die den vollständigen kurzen Arm von Chromosom 12 abdecken (Raeymaekers et al., Genomics 29:170-178, 1995), den Abschnitt des humanen Chromosoms 22, der den Locus des Neurofibromatosistyps 2 enthält (Frazer et al., Genomics 14:574-584, 1992), und die 13 Loci auf dem langen Arm von Chromosom 5 (Warrington et al., Genomics 11:701-708, 1991) herzustellen.
Beispiel 53
Kartierung von 5'-ESTs auf humanen Chromosomen unter Verwendung von PCR-Techniken
5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können unter Verwendung von Methoden auf PCR-Basis humanen Chromosomen zugeordnet werden. In solchen Ansätzen werden Oligonukleotid-Primerpaare aus den 5'-ESTs (oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind) konzipiert, um die Wahrscheinlichkeit einer Amplifizierung über ein Intron zu minimieren. Vorzugsweise weisen die Oligonukleotid-Primer eine Länge von 18–23 bp auf und sind zur PCR-Amplifizierung konzipiert. Die Erstellung von PCR-Primern aus bekannten Sequenzen ist dem Fachmann allgemein bekannt. Für eine Übersicht zur PCR-Technologie siehe Erlich in PCR Technology, Principles and Applications for DNA Amplification, Freeman und Co., New York, 1992.
Zur Amplifizierung von Matrizen aus humaner genomischer Gesamt-DNA werden Primer in Polymerasekettenreaktionen (PCR) eingesetzt. Die PCR-Bedingungen sind wie folgt: 60 ng genomische DNA wird als Matrize für eine PCR mit 80 ng eines jeden Oligonukleotid-Primers, 0,6 Einheiten Taq-Polymerase und 1 μCu eines ³²P-markierten Deoxycytidintriphosphats verwendet. Die PCR wird in einem Microplate-Thermocycler (Techne) unter den folgenden Bedingungen durchgeführt: 30 Zyklen bei 94°C, 1,4 min; 55°C, 2 min; und 72°C, 2 min; mit einer abschließenden Verlängerung bei 72°C für 10 min. Die amplifizierten Produkte werden auf einem 6%igen Polyacrylamidsequenzierungsgel analysiert und durch Autoradiografie visualisiert. Wenn die Länge des resultierenden PCR-Produkts identisch ist zum Abstand zwischen den Enden der Primersequenzen in der erweiterten cDNA, aus der die Primer abgeleitet wurden, wird die PCR-Reaktion anschließend mit DNA-Matrizen aus zwei Panelen somatischer Mensch-Nager-Zellhybride, BIOS PCRable DNA (BIOS Corporation) und dem NIGMS „Human-Rodent Somatic Cell Hybrid Mapping Panel" Number 1 (NIGMS, Camden, NJ) wiederholt.
Die PCR wird eingesetzt, um eine Reihe somatischer Zellhybrid-Zelllinien zu screenen, die definierte Sätze an humanen Chromosomen enthalten, im Hinblick auf das Vorliegen eines bestimmten 5'-ESTs (oder einer cDNA oder einer genomischen DNA, die davon erhältlich ist). Die DNA wird aus den somatischen Hybriden isoliert und als Ausgangsmatrizen für PCR-Reaktionen unter Verwendung der Primerpaare des 5'-ESTs (oder einer cDNA oder einer genomischen DNA, die davon erhältlich ist) verwendet. Nur diejenigen somatischen Zellhybride mit Chromosomen, die das humane Gen enthalten, das dem 5'-EST (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) entspricht, führen zu einem amplifizierten Fragment. Das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) wird dem Chromosom durch Analyse des Trennungsmusters der PCR-Produkte aus den somatischen Hybrid-DNA-Matrizen zugeordnet. Das einzige humane Chromosom, das in allen Zellhybriden vorliegt, die zu einem amplifizierten Fragment führen, ist das Chromosom, das das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) enthält. Für eine Übersicht zu Techniken und Analysen von Ergebnissen zu Gen-Kartierungsexperimenten mit somatischen Zellen siehe Ledbetter et al., Genomics 6:475-481, 1990.
Beispiel 54
Kartierung erweiterter 5'-ESTs auf Chromosomen unter Verwendung von in situ-Fluoreszenzhybridisierung
Die in situ-Fluoreszenzhybridisierung ermöglicht, dass das 5'-EST (oder die cDNA oder die genomische DNA, die davon erhältlich ist) an einer bestimmter Stelle auf einem bestimmten Chromosom kartiert wird. Die Chromosomen, die für in situ-Fluoreszenzhybridisierungstechniken verwendet werden, können aus einer Vielfalt von Quellen, einschließlich Zellkulturen, Geweben oder Vollblut, erhalten werden.
In einer bevorzugten Ausführungsform wird fie chromosomale Lage eines 5'-ESTs (oder einer cDNA oder genomischen DNA, die davon erhältlich ist) durch FISH erhalten, wie es von Cherif et al. (Proc. Natl. Acad. Sci. USA, 87:6639-6643, 1990) beschrieben wird. Chromosomen in der Metaphase werden aus Phytohemagglutinin (PHA)-stimulierten Blutzelldonoren hergestellt. PHS-stimulierte Lymphozyten aus gesunden Männern werden für 72 h in RPMI 1640-Medium kultiviert. Zur Synchronisierung wird Methotrexat (10 μM) für 17 h zugegeben, wobei im Anschluss 5-Bromdesoxyuridin (5-BrdU, 0,1 mM) für 6 h zugegeben wird. Colcemid (1 μg/ml) wird für die letzten 15 min vor der Ernte der Zellen zugegeben. Die Zellen werden gesammelt, in RPMI gewaschen, mit einer hypotonischen Lösung aus KCl (75 mM) bei 37°C für 15 min inkubiert und unter dreimaligem Wechseln in Methanol:Essigsäure (3:1) fixiert. Die Zellsuspension wird auf einen Glasobjektträger aufgetropft und luftgetrocknet. Das 5'-EST (oder die cDNA oder die genomische DNA, die davon erhältlich ist) wird mit Biotin-16 dUTP durch Nick-Translation gemäß den Anweisungen des Herstellers (Bethesda Research Laboratories, Bethesda, MD) markiert, unter Verwendung einer Sephadex G-50-Säule (Pharmacia, Upsala, Schweden) gereinigt und präzipitiert. Kurz vor der Hybridisierung wird das DNA-Pellet in Hybridisierungspuffer (50% Formamid, 2 × SSC, 10% Dextransulfat, 1 mg/ml mit Ultraschall behandelte Lachssperma-DNA, pH 7) gelöst und die Probe wird bei 70°C für 5–10 min denaturiert.
Die bei –20°C gelagerten Objektträger werden für 1 h bei 37°C mit RNase A (100 μg/ml) behandelt, dreimal in 2 × SSC gespült und in einer Ethanolreihe dehydriert. Die Chromosompräparationen werden in 70% Formamid, 2 × SSC für 2 min bei 70°C denaturiert, anschließend bei 4°C dehydriert. Die Objektträger werden mit Proteinase K (10 μg/100 ml in 20 mM Tris-HCl, 2 mM CaCl₂) bei 37°C für 8 min behandelt und dehydriert. Das Hybridisierungsgemisch, das die Sonde enthält, wird auf dem Objektträger platziert, mit einem Deckglas abgedeckt, mit Gummikitt versiegelt und über Nacht in einer feuchten Kammer bei 37°C hybridisiert. Nach der Hybridisierung und Waschschritten im Anschluss an die Hybridisierung wird die biotinylierte Sonde durch Avidin-FITC detektiert und mit zusätzlichen Schichten von biotinyliertem Ziege-Anti-Avidin und Avidin-FITC amplifiziert. Zur chromosomalen Lagebestimmung werden fluoreszierende R-Banden erhalten, wie zuvor beschrieben (Cherif et al., supra). Die Objektträger werden unter einem LEICA-Fluoreszenzmikroskop (DMRXA) beobachtet. Die Chromosomen werden mit Propidiumjodid gegengefärbt und das Fluoreszenzsignal der Sonde erscheint als zwei symmetrisch gelbgrüne Punkte auf beiden Chromatiden des fluoreszierenden R-Band-Chromosoms (rot). Daher kann ein bestimmtes 5'-EST (oder eine cDNA oder genomische DNA, die daraus erhältlich ist) einer bestimmten zytogenetischen R-Bande auf einem bestimmten Chromosom zugeordnet werden.
Nachdem das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) unter Verwendung der in den Beispielen 52–54 oben beschriebenen Techniken einmal bestimmten Chromosomen zugeordnet worden ist, können sie verwendet werden, um eine hochaufgelöste Chromosomenkarte zu erstellen, auf der sie lokalisiert sind oder um die Chromosomen in der Probe zu identifizieren.
Beispiel 55
Verwendung von 5'-ESTs zur Konstruktion oder Erweiterung von Chromosomenkarten
Chromosomenkartierung umfasst das Zuordnen einer bestimmten eindeutigen Sequenz zu einem bestimmten Chromosom, wie es oben beschrieben wurde. Nachdem die eindeutige Sequenz einmal auf einem bestimmten Chromosom kartiert worden ist, wird sie relativ zu anderen eindeutigen Sequenzen zugeordnet, die auf demselben Chromosom lokalisiert sind. Ein Ansatz zur Chromosomenkartierung verwendet eine Serie künstlicher Hefechromosomen (YACs), die mehrere tausend lange Inserts tragen, die aus den Chromosomen des Organismusabgeleitet wurden, von denen die erweiterten cDNAs (oder die genomische DNAs, die daraus erhältlich sind) erhalten wurden. Dieser Ansatz wird in Nagaraja et al., Genome Research 7:210-222, 1997, beschrieben. In Kürze, in diesem Ansatz wird jedes Chromosom in überlappende Stücke zerbrochen, die in den YAC-Vektor insertiert werden. Die YAC-Inserts werden unter Verwendung von PCR oder anderen Verfahren gescreent, um zu bestimmen, ob sie das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) umfassen, dessen Position bestimmt werden soll. Sobald das Insert, das das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) umfasst, einmal nachgewiesen worden ist, kann das Insert durch PCR oder andere Verfahren analysiert werden, um zu bestimmen, ob das Insert auch andere Sequenzen enthält, welche sich bekanntermaßen auf dem Chromosom in dem Abschnitt befinden, von dem das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) abgeleitet wurde. Dieses Verfahren kann für jedes Insert in der YAC-Bibliothek wiederholt werden, um die Lokalisierung einer jeden der erweiterten cDNAs (oder der genomischen DNAs, die daraus erhältlich sind) relativ zueinander und zu anderen bekannten chromosomalen Markern zu bestimmen. Auf diese Weise kann eine hochaufgelöste Karte der Verteilung einer Vielzahl eindeutiger Marker über jedes einzelne der Chromosomen des Organismus erhalten werden.
Wie in Beispiel 56 unten beschrieben, können erweiterte cDNAs (oder genomische DNAs, die daraus erhältlich sind) auch zur Identifizierung von Genen verwendet werden, die mit einem bestimmten Phänotyp verbunden sind, wie beispielsweise einer Erbkrankheit oder einer Wirkstoffantwort.
3. Verwendung von 5'-ESTs oder Sequenzen, die daraus erhältlich sind, oder Fragmenten davon zur Identifizierung von Genen
Beispiel 56
Identifizierung von Genen, die mit Erbkrankheiten oder Ansprechen auf einen Wirkstoff im Zusammenhang stehen
Dieses Beispiel zeigt einen Ansatz, der zum Erstellen eines Zusammenhangs von 5'-ESTs (oder cDNA oder genomischer DNA, die daraus erhältlich ist) mit bestimmten phänotypischen Merkmalen nützlich ist. In diesem Beispiel wird ein bestimmtes 5'-EST (oder eine cDNA oder genomische DNA, die daraus erhältlich ist) als Testsonde verwendet, um dieses 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) mit einem bestimmten phänotypischen Merkmal in Zusammenhang zu setzen.
5'-ESTs (oder cDNA oder genomische DNA, die daraus erhältlich ist) werden an bestimmten Stelle auf einem humanen Chromosom kartiert unter Verwendung von Techniken, wie denjenigen, die in den Beispielen 52 und 53 beschrieben sind, oder anderen, im Fachbereich bekannten Techniken. Eine Suche zur Mendelschen Vererbung im Menschen (McKusick in Mendelian Inheritance in Man (Online verfügbar über Johns Hopkins University Welch Medical Library) offenbart, dass der Abschnitt des humanen Chromosoms, der das 5'-EST (oder die cDNA oder die genomische DNA, die daraus erhältlich ist) enthält, eine sehr genreiche Region darstellt, die mehrere bekannte Gene und einige Krankheiten oder Phänotypen umfasst, für die keine Gene identifiziert wurden. Das Gen, das diesem 5'-EST (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) entspricht, ist deshalb ein unmittelbar ein Kandidat für jede dieser genetischen Erkrankungen.
Zellen aus Patienten mit diesen Erkrankungen oder Phänotypen werden isoliert und in Kultur expandiert. PCR-Primer des 5'-ESTs (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) werden verwendet, um genomische DNA, mRNA oder cDNA, die von den Patienten erhalten wurde, zu screenen. 5'-ESTs (oder cDNA oder genomische DNA, die daraus erhältlich ist), die in den Patienten nicht amplifiziert werden, können durch weitere Untersuchungen mit einer bestimmten Krankheit positiv in Zusammenhang gebracht werden. Wenn die Proben von einem Individuum abgeleitet sind, das den Phänotyp aufweist, der mit der Erkrankung in Zusammenhang steht, kann alternativ die PCR-Untersuchung zu Fragmenten mit Längen führen, welche von den Längen abweichen, wenn die Probe von einem gesunden Individuum abgeleitet ist, wobei dies zeigt, dass das Gen, das das 5'-EST enthält, für die genetische Erkrankung verantwortlich sein kann.
VI. Verwendung eines 5'-ESTs (oder cDNA oder genomischer DNA, die daraus erhältlich ist) zur Konstruktion von Vektoren
Die vorliegenden 5'-ESTs (oder cDNA oder genomische DNA, die daraus erhältlich ist) können auch verwendet werden, um Sekretionsvektoren zu konstruieren, die in der Lage sind, die Sekretion der Proteine zu steuern, die durch Gene in den Vektoren codiert werden. Solche Sekretionsvektoren können die Reinigung oder Anreicherung der Proteine erleichtern, die durch Gene codiert werden, die im Sekretionsvektor insertiert sind, wobei die Zahl an Hintergrundproteinen, von welchen das gewünschte Protein gereinigt oder angereichert werden muss, verringert wird. Beispielhafte Sekretionsvektoren werden in Beispiel 57 unten beschrieben.
1. Konstruktion von Sekretionsvektoren
Beispiel 57
Konstruktion von Sekretionsvektoren
Die Sekretionsvektoren umfassen einen Promotor, der in der Lage ist, die Genexpression in der Wirtszelle, im Gewebe oder einem Organismus von Interesse zu steuern. Solche Promotoren umfassen den Rous Sarcoma Virus-Promotor, den SV40-Promotor, den humanen Zytomegalovirus-Promotor und andere dem Fachmann vertraute Promotoren.
Eine Signalsequenz eines 5'-ESTs (oder einer cDNA oder einer genomischen DNA, die daraus erhältlich ist) ist mit dem Promotor operativ so verknüpft, dass die mRNA, die vom Promotor transkribiert wird, die Translation des Signalpeptids steuert. Die Wirtszelle, das Gewebe oder der Organismus kann eine beliebige Zelle, ein beliebiges Gewebe oder ein beliebiger Organismus sein, der das Signalpeptid erkennt, das durch die Signalsequenz im 5'-EST (oder der cDNA oder der genomischen DNA, die daraus erhältlich ist) codiert wird. Geeignete Wirtszellen umfassen Säugerzellen, Gewebe aus Säugern oder Säugerorganismen, Vogelzellen, Vogelgewebe oder Vogelorganismen, Insektenzellen, Insektengewebe oder Insektenorganismen oder Hefe.
Zusätzlich enthält der Sekretionsvektor Klonierungsstellen zum Insertieren der Gene, welche für die Proteine codieren, die sekretiert werden sollen. Die Klonierungsstellen ermöglichen die Klonierung des insertierten Gens im Leserahmen mit der Signalsequenz, so dass ein Fusionsprotein, in dem das Signalpeptid mit dem Protein fusioniert ist, das durch das insertierte Gen codiert wird, von der mRNA exprimiert wird, die vom Promotor transkribiert wird. Das Signalpeptid steuert die extrazelluläre Sekretion des Fusionsproteins.
Der Sekretionsvektor kann DNA oder RNA sein und kann sich in das Chromosom des Wirts integrieren, wobei er als ein extrachromosomales Replikon stabil im Wirt verbleiben kann, der Sekretionsvektor kann ein künstliches Chromosom sein oder er kann transient im Wirt vorliegen. Viele Nukleinsäuregerüste, die zur Verwendung als Sekretionsvektoren geeignet sind, sind dem Fachmann bekannt, einschließlich retroviraler Vektoren, SV40-Vektoren, Bovine Papilloma Virus-Vektoren, hefeintegrierender Plasmide, hefeepisomaler Plasmide, künstlicher Chromosomen aus Hefe, künstlicher humaner Chromosomen, P-Element-Vektoren, Baculovirus-Vektoren oder bakterieller Plasmide, die transient in den Wirt eingebracht werden können.
Der Sekretionsvektor kann auch ein PolyA-Signal enthalten, so dass das PolyA-Signal stromabwärts des Gens, das in den Sekretionsvektor insertiert ist, lokalisiert ist.
Nachdem das Gen, welches für das Protein codiert, für das eine Sekretion erwünscht ist, in den Sekretionsvektor insertiert worden ist, wird der Sekretionsvektor unter Verwendung von Calciumphosphatpräzipitiation, DEAE-Dextran, Elektroporation, liposomenvermittelter Transfektion, viraler Partikel oder als bloße DNA in die Wirtszelle, das Gewebe oder den Organismus eingeführt. Das durch das insertierte Gen codierte Protein wird anschließend unter Verwendung konventioneller Techniken, wie beispielsweise Ammoniumsulfatpräzipitiation, Immunopräzipitiation, Immunochromatografie, Größenausschlusschromatografie, Ionenaustauschchromatografie und HPLC, aus dem Überstand aufgereinigt oder angereichert. Alternativ kann das sekretierte Protein in ausreichendem Maß angereichert oder in reinen Zustand im Überstand oder im Wachstumsmedium des Wirts vorliegen, so dass es möglich ist, es für den beabsichtigten Zweck ohne weitere Anreicherung zu verwenden.
Die Signalsequenzen können auch in Vektoren insertiert werden, die zur Gentherapie konzipiert sind. In derartigen Vektoren ist die Signalsequenz operativ mit einem Promotor verknüpft, so dass die mRNA, die vom Promotor transkribiert wird, für das Signalpeptid codiert. Eine Klonierungsstelle ist stromabwärts der Signalsequenz lokalisiert, so dass ein Gen, das für ein Protein codiert, dessen Sekretion erwünscht ist, leicht in den Vektor insertiert und mit der Signalsequenz fusioniert werden kann. Der Vektor wird in eine geeignete Wirtszelle eingeführt. Das Protein, das vom Promotor exprimiert wird, wird extrazellulär sekretiert, wodurch ein therapeutischer Effekt erzeugt wird.
Die 5'-ESTs können auch verwendet werden, um Sequenzen zu klonieren, die stromaufwärts der 5'-ESTs lokalisiert sind und in der Lage sind, die Genexpression zu regulieren, einschließlich Promotorsequenzen, Enhancer-Sequenzen und anderen stromaufwärts liegenden Sequenzen, die den Grad an Transkription oder Translation beeinflussen. Nachdem sie identifiziert und kloniert worden sind, können diese stromaufwärts liegenden regulatorischen Sequenzen in Expressionsvektoren verwendet werden, die konzipiert wurden, um die Expression eines insertierten Gens in einer räumlichen, zeitlichen, entwicklungsspezifischen oder quantitativen Weise zu steuern. Beispiel 58 beschreibt ein Verfahren zur Klonierung von Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs liegen.
2. Identifizierung von stromaufwärts liegenden Sequenzen mit Promotoraktivität oder regulatorischer Aktivitäten
Beispiel 58
Verwendung erweiterter cDNAs oder 5'-ESTs zur Klonierung von stromaufwärts liegenden Sequenzen aus genomischer DNA
Aus erweiterten cDNAs oder 5'-ESTs abgeleitete Sequenzen können verwendet werden, um die entsprechenden Gene unter Verwendung von Chromosomen-Walking-Techniken zu isolieren. In einer Chromosomen-Walking- Technik, die den von Clontech verfügbaren GenomeWalker^TM-Kit verwendet, werden fünf Gesamtgenom-DNA-Proben mit einem jeweils einem unterschiedlichen Restriktionsenzym verdaut, das eine 6 Basen-Erkennungsstelle aufweist und ein glattes Ende zurücklässt. Im Anschluss an den Verdau werden Oligonukleotidadapter an jedes Ende der resultierenden genomischen DNA-Fragmente ligiert.
Für jede der fünf genomischen DNA-Bibliotheken wird eine erste PCR-Reaktion gemäß den Anweisungen des Herstellers durchgeführt, wobei ein äußerer Adapterprimer, der im Kit bereitgestellt wird, und ein äußerer genspezifischer Primer verwendet wird. Der genspezifische Primer sollte so gewählt werden, dass er für die erweiterte cDNA oder das 5'-EST von Interesse spezifisch ist und sollte eine Schmelztemperatur, eine Länge und eine Lage in der erweiterten cDNA oder dem 5'-EST aufweisen, die mit seiner Verwendung in den PCR-Reaktionen vereinbar sind. Jede erste PCR-Reaktion enthält 5 ng genomische DNA, 5 μl 10 × Tth-Reaktionspuffer, 0,2 mM eines jeden dNTP, jeweils 0,2 μM äußeren Adapterprimer und äußeren genspezifischen Primer, 1,1 mM Mg(OAc)₂ und 1 μl des Tth-Polymerase 50 × Mix in einem Gesamtvolumen von 50 μl. Der Reaktionszyklus für die erste PCR-Reaktion ist der folgende: 1 min – 94°C/2 sec – 94°C, 3 min – 72°C (7 Zyklen)/2 sec – 94°C, 3 min – 67°C (32 Zyklen)/5 min – 67°C.
Das Produkt der ersten PCR-Reaktion wird verdünnt und als Matrize für eine zweite PCR-Reaktion gemäß den Anweisungen des Herstellers verwendet, wobei ein Paar von Nested-Primern verwendet wird, die innerhalb des Amplicons lokalisiert sind, das sich aus der ersten PCR-Reaktion ergibt. Beispielsweise können 5 μl des Reaktionsprodukts aus dem ersten PCR-Reaktionsgemisch 180-fach verdünnt werden. Die Reaktion werden in einem 50 μl Volumen mit einer Zusammensetzung durchgeführt, die der der ersten PCR-Reaktion entspricht, außer das Nested-Primer verwendet werden. Der erste Nested-Primer ist spezifisch für den Adapter und wird mit dem GenomeWalker^TM-Kit bereitgestellt. Der zweite Nested-Primer ist spezifisch für die bestimmte erweiterte cDNA oder das 5'-EST, für das der Promotor kloniert werden soll und sollte eine Schmelztemperatur, Länge und Lage in der erweiterten cDNA oder dem 5'-EST aufweisen, die mit seiner Verwendung in den PCR-Reaktionen vereinbar ist. Die Reaktionsparameter der zweiten PCR-Reaktion sind die folgenden: 1 min – 94°C/2 sec – 94° C, 3 min – 72°C (6 Zyklen)/2 sec – 94°C, 3 min – 67°C (25 Zyklen)/5 min – 67°C. Das Produkt der zweiten PCR-Reaktion wird unter Verwendung von Standardtechniken gereinigt, kloniert und sequenziert.
Alternativ können zwei oder mehrere humane genomische DNA-Bibliotheken unter Verwendung von zwei oder mehr Restriktionsenzymen konstruiert werden. Die verdaute genomische DNA wird in Vektoren kloniert, die in einzelsträngige, zirkuläre oder lineare DNA umgewandelt werden können. Ein biotinyliertes Oligonukleotid, das mindestens 15 Nukleotide der erweiterten cDNA oder der 5'-EST-Sequenz umfasst, wird an die einzelsträngige DNA hybridisiert. Die Hybride zwischen dem biotinylierten Oligonukleotid und der einzelsträngigen DNA, welche die erweiterte cDNA oder 5'-EST-Sequenz enthält, werden isoliert wie in Beispiel 29 oben beschrieben. Danach wird die einzelsträngige DNA, welche die erweiterte cDNA oder 5'-EST-Sequenz enthält, von den Beads abgelöst und unter Verwendung eines Primers, der für die erweiterte cDNA oder 5'-EST-Sequenz spezifisch ist, oder eines Primers, der einer Sequenz entspricht, die vom Klonierungsvektor umfasst ist, in doppelsträngige DNA umgewandelt. Die resultierende doppelsträngige DNA wird in Bakterien transformiert. DNAs, welche die 5'-EST- oder erweiterte cDNA-Sequenzen enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
Nachdem die stromaufwärts liegenden genomischen Sequenzen einmal wie oben beschrieben kloniert und sequenziert worden sind, können voraussichtliche Promotoren und Transkriptionsstartstellen innerhalb der stromaufwärts liegenden Sequenzen identifiziert werden durch Vergleich der Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs liegen, mit Datenbanken, die bekannte Transkriptionsstartstellen, Transkriptionsfaktorbindungsstellen oder Promotorsequenzen enthalten.
Zusätzlich können Promotoren in stromaufwärts liegende Sequenzen unter Verwendung von Promotorreportervektoren identifiziert werden, wie es in Beispiel 59 beschrieben wird.
Beispiel 59
Identifizierung von Promotoren in klonierten stromaufwärts liegenden Sequenzen
Die stromaufwärts liegenden genomischen Sequenzen der erweiterten cDNAs oder 5'-ESTs werden in einen geeigneten Promotorreportervektor kloniert, wie beispielsweise die Promotorreportervektoren pSEAP-Basic, pSEAP-Enhancer, pβgal-Basic, pβgalEnhancer oder pEGFP-1, die von Clontech erhältlich sind. In Kürze, jeder dieser Promotorreportervektoren umfasst multiple Klonierungsstellen, die stromaufwärts eines Reportergens liegen, das für ein Protein codiert, für das in einfacher Weise eine Probenbestimmung durchgeführt werden kann, wie beispielsweise sekretierte alkalische Phosphatase, β-Galactosidase oder grün fluoreszierendes Protein. Die Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs liegen, werden in die Klonierungsstellen stromaufwärts des Reportergens in beiden Orientierungen kloniert und in eine geeignete Wirtszelle eingeführt. Hinsichtlich der Menge an Reporterprotein wird eine Untersuchung durchgeführt und mit der Menge verglichen, die von einem Vektor erhalten wird, der kein Insert in der Klonierungsstelle trägt. Das Vorliegen einer erhöhten Expressionsmenge in dem Vektor mit dem Insert im Hinblick auf den Kontrollvektor zeigt das Vorliegen eines Promotors im Insert. Wenn nötig, können die stromaufwärts liegenden Sequenzen in Vektoren kloniert werden, die einen Enhancer für eine Erhöhung der Transkriptionsmengen von schwachen Promotorsequenzen enthält. Eine signifikant höhere Menge an Expression als die, welche bei dem Vektor ohne Insert beobachtet wird, zeigt, dass eine Promotorsequenz in der insertierten stromaufwärts liegenden Sequenz vorliegt.
Geeignete Wirtszellen für die Promotorreportervektoren können auf Grundlage der Ergebnisse zur oben beschriebenen Bestimmung der Expressionsmuster der erweiterten cDNAs und 5'-ESTs ausgewählt werden. Wenn die Expressionsmusteranalyse beispielsweise zeigt, dass die mRNA, die einer bestimmten erweiterten cDNA oder einem 5'-EST entspricht, in Fibroblasten exprimiert wird, kann der Promotorreportervektor in eine humane Fibroblastenzelllinie eingeführt werden.
Promotorsequenzen innerhalb der stromaufwärts liegenden genomischen DNA können ferner durch Konstruktion von verschachtelten Deletionen („nested deletions") in der stromaufwärts liegenden DNA bestimmt werden, wobei herkömmliche Techniken, wie beispielsweise Exonuklease III-Verdau, verwendet werden. Die resultierenden deletierten Fragmente können in den Promotorreportervektor insertiert werden, um zu bestimmen, ob die Deletion eine verringerte oder ausgeschaltete Promotoraktivität aufweist. Auf diese Weise können die Grenzen der Promotoren bestimmt werden. Wenn gewünscht, können die möglichen einzelnen regulatorischen Stellen innerhalb des Promotors unter Verwendung von ortsgerichteter Mutagenese (side directed mutagenesis) oder Linkerscanning identifiziert werden, um die möglichen Transkriptionsfaktorbindungsstellen innerhalb des Promotors einzeln oder in Kombination zu auszuschalten. Die Wirkungen dieser Mutationen auf das Transkriptionsniveau können unter Einführung der Mutationen in die Klonierungsstellen in die Promotorreportervektoren bestimmt werden.
Beispiel 60
Klonierung und Identifizierung von Promotoren
Unter Verwendung des Verfahrens, das in Beispiel 58 oben mit 5'-ESTs beschrieben wird, wurden stromaufwärts liegende Sequenzen von mehreren Genen erhalten. Unter Verwendung des Primerpaares GGG AAG ATG GAG ATA GTA TTG CCT G (SEQ ID NO: 29) und CTG CCA TGT ACA TGA TAG AGA GAT TC (SEQ ID NO: 30) wurde der Promotor mit der internen Bezeichnung P13H2 (SEQ ID NO: 31) erhalten.
Unter Verwendung des Primerpaares GTA CCA GGGG ACT GTG ACC ATT GC (SEQ ID NO: 32) und CTG TGA CCA TTG CTC CCA AGA GAG (SEQ ID NO: 33) wurde der Promotor mit der internen Bezeichnung P15B4 (SEQ ID NO: 34) erhalten.
Unter Verwendung des Primerpaares CTG GGA TGG AAG GCA CGG TA (SEQ ID NO: 35) und GAG ACC ACA CAG CTA GAC AA (SEQ ID NO: 36) wurde der Promotor mit der internen Bezeichnung P29B6 (SEQ ID NO: 37) erhalten.
4 stellt eine schematische Beschreibung der isolierten Promotoren und der Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengesetzt sind, bereit. Die stromaufwärts liegenden Sequenzen wurden gescreent hinsichtlich des Vorliegens von Motiven, die Transkriptionsfaktorbindungsstellen oder bekannten Transkriptionsstartstellen ähneln, wobei das Computerprogramm Matlnspector Version 2.0, August 1996 verwendet wurde.
Tabelle VII beschreibt die Transkriptionsfaktorbindungsstellen, die in jedem dieser Promotoren vorliegen. Die mit Matrix bezeichneten Spalten zeigen den Namen der verwendeten Matlnspector-Matrix an. Die mit Position bezeichnete Spalte zeigt die 5'-Position der Promotorstelle an. Die Nummerierung der Sequenzen beginnt mit der Transkriptionsstelle, wie sie durch Abgleich der Genomsequenz mit der 5'-EST-Sequenz bestimmt wird. Die Spalte, die mit „Orientierung" bezeichnet ist, zeigt den DNA-Strang an, auf dem die Stelle nachgewiesen wird, wobei der +-Strang der codierende Strang ist, wie durch Abgleich der Genomsequenz mit der Sequenz des 5'-ESTs bestimmt. Die Spalte, die mit „Score" bezeichnet ist, zeigt den Matlnspector Score an, der für diese Stelle nachgewiesen wurde. Die Spalte, die mit „Länge" bezeichnet ist, zeigt die Länge der Stelle in Nukleotiden. Die Spalte, die mit „Sequenz" bezeichnet ist, zeigt die Sequenz der gefundenen Stelle.
Bakterienklone, die Plasmide enthalten, welche die oben beschriebenen Promotorsequenzen enthalten, werden gegenwärtig in den Laboratorien des Erfinders unter den oben bereitgestellten internen Identifizierungsnummern gelagert. Die Inserts können aus den hinterlegten Materialien durch Anzucht eines Aliquotes eines geeigneten Bakterienklons in dem geeigneten Medium gewonnen werden. Die Plasmid-DNA kann anschließend unter verwendung von dem Fachmann bekannten Plasmidisolierungsverfahren isoliert werden, wie beispielsweise Verfahren zur alkalischen Lyse im Miniprep-Maßstab oder Plasmidisolierung auf Basis alkalischer Lyse im Großmaßstab. Wenn gewünscht, kann die Plasmid-DNA durch Zentrifugation auf einem Cäsiumchloridgradienten, Größenausschlusschromatografie oder Anionenaustauschchromatografie weiter angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden. Alternativ kann eine PCR mit Primern, die an beiden Enden der EST-Insertion konzipiert worden sind, durchgeführt werden. Das dem 5'-EST entsprechende PCR-Produkt kann anschließend unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken manipuliert werden.
Die Promotoren und andere regulatorische Sequenzen, die stromaufwärts der erweiterten cDNAs oder 5'-ESTs lokalisiert sind, können verwendet werden, um Expressionsvektoren zu konzipieren, die in der Lage sind, die Expression eines insertierten Gens in einer gewünschten räumlichen, zeitlichen, entwicklungsspezifischen oder quantitativen Weise zu steuern. Ein Promotor, der in der Lage ist, die gewünschten räumlichen, zeitlichen, entwicklungsspezifischen und quantitativen Muster zu steuern, kann unter Verwendung der Ergebnisse zur Expressionsanalyse, die in Beispiel 26 oben beschrieben wird, selektiert werden. Beispielsweise kann, wenn ein Promotor erwünscht ist, der ein hohes Maß an Expression im Muskel verleiht, die Promotorsequenz, die stromaufwärts einer erweiterten cDNA oder eines 5'-EST liegt, die von einer mRNA abgeleitet sind, die im Muskel in hohem Maße exprimiert wird, im Expressionsvektor verwendet werden, wie es durch das Verfahren gemäß Beispiel 26 bestimmt ist.
Vorzugsweise wird der gewünschte Promotor nahe einer multiplen Restriktionsschnittstelle platziert, um die Klonierung des gewünschten Inserts stromabwärts des Promotors zu ermöglichen, so dass der Promotor in der Lage ist, die Expression des insertierten Gens zu steuern. Der Promotor kann in herkömmliche Nukleinsäuregerüste insertiert werden, die für eine extrachromosomale Replikation, eine Integration in die Wirtschromosomen oder eine transiente Expression konzipiert sind. Geeignete Gerüste für die vorliegenden Expressionsvektoren umfassen retrovirale Gerüste, Gerüste von eukaryotischen Episomen, wie beispielsweise SV40 oder dem Bovine Papilloma-Virus, Gerüste von bakteriellen Episomen oder künstliche Chromosomen.
Vorzugsweise umfassen die Expressionsvektoren ein PolyA-Signal stromabwärts der multiplen Restriktionsstelle, dass zur Polyadenylierung von mRNA dient, die von dem Gen transkribiert wird, das in den Expressionsvektor insertiert ist.
Im Anschluss an die Identifizierung von Promotorsequenzen unter Verwendung von Verfahren gemäß den Beispielen 58–60 können Proteine, die mit dem Promotor wechselwirken, wie in Beispiel 61 unten beschrieben identifiziert werden.
Beispiel 61
Identifizierung von Proteinen, die mit Promotorsequenzen, stromaufwärts liegenden regulatorischer Sequenzen oder mit mRNA wechselwirken
Sequenzen innerhalb der Promotorregion, die wahrscheinlich Transkriptionsfaktoren binden, können durch Homologie mit bekannten Transkriptionsfaktorbindungsstellen oder durch herkömmliche Mutagenese- oder Deletionsanalysen von Reporterplasmiden identifiziert werden, welche die Promotorsequenz enthalten. Beispielsweise können Deletionen in einem Reporterplasmid erzeugt werden, das die Promotorsequenz von Interesse enthält, die operativ mit einem nachweisbaren Reportergen verknüpft ist. Die Reporterplasmide, die verschiedene Deletionen innerhalb der Promotorregion tragen, werden in eine geeignete Wirtszelle transfiziert und die Wirkung der Deletionen auf die Expressionsniveaus wird beurteilt. Transkriptionsfaktorbindungsstellen innerhalb der Regionen, in welchen Deletionen die Expressionsniveaus absenken, können ferner unter Verwendung von ortsgerichteter Mutagenese, Linkerscanning-Analyse oder anderen, dem Fachmann bekannten Techniken, lokalisiert werden.
Nukleinsäuren, die für Proteine codieren, die mit Sequenzen im Promotor wechselwirken, können unter Verwendung von Ein-Hybridsystemen identifiziert werden, wie beispielsweise den Ein-Hybridsystemen, die im Handbuch beschrieben sind, das dem Matchmaker One-Hybrid System-Kit beiliegt, welches von Clontech erhältlich ist (Katalog Nr. K1603-1), dessen Offenbarung hierin durch Referenz enthalten ist. In Kürze, das Matchmaker One-Hybrid System wird wie folgt verwendet. Die Zielsequenz, für die es erwünscht ist, bindende Proteine zu identifizieren, wird stromaufwärts von einem selektierbaren Reportergen kloniert und in das Hefegenom integriert. Vorzugsweise werden mehrere Kopien der Zielsequenzen als Tandem in das Reporterplasmid insertiert. Eine Bibliothek, die aus Fusionsprodukten von cDNAs, die hinsichtlich ihrer Fähigkeit an den Promotor zu binden, beurteilt werden sollen, und der Aktivierungsdomäne eines Hefetranskriptionsfaktors, wie beispielsweise GAL4, besteht, wird in den Hefestammtransformiert, welcher die integrierte Reportersequenz enthält. Die Hefe wird auf selektiven Medien ausplattiert, um Zellen zu selektieren, die den selektierbaren Marker exprimieren, der mit der Promotorsequenz verknüpft ist. Die Kolonien, die auf den selektiven Medien wachsen, enthalten Gene, die für Proteine codieren, die an die Zielsequenz binden. Die Inserts in den Genen, welche für die Fusionsproteine codieren, werden ferner durch Sequenzierung charakterisiert. Zusätzlich können die Inserts in Expressionsvektoren oder in in vitro-Transkriptionsvektoren insertiert werden. Das Binden der durch Inserts codierten Polypeptide an die Promotor-DNA kann durch Techniken, die dem Fachmann bekannt sind, bestätigt werden, wie beispielsweise Gelshift-Analysen oder DNAse-Protection-Analyse.
VII. Verwendung von 5'-ESTs (oder cDNAs oder genomischer DNAs, die davon erhältlich sind) in der Gentherapie
Die vorliegende Erfindung umfasst auch die Verwendung von 5'-ESTs (oder cDNA oder genomischer DNA, die daraus erhältlich ist) in Strategien zur Gentherapie, einschließlich Antisense- und Triple Helix-Strategien, wie sie in den Beispielen 62 und 63 unten beschrieben werden. In Antisense-Ansätzen werden zu einer mRNA komplementäre Nukleinsäuresequenzen intrazellulär mit der mRNA hybridisiert, wodurch sie die Expression des durch die mRNA codierten Proteins blockieren. Die Antisense-Sequenzen können die Genexpression durch eine Vielfalt an Mechanismen verhindern. Beispielsweise können die Antisense-Sequenzen die Fähigkeit der Ribosomen hemmen, die mRNA zu translatieren. Alternativ können die Antisense-Sequenzen den Transport der mRNA aus dem Kern ins Zytoplasma blockieren, wodurch die zur Translation zur Verfügung stehende mRNA-Menge beschränkt wird. Ein anderer Mechanismus, über den Antisense-Sequenzen die Genexpression hemmen können, ist eine Wechselwirkung mit dem mRNA-Spleißen. In noch einer anderen Strategie kann die Antisense-Nukleinsäure Teil eines Ribozyms sein, das in der Lage ist, die ZielmRNA spezifisch zu spalten.
Beispiel 62
Herstellung und Verwendung von Antisense-Oligonukleotiden
Die Antisense-Nukleinsäuremoleküle, die in der Gentherapie verwendet werden sollen, können entweder DNA- oder RNA-Sequenzen sein. Sie können eine Sequenz umfassen, die komplementär zu der Sequenz des 5'-ESTs (oder der cDNA oder der genomischen DNA, die davon erhältlich ist) ist. Die Antisense-Nukleinsäuren können eine Länge und eine Schmelztemperatur aufweisen die ausreicht, die Bildung eines intrazellulären Duplex mit ausreichender Stabilität zu ermöglichen, um so die Expression der mRNA in dem Duplex zu hemmen. Strategien zur Konzipierung von Antisense-Nukleinsäuren, die zur Verwendung in der Gentherapie geeignet sind, sind in Green et al., Anm. Rev. Biochem. 55:569-597, 1986, und Izant und Weintraub, Cell 36:1007-1015, 1984, offenbart.
In einigen Strategien werden Antisense-Moleküle von einer Proteincodierenden Nukleotidsequenz durch Umkehrung der Orientierung der codierenden Region im Hinblick auf einen Promotor erhalten, um so den Gegenstrang von dem Strang zu transkribieren, der normalerweise in der Zelle transkribiert wird. Die Antisense-Moleküle können unter Verwendung von in vitro-Transkriptionssystemen transkribiert werden, wie beispielsweise denjenigen Systemen, die T7- oder SP6-Polymerase verwenden, um das Transkript zu erzeugen. Ein anderer Ansatz betrifft die Transkription der Antisense-Nukleinsäuren in vivo, wobei eine DNA, welche eine Antisense-Sequenz enthält, in einem Expressionsvektor operativ mit einem Promotor verknüpft wird.
Alternativ können Oligonukleotide, die zu dem Strang komplementär sind, der in der Zelle normalerweise transkribiert wird, in vitro synthetisiert werden. Daher sind die Antisense-Nukleinsäuren komplementär zu der entsprechenden mRNA und in der Lage, mit der mRNA zu hybridisieren, um so ein Duplex zu erzeugen. In einigen Ausführungsformen können die Antisense-Sequenzen modifizierte Zuckerphosphatgerüste enthalten, um die Stabilität zu erhöhen und um sie weniger sensitiv für einen RNAse-Angriff zu machen. Beispiele für Modifikationen, die zur Verwendung in Antisense-Strategien geeignet sind, werden von Rossi et al., Pharmacol. Ther. 50(2):245-254, 1991, beschrieben.
Es können verschiedene Typen von Antisense-Oligonukleotiden verwendet werden, die zu der Sequenz des 5'-ESTs (oder der cDNA oder der genomischen DNA, die davon erhältlich ist) komplementär sind. In einer bevorzugten Ausführungsform werden stabile und semi-stabile Antisense-Oligonukleotide verwendet, wie in der internationalen Patentanmeldung Nr. PCT WO 94/23026 beschrieben ist. In diesen Molekülen sind das 3'-Ende oder beide 3'- und 5'-Enden mit intramolekularen Wasserstoffbrücken zwischen komplementären Basenpaaren belegt. Im Vergleich zu herkömmlichen Antisense-Oligonukleotiden sind diese Moleküle besser in der Lage, Exonuklease-Angriffen zu widerstehen und weisen eine erhöhte Stabilität auf.
In einer anderen bevorzugten Ausführungsform werden die Antisense-Oligodeoxynukleotide gegen Herpes simplex Virus-Typ 1 und 2 verwendet, wie es in der internationalen Patentanmeldung Nr. WO 95/0414 1 beschrieben ist.
In noch einer weiteren bevorzugten Ausführungsform werden die kovalent querverknüpften Antisense-Oligonukleotide verwendet, die in der internationalen Patentanmeldung Nr. WO 96/31523 beschrieben sind. Diese doppel- oder einzelsträngigen Oligonukleotide umfassen eine bzw. mehrere kovalente Inter- oder Intraoligonukleotid-Querverknüpfungen, wobei die Querverknüpfung aus einer Amidbindung zwischen einer primären Amingruppe des einen Strangs und einer Carboxylgruppe des anderen Strangs oder des gleichen Strangs besteht, wobei die primäre Amingruppe in der 2'-Position des Strangnukleotid-Monosaccharidrings direkt substituiert ist und die Carboxylgruppe durch eine aliphatische Spacergruppe getragen wird, substituiert an einem Nukleotid oder Nukleotidanalogon des anderen oder des gleichen Strangs.
Es können auch die Antisense-Oligodeoxynukleotide und Oligonukleotide, die in der internationalen Anmeldung Nr. WO 92/18522 offenbart sind, verwendet werden. Diese Moleküle sind gegenüber einem Abbau stabil und enthalten mindestens eine Transkriptionskontrollerkennungssequenz, die an Kontrollproteine bindet und dafür als Köder wirksam ist. Diese Moleküle können "Haarnadel"-Strukturen, "Hantel-Strukturen" ("dumbbell" structures), "modifizierte Hantel"-Strukturen", "quervernetzte" Lockstrukturen" ("cross-linked" decoy structures) und "Schleifen"-Strukturen enthalten.
In einer weiteren bevorzugten Ausführungsform werden die zyklischen doppelsträngigen Oligonukleotide, die in der europäischen Patentanmeldung Nr. 0 572 287 A2 beschrieben sind, verwendet. Diese ligierten Oligonukleotid-"Hanteln" enthalten die Bindungsstelle für einen Transkriptionsfaktor und hemmen die Expression des unter Kontrolle des Transkriptionsfaktors stehenden Gens durch Beschlagnahme des Faktors.
Die Verwendung der geschlossenen Antisense-Oligonukleotide, die in der internationalen Anmeldung Nr. WO 92/19732 offenbart sind, ist ebenfalls umfasst. Da diese Moleküle keine freien Enden aufweisen, sind sie gegenüber Abbau durch Exonukleasen resistenter als herkömmliche Oligonukleotide. Diese Oligonukleotide können multifunktional sein und können mit mehreren Regionen, die zur Ziel-mRNA nicht benachbart sind, wechselwirken.
Die geeignete Menge an Antisense-Nukleinsäuren, die benötigt wird, um die Genexpression zu hemmen, kann unter Verwendung einer in vitro-Expressionsanalyse bestimmt werden. Das Antisense-Molekül kann durch Diffusion, Injektion, Infusion, Transfektion oder h-Region vermitteltem Import unter Verwendung von im Fachbereich bekannten Verfahren in die Zellen eingeführt werden. Beispielsweise kann die Antisense-Nukleinsäure als bloßes oder nacktes Oligonukleotid, als in Lipid verkapseltes Oligonukleotid, als Oligonukleotidsequenz, die durch ein virales Protein verkappselt ist, oder als eine Oligonukleotidsequenz, die mit einem in einem Expressionsvektor enthaltenem Promotor operativ verknüpft ist, in den Körper eingeführt werden. Der Expressionsvektor kann ein beliebiger Vektor aus der Vielfalt von im Fachbereich bekannten Expressionsvektoren sein, einschließlich retroviraler oder viraler Vektoren, Vektoren die zur extrachromosomalen Replikation fähig sind oder integrierenden Vektoren. Die Vektoren können DNA oder RNA sein.
Die Antisense-Moleküle werden in Zellproben mit einer Reihe von verschiedenen Konzentrationen, vorzugsweise zwischen 1 × 10^–10 M bis 1 × 10^–10 M eingeführt. Nachdem die minimale Konzentration, welche die Genexpression adäquat kontrollieren kann, identifiziert worden ist, wird die optimierte Dosis in eine Dosierung umgerechnet, die zur Verwendung in vivo geeignet ist. Beispielsweise wird eine Hemmkonzentration in Kultur von 1 × 10^–10 zu einer Dosis von etwa 0,6 mg/kg Körpergewicht umgerechnet. Oligonukleotidmengen, die 100 mg/kg Körpergewicht oder höher erreichen, können möglich sein, nachdem die Toxizität der Oligonukleotide an Labortieren getestet wurde. Es ist zusätzlich umfasst, dass Zellen aus Wirbeltieren entnommen werden, mit Antisense-Oligonukleotiden behandelt werden und wieder in das Wirbeltier eingeführt werden.
Es ist ferner umfasst, dass die Antisense-Oligonukleotidsequenz in eine Ribozymsequenz eingebracht wird, um eine spezifische Bindung des Antisense-Elements zu ermöglichen und seine Ziel-mRNA zu spalten. Für technische Anwendungen im Hinblick auf Ribozyme und Antisense-Oligonukleotide siehe Rossi et al., supra.
In einer bevorzugten Ausführungsform dieser Erfindung wird das durch das Gen codierte Polypeptid zuerst identifiziert, so dass die Wirkung der Antisense-Hemmung auf die Translation unter Verwendung von Techniken überwacht werden kann, die Antikörper-vermittelte Tests, wie beispielsweise RIAs und ELISA, funktionale Assays oder Radiomarkierung umfassen, aber nicht darauf beschränkt sind.
Die erfindungsgemäßen 5'-ESTs (oder cDNAs oder genomische DNAs, die davon erhältlich sind) können auch in Gentherapieansätzen verwendet werden, die auf der Bildung einer intrazellulären Triplehelix beruhen. Triplehelix-Oligonukleotide werden verwendet, um die Transkription von einem Genom zu hemmen. Sie sind insbesondere für Untersuchungen hinsichtlich Veränderungen der Zellaktivität nützlich, da sie mit einem bestimmten Gen in Zusammenhang stehen. Die erfindungsgemäßen 5'-EST-Sequenzen (oder cDNAs oder genomische DNAs, die davon erhältlich sind) oder mehr bevorzugt ein Abschnitt dieser Sequenzen kann verwendet werden, um die Genexpression in Individuen mit Krankheiten, die mit der Expression eines bestimmten Gens in Zusammenhang stehen, zu hemmen. In ähnlicher Weise kann ein Abschnitt der 5'-EST-Sequenzen (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind) verwendet werden, um die Wirkung der Hemmung der Transkription eines bestimmten Gens innerhalb der Zelle zu untersuchen. Herkömmlich wurden Homopurinsequenzen im Rahmen von Triplehelix-Strategien für am nützlichsten gehalten. Jedoch können Homopyrimidinsequenzen ebenfalls die Genexpression hemmen. Derartige Homopyrimidinoligonukleotide binden an die große Furche bei Homopurin/Homopyrimidinsequenzen. Deshalb sind beide Arten von Sequenzen des 5'-ESTs oder des Gens, das dem 5'-EST entspricht, umfasst.
Beispiel 63
Herstellung und Verwendung von Triplehelix-Sonden
Die Sequenzen der 5'-ESTs (oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind) werden durchsucht, um 10-mer oder 20-mer Homopyrimidin- oder Homopurinabschnitte zu identifizieren, die in Strategien auf Grundlage von Triplehelices zur Hemmung von Genexpression verwendet werden könnten. Im Anschluss an die Identifizierung von potentiellen Homopyrimidin- oder Homopurinabschnitten wird deren Wirksamkeit bei der Hemmung der Genexpression durch Einbringen von verschiedenen Mengen an Oligonukleotiden, welche die Kandidatensequenzen enthalten, in Gewebekulturzellen, die normalerweise das Zielgen exprimieren, beurteilt. Die Oligonukleotide können mit einem Oligonukleotid-Synthesizer hergestellt werden oder können kommerziell von einer Firma bezogen werden, die sich auf die Oligonukleotidsynthese für Kunden spezialisiert hat, wie beispielsweise GENSET, Paris, Frankreich.
Die Oligonukleotide können in die Zellen unter Verwendung einer Vielfalt von dem Fachmann bekannten Verfahren eingeführt werden, einschließlich aber nicht beschränkt auf Calciumphosphatpräzipitiation, DEAE-Dextran, Elektroporation, liposomvermittelte Transfektion oder native Aufnahme.
Behandelte Zellen werden auf eine veränderte Zellfunktionen oder verringerte Genexpression hin überwacht, wobei Techniken, wie beispielsweise Northern Blotting, RNAse Protection-Assays oder Strategien auf Grundlage von PCR verwendet werden, um die Transkriptionsmengen des Zielgens in den Zellen zu überwachen, die mit dem Oligonukleotid behandelt wurden. Die zu überwachenden Zellfunktionen werden auf Grundlage der Homologien des Zielgens, das der erweiterten cDNA entspricht, von der das Oligonukleotid abgeleitet wurde, mit bekannten Gensequenzen, die mit einer bestimmten Funktion im Zusammenhang stehen, vorhergesagt. Die Zellfunktionen können auch auf Grundlage des Vorliegens abnormaler Physiologien innerhalb der Zellen, die aus Individuen mit einer Erbkrankheit abgeleitet wurden, vorhergesagt werden, insbesondere wenn die erweiterte cDNA mit der Krankheit verbunden ist, wobei die in Beispiel 56 beschriebenen Techniken verwendet werden.
Die Oligonukleotide, die bei der Hemmung der Genexpression in den Gewebekulturzellen wirksam sind, können anschließend unter Verwendung von Techniken, die oben und in Beispiel 62 beschrieben sind, mit einer Dosierung, die auf Grundlage der in vitro-Ergebnisse berechnet wurde, wie es in Beispiel 62 beschrieben wird, eingeführt werden.
In einigen Ausführungsformen können die natürlichen (beta-) Anomere der Oligonukleotideinheiten durch alpha-Anomere ersetzt werden, um so die Oligonukleotide gegenüber Nukleasen resistenter zu machen. Ferner kann ein interkalierendes Mittel, wie beispielsweise Ethidiumbromid oder dergleichen, an das 3'-Ende des alpha Oligonukleotids angebracht werden, um die Triplehelix zu stabilisieren. Für Informationen zur Herstellung von Oligonukleotiden, die zur Triplehelixbildung geeignet sind, siehe Griffin et al., Science 245:967-971, 1989.
Beispiel 64
Verwendung von cDNAs, welche unter Verwendung der 5'-ESTs erhalten werden, Expression eines codierten Protein in einem Wirtsorganismus
Die cDNAs, die wie oben beschrieben unter Verwendung der hierin beschriebenen 5'-ESTs erhalten wurden, können auch verwendet werden, um ein codiertes Protein in einem Wirtsorganismus zu exprimieren, um eine vorteilhafte Wirkung zu erzielen. In solchen Verfahren kann das codierte Protein transient im Wirtsorganismus exprimiert werden oder das codierte Protein kann stabil im Wirtsorganismus exprimiert werden. Das codierte Protein kann eine beliebige der oben beschriebenen Aktivitäten aufweisen. Das codierte Protein kann ein Protein sein, das im Wirtsorganismus nicht vorhanden ist oder das codierte Protein kann alternativ die im Wirtsorganismus vorkommenden Proteinmengen erhöhen.
Eine erweiterte cDNA mit voller Länge, die für das Signalpeptid und für das reife Protein codiert, oder eine erweiterte cDNA, die nur für das reife Protein codiert, wird in den Wirtsorganismus eingeführt. Die erweiterte cDNA kann in den Wirtsorganismus unter Verwendung einer Vielfalt von dem Fachmann bekannten Techniken eingeführt werden. Beispielsweise kann die erweiterte cDNA als nackte DNA in den Wirtsorganismus injiziert werden, so dass das codierte Protein im Wirtsorganismus exprimiert wird, wodurch eine vorteilhafte Wirkung erzielt wird.
Alternativ kann die erweiterte cDNA in einen Expressionsvektor stromabwärts eines Promotors kloniert werden, der im Wirtsorganismus aktiv ist. Der Expressionsvektor kann ein beliebiger der Expressionsvektoren sein, die zur Verwendung in der Gentherapie konzipiert sind, einschließlich viraler oder retroviraler Vektoren. Der Expressionsvektor kann direkt in den Wirtsorganismus eingeführt werden, so dass das codierte Protein im Wirtsorganismus exprimiert wird, um eine vorteilhafte Wirkung zu erzeugen. In einem anderen Ansatz kann der Expressionsvektor in vitro in Zellen eingefügt werden. Die Zellen, die den Expressionsvektor enthalten, werden danach selektiert und in den Wirtsorganismus eingeführt, wo sie das codierte Protein exprimieren, um eine vorteilhafte Wirkung zu erzeugen.
Beispiel 65
Verwendung von Signalpeptiden, die durch 5'-ESTs oder daraus erhaltenen Sequenzen codiert werden, um Proteine in Zellen zu importieren
Die kurze hydrophobe Kernregion (h) von Signalpeptiden, die durch die 5'-ESTs oder erweiterten cDNAs codiert werden, die von den SEQ ID Nos: 38-185 abgeleitet sind, können auch als Träger verwendet werden, um ein Peptid oder Protein von Interesse, eine so genannte Fracht, in Gewebekulturzellen zu importieren (Lin et al., J. Biol. Chem., 270:14225-14258, 1995; Du et al., J. Peptide Res., 51:235-243, 1998; Rojas et al., Nature Biotech., 16:370-375, 1998).
Wenn zellpermeable Peptide von beschränkter Größe (etwa bis zu 25 Aminosäuren) über eine Zellmembran transloziert werden sollen, kann auf eine chemische Synthese zurückgegriffen werden, um die h-Region entweder an den C-Terminus oder an den N-Terminus des Frachtpeptids von Interesse anzufügen. Alternativ können, wenn längere Peptide oder Proteine in Zellen importiert werden sollen, Nukleinsäuren genetisch verändert werden, wobei dem Fachmann bekannte Techniken verwendet werden, um die erweiterte cDNA-Sequenz, welche die h-Region codiert, mit dem 5'- oder 3'-Ende der DNA-Sequenz, die das Frachtpolypeptid codiert, zu verknüpfen. Derartig genetisch veränderte Nukleinsäuren werden anschließend entweder in vitro oder in vivo nach der Transfektion in geeignete Zellen translatiert, wobei herkömmliche Techniken verwendet werden, um das resultierende zellpermeable Polypeptid herzustellen. Geeignete Wirtszellen werden anschließend mit dem zellpermeablen Polypeptid einfach inkubiert, das anschließend über die Membran hinweg transloziert wird.
Dieses Verfahren kann angewandt werden, um verschiedene intrazelluläre Funktionen oder zelluläre Prozesse zu untersuchen. Beispielsweise wurde es verwendet, um funktionell relevante Domänen intrazellulärer Proteine zu sondieren und um Protein-Protein-Wechselwirkungen, die an Signaltransduktionswegen beteiligt sind, zu untersuchen (Lin et al., supra; Lin et al., J. Biol. Chem., 271:5305-5308, 1996; Rojas et al., J. Biol. Chem., 271:27456-27461, 1996; Liu et al., Proc. Natl. Acad. Sci. USA, 93:11819-11824, 1996; Rojas et al., Bioch. Biophys. Res. Commun., 234:675-680, 1997).
Solche Techniken können in der Zelltherapie eingesetzt werden, um Proteine zu importieren, wobei therapeutische Wirkungen erzielt werden. Beispielsweise können Zellen, die aus einem Patienten isoliert wurden, mit importierten therapeutischen Proteinen behandelt werden und anschließend wieder in den Wirtsorganismus eingeführt werden.
Alternativ kann die h-Region von Signalpeptiden der vorliegenden Erfindung in Kombination mit einem Kernlokalisierungssignal verwendet werden, um Nukleinsäuren in den Zellkern abzugeben. Derartige Oligonukleotide können Antisense-Oligonukleotide oder Oligonukleotide sein, die konzipiert wurden, um Triplehelices zu bilden, wie es in den Beispielen 62 bzw. 63 beschrieben wird, um die Prozessierung und/oder Reifung einer zellulären Ziel-RNA zu hemmen.
Wie oben beschrieben, können die cDNAs oder Abschnitte davon, die unter Verwendung der hierin beschriebenen 5'-ESTs erhalten wurden, für verschiedene Zwecke verwendet werden. Die Polynukleotide können verwendet werden, um rekombinantes Protein zur Analyse, Charakterisierung oder therapeutischen Verwendung zu exprimieren; als Marker für Gewebe, in denen das entsprechende Protein vorzugsweise exprimiert wird (entweder konstitutiv oder in einer bestimmten Phase der Gewebedifferenzierung oder -entwicklung oder bei Krankheitszuständen); als Molekulargewichtsmarker auf Southern-Gelen; als Chromosomenmarker oder Tags (wenn markiert), um Chromosomen zu identifizieren oder um miteinander in Beziehung stehende Genpositionen zu kartieren; um sie mit endogenen DNA-Sequenzen in Patienten zu vergleichen, um so mögliche genetische Erkrankungen zu identifizieren; als Sonden zur Hybridisierung und zur Entdeckung neuer miteinander in Beziehung stehender DNA-Sequenzen; als Informationsquelle, um PCR-Primer für genetisches Fingerprinting abzuleiten; für eine Auswahl und Herstellung von Oligomeren zur Befestigung auf einem „Genchip" oder einem anderem Träger, einschließlich der Untersuchung von Expressionsmustern; zur Herstellung von Anti-Protein-Antikörpern unter Verwendung von DNA-Immunisierungstechniken und als Antigen zur Herstellung von Anti-DNA-Antikörpern oder um andere Immunantworten auszulösen. In Fällen, in denen das Polynukleotid für ein Protein codiert, das an ein anderes Protein bindet oder möglicherweise bindet (beispielsweise in einer Rezeptor-Ligand-Wechselwirkung) kann das Polynukleotid auch in Interaction Trap-Assays verwendet werden (wie beispielsweise dem der in Gyuris et al., Cell 75:791-803, 1993 beschrieben wird), um Polynukleotide zu identifizieren, welche für das andere Protein codieren, mit welchen die Bindung stattfindet, oder um Hemmstoffe der Bindewechselwirkung zu identifizieren.
Die Proteine oder Polypeptide, die durch die vorliegende Erfindung bereitgestellt werden, können in ähnlicher Weise in Assays verwendet werden, um die biologische Aktivität zu bestimmen, einschließlich einem Panel multipler Proteine für Hochdurchsatz-Screening; um Antikörper zu erzeugen oder um eine andere Immunantwort auszulösen; als ein Reagenz (einschließlich des markierten Reagenz) in Assays, die konzipiert sind, die Mengen des Proteins (oder seines Rezeptors) in biologischen Fluiden quantitativ zu bestimmen; als Marker für Gewebe, in denen das entsprechende Protein vorzugsweise exprimiert wird (entweder konstitutiv oder in einer bestimmten Phase der Gewebedifferenzierung oder -entwicklung oder in einem Krankheitszustand); und selbstverständlich um korrelierende Rezeptoren oder Liganden zu isolieren. In Fällen, in denen das Protein bindet oder möglicherweise bindet (wie beispielsweise in einer Rezeptor-Ligand-Wechselwirkung), kann das Protein verwendet werden, um andere Proteine zu identifizieren, mit denen eine Bindung stattfindet, oder um Hemmstoffe der Bindungswechselwirkung zu identifizieren. Proteine, die bei diesen Bindungswechselwirkungen beteiligt sind, können auch verwendet werden, um nach Peptidhemmstoffen oder kleinen Molekülhemmstoffen oder Agonisten dieser Bindewechselwirkung zu screenen.
Beliebige oder alle dieser Forschungsmöglichkeiten können weiterentwickelt werden, dass sie als Reagenz geeignet sind, oder für ein Kit-Format zur Kommerzialisierung als Forschungsprodukte.
Die oben aufgeführten Verfahren zur Durchführung der Verwendungen sind dem Fachmann allgemein bekannt. Referenzen, die derartige Verfahren offenbaren, umfassen ohne Beschränkung Molecular Cloning; A Laboratory Manual, 2. Ausgabe, Cold spring Harbor Laboratory Press, Sambrook, Fritsch und Maniatis Hrsg., 1989, und Methods in Enzymology; Guide to Molecular Cloning Techniques, Academic Press, Berger und Kimmel Hrsg., 1987.
Erfindungsgemäße Polynukleotide und Proteine können auch als Nahrungsmittelquellen oder Nahrungsergänzungsstoffe verwendet werden. Derartige Verwendungen umfassen ohne Beschränkung die Verwendung als Protein- oder Aminosäurezusatz, die Verwendung als Kohlenstoffquelle, die Verwendung als Stickstoffquelle und die Verwendung als Kohlenwasserstoffquelle. In derartigen Fällen kann das erfindungsgemäße Protein oder Polynukleotid der Nahrung für einen bestimmten Organismus zugefügt werden oder es kann als getrennte feste oder flüssige Präparation verabreicht werden, wie beispielsweise in Form eines Puders, als Pillen, Lösungen, Suspensionen oder als Kapseln. Im Fall von Mikroorganismen kann das erfindungsgemäße Protein oder Polynukleotid dem Medium zugegeben werden, in oder auf welchem der Mikroorganismus kultiviert wird. Tabelle 1: Parameter, welche für jeden Schritt der EST-Analyse verwendet wurden

* Verwendung des „Quick Fast" Datenbank-Scanners
† Anordnung, welche weiterhin so eingeschränkt, dass näher als 10 bp zum EST\5'-Ende begonnen wird
¤ Verwendung einer BLOSUM62 Substitutionsmatrix

Claims

Signalpeptid, welches die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 aufweist.
Signalsequenz, welche für ein Signalpeptid nach Anspruch 1 codiert.
Signalsequenz nach Anspruch 2, welche die Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45 aufweist.
Gereinigte und isolierte Nukleinsäure, welche für ein humanes, sekretiertes Polypeptid codiert, welches das Signalpeptid nach Anspruch 1 am 5'-Ende der codierenden Sequenz umfasst.
Nukleinsäure nach Anspruch 4, worin die Nukleinsäure eine Signalsequenz umfasst, welche die Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45 aufweist.
Nukleinsäure nach Anspruch 5, worin der Aminoterminus des Polypeptids durch die Nukleotide 115 bis 396 der SEQ ID NO: 45 codiert ist.
Nukleinsäure nach Anspruch 4, worin die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden ist, welche für ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Expressionsvektor, umfassend eine Signalsequenz nach Anspruch 2 oder 3, welche in funktionsfähiger Weise mit einem Promoter verbunden ist.
Expressionsvektor, umfassend eine Nukleinsäure nach einem der Ansprüche 4 bis 7, welche in funktionsfähiger Weise mit einem Promoter verbunden ist.
Expressionvektor nach Anspruch 8 oder 9, worin der Vektor ein Sekretionsvektor ist.
Polypeptid, welches von einem Polynukleotid nach einem der Ansprüch 4 bis 6 codiert ist.
Polypeptid nach Anspruch 11, worin das Polypeptid die Aminosäuren 1 bis 64 der SEQ ID NO: 299 umfasst.
Fusionsprotein, welches durch eine Nukleinsäure nach Anspruch 7 codiert ist.
Verwendung eines Signalpeptids nach Anspruch 1 zum Steuern der extrazellulären Sekretion eines Polypeptids, mit der Maßgabe, dass die Verwendung nicht an einem menschlichen oder tierischen Körper eingesetzt wird.
Verwendung eines Signalpeptids nach Anspruch 1 zum Vereinfachen der Proteinreinigung eines gewünschten Polypeptids.
Verwendung eines Vektors nach einem der Ansprüche 8 bis 10 zum Steuern der extrazellulären Sekretion eines Polypeptids, mit der Maßgabe, dass die Verwendung nicht an einem menschlichen oder tierischen Körper eingesetzt wird.
Verwendung eines Vektors nach einem der Ansprüche 8 bis 10 zum Vereinfachen der Proteinreinigung eines gewünschten Polypeptids.
Verwendung nach einem der Ansprüche 14 bis 17, worin das Polypeptid ein Polypeptid nach einem der Ansprüche 11 bis 13 ist.