-
Hintergrund
der Erfindung
-
Die
auf 50,000 bis 100,000 geschätzten
Gene, die entlang der humanen Chromosomen verstreut sind, bieten
eine enorme Aussicht für
das Verständnis,
die Diagnose und die Behandlung humaner Erkrankungen. Darüber hinaus
finden Sonden, welche spezifisch mit über das humane Genom verteilten
Loci hybridisieren können,
Anwendung bei der Erstellung hochaufgelöster Chromosomenkarten und
bei der Identifizierung von Individuen.
-
In
der Vergangenheit war selbst die Charakterisierung eines einzelnen
humanen Gens ein mühsames Verfahren,
welches jahrelange Bemühungen
erforderte. Neuere Entwicklungen auf den Gebieten der Klonierungsvektoren,
der DNA-Sequenzierung und der Computertechnologie sind verbunden
worden, um die Geschwindigkeit, mit der humane Gene isoliert, sequenziert,
kartiert und charakterisiert werden können, außerordentlich zu beschleunigen.
Klonierungsvektoren, wie beispielsweise künstliche Hefechromosomen (YACs) und
künstliche
Bakterienchromosomen (BACs) können
DNA-Inserts mit einer Länge
von 300 bis 1000 Kilobasen (kb) bzw. 100–400 kb aufnehmen, wodurch
die Manipulation und Anordnung von DNA-Sequenzen, welche auf den
humanen Chromosomen über
große
Abstände
verteilt sind, erleichtert wird. Automatisierte DNA-Sequenzierungsmaschinen
ermöglichen
die schnelle Sequenzierung von humanen Genen. Bioinformatik-Software
ermöglicht
den Vergleich von Nukleinsäure-
und Proteinsequenzen, wodurch die Charakterisierung von humanen
Genprodukten unterstützt
wird.
-
Gegenwärtig werden
zwei verschiedene Ansätze
zur Identifizierung und Charakterisierung der über das humane Genom verteilten
Gene verfolgt. In einem Ansatz werden große Fragmente genomischer DNA isoliert,
kloniert und sequenziert. Potenzielle offene Leserahmen in diesen
genomischen Sequenzen werden unter Verwendung von Bioinformatik-Software
identifiziert. Dieser Ansatz führt
jedoch zur Sequenzierung langer Strecken humaner DNA, welche für kein Protein
codiert, um die über
das Genom verteilten für
ein Protein codierenden Sequenzen zu finden. Zusätzlich zum Erfordernis einer
umfangreichen Sequenzierung kann die Bioinformatik-Software die
erhaltenen genomischen Sequenzen falsch charakterisieren. Auf diese
Weise kann die Software falschpositive Ergebnisse, in denen nicht
codierende DNA fälschlicherweise
als codierende DNA charakterisiert wird, oder falsch-negative Ergebnisse
erzeugen, in denen codierende DNA fälschlicherweise als nicht codierende
DNA bezeichnet wird.
-
Ein
alternativer Ansatz verfolgt einen direkteren Weg zur Identifizierung
und Charakterisierung humaner Gene. In diesem Ansatz werden aus
isolierten Messenger-RNAs (mRNAs), welche für humane Proteine codieren,
komplementäre
DNAs (cDNAs) synthetisiert. Unter Verwendung dieses Ansatzes wird
eine Sequenzierung nur mit DNA durchgeführt, welche aus Abschnitten
des Genoms abgeleitet wurde, welche für ein Protein codieren. Oftmals
werden nur kurze Strecken der cDNA sequenziert, um Sequenzen zu
erhalten, die als „Expressed
Sequenz Tags" (ESTs)
bezeichnet werden. Diese ESTs können
dann verwendet werden, um erweiterte cDNAs zu isolieren und aufzureinigen,
welche Sequenzen umfassen, die zu den EST-Sequenzen benachbart sind.
Die erweiterten cDNAs können
die vollständige
EST-Sequenz umfassen, die verwendet wurde, um sie zu erhalten oder
sie können
nur einen Teil der EST-Sequenz umfassen, die verwendet wurde, um
sie zu erhalten. Darüber
hinaus können
die erweiterten cDNAs die vollständige
codierende Sequenz des Gens enthalten, von dem das EST abgeleitet
wurde, oder alternativ können
die erweiterten cDNAs Teile der codierenden Sequenz des Gens enthalten,
von dem das EST abgeleitet wurde. Es ist verständlich, dass mehrere erweiterte
cDNAs vorliegen können,
welche die EST-Sequenz als Ergebnis eines alternativen Spleißings oder als
Ergebnis der Aktivität
von alternativen Promotoren umfassen.
-
In
der Vergangenheit wurden diese kurzen EST-Sequenzen oft aus cDNA-Bibliotheken auf
Grundlage von Oligo-dT erhalten. Demgemäß entsprechen sie hauptsächlich der
nicht translatierten 3'-Region
der mRNA. Zum Teil ist das Übergewicht
der EST-Sequenzen, welche von dem 3'-Ende der mRNA abgeleitet sind, eine Folge
der Tatsache, dass herkömmliche
Techniken zum Erhalten von cDNAs für die Isolierung von cDNA-Sequenzen,
welche von den 5'-Enden
von mRNAs abgeleitet sind, nicht gut geeignet sind (Adams et al.,
Nature 377:3-174, 1996; Hillier et al., Genome Res. 6:807-828, 1996).
-
Darüber hinaus
entsprechen in den beschriebenen Fällen, in denen längere cDNA-Sequenzen
erhalten wurden, die beschriebenen Sequenzen üblicherweise den codierenden
Sequenzen und umfassen nicht die vollständige nicht translatierte 5'-Region der mRNA,
von welcher die cDNA abgeleitet ist. Solche unvollständigen Sequenzen
umfassen das erste Exon der mRNA möglicherweise nicht, insbesondere
in den Fällen,
bei welchen das erste Exon kurz ist. Darüber umfassen sie möglicherweise
einige Exons nicht, oftmals kurze Exons, die stromaufwärts der
Spleißingstellen
liegen. Es besteht deshalb ein Bedarf, Sequenzen zu erhalten, die
von den 5'-Enden
von mRNAs abgeleitet sind.
-
Während viele
Sequenzen, welche von humanen Chromosomen abgeleitet sind, praktische
Anwendung besitzen, sind Ansätze,
welche auf der Identifizierung und Charakterisierung der chromosomalen
Sequenzen basieren, welche für
ein Proteinprodukt codieren, für
diagnostische und therapeutische Verwendungen besonders relevant.
Von den 50,000–100,000
Genen, welche für
ein Protein codieren, sind sowohl diejenigen Gene, welche für Proteine
codieren, welche von der Zelle, in der sie synthetisiert werden,
sekretiert werden, als auch die sekretierten Proteine selbst als
mögliche
therapeutische Mittel besonders wertvoll. Solche Proteine sind oftmals
bei der Kommunikation von Zelle zu Zelle beteiligt und können für die Erzeugung
einer klinisch relevanten Reaktion in ihren Zielzellen verantwortlich
sein.
-
Tatsächlich finden
gegenwärtig
mehrere sekretorische Proteine, einschließlich Gewebeplasminogenaktivator,
G-CSF, GM-CSF, Erythropoietin, humanes Wachstumshormon, Insulin,
Interferon-α,
Interferon-β,
Interferon-γ und
Interleukin-2 klinische Verwendung. Diese Proteine werden verwendet,
um eine breite Auswahl an Erkrankungen zu behandeln, einschließlich akutem
Myokardinfarkt, akuter ischämischer
Apoplexie, Anämie,
Diabetes, Wachstumshormondefizienz, Hepatitis, Nierencarzinom, durch
Chemotherapie induzierte Neutropenie, und Multipler Sklerose. Aus
diesen Gründen
stellen erweiterte cDNAs, welche für sekretierte Proteine oder
Abschnitte davon codieren, eine besonders wertvolle Quelle für therapeutische
Mittel dar. Es besteht deshalb ein Bedarf zur Identifizierung und
Charakterisierung von sekretierten Proteinen und den Nukleinsäuren, welche
für sie
codieren.
-
Außer, dass
sie selbst therapeutisch verwendbar sind, enthalten sekretorische
Proteine an ihren Aminotermini kurze Peptide, sogenannte Signalpeptide,
welche ihre Sekretion steuern. Diese Signalpeptide werden durch
die Signalsequenzen codiert, welche an den 5'-Enden der codierenden Sequenzen lokalisiert
sind, welche für
die sekretierten Proteine codieren. Da diese Signalpeptide die extrazelluläre Sekretion
eines beliebigen Proteins steuern, mit dem sie operativ verknüpft sind,
können
die Signalsequenzen ausgenutzt werden, um die effiziente Sekretion
eines beliebigen Proteins durch operative Verknüpfung der Signalsequenz mit
einem Gen, welches für
das Protein codiert, dessen Sekretion erwünscht ist, zu steuern. Ferner
können
auch Teile von Signalsequenzen verwendet werden, um den intrazellulären Import
eines Peptids oder eines Proteins von Interesse zu steuern. Dies
kann sich in Strategien zur Gentherapie als vorteilhaft erweisen,
bei welchen es erwünscht
ist, ein bestimmtes Genprodukt an Zellen abzugeben, die sich von
der Zelle unterscheiden, in welcher das Genprodukt erzeugt wird.
Signalsequenzen, welche für
Signalpeptide codieren, finden auch in Techniken zur Vereinfachung
der Proteinreinigung Anwendung. In solchen Anwendungen erleichtert
die extrazelluläre
Sekretion des gewünschten
Proteins die Reinigung durch Verringerung der Anzahl unerwünschter Proteine,
aus welchen das gewünschte
Protein ausgewählt
werden muss, in hohem Maße.
Es besteht hier deshalb ein Bedarf, die 5'-Abschnitte der Gene für sekretorische
Proteine, welche für
Signalpeptide codieren, zu identifizieren und zu charakterisieren.
-
Die öffentlichen
Informationen zur Anzahl humaner Gene, für welche die Promotoren und
stromaufwärts
liegenden regulatorischen Regionen identifiziert und charakterisiert
worden sind, sind ziemlich beschränkt. Teilweise mag dies auf
den Schwierigkeiten bei der Isolierung solcher regulatorischer Sequenzen
beruhen. Stromaufwärts
liegende regulatorische Sequenzen, wie beispielsweise Bindestellen
für Transkriptionsfaktoren,
sind normalerweise zu kurz, um als Sonden zur Isolierung von Promotoren
aus humanen Genombibliotheken verwendet zu werden. In letzter Zeit
sind einige Ansätze
entwickelt worden, um Humanpromotoren zu isolieren. Einer von ihnen
besteht in der Herstellung einer CpG-Insel-Bibliothek (Cross, et
al., Nature Genetics 6:236-244, 1994). Der zweite besteht in der
Isolierung humaner genomischer DNA-Sequenzen, welche Spel-Bindungsstellen enthalten,
durch die Verwendung eines Spel-Bindungsproteins (Mortlock et al.,
Genome Res., 6:327-335, 1996). Aufgrund mangelnder Spezifität oder mangelndem
Umfang weisen beide Ansätze Grenzen
auf.
-
Die
vorliegenden 5'-ESTs
können
verwendet werden, um stromaufwärts
liegende regulatorische Regionen, welche sowohl die Lokalisierung,
das Entwicklungsstadium, die Rate und die Menge der Proteinsynthese
ebenso wie die Stabilität
der mRNA kontrollieren bzw. steuern, effizient zu identifizieren
und zu isolieren (Theil, BioFactors 4:87-93, 1993). Sobald sie einmal
identifiziert und charakterisiert wurden, können diese regulatorischen
Regionen in der Gentherapie oder in Protein-Reinigungssystemen verwendet
werden, um die gewünschte
Menge und die gewünschten
Lokalisierungen der Proteinsynthese zu erhalten, oder um die Synthese
von unerwünschten
Genprodukten zu hemmen, zu verringern oder zu verhindern.
-
Darüber hinaus
können
ESTs, welche die 5'-Enden
von sekretorischen Proteingenen enthalten, Sequenzen umfassen, die
als Sonden zur Chromosomenkartierung und zur Identifizierung von
Individuen nützlich
sind. Es besteht deshalb ein Bedarf, die Sequenzen zu identifizieren
und zu charakterisieren, welche stromaufwärts von den 5'-codierenden Gensequenzen
liegen, welche für
sekretorische Proteine codieren.
-
Zusammenfassung
der Erfindung
-
Die
vorliegende Erfindung betrifft gereinigte, isolierte oder rekombinante
ESTs, welche Sequenzen umfassen, die von den authentischen 5'-Enden ihrer entsprechenden
mRNAs abgeleitet wurden. Der Ausdruck „entsprechende mRNA" bezieht sich auf
die mRNA, welche die Matrize in der cDNA-Synthese darstellte, die das
5'-EST erzeugte.
Diese Sequenzen werden im Folgenden hierin als „5'-ESTs" bezeichnet. Wie hierin verwendet, erfordert
der Begriff „gereinigt" keine absolute Reinheit;
vielmehr ist er als eine relative Definition beabsichtigt. Einzelne
5'-EST-Klone, die
aus einer cDNA-Bibliothek isoliert wurden, wurden herkömmlich bis
zur elektrophoretischen Homogenität aufgereinigt. Die aus diesen
Klonen erhaltenen Sequenzen konnten direkt weder aus der Bibliothek
noch aus humaner Gesamt-DNA erhalten werden. Die cDNA-Klone als
solche kommen nicht natürlich
vor, sondern werden vielmehr durch Manipulation einer teilweise
gereinigten natürlich
vorkommenden Substanz (Messenger-RNA) erhalten. Die Umwandlung der
mRNA in eine cDNA-Bibliothek umfasst die Erzeugung einer synthetischen
Substanz (cDNA) und reine einzelne cDNA-Klone können durch klonale Auswahl
aus der synthetischen Bibliothek isoliert werden. Daher führt die
Erzeugung einer cDNA-Bibliothek aus Messenger-RNA und nachfolgender
Isolierung einzelner Klone aus der Bibliothek zu einer etwa 104 bis 104-fachen
Reinigung der nativen Messenger-RNA. Die Reinigung des Ausgangsmaterials
oder natürlichen Materials
um mindestens eine Größenordnung,
vorzugsweise zwei oder drei Größenordnungen
und mehr bevorzugt um vier oder fünf Größenordnungen, ist ausdrücklich umfasst.
-
Wie
hierin verwendet, erfordert der Ausdruck „isoliert", dass das Material aus seiner ursprünglichen Umgebung
(z.B. die natürliche
Umgebung, wenn es natürlich
vorkommt) entfernt wird. Beispielsweise gilt ein natürlich vorkommendes
Polynukleotid, das in einem lebendigen Tier vorliegt, als nicht
isoliert, während
das gleiche Polynukleotid, welches von einem Teil oder von dem Gesamten
des im natürlichen
System koexistierenden Materials abgetrennt ist, isoliert ist.
-
Wie
hierin verwendet, bedeutet der Ausdruck „rekombinant", dass das 5'-EST zu einer „Gerüst"-Nukleinsäure benachbart
ist, zu der es in seiner natürlichen
Umgebung nicht benachbart ist. Zusätzlich stellen die 5'-ESTs 5% oder mehr
der Anzahl der Nukleinsäureinserts
in einer Population von Nukleinsäuregerüstmolekülen dar,
um als „angereichert" zu gelten. Gerüstmoleküle der vorliegenden
Erfindung umfassen Nukleinsäuren, wie
beispielsweise Expressionsvektoren, selbstreplizierende Nukleinsäuren, Viren,
integrierende Nukleinsäuren
und andere Vektoren oder Nukleinsäuren, welche verwendet werden,
um ein Nukleinsäureinsert
von Interesse zu erhalten oder zu manipulieren. Vorzugsweise stellen
die angereicherten 5'-ESTs
15% oder mehr der Zahl an Nukleinsäure inserts in der Population
rekombinanter Gerüstmoleküle dar.
Mehr bevorzugt stellen die angereicherten 5'-ESTs 50% oder mehr der Anzahl an Nukleinsäureinserts
in der Population rekombinanter Gerüstmoleküle dar. In einer höchst bevorzugten
Ausführungsform
stellen die angereicherten 5'-ESTs
90% oder mehr der Anzahl an Nukleinsäureinserts in der Population
rekombinanter Gerüstmoleküle dar.
-
„Stringente", „moderate" und „schwache" Hybridisierungsbedingungen
sind wie in Beispiel 29 definiert.
-
Soweit
nicht anders angegeben, ist eine „komplementäre" Sequenz vollständig komplementär.
-
Daher
sind 5'-ESTs in
cDNA-Bibliotheken, in welchen ein oder mehrere 5'-ESTs 5% oder mehr der Anzahl an Nukleinsäureinserts
in den Gerüstmolekülen ausmachen, „angereicherte
rekombinante 5'-ESTs", wie hierin bestimmt.
Ebenso sind 5'-ESTs
in einer Population von Plasmiden, worin eines oder mehrere erfindungsgemäße 5'-ESTs insertiert
worden sind, so dass sie 5% oder mehr der Anzahl der Inserts im
Plasmidgerüst darstellen, „angereicherte
rekombinante 5'-ESTs", wie hierin bestimmt.
Jedoch sind 5'-ESTs
in cDNA-Bibliotheken, in welchen 5'-ESTs weniger als 5% der Anzahl an Nukleinsäureinserts
in der Population an Gerüstmolekülen ausmachen,
wie beispielsweise in Bibliotheken, in welchen Gerüstmoleküle mit 5'-EST äußerst selten sind,
keine „angereicherten
rekombinanten 5'-ESTs".
-
Die
vorliegende Erfindung betrifft insbesondere 5'-ESTs, die aus Genen abgeleitet wurden,
welche für sekretierte
Proteine codieren. Wie hierin verwendet, ist ein „sekretiertes" Protein ein Protein,
das, wenn es in einer geeigneten Wirtszelle exprimiert wird, über oder
durch eine Membran transportiert wird, wobei der Transport als Ergebnis
von Signalpeptiden in der Aminosäuresequenz
des Proteins umfasst ist. „Sekretierte" Proteine umfassen
ohne Beschränkung
Proteine, die vollständig
(z.B. lösliche
Proteine) oder teilweise (z.B. Rezeptoren) aus der Zelle, in der
sie exprimiert werden, sekretiert werden. „Sekretierte" Proteine umfassen
auch ohne Einschränkung
Proteine, die über
die Membran des endoplasmatischen Retikulums hinweg transportiert werden.
-
Derartige
5'-ESTs umfassen
Nukleinsäuresequenzen,
die Signalsequenzen genannt werden, welche für Signalpeptide codieren, welche
die extrazelluläre
Sekretion der Proteine steuern, welche durch die Gene codiert werden,
von welchen die 5'-ESTs
abgeleitet sind. Im Allgemeinen sind die Signalpeptide an den Aminotermini
sekretierter Proteine lokalisiert.
-
Sekretierte
Proteine werden durch Ribosomen, die mit dem „rauhen" endoplasmatischen Retikulum verbunden
sind, translatiert. Im Allgemeinen werden sekretierte Proteine kotranslational
zur Membran des endoplasmatischen Retikulums überführt. Die Verbindung des Ribosoms
mit dem endoplasmatischen Retikulum während der Translation sekretierter
Proteine wird durch das Signalpeptid vermittelt. Das Signalpeptid
wird normalerweise nach seinem kotranslationalen Eintritt in das
endoplasmatische Retikulum abgespalten. Nach der Abgabe an das endoplasmatische
Retikulum können
sekretierte Proteine den Golgi-Apparat durchlaufen. Im Golgi-Apparat
können
die Proteine posttranslationalen Modifizierungen unterzogen werden,
bevor sie in sekretorische Vesikel eintreten, die sie über die
Zellmembran hinweg transportieren.
-
Die
erfindungsgemäßen 5'-ESTs weisen einige
wichtige Anwendungen auf. Zum Beispiel können sie verwendet werden,
um cDNA-Klone zu erhalten und zu exprimieren, welche die vollständigen proteincodierenden
Sequenzen der entsprechenden Genprodukte umfassen, einschließlich der
authentischen Translationsstartstellen, die aus den 5'-Enden der codierenden
mRNA-Sequenzen abgeleitet sind, aus denen die 5'-ESTs abgeleitet sind. Diese cDNAs werden
im Folgenden als „Volllängen-cDNAs" bezeichnet. Diese
cDNAs können auch
DNA umfassen, die aus mRNA-Sequenzen, die stromaufwärts zur
Translationsstartstelle liegen, abgeleitet sind. Die Volllängen-cDNA-Sequenzen
können
verwendet werden, um die Proteine zu exprimieren, die den 5'-ESTs entsprechen.
Wie oben diskutiert, sind sekretierte Proteine therapeutisch wichtig.
Daher können
die Proteine, die durch die cDNAs exprimiert werden, bei der Behandlung
oder bei der Kontrolle einer Vielfalt von humanen Beschwerden nützlich sein.
Die 5'-ESTs können auch
verwendet werden, um die entsprechende genomische DNA zu erhalten.
Der Ausdruck „entsprechende
genomische DNA" betrifft
die genomische DNA, welche die mRNA codiert, aus der das 5'-EST abgeleitet wurde.
-
Alternativ
können
die 5'-ESTs verwendet
werden, um erweiterte cDNAs, die für Abschnitte des sekretierten
Proteins codieren, zu erhalten und zu exprimieren. Die Abschnitte
können
die Signalpeptide der sekretierten Proteine oder die reifen Proteine
umfassen, die erzeugt werden, wenn das Signalpeptid abgespalten wird.
Die Abschnitte können
auch Polypeptide mit mindestens 10 aufeinander folgenden Aminosäuren, die durch
die erweiterten cDNAs oder Volllängen-cDNAs
codiert werden, umfassen. Alternativ können die Abschnitte mindestens
15 aufeinander folgende Aminosäuren,
die durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden,
umfassen. In einigen Ausführungsformen
können
die Abschnitte mindestens 25 aufeinander folgende Aminosäuren, die
durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden, umfassen.
In anderen Ausführungsformen
können
die Abschnitte mindestens 40 Aminosäuren, die durch die erweiterten
cDNAs oder Volllängen-cDNAs
codiert werden, umfassen.
-
Antikörper, welche
die vollständigen
sekretierten Proteine, die durch die erweiterten cDNAs oder Volllängen-cDNAs
oder Fragmente davon mit mindestens 10 aufeinander folgenden Aminosäuren, mit
mindestens 15 aufeinander folgenden Aminosäuren, mit mindestens 25 aufeinander
folgenden Aminosäuren
oder mit mindestens 40 aufeinander folgenden Aminosäuren, codiert
werden, spezifisch erkennen, können
ebenfalls erhalten werden, wie es unten beschrieben wird. Antikörper, die
spezifisch das reife Protein erkennen, das erzeugt wird, wenn das
Signalpeptid abgespalten wird, können
ebenfalls erhalten werden, wie es unten beschrieben wird. In ähnlicher
Weise können
auch Antikörper
erhalten werden, die spezifisch die Signalpeptide erkennen, die
durch die erweiterten cDNAs oder Volllängen-cDNAs codiert werden.
-
In
einigen Ausführungsformen
umfassen die erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden,
die Signalsequenz. In anderen Ausführungsformen können die
erweiterten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, die vollständige codierende
Sequenz für
das reife Protein umfassen (d.h. das Protein, das erzeugt wird,
wenn das Signalpolypeptid abgespalten wird). Darüber hinaus können die erweiterten
cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, regulatorische
Regionen umfassen, die stromaufwärts
der Translationsstartstelle oder stromabwärts des Stoppcodons liegen
und welche die Menge, Lokalisierung oder das Entwicklungsstadium
der Genexpression kontrollieren bzw. steuern.
-
Wie
oben diskutiert, sind sekretierte Proteine therapeutisch wichtig.
Daher können
die Proteine, die von den erweiterten cDNAs oder Volllängen-cDNAs,
die unter Verwendung der 5'-ESTs
erhalten wurden, exprimiert werden, bei der Behandlung oder Kontrolle
einer Vielfalt von humanen Beschwerden nützlich sein.
-
Die
5'-ESTs (oder cDNAs
oder genomische DNAs, die davon erhalten wurden) können in
forensischen Verfahren eingesetzt werden, um Individuen zu identifizieren,
oder in diagnostischen Verfahren, um Individuen mit genetischen
Erkrankungen zu identifizieren, die aus einer abnormalen Expression
der Gene herrühren,
die den 5'-ESTs
entsprechen. Darüber
hinaus ist die vorliegende Erfindung bei der Erstellung einer hochaufgelösten Karte
der humanen Chromosomen nützlich.
-
Die
vorliegende Erfindung betrifft auch Vektoren zur Sekretion, die
in der Lage sind, die Sekretion eines Proteins von Interesse zu
steuern. Solche Vektoren können
in Strategien zur Gentherapie verwendet werden, in welchen es wünschenswert
ist, ein Genprodukt in einer Zelle zu erzeugen, das an eine andere
Stelle im Körper
abgegeben werden soll. Vektoren zur Sekretion können auch die Reinigung von
gewünschten
Proteinen erleichtern.
-
Die
vorliegende Erfindung betrifft auch Vektoren zur Expression, die
in der Lage sind, die Expression eines insertierten Gens in einer
gewünschten
räumlichen
oder temporären
Weise oder in einem gewünschten Maß zu steuern.
Solche Vektoren können
Sequenzen umfassen, die stromaufwärts der 5'-ESTs liegen, wie beispielsweise Promotoren
oder stromaufwärts
liegende regulatorische Sequenzen.
-
Schließlich kann
die vorliegende Erfindung auch zur Gentherapie verwendet werden,
um genetische Erkrankungen zu kontrollieren oder zu behandeln. Signalpeptide
können
auch mit heterologen Proteinen fusioniert werden, um deren extrazelluläre Sekretion
zu steuern.
-
Bakterienklone,
die Bluescript-Plasmide mit Inserts enthalten, welche die erfindungsgemäßen 5'-EST (SEQ ID NO:
38-291) aufweisen, werden gegenwärtig
bei 80°C
in 4% (v/v) Glycerin in den Laboratorien des Erfinders unter den
Bezeichnungen gelagert, die neben den SEQ ID-Nummern aufgeführt sind.
Die Inserts können
aus den hinterlegten Materialien durch Anzucht der entsprechenden
Klone in einem geeigneten Medium gewonnen werden. Anschließend kann
die Bluescript-DNA unter Verwendung von dem Fachmann bekannten Verfahren
zur Plasmidisolierung isoliert werden, wie beispielsweise alkalische
Lyse von Minipreps oder alkalische Lyse im Großmaßstab als Verfahren zur Plasmidisolierung.
Wenn gewünscht,
kann die Plasmid-DNA mittels Zentrifugation auf einem Cäsiumchloridgradienten,
Größenausschlusschromatografie
oder Anionenaustauschchromatografie weiter angereichert werden.
Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann
dann unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken
manipuliert werden. Alternativ kann eine PCR mit Primern, die hinsichtlich
beider Enden der EST-Insertion
konzipiert sind, durchgeführt
werden. Das dem 5'-EST
entsprechende PCR-Produkt kann anschließend unter Verwendung von dem
Fachmann vertrauten Standardklonierungstechniken manipuliert werden.
-
Ein
Aspekt der vorliegenden Erfindung ist ein Signalpeptid, welches
die Sequenz der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 aufweist.
-
Ein
anderer Aspekt der vorliegenden Erfindung ist eine Signalsequenz,
welche für
ein Signalpeptid mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 codiert.
In einer Ausführungsform
weist die Signalsequenz die Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45 auf.
-
Noch
ein anderer Aspekt der vorliegenden Erfindung ist eine gereinigte
und isolierte Nukleinsäure, welche
für ein
humanes sekretiertes Polypeptid codiert, welches die Sequenz der
Aminosäuren –30 bis –1 der SEQ
ID NO: 299 am 5'-Ende
der codierenden Sequenz aufweist. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein
Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid,
welches die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst.
-
Eine
weitere Ausführungsform
der vorliegenden Erfindung ist ein Expressionsvektor, umfassend
eine Signalsequenz, welche für
ein Signalpeptid mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 codiert,
welche in funktionsfähiger
Weise mit einem Promoter verbunden ist. Der Expressionsvektor kann
ein Sekretionsvektor sein. In einer Ausführungsform besitzt die Signalsequenz
die Sequenz der Nukleotide 115 bis 204 der SEQ ID NO: 45.
-
Ein
weiterer Aspekt der Erfindung ist ein Expressionsvektor, welcher
eine gereinigte und isolierte Nukleinsäure umfasst, welche für ein humanes
sekretiertes Polypeptid codiert, welche in funktionsfähiger Weise mit
einem Promoter verbunden ist, worin die isolierte Nukleinsäure für ein Polypeptid
codiert, welches am 5'-Ende
der codierenden Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 umfasst.
Der Expressionsvektor kann ein Sekretionsvektor sein. In einer ersten
Auzsführungsform
umfasst die Nukleinsäure eine
Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der SEQ
ID NO: 45. In dieser Ausführungsform
ist der Aminoterminus des Polypeptids durch die Nukleotide 115 bis
396 der SEQ ID NO: 45 codiert. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende der einer Sequenz verbunden, welche
für ein
Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid,
welches die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst.
-
Noch
ein weiterer Aspekt der vorliegenden Erfindung ist ein Polypeptid,
welches für
eine gereinigte und isolierte Nukleinsäure codiert, welche für ein humanes
sekretiertes Polypeptid codiert, umfassend die Sequenz der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 am 5'-Ende
der codierenden Sequenz. Das Polypeptid kann die Aminosäuren 1 bis
64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein
Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid,
welches die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst.
-
Ein
weiterer Aspekt der vorliegenden Erfindung ist ein Fusionsprotein,
welche svon einer gereinigten und isolierten Nukleinsäure codiert
ist, welche für
ein humanes sekretiertes Polypeptid codiert, umfassend die Sequenz
der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 am 5'-Ende
der codierenden sequenz, worin die Signalsequenz im Leserahmen mit
dem 5'-Ende einer
Sequenz verbunden ist, welche für
ein Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid,
welches die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst.
-
Ein
weiterer Aspekt der vorliegenden Erfindung ist die Verwendung eines
Signalpeptids mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 zum Steuern
der extrazellulären
Sekretion eines Polypeptids, mit der Maßgabe, dass die Verwendung
nicht an einem menschlichen oder tierischen Körper eingesetzt wird.
-
Ein
anderer Aspekt der vorliegenden Erfindung ist die Verwendung eines
Signalpeptids mit der Sequenz der Aminosäuren –30 bis –1 der SEQ ID NO: 299 zum Vereinfachen
der Proteinreinigung eines gewünschten
Polypeptids. Das Polypeptid kann codiert sein von einer gereinigten
und isolierten Nukleinsäure, welche
für ein
humanes sekretiertes Polypeptid codiert, welches am 5'-Ende der codierenden
Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 umfasst. Das Polypeptid kann die Aminosäuren 1 bis 64
der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein
Polypeptid codiert, welches heterolog ist im Bezug auf ein Polypeptid,
welches die Aminosäuren 1
bis 64 der SEQ ID NO: 299 umfasst.
-
Ein
weiterer Aspekt der vorliegenden Erfindung ist die Verwendung eines
Vektors, umfassend eine gereinigte und isolierte Nukleinsäure, welche
für ein
humanes sekretiertes Polypeptid codiert, welche in funktionsfähiger Weise
mit einem Promoter verbunden ist, worin die isolierte Nukleinsäure am 5'-Ende der codierenden
Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 umfasst, Steuern der extrazellulären Sekretion eines Polypeptids,
mit der Maßgabe,
dass die Verwendung nicht an einem menschlichen oder tierischen
Körper
eingesetzt wird. Der Expressionsvektor kann ein Sekretionsvektor
sein. Das Polypeptid, dessen Sekretion gesteuert wird, kann codiert
sein von einer gereinigten und isolierten Nukleinsäure, welche
für ein
humanes sekretiertes Polypeptid codiert, welches am 5'-Ende der codierenden
Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 umfasst. Das Polypeptid kann die Aminosäuren 1 bis
64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein Polypeptid
codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches
die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein Polypeptid
codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches
die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst.
-
Die
Verwendung eines Expressionsvektors, umfassend eine gereinigte und
isolierte Nukleinsäure, welche
für ein
humanes sekretiertes Polypeptid codiert, welche in funktionsfähiger Weise
mit einem Promoter verbunden ist, worin die isolierte Nukleinsäure am 5'-Ende der codierenden
Sequenz die Sequenz der Aminosäuren –30 bis –1 der SEQ
ID NO: 299 umfasst, vereinfacht die Protein reinigung eines gewünschten
Polypeptids. Der Expressionsvektor kann ein Sekretionsvektor sein.
Das Polypeptid kann die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfassen. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein Polypeptid
codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches
die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst. In einer ersten Ausführungsform
umfasst die Nukleinsäure
eine Signalsequenz mit der Sequenz der Nukleotide 115 bis 204 der
SEQ ID NO: 45. In dieser Ausführungsform
kann der Aminoterminus des Polypeptids durch die Nukleotide 115
bis 396 der SEQ ID NO: 45 codiert sein. In einer zweiten Ausführungsform
ist die Signalsequenz im Leserahmen mit dem 5'-Ende einer Sequenz verbunden, welche
für ein Polypeptid
codiert, welches heterolog ist im Bezug auf ein Polypeptid, welches
die Aminosäuren
1 bis 64 der SEQ ID NO: 299 umfasst.
-
Kurze Beschreibung
der Zeichnungen
-
1 ist
eine Zusammenfassung eines Verfahrens zum Erhalten von cDNAs, die
daraufhin ausgewählt
wurden, dass sie die 5'-Enden
der mRNAs enthalten, von denen sie abgeleitet wurden.
-
2 zeigt
die Verteilung von Von Heijne-Ergebnissen für 5'-ESTs in jeder der hierin beschriebenen Kategorien
und die Wahrscheinlichkeit, dass diese 5'-ESTs für ein Signalpeptid codieren.
-
3 fasst
ein allgemeines Verfahren zusammen, das verwendet wird, um erweiterte
cDNAs, die zu 5'-ESTs
benachbarte Sequenzen enthalten, zu klonieren und zu sequenzieren.
-
4 (Beschreibung
von Promotorstrukturen, isoliert aus Signal-Tag-5'-ESTs)
stellt eine schematische Beschreibung von isolierten Promotoren
und der Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengesetzt
sind, bereit.
-
Ausführliche
Beschreibung
-
Tabelle
IV zeigt eine Analyse der 43 Aminosäuren, die am N-Terminus aller
humaner SwissProt-Proteine lokalisiert sind, um die Häufigkeit
falsch positiver oder falsch-negativer Ergebnisse unter Verwendung
der hierin beschriebenen Techniken zur Signalpeptididentifizierung
zu bestimmen.
-
Tabelle
V zeigt die Verteilung von 5'-ESTs
in jeder hierin beschriebenen Kategorie und die Zahl von 5'-ESTs in jeder Kategorie
mit einem bestimmten Von Heijne-Mindestergebnis.
-
Tabelle
VI zeigt die Verteilung von 5'-ESTs
in jeder hierin beschriebenen Kategorie hinsichtlich des Gewebes,
aus dem die 5'-ESTs
der entsprechenden mRNA erhalten wurden.
-
Tabelle
VII beschreibt die Transkriptionsfaktor-Bindungsstellen, die in
jedem dieser Promotoren vorliegen.
-
I. Allgemeine Verfahren
zum Erhalten von 5'-ESTs,
die aus mRNAs mit intakten 5'-Enden
abgeleitet sind
-
Um
die erfindungsgemäßen 5'-ESTs zu erhalten,
müssen
mRNAs mit intakten 5'-Enden
erhalten werden. Gegenwärtig
gibt es zwei Ansätze
zum Erhalten solcher mRNAs mit intakten 5'-Enden, wie unten beschrieben wird:
Entweder chemisch (1) oder enzymatisch (2).
-
1. Chemische Verfahren
zum Erhalten von mRNAs mit intakten 5'-Enden
-
Einer
dieser Ansätze
ist ein chemisches Modifikationsverfahren, das die Derivatisierung
der mRNA 5'-Enden
der mRNAs und die Selektion der derivatisierten mRNAs umfasst. Die
5'-Enden eukaryotischer mRNAs
weisen eine Struktur auf, die als „Cap" bezeichnet wird, das an Position 7
ein methyliertes Guanosin besitzt. Dieses Cap wird durch eine 5',5'-Triphosphatbindung
mit der ersten transkribierten Base der mRNA verbunden. In einigen
Fällen
ist das 5'-Guanosin
sowohl an Position 2 als auch Position 7 methyliert. In seltenen
Fällen
ist das 5'-Guanosin
dreifach an den Positionen 2, 7 und 7 methyliert. Beim chemischen
Verfahren zum Erhalten von mRNAs mit intakten 5'-Enden wird das 5'-Cap spezifisch derivatisiert und an
eine reaktive Gruppe auf einem immobilisierten Träger gekoppelt.
Diese spezifische Derivatisierung basiert auf der Tatsache, dass
nur die Ribose, die mit dem methylierten Guanosin am 5'-Ende der mRNA verknüpft ist,
und die Ribose, die mit der Base am 3'-Terminus der mRNA verknüpft ist,
2',3'-cis-Diole besitzen.
-
Gegebenenfalls
kann das 2',3'-cis-Diol der 3'-terminalen Ribose
chemisch modifiziert, substituiert, umgewandelt oder entfernt werden,
wobei nur die Ribose, die mit dem methylierten Guanosin verknüpft ist,
am 5'-Ende der mRNA
mit einem 2',3'-cis-Diol verbleit.
Eine Vielfalt an Techniken zur Entfernung des 2',3'-cis-Diols an
der 3'-terminalen
Ribose stehen zur Verfügung.
Beispielsweise kann eine kontrollierte alkalische Hydrolyse verwendet
werden, um mRNA-Fragmente zu erzeugen, in welchen die 3'-terminale Ribose
ein 3'-Phosphat, ein
2'-Phosphat oder
ein (2'-3')-Cyclophosphat ist.
Anschließend
kann das Fragment, das die ursprüngliche 3'-Ribose umfasst,
durch Chromatografie an einer Oligo-dT-Säule aus dem Gemisch entfernt
werden. Alternativ kann eine Base, die kein 2',3'-cis-Diol aufweist, unter
Verwendung einer RNA-Ligase, wie beispielsweise einer T4-RNA-Ligase, an das
3'-Ende der mRNA
angefügt
werden. Beispiel 1 unten beschreibt ein Verfahren zur Ligation eines
Nukleosiddiphosphats an das 3'-Ende
von Messenger-RNA.
-
Beispiel 1
-
Ligation des Nukleosiddiphosphats
pCp an das mRNA 3'-Ende
-
Ein μg RNA wurde
in einem Reaktionsmedium von insgesamt 10 μl in Gegenwart von 5 U T4-Phagen-RNA-Ligase in dem vom Hersteller
bereitgestellten Puffer (Gibco-BRL), 40 U des RNase-Inhibitors RNasin
(Promega) und 2 μl 32pCp (Amersham #PB 10208) inkubiert. Die
Inkubation wurde bei 37°C
für 2 Stunden
oder über
Nacht bei 7–8°C durchgeführt.
-
Im
Anschluss an die Modifizierung oder Entfernung des 2',3'-cis-Diols an der
3'-Ribose kann das 2',3'-cis-Diol, das am
5'-Ende der mRNA
vorliegt, unter Verwendung von Reagenzien, wie beispielsweise NaBH4, NaBH3CN oder Natriumperjodat,
oxidiert werden, wobei das 2',3'-cis-Diol in einen
Dialdehyd umgewandelt wird. Beispiel 2 beschreibt die Oxidation
des 2',3'-cis-Diols am 5'-Ende der mRNA mit
Natriumperjodat.
-
Beispiel 2
-
Oxidation
eines 2',3'-cis-Diols am 5'-Ende der mRNA mit
Natriumperjodat 0,1 OD-Einheiten des entweder mit einem Cap versehenen
Oligoribonukleotids mit 47 Nukleotiden (einschließlich des
Caps) oder eines Oligoribonukleotids mit 46 Nukleotiden ohne Cap
wurden wie im Folgenden beschrieben behandelt. Die Oligoribonukleotide
wurden durch in vitro-Tanskription unter Verwendung des Transkriptionskits „AmpliScribe
T7" (Epicentre Technologies)
hergestellt. Wie unten gezeigt, enthielt die DNA-Matrize für das RNA-Transkript
ein einzelnes Cytosin. Um die RNA ohne Cap zu synthetisieren, wurden
alle vier NTPs in die in vitro-Transkriptionsreaktion gegeben. Um
die RNA mit Cap zu erhalten, wurde GTP durch ein Analogon des Caps, m7G(5')ppp(5')G, ersetzt. Diese
von der Polymerase erkannte Verbindung wurde am 5'-Ende des entstehenden
Transkripts während
der Initiation der Transkription eingebaut, wurde aber während des
Verlängerungsschritts
nicht eingebaut. Folglich enthielt die resultierende RNA an ihrem
5'-Ende ein Cap.
Die Sequenzen der durch die in vitro-Transkription erzeugten Oligoribonukleotide
waren:
+Cap:
5'm7GpppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NO: 1)
–Cap:
5'-pppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NO: 2)
-
Die
Oligoribonukleotide wurden in 9 μl
Acetatpuffer (0,1 M Natriumacetat, pH 5,2) und 3 μl frisch
hergestellter 0,1 M Natriumperjodatlösung gelöst. Das Gemisch wurde für 1 Stunde
im Dunkeln bei 4°C
oder bei Raumtemperatur inkubiert. Danach wurde die Reaktion durch
Zugabe von 4 μl
10%igem Ethylenglycol gestoppt. Das Produkt wurde mit Ethanol präzipitiert,
in mindestens 10 μl
Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser
dialysiert.
-
Die
resultierenden Aldehydgruppen können
anschließend
mit Molekülen
gekoppelt werden, die eine reaktive Amingruppe aufweisen, wie beispielsweise
Hydrazin-, Carbazid-, Thiocarbazid- oder Semicarbazidgruppen, um
die Anreicherung der 5'-Enden
der mRNAs zu erleichtern. Moleküle
mit reaktiven Amingruppen, die zur Verwendung bei der Selektion
von mRNAs mit intakten 5'-Enden
geeignet sind, umfassen Avidin, Proteine, Antikörper, Vitamine, Liganden, die
zur spezifischen Bindung an Rezeptormoleküle fähig sind, oder Oligonukleotide.
Beispiel 3 unten beschreibt die Kopplung des resultierenden Dialdehyds
an Biotin.
-
Beispiel 3
-
Kopplung
des Dialdehyds am 5'-Ende
der Transkripte mit Biotin Das in Beispiel 2 erhaltene Oxidationsprodukt
wurde in 50 μl
Natriumacetat bei einem pH zwischen 5 und 5,2 und 50 μl frisch
hergestellter 0,02 M Lösung
von Biotinhydrazid in einem Methoxyethanol/Wassergemisch (1:1) der
Formel
gelöst.
-
In
der in diesen Experimenten verwendeten Verbindung ist n = 5. Jedoch
wird erkannt, dass auch andere, kommerziell erhältliche Hydrazide verwendet
werden können,
wie beispielsweise Moleküle
der obigen Formel, bei denen n zwischen 0 und 5 variiert. Das Gemisch
wurde anschließend
für 2 Stunden
bei 37°C
inkubiert, mit Ethanol präzipitiert
und gegen destilliertes Wasser dialysiert. Beispiel 4 zeigt die
Spezifität
der Biotinylierungsreaktion.
-
Beispiel 4
-
Spezifität der Biotinylierung
von Transkripten mit Caps
-
Die
Spezifität
der Biotinylierung für
mRNAs mit Caps wurde durch Gelelektrophorese der folgenden Proben
beurteilt: Probe 1. Das in vitro-Transkript mit 46 Nukleotiden und
ohne Cap, das wie in Beispiel 2 beschrieben hergestellt wurde, und
mit 32pCp markiert ist, wie es in Bespiel
1 beschrieben wird.
-
Probe
2. Das in vitro-Transkript mit 46 Nukleotiden und ohne Cap, das
wie in Beispiel 2 beschrieben hergestellt wurde, mit 32pCp
markiert ist, wie es in Beispiel 1 beschrieben wird, und in einer
Oxidationsreaktion gemäß Beispiel
2 umgesetzt und den Biotinylierungsbedingungen gemäß Beispiel
3 unterzogen wurde.
-
Probe
3. Das in vitro-Transkript mit 47 Nukleotiden und Cap, das wie in
Beispiel 2 beschrieben hergestellt wurde, und mit 32pCp
markiert ist, wie es in Beispiel 1 beschrieben wird.
-
Probe
4. Das in vitro-Transkript mit 47 Nukleotiden und Cap, wie in Beispiel
2 beschrieben, mit 32pCp markiert, wie in
Beispiel 1 beschrieben, behandelt mit der Oxidationsreaktion aus
Beispiel 2 und den Biotinylierungsbedingungen aus Beispiel 3 unterzogen.
-
Die
Proben 1 und 2 zeigten identische Wandergeschwindigkeiten, was zeigt,
dass RNAs ohne Cap nicht oxidiert und biotinyliert wurden. Probe
3 wanderte langsamer als die Proben 1 und 2, während Probe 4 die langsamste
Wanderung zeigte. Der Unterschied bezüglich der RNA-Wanderung in
den Proben 3 und 4 zeigt, dass die RNAs mit Cap spezifisch biotinyliert
wurden.
-
In
einigen Fällen
können
mRNAs mit intakten 5'-Enden
durch Binden des Moleküls,
das eine reaktive Aminogruppe enthält, an einen geeigneten Festphasenträger, wie
beispielsweise die Innenseite des Gefäßes, das die mRNAs enthält, magnetische
Beads, chromatografische Matrizen oder Nylon- oder Nitrozellulosemembranen
angereichert werden. Beispielsweise kann, wenn das Molekül mit reaktiver
Amingruppe Biotin ist, der Festphasenträger an Avidin oder Streptavidin
gekoppelt werden. Alternativ kann, wenn das Molekül mit der reaktiven
Amingruppe ein Antikörper
oder ein Rezeptorligand ist, der Festphasenträger an das verwandte Antigen
oder den verwandten Rezeptor gekoppelt werden. Schließlich kann
der Festphasenträger
ein komplementäres
Oligonukleotid umfassen, wenn das Molekül mit reaktiver Amingruppe
ein Oligonukleotid umfasst.
-
Die
mRNAs mit intakten 5'-Enden
können
im Anschluss an das Anreicherungsverfahren von der Festphase abgelöst werden.
Beispielsweise können
die mRNAs von der Festphase durch einfaches Erhitzen auf 95°C in 2% SDS
abgelöst
werden, wenn der Dialdehyd an Biotinhydrazid gekoppelt ist und die
Festphase Streptavidin umfasst. In einigen Verfahren kann das Molekül mit reaktiver
Amingruppe im Anschluss an die Anreicherung auch von dem mRNAs mit
intakten 5'-Enden
abgespalten werden. Beispiel 5 beschreibt das Einfangen biotinylierter
mRNA mit streptavidinbeschichteten Beads und die Freisetzung der
biotinylierten mRNAs von den Beads nach der Anreicherung.
-
Beispiel 5
-
Einfangen
und Freisetzung biotinylierter mRNAs unter Verwendung streptavidinbeschichteter
Beads
-
Die
streptavidinbeschichteten magnetischen Beads wurden gemäß den Herstellerangaben
(CPG Inc., USA) hergestellt. Die biotinylierten mRNAs wurden einem
Hybridisierungspuffer zugegeben (1,5 M NaCl, pH 5–6). Nach
Inkubation für
30 Minuten wurde das ungebundene und nicht biotinylierte Material
entfernt. Die Beads wurden einige Male in Wasser mit 1 % SDS gewaschen.
Die so erhaltenen Beads wurden bei 95°C für 15 Minuten in Wasser, das
2% SDS enthielt, inkubiert.
-
Beispiel
6 zeigt die Effizienz mit der biotinylierte mRNAs von den streptavidinbeschichteten
Beads gewonnen wurden.
-
Beispiel 6
-
Effizienz
der Gewinnung biotinylierter mRNAs
-
Die
Effizienz des Gewinnungsverfahrens wurde wie folgt beurteilt. Wie
oben beschrieben, wurden RNAs mit Cap mit 32pCp
markiert, oxidiert, biotinyliert und an streptavidinbeschichtete
Beats gebunden. Anschließend
wurden die gebundenen RNAs für
5, 15 oder 30 Minuten bei 95°C
in Gegenwart von 2% SDS inkubiert.
-
Die
Reaktionsprodukte wurden durch Elektrophorese auf 12%igen Polyacylamidgelen
unter denaturierenden Bedingungen (7 M Harnstoff) analysiert. Die
Gele wurden einer Autoradiografie unterzogen. Während dieser Manipulation wurden
die Hydrazonbindungen nicht reduziert.
-
Sobald
die Inkubationszeiten in 2% SDS anstiegen, wurden steigende Mengen
an Nukleinsäuren
gewonnen, was zeigt, dass biotinylierte mRNAs effizient gewonnen
wurden.
-
In
einem alternativen Verfahren zum Erhalten von mRNAs mit intakten
5'-Enden wurde ein
Oligonukleotid, das derivatisiert worden war, um eine reaktive Amingruppen
zu erhalten, spezifisch an mRNAs mit einem intakten Cap gekoppelt.
Vorzugsweise wird das 3'-Ende
der mRNA vor dem Schritt, bei welchem die Aldehydgruppen mit dem
derivatisierten Oligonukleotid verbunden werden, wie oben beschrieben
blockiert, um so zu verhindern, dass das derivatisierte Oligonukleotid
mit dem mRNA 3'-Ende
verbunden wird. Beispielsweise kann pCp unter Verwendung von T4
RNA-Ligasen am mRNA 3'-Ende
angebracht werden, wie in Beispiel 1 beschrieben wird. Wie oben
diskutiert, ist die Blockierung des mRNA 3'-Endes jedoch ein optionaler Schritt. Derivatisierte
Oligonukleotide können
hergestellt werden, wie in Beispiel 7 beschrieben wird.
-
Beispiel 7
-
Derivatisierung von Oligonukleotiden
-
Ein
am 3'-Ende phosphoryliertes
Oligonukleotid wurde durch Behandlung mit einer wässrigen
Lösung eines
Hydrazins oder Dihydrazids mit der Formel H2N(R1)
NH2 bei etwa 1 bis 3 M und bei pH 4,5 bei
einer Temperatur von 8°C über Nacht
in ein 3'-Hydrazid
in 3' umgewandelt.
Die Inkubation wurde in Gegenwart eines wasserlöslichen Mittels vom Carbodiimidtyp
bei einer Endkonzentration von 0,3 M durchgeführt, wie beispielsweise 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid.
-
Das
derivatisierte Oligonukleotid wurde anschließend von den anderen Mitteln
und Produkten unter Verwendung von Standardtechniken zur Isolierung
von Oligonukleotiden abgetrennt.
-
Wie
oben diskutiert, können
die mRNAs, welche angereichert werden sollen, behandelt werden,
um die 3'-OH-Gruppen
zu entfernen, die daran vorliegen können. Dies kann durch enzymatische
Ligation von Sequenzen, denen ein 3'-OH fehlt erreicht werden, wie beispielsweise
pCp wie es in Beispiel 1 beschrieben wird. Alternativ können die
3'-ON-Gruppen durch
alkalische Hydrolyse entfernt werden, wie es in Beispiel 8 unten beschrieben
wird.
-
Beispiel 8
-
Entfernung von 3'-OH-Gruppen der mRNA
unter Verwendung einer alkalischen Hydrolyse
-
In
einem Gesamtvolumen von 100 μl
0,1 N Natriumhydroxid wurden 1,5 μg
mRNA für
40 bis 60 Minuten bei 4°C
inkubiert. Die Lösung
wird mit Essigsäure
neutralisiert und mit Ethanol präzipitiert.
-
Im
Anschluss an die optionale Entfernung der 3'-ON-Gruppen werden die Diolgruppen an
den mRNA 5'-Enden
der mRNAs oxidiert, wie es in Beispiel 9 unten beschrieben wird.
-
Beispiel 9
-
Oxidation
von Diolen der mRNA
-
Bis
zu 1 OD-Einheit RNA wurde in 9 μl
Puffer (0,1 M Natriumacetat, pH 6–7) oder in Wasser und 3 μl frisch
hergestellter 0,1 M Natriumperjodatlösung gelöst. Die Reaktion wurde für 1 h in
der Dunkelheit bei 4°C oder
bei Raumtemperatur inkubiert. Im Anschluss an die Inkubation wurde
die Reaktion durch Zugabe von 4 μl
10% Ethylenglycol gestoppt. Danach wurde das Gemisch für 15 Minuten
bei Raumtemperatur inkubiert. Nach Ethanolpräzipitation wurde das Produkt
in mindestens 10 μl
Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser
dialysiert.
-
Im
Anschluss an die Oxidation der Diolgruppen an den mRNA 5'-Enden wurde das
derivatisierte Oligonukleotid mit den resultierenden Aldehyden verbunden
wie es in Beispiel 10 beschrieben wird.
-
Beispiel 10
-
Ligation von
mRNA-Aldehyden an derivatisierte Oligonukleotide
-
Die
oxidierte mRNA wurde in saurem Medium, wie beispielsweise 50 μl Natriumacetat,
pH 4–6,
gelöst. 50 μl einer Lösung des
derivatisierten Oligonukleotids wurden zugegeben, um ein Verhältnis mRNA:derivatisiertes
Oligonukleotid von 1:20 zu erhalten. Das Gemisch wurde mit einem
Borhydrid reduziert und für
2 h bei 37°C
oder über
Nacht (14 h) bei 10°C
inkubiert. Das Gemisch wurde anschließend mit Ethanol präzipitiert,
in 10 μl
oder mehr Wasser oder einem geeigneten Puffer resuspendiert und
gegen destilliertes Wasser dialysiert. Wenn gewünscht, kann das resultierende
Produkt unter Verwendung von Acrylamidgelelektrophorese, HPLC-Analyse
oder anderen herkömmlichen
Techniken analysiert werden.
-
Im
Anschluss an das Anbringen des derivatisierten Oligonukleotids an
die mRNAs kann eine reverse Transkriptionsreaktion, wie in Beispiel
11 unten beschrieben, durchgeführt
werden.
-
Beispiel 11
-
Reverse Transkription
von mRNAs, die an derivatisierte Oligonukleotide ligiert sind
-
Ein
Oligodeoxyribonukleotid wurde wie im Folgenden beschrieben derivatisiert.
Drei OD-Einheiten eines Oligodeoxyribonukleotids der Sequenz 5'ATCAAGAATTCGCACGAGACCA
TTA3' (SEQ ID NO:
3) mit 5'-OH- und
3'-P-Enden wurden in 70 μl 1,5 M Hydroxybenzotriazollösung, pH
5,3, hergestellt in Dimethylformamid/Wasser (75:25), das 2 μg 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid
enthielt, gelöst.
Das Gemisch wurde für
2 h 30 min bei 22°C
inkubiert und anschließend
zweimal in LiClO4/Aceton präzipitiert.
Das Pellet wurde in 200 μl
0,25 M Hydrazin resuspendiert und bei 8°C 3 bis 14 h inkubiert. Im Anschluss
an die Hydrazinreaktion wurde das Gemisch zweimal in LiClO4/Aceton präzipitiert.
-
Die
revers zu transkribierenden Messenger-mRNAs wurden aus Plazentablöcken mit
Seitenlängen von
2 cm extrahiert, die bei –80°C gelagert
worden waren. Die Gesamt-RNA wurde unter Verwendung herkömmlicher
Techniken auf Grundlage von sauerem Phenol extrahiert. Oligo-dT-Chromatografie
wurde eingesetzt um die mRNAs zu reinigen. Die Integrität der mRNAs
wurde durch Northern-Blot überprüft.
-
Die
Diolgruppen von 7 μg
der Plazenta mRNAs wurden, wie oben in Beispiel 9 beschrieben, oxidiert. Das
derivatisierte Oligonukleotid wurde, wie in Beispiel 10 oben beschrieben,
mit den mRNAs verbunden mit der Ausnahme, dass der Präzipitiationsschritt
durch einen Ausschlusschromatografieschritt ersetzt wurde, um die
derivatisierten Oligodeoxyribonukleotide, die nicht mit mRNAs verbunden
worden waren, zu entfernen. Die Ausschlusschromatografie wurde wie
folgt durchgeführt:
Zehn
ml Ultrogel AcA34 (BioSepra#230151) Gel, ein Gemisch aus Agarose
und Acrylamid, wurde in 50 ml einer Lösung aus 10 mM Tris, pH 8,0,
300 mM NaCl, 1 mM EDTA und 0,05% SDS equilibriert. Man ließ sich das Gemisch
absetzen. Der Überstand
wurde entfernt und das Gel wurde in 50 ml Puffer resuspendiert.
Dieses Verfahren wurde 2 oder 3 Mal wiederholt.
-
Ein
Glaskügelchen
(Durchmesser 3 mm) wurde in eine 2 ml Einwegpipette (Länge 25 cm)
eingeführt. Die
Pipette wurde mit der Gelsuspension befüllt, bis sich die Höhe des Gels
bei 1 cm vom oberen Ende der Pipette aus stabilisierte. Die Säule wurde
anschließend
mit 20 ml des Equilibrierungspuffers (10 mM Tris HCl pH 7,4, 20
mM NaCl) equilibriert.
-
Zehn μl der mRNA,
die mit dem derivatisierten Oligonukleotid umgesetzt worden waren,
wurden in 39 μl
10 mM Harnstoff und 2 μl
Glycerin-Blau Puffer gemischt, wobei der Glycerin-Blau Puffer durch
Auflösen
von 5 mg Bromphenolblau in 60% Glycerin (v/v) und Leiten des Gemischs über einen
Filter mit 0,45 μm
Durchmesser hergestellt worden waren.
-
Anschließend wurde
die Säule
mit den mRNAs beladen, welche mit dem Oligonukleotid gekoppelt waren.
Sobald die Probe eingedrungen war, wurde Equilibrierungspuffer zugegeben.
Anschließend
wurden hundert μl
Fraktionen gesammelt. Derivatisierte Oligonukleotide, die nicht
an mRNA angebracht worden waren, traten in Fraktion 16 und späteren Fraktionen
auf. Die Fraktionen 3 bis 15 wurden deshalb vereinigt und mit Ethanol
präzipitiert.
-
Um
zu bestimmen, ob das derivatisierte Oligonukleotid tatsächlich mit
mRNA verknüpft
war, wurde ein Zehntel der vereinigten Fraktionen zweifach auf einer
Nylonmembran aufgetragen und unter Verwendung herkömmlicher
Techniken mit einer radioaktiven Sonde hybridisiert. Die bei diesen
Hybridisierungen eingesetzte 32P markierte
Sonde war ein Oligodeoxyribonukleotid mit der Sequenz 5'TAATGGTCTCGT GCGAATTCTTGAT3' (SEQ ID NO: 4),
das sich zum derivatisierten Oligonukleotid antikomplementär verhielt. Ein
nach Audioradiografie beobachtetes Signal zeigte, dass das derivatisierte
Oligonukleotid tatsächlich
mit der mRNA verbunden worden war.
-
Die
verbleibenden neun Zehntel der mRNAs, die mit dem derivatisierten
Oligonukleotid reagiert hatten, wurden wie im Folgenden beschrieben,
revers transkribiert. Eine reverse Transkription wurden mit Reverser
Transkriptase nach den Anweisungen des Herstellers und 50 pmol Nonameren
mit willkürlichen
Sequenzen als Primern durchgeführt.
-
Um
sicher zu stellen, dass die reverse Transkription über die
Capstruktur hinweg ausgeführt
wurde, wurden zwei Arten von Experimenten durchgeführt.
-
Im
ersten Ansatz wurde nach der durch alkalische Hydrolyse erreichten
Entfernung der RNA aus den cDNA:RNA-Heteroduplexen, die aus der
reversen Transkriptionsreaktion erhalten worden waren, ein Teil
der resultierenden einzelsträngigen
cDNAs auf einer positiv geladenen Membran aufgetragen und unter
Verwendung herkömmlicher
Verfahren an eine 32P-markierte Sonde mit
identischer Sequenz zu der des derivatisierten Oligonukleotids hybridisiert.
Kontrollspots, die 1 pmol, 100 fmol, 50 fmol, 10 fmol und 1 fmol
eines Kontrolloligodeoxyribonukleotids mit einer Sequenz, die zu
der des derivatisierten Oligonukleotids identisch war, enthielten,
waren ebenfalls umfasst. Die von den cDNA enthaltenden Spots erhaltenen
Signale zeigten, dass etwa 15 fmol des derivatisierten Oligonukleotids
revers transkribiert worden waren. Diese Ergebnisse zeigen, dass die
reverse Transkription über
ein Cap hinweg durch geführt
werden kann und sie zeigen insbesondere, dass Reverse Transkriptase
die 5'-P-P-P-5'-Bindung des Caps
eukaryotischer Messenger-RNAs überquert.
-
In
der zweiten Art von Experiment wurden die einzelsträngigen cDNAs,
die aus der obigen Erststrangsynthese erhalten worden waren, als
Matrize für
PCR-Reaktionen verwendet.
Zwei Reaktionstypen wurden ausgeführt. Als erstes wurde eine
spezifische Amplifikation der mRNAs für Alphaglobin, Dehydrogenase, pp15
und Elongationsfaktor E4 unter Verwendung der folgenden Paare an
Oligodesoxyribonukleotid-Primern durchgeführt. Alphaglobin
Dehydrogenase
pp15
Elongationsfaktor
E4
-
Als
zweites wurden unspezifische Amplifikationen mit den Antisense-Oligodeoxyribonukleotiden
der oben beschriebenen Paare und einem Primer durchgeführt, der
aus der Sequenz des derivatisierten Oligodeoxyribonukleotids (5'-ATCAAGAATTCGCACGAGACCATTA-3' (SEQ ID NO: 13)
abgeleitet worden war.
-
Ein
Zwanzigstel der folgenden RT-PCR-Produktproben wurden auf einem
1,5% Agarosegel aufgetrennt und mit Ethidiumbromid angefärbt.
-
Probe
1: Die Produkte einer PCR-Reaktion unter Verwendung der Globinprimer
gemäß SEQ ID
NO: 5 und 6 in Gegenwart von cDNA.
-
Probe
2: Die Produkte einer PCR-Reaktion unter Verwendung der Globinprimer
gemäß SEQ ID
NO: 5 und 6 in Abwesenheit zugegebener cDNA.
-
Probe
3: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer
gemäß SEQ ID
NO: 7 und 8 in Gegenwart von cDNA.
-
Probe
4: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer
gemäß SEQ ID
NO: 7 und 8 in Abwesenheit zugegebener cDNA.
-
Probe
5: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer gemäß SEQ ID
NO: 9 und 10 in Gegenwart von cDNA.
-
Probe
6: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer gemäß SEQ ID
NO 9 und 10 in Abwesenheit zugegebener cDNA.
-
Probe
7: Die Produkte einer PCR-Reaktion unter Verwendung der EIF4-Primer gemäß SEQ ID
NO: 11 und 12 in Gegenwart von zugegebener cDNA.
-
Probe
8: Die Produkte einer PCR-Reaktion unter Verwendung der EIF4-Primer gemäß SEQ ID
NO: 11 und 12 in Abwesenheit zugegebener cDNA.
-
Eine
Bande mit der für
das PCR-Produkt erwarteten Größe wurde
nur in den Proben 1, 3, 5 und 7 beobachtet und zeigt somit das Vorliegen
der entsprechenden Sequenz in der cDNA-Population an.
-
Es
wurden auch PCR-Reaktionen mit den Antisense-Oligonukleotiden der
Globin- und Dehydrogenase-Primer (SEQ ID NO: 6 und 8) und einem
Oligonukleotid, dessen Sequenz der des derivatisierten Oligonukleotids
entsprach, durchgeführt.
Das Vorliegen von PCR-Produkten mit der erwarteten Größe in den
Proben, die den obigen Proben 1 und 3 entsprachen, zeigte, dass
das derivatisierte Oligonukleotid mit mRNA verknüpft worden war.
-
Die
obigen Beispiele fassen das chemische Verfahren zur Anreicherung
von mRNAs zusammen für solche
mRNAs, die intakte 5'-Enden
aufweisen, wie es in 1 dargestellt ist. Weitere
Einzelheiten, welche die chemischen Ansätze zum Erhalten solcher mRNAs
betreffen, werden in der internationalen Anmeldung Nr. WO 96/34981,
veröffentlicht
7. November 1996, offenbart. Strategien, die auf den oben beschriebenen
chemischen Modifikationen der 5'-Capstruktur
beruhen, können
verwendet werden, um cDNAs zu erzeugen, die darauf hin selektiert
wurden, dass sie die 5'-Enden
der mRNAs, von denen sie abgeleitet wurden, umfassen. In einer Version
derartiger Verfahren werden die mRNA 5'-Enden wie oben beschrieben modifiziert.
Danach wird eine reverse Transkriptionsreaktion durchgeführt, um
einen Primer zu verlängern,
der komplementär
ist zum 5'-Ende
der mRNA. Einzelsträngige
RNAs werden entfernt, um eine Population von cDNA/mRNA-Heteroduplexen
zu erhalten, in denen die mRNA ein intaktes 5'-Ende umfasst. Die resultierenden Heteroduplexe
können
auf einer festen Phase, die mit einem Molekül beschichtet ist, das zur
Wechselwirkung mit dem zur Derivatisierung des 5'-Endes der mRNA verwendeten Moleküls in der
Lage ist, eingefangen werden. Danach werden die Stränge der
Heteroduplexe getrennt, um einzelsträngige Erststrang-cDNAs zu gewinnen,
die das mRNA 5'-Ende
umfassen. Die Zweitstrang-cDNA-Synthese kann anschließend unter
Verwendung herkömmlicher
Techniken fortgeführt
werden. Beispielsweise können
die in WO 96/34981 oder in Carninci et al., Genomics 37:327-336,
1996, offenbarten Verfahren verwendet werden, um cDNAs zu selektieren,
welche die Sequenz umfassen, die vom 5'-Ende der codierenden mRNA Sequenz abgeleitet
ist.
-
Im
Anschluss an die Ligation des Oligonukleotid-Tags an das 5'-Cap der mRNA wird
eine reverse Transkriptionsreaktion ausgeführt, um einen Primer, der zu
der mRNA komplementär
ist, zum 5'-Ende
der mRNA hin zu verlängern.
Im Anschluss an die Entfernung der RNA-Komponente aus dem resultierenden
Heteroduplex unter Verwendung von Standardtechniken, wird die cDNA-Zweitstrangsynthese
mit einem Primer durchgeführt,
der komplementär
zum Oligonukleotid-Tag ist.
-
2. Enzymatische Verfahren
zum Erhalten von mRNAs mit intakten 5'-Enden
-
Andere
Techniken zur Selektion von cDNAs, die über das 5'-Ende der mRNA, von der sie abgeleitet sind,
hinaus erweitert sind, sind vollständig enzymatisch. Einige Versionen
dieser Techniken werden in Dumas Milne Edwards J.B. (Doktorarbeit
der Paris VI Universität, „Le clonage
des ADNc complets: difficultes et perspectives nouvelles. Apports
pour l'etude de
la regulation des l'expression
de la tryptophane hydroxylase de rat„, 20. Dezember 1993),
EP 0,625,572 und Kato et
al., Gene 150:243-250, 1994, offenbart.
-
In
Kürze,
in derartigen Ansätzen
wird isolierte mRNA mit alkalischer Phosphatase behandelt, um die Phosphatgruppen,
die an den 5'-Enden
unvollständiger
mRNAs ohne Cap vorliegen, zu entfernen. Im Anschluss an dieses Verfahren
wird das bei Volllängen-mRNAs
vorliegende Cap mit einem Capentfernendem Enzym, wie beispielsweise
T4-Polynukleotidgenase oder Tabaksäure-Pyrophosphatase enzymatisch
entfernt. Ein Oligonukleotid, das entweder ein DNA-Oligonukleotid
oder DNA-RNA-Hybridoligonukleotid mit RNA an seinem 3'-Ende sein kann,
wird anschließend
unter Verwendung von T4-RNA-Ligase an das Phosphat, das am 5'-Ende der mRNA ohne
Cap vorliegt, ligiert. Das Oligonukleotid kann eine Schnittstelle
umfassen, um das Klonieren der cDNAs im Anschluss an deren Synthese
zu erleichtern. Beispiel 12 unten beschreibt ein enzymatisches Verfahren,
das auf der Doktorarbeit von Dumas basiert.
-
Beispiel 12
-
Enzymatischer Ansatz zum
Erhalten von 5'-ESTs
-
Zwanzig
Mikrogramm von PolyA+-RNA wurden unter Verwendung
von Phosphatase aus Rinderdarm (Calf Intestinal Phosphatase) (Biolabs)
dephosphoryliert. Nach einer Phenolchloroformextraktion wurde die mRNA-Capstruktur unter
Verwendung von Tabaksäure-Pyrophosphatase
(gereinigt wie von Shinshi et al., Biochemstry 15:2185-2190, 1976
beschrieben) hydrolysiert und ein Halb-5'-DNA/RNA-3'-Oligonukleotid mit einem unphosphorylierten
5'-Ende, einem Adenosinribophosphatabschnitt
am 3'-Ende und einer
EcoRI-Stelle nahe dem 5'-Ende
wurde unter Verwendung der T4 RNA-Ligase (Biolabs) an die 5'-P-Enden der mRNA ligiert. Oligonukleotide,
die zur Verwendung in diesem Verfahren geeignet sind, weisen vorzugsweise
eine Länge
von 30 bis 50 Basen auf. Oligonukleotide mit einem unphosphorylierten
5'-Ende können durch
Zugabe eines Fluorochroms an das 5'-Ende synthetisiert werden. Die Einbeziehung
eines Adenosinribophosphatabschnitts am 3'-Ende der Oligonukleotide steigert die
Effizienz der Ligation. Es wird erkannt, dass das Oligonukleotid
außer EcoRI
andere Klonierungsstellen enthalten kann.
-
Im
Anschluss an die Ligation der Oligonukleotide an das Phosphat, das
am 5'-Ende der mRNA
ohne Cap vorliegt, wird die Erst- und Zweitstrang-cDNA-Synthese unter Verwendung
herkömmlicher
Verfahren oder unter Verwendung der Verfahren, die in
EP 0,625,572 und Kato et al., supra,
und Dumas Milne Edwards, supra offenbart sind, ausgeführt. Die
resultierende cDNA kann anschließend in Vektoren ligiert werden,
wie beispielsweise solche Vektoren, die in Kato et al., supra, offenbart
sind oder andere dem Fachmann bekannte Nukleinsäurevektoren, wobei Techniken
verwendet werden, wie sie beispielsweise in Sambrook et al., Molecular
Cloning: A Laboratory Manual 2. Ausgabe, Cold Spring Harbor Laboratory
Press, 1989 beschrieben sind.
-
II. Erhalten und Charakterisieren
der erfindungsgemäßen 5'-ESTs
-
Die
hierin beschriebenen 5'-ESTs
wurden unter Verwendung der vorausgehend genannten chemischen und
enzymatischen Ansätze
zur Anreicherung von mRNAs im Hinblick auf mRNAs mit intakten 5'-Enden erhalten,
wie es unten beschrieben wird.
-
1. Erhalten von 5'-ESTs unter Verwendung
von mRNAs mit intakten 5'-Enden
-
Zuerst
wurden mRNAs hergestellt, wie es in Beispiel 13 unten beschrieben
wird.
-
Beispiel 13
-
Herstellung von mRNA mit
intakten 5'-Enden
-
Humane
Gesamt-RNAs oder PolyA+-RNAs, die aus 29
verschiedenen Geweben abgeleitet waren, wurden von LABIMO bzw. CLONTECH
bezogen und verwendet, um 44 cDNA-Bibliotheken zu erstellen, wie es
im Folgenden beschrieben wird. Die bezogene RNA war entweder aus
Zellen oder Geweben unter Verwendung von saurer Guanidiumthiocyanat-Phenol-Chloroform-Extraktion
isoliert worden (Chomczyniski und Sacchi, Analytical Biochemstry
162:156-159, 1987). Um die ribosomale RNA zu entfernen wurde PolyA+ RNA aus Gesamt-RNA (LABIMO) über zwei
Durchläufe
von Oligo-dT-Chromatografie isoliert, wie es von Aviv und Leder, Proc.
Natl. Acad. Sci. USA 69:1408-1412, 1972 beschrieben wird.
-
Die
Qualität
und Integrität
der PolyA+-RNAs wurde überprüft. Es wurden mit einer Globinsonde
hybridisierte Northern Blots verwendet, um zu bestätigen, dass
die mRNAs nicht degradiert waren. Verunreinigung der PolyA+-mRNAs durch ribosomale Sequenzen wurde
unter Verwendung von Northern Blots und einer Sonde, die aus der
Sequenz von 28S rRNA abgeleitet war, überprüft. mRNA-Präparationen
mit weniger als 5% rRNAs wurden zur Herstellung einer Bibliothek
verwendet. Um die Herstellung von Bibliotheken mit RNAs zu vermeiden,
die mit exogenen Sequenzen verunreinigt waren (prokaryotisch oder
aus einem Pilz), wurde das Vorliegen bakterieller 16S ribosomaler
Sequenzen oder zweier stark exprimierter mRNAs aus Pilz unter Verwendung
von PCR untersucht.
-
Im
Anschluss an die Herstellung der mRNAs wurden die oben beschriebenen
chemischen und/oder die enzymatischen Verfahren zur Anreicherung
solcher mRNAs, die intakte 5'-Enden
aufweisen, verwendet, um 5'-ESTs
aus verschiedenen Geweben zu erhalten. In beiden Ansätzen wurde
ein Oligonukleotid-Tag an die mRNA 5'-Enden angebracht. Der Oligonukleotid-Tag
trug eine EcoRI-Stelle in sich, um spätere Klonierungsverfahren zu
erleichtern. Um die Verarbeitung einzelsträngiger und doppelsträngiger cDNA,
die bei der Erstellung der Bibliotheken erhalten wurde, zu erleichtern,
wurde die gleiche Nukleotidsequenz verwendet, um das ligierte Oligonukleotid
sowohl für
den chemischen als auch den enzymatischen Ansatz zu konzipieren.
Trotzdem war das im chemischen Verfahren verwendete Tag ein Oligodeoxyribonukleotid,
das mit dem Cap der mRNA verknüpft
war, wohingegen in der enzymatischen Ligation das Tag ein chimäres Halb-5'-DNA/RNA3'-Oligonukleotid war,
das an das 5'-Ende
von mRNA ohne Cap ligiert wurde, wie in Beispiel 12 beschrieben
wird.
-
Bevor
die Erststrangsynthese durchgeführt
wurde, wie es in Beispiel 14 beschrieben wird, wurde im Anschluss
an das Anbringen des Oligonukleotid-Tags an die mRNA durch entweder
chemische oder enzymatische Verfahren die Integrität der mRNA
durch Ausführung
eines Northern Blots mit 200 bis 500 ng mRNA untersucht, wobei eine
zum Oligonukleotid-Tag komplementären Sonde verwendet wurde.
-
Beispiel 14
-
cDNA-Synthese unter Verwendung
von mRNA-Matrizen mit intakten 5'-Enden
-
Für die mRNAs,
die unter Verwendung sowohl chemischer als auch enzymatischer Verfahren
mit Oligonukleotid-Tags verknüpft
worden waren, wurde die Erststrang-cDNA-Synthese unter Verwendung
der Reversen Transkriptase Superscript II (Gibco BRL) oder Rnase
H Minus M-MLV (Promega) mit willkürlichen Nonameren als Primern
durchgeführt.
Um die internen EcoRI-Stellen in der cDNA vor Verdau bei späteren Verfahrensschritten
zu schützen,
wurde für
die Erststrangsynthese methyliertes dCTP verwendet. Nach Entfernung
von RNA durch alkalische Hydrolyse wurde die Erststrang-cDNA unter
Verwendung von Isopropanol präzipitiert,
um verbliebene Primer zu entfernen.
-
Sowohl
für die
chemischen als auch die enzymatischen Verfahren wurde der cDNA-Zweitstrang
mit einem Klenow-Fragment unter Verwendung eines Primers entsprechend
dem 5'-Ende des
ligierten Oligonukleotids synthetisiert, wie es in Beispiel 12 beschrieben
wird. Der Primer ist vorzugsweise 20–25 Basen lang. Methyliertes
dCTP wurde auch zur Zweitstrangsynthese verwendet, um während des
Klonierungsverfahrens die internen EcoRI-Stellen in der cDNA vor
Verdau zu schützen.
-
Im
Anschluss an die cDNA-Synthese wurden die cDNAs in pBlueScript-Vektoren kloniert,
wie es in Beispiel 15 unten beschrieben wird.
-
Beispiel 15
-
Klonierung von cDNAs,
die aus mRNA mit intakten 5'-Enden
abgeleitet sind in BlueScript
-
Im
Anschluss an die Zweitstrangsynthese wurden die Enden der cDNA mit
T4 DNA-Polymerase (Biolabs) geglättet
und die cDNA wurde mit EcoRI verdaut. Da während der cDNA-Synthese methyliertes
dCTP verwendet worden war, stellte die im Tag vorliegende EcoRI-Stelle
die einzige halb-methylierte Stelle dar und war demzufolge die einzige
Stelle, die einem EcoRI-Verdau zugänglich war. Die cDNA wurde
anschließend unter
Verwendung von Ausschlusschromatografie (AcA, Biosepra) größenfraktioniert
und die Fraktionen, die cDNAs mit mehr als 150 bp entsprachen, wurden
vereinigt und mit Ethanol präzipitiert.
Die cDNA wurde direkt in die Smal- und EcoRI-Enden des Phagemid
pBlueScript-Vektors (Stratagene) kloniert. Das Ligationsgemisch wurde
in Bakterien elektroporiert und unter geeigneten antibiotischen
Auswahlbedingungen vermehrt.
-
Klone,
die den angefügte
Oligonukleotid-Tag enthielten, wurden selektiert, wie es in Beispiel
16 unten beschrieben wird.
-
Beispiel 16
-
Selektion
von Klonen mit daran angebrachtem Oligonukleotid-Tag
-
Die
wie oben beschrieben hergestellten Plasmid-DNAs enthaltenden 5'-EST-Bibliotheken wurden
gereinigt (Qiagen). Eine positive Selektion der Klone mit Tag wurde
wie folgt durchgeführt.
In Kürze,
in diesem Selektionsverfahren wird die Plasmid-DNA unter Verwendung
der Gen II-Endonuklease des Phagen F1 in Kombination mit einer Exonuklease
(Chang et al., Gene 127:95-8, 1993), wie beispielsweise Exonuklease
III oder T7 Gen 6 Exonuklease, in eine einzelsträngige DNA umgewandelt. Die
resultierende einzelsträngige
DNA wurde anschließend
unter Verwendung paramagnetischer Beads, wie von Fry et al., Biotechniques, 13:124-131,
1992 beschrieben, aufgereinigt. In diesem Verfahren wird die einzelsträngige DNA
mit einem biotinylierten Oligonukleotid, das eine Sequenz entsprechend
dem 3'-Ende des
in Beispiel 13 beschriebenen Oligonukleotids aufweist, hybridisiert.
Der Primer weist vorzugsweise eine Länge von 20–25 Basen auf. Klone, die eine
zum biotinylierten Oligonukleotid komplementäre Sequenz umfassen, wurden
durch Inkubation mit Streptavidin-beschichteten magnetischen Beads
eingefangen, wobei sich daran eine magnetische Selektion anschloss.
Nach dem Einfangen der positiven Klone wurde die Plasmid-DNA von
den magnetischen Beads abgelöst
und unter Verwendung einer DNA-Polymerase, wie beispielsweise der
von Amersham Pharmacia Biotech erhältlichen Thermo- Sequenase in doppelsträngige DNA
umgewandelt. Alternativ können
Protokolle, wie beispielsweise das im Gene Trapper Kit, der von
Gibco BRL bezogen werden kann, beschriebene verwendet werden. Die
doppelsträngige
DNA wurde anschließend
in Bakterien elektroporiert. Unter Verwendung einer Dot-Blot-Analyse
wurde der Prozentanteil positiver Klone mit dem 5'-Tag Oligonukleotid
dahingehend abgeschätzt,
dass er sich normalerweise zwischen 90 und 98% bewegt.
-
Im
Anschluss an die Elektroporation wurden die Bibliotheken in 384-Mikrotiterplatten
(MTP) angeordnet. Für
zukünftige
Bedürfnisse
wurde eine Kopie der MTP eingelagert. Anschließend wurden die Bibliotheken in
96 MTP überführt und
wie unten beschrieben sequenziert.
-
Beispiel 17
-
Sequenzierung
von Inserts in selektierten Klonen
-
Die
Plasmidinserts wurden zuerst durch eine PCR-Reaktion in PE 9600
Thermocyclern (Perkin-Elmer, Applied Biosystems Divison, Foster
City, CA) unter Verwendung von Standard-SETA-A- und SETA-B-Primern (Genset
SA), AmpliTaqGold (Perkin-Elmer), dNTPs (Boehringer), Puffer und
mit Zyklusbedingungen amplifiziert, wie von der Perkin-Elmer Corporation
empfohlen.
-
Anschließend wurden
die PCR-Produkte unter Verwendung automatischer ABI Prism 377 Sequenzierer
(Perkin-Elmer) sequenziert. Die Sequenzierungsreaktionen wurden
unter Verwendung von PE 9600 Thermocyclern mit Standardfarbstoffprimerchemie
und ThermoSequenase (Amersham Pharmacia Biotech) durchgeführt. Die
verwendeten Primer waren wie jeweils geeignet entweder T7 oder 21
M13 (erhältlich
von Genset SA). Die Primer waren mit den JOE-, FAM-, ROX- und TAMRA-Farbstoffen
markiert. Die für
die Sequenzierungsreaktionen verwendeten dNTPs und ddNTPs wurden
von Boehringer bezogen. Sequenzierungspuffer, Reagenzienkonzentrationen
und Zyklusbedingungen waren wie von Amersham empfohlen.
-
Im
Anschluss an die Sequenzierungsreaktion wurden die Proben mit Ethanol
präzipitiert,
in Formamidladepuffer aufgenommen und auf ein standardmäßiges 4%
Acrylamidgel aufgetragen. Die Elektrophorese wurde für 2,5 Stunden
bei 3000 V an einem ABI 377 Sequenzierungsgerät durchgeführt und die Sequenzdaten wurden
gesammelt und unter Verwendung der ABI Prism DNA Sequencing Analysis
Software, Version 2.1.2 analysiert.
-
2. Computeranalyse der
erhaltenen 5'-ESTs:
Erstellung von NetGene und SignalTag Datenbanken
-
Die
Sequenzdaten der 44 wie oben beschrieben hergestellten cDNA-Bibliotheken wurden
auf eine proprietäre
Datenbank übertragen,
wo Schritte zur Qualitätskontrolle
und Validierung durchgeführt
wurden. Ein proprietärer
Base-Caller, der
unter einem Unix-System arbeitet, kennzeichnete automatisch fehlerverdächtige Peakwerte,
wobei die Form der Peaks, die Auflösung zwischen den Peaks und
der Rauschpegel berücksichtigt wurden.
Der proprietäre
Base-Caller führte auch
einen automatischen Abgleich durch. Jeder Abschnitt mit 25 oder
weniger Basen und mehr als 4 fehlerverdächtigen Peakwerten wurde als
unzuverlässig
eingestuft und verworfen. Sequenzen, die dem Klonierungsvektor oder
Ligationsoligonukleotiden entsprachen, wurden automatisch aus den
EST-Sequenzen entfernt.
Die resultierenden EST-Sequenzen können an ihrem 5'-Ende jedoch 1 bis
5 Basen enthalten, die zu den oben erwähnten Sequenzen zählen. Wenn
Bedarf entsteht, können sie
auf Grundlage einer Unterscheidung von Fall zu Fall einfach entfernt
werden.
-
Im
Anschluss an die oben beschriebene Sequenzierung wurden die 5'-EST-Sequenzen in NetGeneTM eingegeben, wobei es sich um eine proprietäre Datenbank
handelt, die wie unten beschrieben zur Speicherung und Manipulierung
aufgerufen wurde. Der Fachmann erkennt, dass die Daten auf einem
beliebigen Medium, das von einem Computer gelesen werden kann und
auf das ein Computer zugreifen kann, gespeichert und manipuliert
werden können.
Computerlesbare Medien umfassen magnetisch, optisch oder elektronisch
lesbare Medien. Beispielsweise kann das computerlesbare Medium sowohl
eine Hard Disc, eine Floppy Disc, ein magnetisches Band, einer CD-ROM,
RAM oder ROM als auch andere dem Fachmann bekannte Medientypen sein.
-
Zusätzlich können die
Daten in einer Vielfalt von Datenverarbeitungsprogrammen in unterschiedlichen Formaten
gespeichert und manipuliert werden. Zum Beispiel können die
Sequenzdaten als Text in einer Wortverarbeitungsdatei, wie beispielsweise
Microsoft WORD oder WORDPERFECT oder als eine ASCII-Datei in einer Vielzahl
von dem Fachmann bekannten Datenbankenprogrammen, wie beispielsweise
DB2, SYBASE oder ORACLE, gespeichert werden.
-
Das
computerlesbare Medium, auf dem die Sequenzinformation gespeichert
ist, kann sich in einem Personal-Computer, einem Netzwerk, einem
Server oder anderen, dem Fachmann bekannten Computersystemen befinden.
Der Computer oder das andere System umfasst vorzugsweise das oben
beschriebene Speichermedium und einen Prozessor für einen
Zugriff auf und die Manipulation der Sequenzdaten. Sobald die Sequenzdaten
gespeichert worden sind, können
sie manipuliert und durchsucht werden, um diejenigen gespeicherten
Sequenzen zu finden, die eine gewünschte Nukleinsäuresequenz
enthalten oder die ein Protein mit einer bestimmten funktionalen
Domäne
codieren. Beispielsweise kann die gespeicherte Sequenzinformation mit
anderen bekannten Sequenzen verglichen werden, um Homologien, Motive,
die eine biologische Funktion implizieren, oder strukturelle Motive
zu identifizieren.
-
Programme,
die verwendet werden können,
um die gespeicherten Sequenzen zu durchsuchen oder zu vergleichen,
umfassen die MacPattern(EMBL), BLAST- und BLAST2-Programmserien
(NCBI), einfache lokale Alignment Suchprogramme für Nukleotid-(BLASTN)
und Peptid-(BLASTX) Vergleiche (Altschule et al., J. Mol. Biol.
215:403, 1990) sowie FASTA (Pearson und Lipman, Proc. Natl. Acad.
Sci. USA 85:2444, 1988). Die BLAST-Programme erweitern anschließend die
Alignments auf Grundlage bestimmter Abgleich- und Fehlabgleichkriterien
(„Match"- und Mismatch"-Kriterien).
-
Motive,
die unter Verwendung der oben und den in Beispiel 28 beschriebenen
Programmen nachgewiesen werden können,
umfassen Sequenzen, welche für
Leucin-Zipper, Helix-Turn-Helix-Motive, Glycosylierungsstellen,
Ubiquitinierungsstellen, Alphahelices und Betafaltblätter codieren,
für Signalpeptide
codierende Signalsequenzen, welche die Sekretion der codierten Proteine
steuern, Sequenzen, die mit der Regulation von Transkription in
Zusammenhang stehen, wie beispielsweise Homeoboxen, saure Abschnitte, enzymatisch
aktive Stellen, Substratbindungsstellen und enzymatische Spaltstellen.
-
Bevor
die cDNAs in der NetGeneTM Datenbank nach
Sequenzmotiven von Interessen durchsucht wurden, wurden von mRNAs
abgeleitete cDNAs, die nicht von Interesse waren, identifiziert
und von weiteren Überlegungen
ausgeschlossen, wie es in Beispiel 18 unten beschrieben wird.
-
Beispiel 18
-
Ausschluss
unerwünschter
Sequenzen von weiteren Überlegungen
-
5'-ESTs in der NetGeneTM-Datenbank, die von unerwünschten
Sequenzen abgeleitet waren, wie beispielsweise Transfer-RNAs, ribosomale
RNAs, mitochondrielle RNAs, prokaryotische RNAs, RNAs aus Pilzen, Alu-Sequenzen,
L1-Sequenzen oder Repeatsequenzen, wurden unter Verwendung der FASTA- und BLASTN-Programme
mit den in Tabelle 1 aufgelisteten Parametern identifiziert.
-
Um
die für
tRNAs codierenden 5'-ESTs
von weiteren Überlegungen
auszuschließen,
wurden die 5'-EST-Sequenzen
mit den Sequenzen von 1190 bekannten tRNAs verglichen, die aus EMBL
Version 38 erhalten wurden, von denen 100 human waren. Der Vergleich
wurde unter Verwendung von FASTA für beide Stränge der 5'-ESTs durchgeführt. Sequenzen mit mehr als
80% Homologie über
mehr als 60 Nukleotide hinweg wurden als tRNAs identifiziert. Von
den 144 341 gesceenten Sequenzen wurden 26 als tRNAs identifiziert und
von weiteren Überlegungen
ausgeschlossen.
-
Um
die für
rRNAs codierenden 5'-ESTs
von weiteren Überlegungen
auszuschließen,
wurden die 5'-EST-Sequenzen
mit den Sequenzen von 2497 bekannten rRNAs, die aus EMBL Version
38 erhalten wurden, verglichen, von denen 73 human waren. Der Vergleich
wurde unter Verwendung von BLASTN für beide Stränge der 5'-ESTs mit dem Parameter S = 108 durchgeführt. Sequenzen
mit mehr als 80% Homologie über Strecken,
die länger
als 40 Nukleotide waren, wurden als rRNAs identifiziert. Von den
144 341 durchmusterten Sequenzen wurden 3 312 als rRNAs identifiziert
und von weiteren Überlegungen
ausgeschlossen.
-
Um
die für
mtRNAs codierenden 5'-ESTs
von weiteren Überlegungen
auszuschließen,
wurden die 5'-EST-Sequenzen
mit den Sequenzen von zwei bekannten mitochondriellen Genomen, für welche
die vollständige
genomische Sequenz zur Verfügung
steht, und allen Sequenzen, die von diesen mitochondriellen Genomen
transkribiert werden, einschließlich
tRNAs, rRNAs und mRNAs, in der Summe 38 Sequenzen, verglichen. Der
Vergleich wurde unter Verwendung von BLASTN für beide Stränge der 5'-ESTs mit dem Parameter S = 108 durchgeführt. Sequenzen
mit mehr als 80% Homologie über
Strecken, die länger
als 40 Nukleotide waren, wurden als mtRNAs identifiziert. Von den
144 341 durchmusterten Sequenzen wurden 6 110 als mtRNAs identifiziert
und von weiteren Überlegungen
ausgeschlossen.
-
Sequenzen,
die von exogenen Kontaminanten herrühren könnten, wurden von weiteren Überlegungen durch
Vergleich der 5'-EST-Sequenzen
mit Version 46 der EMBL-Abteilungen für Bakterien und Pilze unter Verwendung
von BLASTN mit dem Parameter S = 144 entfernt. Alle Sequenzen mit
mehr als 90% Homologie über
mindestens 40 Nukleotide hinweg wurden als exogene Kontaminanten
identifiziert. Von den 42 untersuchten cDNA-Bibliotheken betrug
der durchschnittliche Prozentanteil darin enthaltener prokaryotischer
Sequenzen und darin enthaltener Pilzsequenzen 0,2% bzw. 0,5%. Von
diesen Sequenzen konnte nur eine als pilzspezifische Sequenz identifiziert
werden. Die anderen waren entweder Pilzsequenzen oder prokaryotische Sequenzen
mit Homologien zu Wirbeltiersequenzen oder umfassten Repeatsequenzen,
die während
des elektronischen Vergleichs nicht maskiert worden waren.
-
Zusätzlich wurden
die 5'-ESTs mit
6093 Alu-Sequenzen und 1115 L1-Sequenzen
verglichen, um 5'-ESTs
zu maskieren, die derartige Repeatsequenzen enthielten. 5'-ESTs, die THE- und
MER-Repeats, SSTR-Sequenzen oder Satelliten, Mikrosatelliten oder
telomerische Repeats umfassten, wurden ebenfalls von weiteren Überlegungen
ausgeschlossen. Im Durchschnitt enthielten 11,5% der Sequenzen in
den Bibliotheken Repeatsequenzen. Von diesen 11,5% enthielten 7%
Alu-Repeats, 3,3% enthielten L1-Repeats und die übrigen 1,2% wurden von den
anderen durchmusterten Typen repetitiver Sequenzen abgeleitet. Diese
Prozentangaben stehen in Übereinstimmung
mit denen, welche in cDNA-Bibliotheken
nachgewiesen wurden, welche von anderen Gruppen hergestellt wurden.
Beispielsweise enthielten die cDNA-Bibliotheken von Adams et al.
in Abhängigkeit
von der zur cDNA-Bibliothek-Herstellung verwendeten RNA-Quelle zwischen
0% und 7,4% Alu-Repeats (Adams et al., Nature 377:174, 1996).
-
Die
Sequenzen derjenigen 5'-ESTs,
die nach der Entfernung unerwünschter
Sequenzen zurück
blieben, wurden mit den Sequenzen bekannter humaner mRNAs verglichen,
um die Genauigkeit der oben beschriebenen Sequenzierungsverfahren
festzustellen.
-
Beispiel 19
-
Messen der
Sequenzierungsgenauigkeit durch Vergleich mit bekannten Sequenzen
-
Um
ferner die Genauigkeit des oben beschriebenen Sequenzierungsverfahrens
zu bestimmen, wurden die 5'-EST-Sequenzen,
die von bekannten Sequenzen abgeleitet waren, identifiziert und
mit den ursprünglich
bekannten Sequenzen verglichen. Als Erstes wurde bezüglich der
5'-ESTs eine FASTA-Analyse mit Überhängen, die
kürzer
als 5 bp waren, an beiden Enden durchgeführt, um diejenigen 5'-ESTs zu identifizieren,
die mit einem Eintrag in der öffentlichen
Human mRNA Datenbank übereinstimmen.
Die 6655 5'-ESTs,
die mit einer bekannten humanen mRNA übereinstimmten, wurden anschließend mit
ihrer verwandten mRNA abgeglichen und eine dynamische Programmierung
wurde verwendet, um Substitutionen, Insertionen und Deletionen in
die Liste der zu erkennenden „Fehler" aufzunehmen. Fehler,
die in den letzten 10 Basen der 5'-EST-Sequenzen auftraten, wurden ignoriert,
um eine Einbeziehung von störenden
Klonierungsstellen bei der Analyse der Sequenzierungsgenauigkeit
zu vermeiden.
-
Die
Analyse offenbarte, dass die Sequenzen, die in der NetGeneTM-Datenbank
enthalten waren, eine Fehlerfreiheit von mehr als 99,5% aufwiesen.
-
Um
die Effizienz zu bestimmen, mit der das obige Selektionsverfahren
cDNAs selektiert, welche die 5'-Enden
ihrer entsprechenden mRNAs umfassen, wurde die folgende Analyse
durchgeführt.
-
Beispiel 20
-
Bestimmung der Effizienz
der 5'-EST-Selektion
-
Um
die Effizienz zu bestimmen, mit der die oben beschriebenen Selektionsverfahren
5'-ESTs isolierten,
die Sequenzen nahe am 5'-Ende
der mRNAs umfassten, aus denen sie abgeleitet waren, wurden die
Sequenzender 5'-EST-Enden, die von den
Genen für
die Untereinheit α des
Elongationsfaktors 1 und der schweren Kette von Ferritin abgeleitet
waren, mit denen bekannter cDNA-Sequenzen
dieser Gene verglichen. Da die Transkriptionsstartstellen beider
Gene gut charakterisiert sind, können
sie verwendet werden, um den Prozentanteil abgeleiteter 5'-ESTs zu bestimmen,
welche die authentischen Transkriptionsstartstellen umfassten.
-
Für beide
Gene umfassten tatsächlich
mehr als 95% der erhaltenen 5'-ESTs
Sequenzen, die nahe am oder stromaufwärts des 5'-Endes der entsprechenden mRNAs lagen.
-
Um
die Analyse zur Verlässlichkeit
der Isolierungsverfahren für
5'-ESTs aus ESTs
in der NetGeneTM-Datenbank auszuweiten,
wurde zum Vergleich eine ähnliche
Analyse unter Verwendung einer Datenbank durchgeführt, die
aus humanen mRNA-Sequenzen zusammengestellt worden war, wobei die
humanen mRNA-Sequenzen aus der GenBank-Datenbank Version 97 entnommen
worden waren. Die 5'-Enden
von mehr als 85% der aus mRNAs abgeleiteten 5'-ESTs, die in der GenBank-Datenbank
enthalten waren, waren nahe der 5'-Enden der bekannten Sequenz lokalisiert.
Da einige der mRNA-Sequenzen, die in der GenBank-Datenbank zur Verfügung stehen,
von genomischen Sequenzen abgeleitet sind, wird eine Übereinstimmung
am 5'-Ende mit diesen
Sequenzen als interne Übereinstimmung
gerechnet. Daher unterschätzt
das hier verwendete Verfahren die EST-Ausbeuten für ESTs,
welche die authentischen 5'-Enden
ihrer entsprechende mRNAs umfassen.
-
Die
oben hergestellten EST-Bibliotheken umfassten mehrere 5'-ESTs, die von der
gleichen mRNA abgeleitet waren. Die Sequenzen solcher 5'-ESTs wurden miteinander
verglichen und die längsten
5'-ESTs für jede mRNA
wurden identifiziert. Überlappende
cDNAs wurden zu kontinuierlichen Sequenzen (Contigs) angeordnet.
Die resultierenden kontinuierlichen Sequenzen wurden anschließend mit öffentlichen
Datenbanken verglichen, um ihre Ähnlichkeit
mit bekannten Sequenzen zu beurteilen, wie in Beispiel 21 unten
beschrieben wird.
-
Beispiel 21
-
Clusterbildung der 5'-ESTs und Berechnung
der Neuheitsindices für
cDNA-Bibliotheken
-
Für jede sequenzierte
EST-Bibliothek wurden die Sequenzen über das 5'-Ende in Clustern zusammengefasst. Jede
Sequenz in der Bibliothek wurde über
BLASTN2 (direkter Strang, Parameter S = 107) mit den anderen verglichen.
ESTs mit Segmentpaaren von hohem Ergebniswert (high scoring segment
pairs) (HSPs), die mindestens 25 bp lang waren, 95% identische Basen
aufwiesen und näher
als 10 bp von jedem EST 5'-Ende
begannen, wurden gruppiert. Die längste Sequenz, die im Cluster
nachgewiesen wurde, wurde als Vertreter der Gruppe herangezogen.
Anschließend
wurde eine Gesamtclusterbildung zwischen den Bibliotheken durchgeführt, was
zur Bestimmung von Super-Contigs führte.
-
Um
die Ausbeute an neuen Sequenzen innerhalb der EST-Bibliotheken zu
bestimmen, wurde eine Neuheitsrate (NR) als: NR = 100 × (Zahl
der neuen einmaligen Sequenzen, die in der Bibliothek nachgewiesen werden/Gesamtzahl
der Sequenzen aus der Bibliothek) bestimmt. Normalerweise bewegte
sich die Neuheitsrate in Abhängigkeit
vom Gewebe, aus denen die EST-Bibliothek erhalten wurde, zwischen
10% und 41 %. Für die
meisten Bibliotheken wurde die statistische Sequenzierung von 5'-EST-Bibliotheken
fortgesetzt, bis die Neuheitsrate 20% erreichte.
-
Im
Anschluss an die oben beschriebene Charakterisierung wurde die 5'-EST-Kollektion in NetGeneTM durchmustert, um diejenigen ESTs zu identifizieren,
die potentielle Signalsequenzen trugen, wie es in Beispiel 22 unten
beschrieben wird.
-
Beispiel 22
-
Identifizierung potentieller
Signalsequenzen in 5'-ESTs
-
Die
5'-ESTs in der NetGeneTM-Datenbank wurden gescreent, um diejenigen
5'-ESTs zu identifizieren, die
einen ununterbrochenen offenen Leserahmen (ORF) aufweisen, der länger als
45 Nukleotide ist, mit einem ATG-Codon beginnt und bis zum Ende
des ESTs reicht. Etwa die Hälfte
der cDNA-Sequenzen in NetGeneTM enthielt
einen derartigen ORF. Die ORFs dieser 5'-ESTs wurden anschließend unter
Verwendung leicht abgeänderter
von Von Heijne offenbarter Verfahren (Nucleic Acids Res. 14:4683-4690,
1986) durchsucht, um mögliche
Signalmotive zu identifizieren. Für diejenigen 5'-EST-Sequenzen, die
einen mindestens 15 Aminosäuren langen
Abschnitt mit einem Ergebnis von mindestens 3,5 in der Von Heijne
Signalpeptid-Identifizierungsmatrix codierten, wurden in Betracht
gezogen, ein Signalpeptid zu enthalten. Solche 5'-ESTs, die mit einer bekannten humanen
mRNA oder einer EST-Sequenz übereinstimmten
und ein 5'-Ende
mit mehr als 20 Nukleotiden stromabwärts des bekannten 5'-Endes aufwiesen,
wurden von der weiteren Analyse ausgeschlossen. Die verbleibenden
cDNAs, die eine Signalsequenz enthielten, wurden in eine Datenbank,
die als SignalTagTM bezeichnet wird, aufgenommen.
-
Um
die Fehlerfreiheit des obigen Verfahrens zur Identifizierung von
Signalsequenzen zu bestätigen, wurde
die Analyse aus Beispiel 23 durchgeführt.
-
Beispiel 23
-
Bestätigung der Genauigkeit zur
Identifizierung möglicher
Signalsequenzen in 5'-ESTs
-
Die
Genauigkeit des obigen Verfahrens zur Identifizierung von Signalsequenzen,
die Signalpeptide codieren, wurde durch Anwenden des Verfahrens
auf 43 Aminosäuren,
die am N-Terminus aller humanen SwissProt-Proteine lokalisiert sind,
beurteilt. Der computerberechnete Von Heijnes-Score für jedes
Protein wurde mit der bekannten Eigenschaft des Proteins, ein sekretiertes
oder nicht sekretiertes Protein zu sein, verglichen. Auf diese Weise
konnte die Zahl der nicht sekretierten Proteine mit einem Ergebnis
höher als
3,5 (falsch-positiv) und die Zahl der sekretierten Proteine mit
einem Ergebnis niedriger als 3,5 (falsch-negativ) berechnet werden.
-
Unter
Verwendung der Ergebnisse aus der obigen Analyse wurde die Wahrscheinlichkeit
berechnet, dass ein Peptid, das durch die 5'-Region der mRNA codiert wird, wirklich
ein echtes Signalpeptid ist auf Grundlage seines Von Heijnes-Scores,
wobei Annahme als Grundlage diente, dass entweder 10% der humanen
Proteine sekretiert werden oder dass 20% der humanen Proteine sekretiert
werden. Die Ergebnisse dieser Analyse sind in 2 und
in Tabelle IV gezeigt.
-
Unter
Verwendung des obigen Verfahrens zur Identifizierung von sekretorischen
Proteinen wurden 5'-ESTs
der nachfolgenden Polypeptide, für
die bekannt ist, dass sie sekretiert werden, erhalten: humanes Glukagon,
Gamma-Interferon
induzierter Monokin-Vorläufer,
sekretiertes Cyclophilin-ähnliches
Protein, humanes Pleiotropin und humaner Biotinidase-Vorläufer. Somit
identifizierte das obige Verfahren erfolgreich diejenigen 5'-ESTs, die ein Signalpeptid
codieren.
-
Um
zu bestätigen,
dass das Signalpeptid, das durch die 5'-ESTs codiert wird, tatsächlich als
Signalpeptid wirkt, können
die Signalsequenzen aus den 5'-ESTs
in einen Vektor kloniert werden, der zur Identifizierung von Signalpeptiden
konzipiert ist. Solche Vektoren sind so konzipiert, dass sie die
Fähigkeit
in Selektionsmedium zu wachsen, ausschließlich solchen Wirtszellen verleihen,
welche einen Vektor mit einer operativen verknüpften Signalsequenz enthalten.
Um zu bestätigen,
dass ein 5'-EST
für ein
wirkliches Signalpeptid codiert, kann die Signalsequenz des 5'-ESTs beispielsweise
stromaufwärts
und im Leserahmen mit einer nicht sekretorischen Form des Hefe-Invertasegens
in Vektoren zur Signalpeptidselektion insertiert werden, wie denjenigen
Vektoren, die in US-Patent Nr. 5,536,637 beschrieben sind. Das Wachstum
von Wirtszellen, die Vektoren zur Signalsequenzselektion mit der
korrekt insertierten 5'-EST-Signalsequenz
enthalten, bestätigt,
dass das 5'-EST
für ein
echtes Signalpeptid codiert.
-
Alternativ
kann das Vorliegen eines Signalpeptid durch Klonierung der erweiterten
cDNA, die unter Verwendung der ESTs erhalten wurden, in Expressionsvektoren,
wie beispielsweise pXT1 (wie in Beispiel 30 unten beschrieben) bestätigt werden
oder durch Konstruktion von Promotor-Signalsequenz-Reportergen-Vektoren,
die Fusionsproteine zwischen dem Signalpeptid und einem Assay-fähigen Reportergen
codieren. Nach Einführung
dieser Vektoren in eine geeignete Wirtszelle, wie beispielsweise
COS-Zellen oder NIH 3T3-Zellen, kann das Wachstumsmedium geerntet
werden und im Hinblick auf das Vorliegen des sekretierten Proteins analysiert
werden. Das Medium aus diesen Zellen wird mit dem Medium aus Kontrollzellen
verglichen, die Vektoren ohne die Signalsequenz oder das erweiterte
cDNA-Insert enthalten, um Vektoren zu identifizieren, die für ein funktionales
Signalpeptid oder ein authentisches sekretiertes Protein codieren.
-
Diejenigen
5'-ESTs, die für ein Signalpeptid
codieren, wie durch das Verfahren gemäß Beispiel 22 oben bestimmt,
wurden ferner auf Grundlage ihrer Homologie zu bekannten Sequenzen
in vier Kategorien eingruppiert, wie in Beispiel 24 unten beschrieben
wird.
-
Beispiel 24
-
Kategorisierung 5'-ESTs, welche für ein Signalpeptid
codieren
-
Diejenigen
5'-ESTs mit einer
Sequenz, die weder mit einer beliebigen bekannten Vertebratensequenz noch
mit einer beliebigen, öffentlich
zugänglichen
EST-Sequenz übereinstimmten,
wurden als „neu" bezeichnet. Unter
den Sequenzen in der SignalTagTM-Datenbank
fielen 947 der 5'-ESTs
mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
-
Diejenigen
Diejenigen 5'-ESTs,
die eine Sequenz aufwiesen, die mit keiner Vertebratensequenz übereinstimmten,
aber mit einem öffentlich
bekannten EST übereinstimmten,
wurden als „EST-ext" bezeichnet, vorausgesetzt,
dass die bekannte EST-Sequenz mindestens um 40 Nukleotide in 5'-Richtung erweitert
war. Unter den Sequenzen in der SignalTagTM-Datenbank
fielen 150 der 5'-ESTs
mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
-
Diejenigen
ESTs, die mit keiner Vertebratensequenz übereinstimmten, jedoch mit
einem öffentlich
bekannten EST übereinstimmten,
wobei das bekannte EST nicht mindestens 40 Nukleotide in 5'-Richtung erweitert
war, wurden als „EST" bezeichnet. Unter
den Sequenzen in der SignalTagTM-Datenbank
fielen 599 der 5'-ESTs
mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
-
Diejenigen
5'-ESTs, die mit
einer humanen mRNA-Sequenz übereinstimmten,
aber die bekannte Sequenz um mindestens 40 Nukleotide in 5'-Richtung erweiterten,
wurden als „VERT-ext" bezeichnet. Unter
den Sequenzen in der SignalTagTM-Datenbank
fielen 23 der 5'-ESTs
mit einem Von Heijne-Score von mindestens 3,5 in diese Kategorie.
Von dieser Kategorie war ein 5'-EST
umfasst, das die bekannte Sequenzen der humanen Translokase-mRNA
um mehr als 200 Basen in 5'-Richtung
erweiterte. Es wurde auch ein 5'-EST
identifiziert, das die Sequenz eines humanen Tumorsuppressor-Gens
in 5'-Richtung erweiterte.
-
Tabelle
V zeigt die Verteilung von 5'-ESTs
in jeder Kategorie und die Zahl an 5'-ESTs in jeder Kategorie mit einem bestimmten
minimalen von Heijne-Score.
-
3. Bewertung räumlicher
und zeitlicher Expression von mRNAs, die den 5'-ESTs oder den erweiterten cDNAs entsprachen
-
Jeder
der 5'-ESTs wurde
auf Grundlage des Gewebes, aus welchem die entsprechende mRNA erhalten
worden war, auch kategorisiert, wie es in Beispiel 25 unten beschrieben
wird.
-
Beispiel 25
-
Kategorisierung von Expressionsmustern
-
Tabelle
VI zeigt die Verteilung von 5'-ESTs
in jeder der oben definierten Kategorien im Hinblick auf das Gewebe,
aus dem die 5'-ESTs
der entsprechenden mRNA erhalten wurden.
-
Tabelle
II stellt die Sequenzidentifizierungsnummer von 5'-EST-Sequenzen bereit,
die Kategorien, unter welche diese Sequenzen fallen, und den von
Heijne-Score des
Signalpeptids, das für
sie codiert. Die 5'-EST-Sequenz
und die Aminosäuresequenzen,
für welche
sie codieren, sind im angefügten
Sequenzprotokoll bereitgestellt. Tabelle III stellt die Sequenz-ID-Nummern
des 5'-ESTs und die
Sequenz der Signalpeptide bereit, für welche sie codieren. Die
Sequenzen der 5'-ESTs
und der Polypeptide, für
welche sie codieren, werden im hieran angefügten Sequenzprotokoll bereitgestellt.
-
Die
DNA-Sequenz SEQ ID NO: 38-291 kann auf einfache Weise nach beliebigen
darin enthaltenen Fehlern gescreent werden und jede Zweideutigkeit
bezüglich
der Sequenz kann durch Resequenzierung beider Stränge eines
Fragments, das solche Fehler oder Zweideutigkeiten enthält, aufgelöst werden.
Solche Fragmente können
aus den Plasmiden, die im Labor der Erfinder gelagert sind, erhalten
werden oder können unter
Verwendung der hierin beschriebenen Techniken isoliert werden. Die
Auflösung
jeglicher derartiger Zweideutigkeiten oder Fehler kann durch Verwendung
von Primern erleichtert werden, die mit Sequenzen hybridisieren,
die nahe der zweideutigen oder fehlerhaften Sequenzen lokalisiert
sind. Beispielsweise können
die Primer an Sequenzen innerhalb von 50–75 Basen im Bereich der Zweideutigkeit
oder des Fehlers hybridisieren. Nach Auflösung eines Fehlers oder einer
Zweideutigkeit können
in den Proteinsequenzen, die durch die DNA codiert werden, die den
Fehler oder die Zweideutigkeit enthält, entsprechende Korrekturen
vorgenommen werden.
-
Zusätzlich zur
Kategorisierung der 5'-ESTs
können
im Hinblick auf ihr Ursprungsgewebe sowohl die räumlichen und zeitlichen Expressionsmuster
der mRNAs, die den 5'-ESTs
entsprechen, als auch ihre Expressionsmengen, bestimmt werden, wie
es in Beispiel 26 unten beschrieben wird. Die Charakterisierung
der räumlichen
und zeitlichen Expressionsmuster und Expressionsmengen dieser mRNAs
ist bei der Konzeption von Expressionsvektoren nützlich, die in räumlich oder
zeitabhängig
gewünschter
Weise zur Herstellung einer gewünschten
Menge eines Genprodukts in der Lage sind, und wird unten ausführlicher
diskutiert.
-
Darüber hinaus
können
auch 5'-ESTs identifiziert
werden, deren entsprechende mRNAs mit Erkrankungszuständen verbunden
sind. Beispielsweise kann eine bestimmte Krankheit aus einem Expressionsmangel, Überexpression
oder Unterexpression einer mRNA, die einem 5'-EST entspricht, herrühren. Durch
Vergleich der mRNA-Expressionsmuster und -mengen in Proben, die
von gesunden Individuen entnommen wurden, mit Proben von Individuen,
die unter einer bestimmten Krankheit leiden, können für diese Krankheit verantwortliche
5'-ESTs identifiziert
werden.
-
Es
wird erkannt, dass die Ergebnisse der obigen Charakterisierungsverfahren
für 5'-ESTs auch auf erweiterte
cDNAs (die wie unten beschrieben erhalten werden können) angewendet
werden können,
die Sequenzen enthalten, die zu den 5'-ESTs benachbart sind. Es wird auch
erkannt, dass anstelle einer Charakterisierung der ESTs selbst die
Charakterisierung aufgeschoben werden kann, bis erweiterte cDNAs
erhalten worden sind.
-
Beispiel 26
-
Bewertung von Expressionsmengen
und -mustern von mRNAs, die 5'-ESTs
oder erweiterten cDNAs entsprechen
-
Expressionsmengen
und -muster von mRNAs, die 5'-ESTs
oder erweiterten cDNAs (die wie unten in Beispiel 27 beschrieben
erhältlich
sind) entsprechen, können
durch Lösungshybridisierung
mit langen Sonden analysiert werden, wie es in der internationalen
Patentanmeldung Nr. WO 97/05277 beschrieben wird. In Kürze, ein
5'-EST, eine erweiterte
cDNA oder ein Fragment davon welche dem Gen entsprechen, das für die zu charakterisierende
mRNA codiert, wird in eine Klonierungsstelle unmittelbar stromabwärts von
einem Bakteriophagen (T3, T7 oder SP6) RNA-Polymerasepromotor insertiert,
um Antisense-RNA zu erzeugen. Vorzugsweise weist das 5'-EST oder die erweiterte
cDNA 100 oder mehr Nukleotide auf. Das Plasmid wird linearisiert und
in Gegenwart von Ribonukleotiden transkribiert, die modifizierte
Ribonukleotide (d.h. Biotin-UTP und DIG-UTP) umfassen. Ein Überschuss
dieser doppelt markierten RNA wird in Lösung mit mRNA hybridisiert, die
aus Zellen oder Gewebe von Interesse isoliert wurde. Die Hybridisierungen
wurden unter stringenten Standardbedingungen durchgeführt (40–50°C für 16 Stunden
in 80% Formamid, 0,4 M NaCl-Puffer, pH 7–8). Die nicht hybridisierte
Sonde wird durch Verdau mit Ribonukleasen, die für einzelsträngige RNA spezifisch sind (d.h.
RNasen CL3, TI, Phy M, U2 oder A), entfernt. Das Vorliegen der Biotin-UTP-Modifikation
ermöglicht
das Einfangen des Hybrids auf einer mit Streptavidin beschichteten
Mikrotitrationsplatte. Das Vorliegen der DIG-Modifikation ermöglicht es,
das Hybrid zu detektieren und unter Verwendung eines anti-DIG-Antikörpers, der
mit alkalischer Phosphatase gekoppelt ist, mittels ELISA zu quantifizieren.
-
Die
5'-ESTs, erweiterten
cDNAs oder Fragmente davon können
für eine
serielle Analyse der Genexpression (SAGE) auch mit Nukleotidsequenz-Tags
versehen werden, wie es in der UK-Patentanmeldung No. 2 305 241
A beschrieben wird. In diesem Verfahren werden cDNAs aus einer Zelle,
aus Gewebe, aus einem Organismus oder einer anderen Nukleinsäurequelle,
für welche
die Genexpressionsmuster bestimmt werden müssen, hergestellt. Die resultierenden
cDNAs werden in zwei Pools aufgeteilt. In jedem Pool werden die
cDNAs mit einer ersten Restriktionsendonuklease gespalten, die als
Anchoring-Enzym
bezeichnet wird und die eine Erkennungsstelle aufweist, für die es
wahrscheinlich ist, dass sie in den meisten cDNAs mindestens einmal
vorkommt. Die Fragmente, die den 5'- oder 3'-Hauptabschnitt der gespaltenen cDNA
enthalten, werden durch Binden an ein Einfangmedium, wie beispielsweise
Streptavidinbeschichtete Beads, isoliert. Ein erster Oligonukleotidlinker
mit einer ersten Sequenz zur Hybridisierung an einen Amplifizierungsprimer
und einer internen Restriktionsstelle für eine so genannte Tagging-Endonuklease
wird an die verdauten cDNAs im ersten Pool ligiert. Ein Verdau mit
der zweiten Endonuklease erzeugt kurze Tagfragmente aus den cDNAs.
-
Ein
zweites Oligonukleotid mit einer zweiten Sequenz zur Hybridisierung
eines Amplifikationsprimers und einer internen Restriktionsstelle
wird mit den verdauten cDNAs im zweiten Pool ligiert. Die cDNA-Fragmente
im zweiten Pool werden auch mit der Tagging-Endonuklease verdaut,
um kurze Tag-Fragmente zu erzeugen, die von den cDNAs im zweiten
Pool abgeleitet sind. Die Tags, die sich aus dem Verdau des ersten und
zweiten Pools mit dem Anchoring-Enzym und der Tagging-Endonuklease
ergeben, werden miteinander ligiert, um so genannte Ditags zu bilden.
In einigen Ausführungsformen
werden die Ditags hinter einander angeordnet (concatamerisiert),
um Ligationsprodukte zu erzeugen, die 2 bis 200 Ditags enthalten.
Anschließend werden
die Tag-Sequenzen bestimmt und mit den Sequenzen der 5'-ESTs oder erweiterten
cDNAs verglichen, um zu bestimmen, welche 5'-ESTs oder erweiterten cDNAs in der
Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle,
von denen die Tags abgeleitet waren, exprimiert werden. Auf diese
Weise wird das Expressionsmuster der 5'-ESTs oder erweiterten cDNAs in der
Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle
erhalten.
-
Eine
quantitative Analyse der Genexpression kann auch unter Verwendung
von Arrays durchgeführt werden.
Wie hierin verwendet, bezeichnet der Ausdruck Array eine eindimensionale,
zweidimensionale oder multidimensionale Anordnung von Volllängen-cDNAs
(z.B. erweiterte cDNAs, welche die codierende Sequenz für das Signalpeptid,
die codierende Sequenz für
das reife Protein und ein Stopcodon umfassen), erweiterten cDNAs,
5'-ESTs oder Fragmenten
davon, die eine ausreichende Länge
aufweisen, um eine spezifische Detektion der Genexpression zu ermöglichen.
Vorzugsweise sind die Fragmente mindestens 15 Nukleotide lang. Mehr
bevorzugt sind die Fragmente mindestens 100 Nukleotide lang, mehr
bevorzugt sind die Fragmente mehr als 100 Nukleotide lang. In einigen
Ausführungsformen
können
die Fragmente mehr als 500 Nukleotide lang sein.
-
Eine
quantitative Analyse der Genexpression kann beispielsweise wie unten
beschrieben mit Volllängen-cDNAs,
erweiterten cDNAs, 5'-ESTs
oder Fragmenten davon in einem Komplementär-DNA-Mikroarray durchgeführt werden,
wie er von Schena et al. (Science 270:467-470, 1995; Proc. Natl.
Acad. Sci. U.S.A. 93:10614-10619, 1996) beschrieben wird. Volllängen-cDNAs,
erweiterte cDNAs, 5'-ESTs
oder Fragmente davon werden durch PCR amplifiziert und aus 96 Well-Mikrotiterplatten
auf silylierte Mikroskopdeckgläser
unter Verwendung von Hochgeschwindigkeitsrobotertechnik angeordnet.
Gedruckte Arrays werden in einer Feuchtigkeitskammer inkubiert,
um eine Rehydrierung der Arrayelemente zu ermöglichen, und einmal in 0,2%
SDS für
1 min, zweimal in Wasser für
1 min und einmal für
5 min in Natriumborhydridlösung
gespült.
Die Arrays werden in Wasser für
2 min bei 95°C
eingetaucht, für
1 min in 0,2% SDS überführt, zweimal
mit Wasser gespült, luftgetrocknet
und in der Dunkelheit bei 25 C gelagert.
-
Zell-
oder Gewebe-mRNA wird isoliert oder kommerziell bezogen und Sonden
werden durch eine einzelne Runde reverser Transkription hergestellt.
Die Sonden werden auf 1 cm2 Mikroarrays
unter einem 14 × 14
Deckglas aus Glas für 6–12 Stunden
bei 60°C
hybridisiert. Die Arrays werden für 5 min bei 25°C in Waschpuffer
mit schwacher Stringenz (1 × SSC/0,2%
SDS) und anschließend
für 10
min bei Raumtemperatur in Waschpuffer mit hoher Stringenz (0,1 × SSC/0,2%
SDS) gewaschen. Die Arrays werden in 0,1 × SSC unter Verwendung einer
Fluoreszenzlaser-Scanningvorrichtung, die mit einem maßgeschneiderten
Filterset ausgestattet ist, gescannt. Durch Bilden des Durchschnitts
für die
Verhältnisse
von zwei unabhängigen
Hybridisierungen werden genaue differentielle Expressionsmessungen
erhalten.
-
Eine
quantitative Analyse der Expression von Genen kann auch mit Volllängen-cDNAs,
erweiterten cDNAs, 5'-ESTs
oder Fragmenten davon in Komplementär-DNA-Arrays durchgeführt werden,
wie es von Pietu et al. (Genome Research 6:492-503, 1996) beschrieben
wird. Die Volllängen-cDNAs,
erweiterten cDNAs, 5'-ESTs
oder Fragmente davon werden durch PCR amplifiziert und auf Membranen
punktförmig
aufgetragen. Anschließend
werden mRNAs, die aus verschiedenen Geweben oder Zellen stammen,
mit radioaktiven Nukleotiden markiert. Nach der Hybridisierung und
Waschen unter kontrollierten Bedingungen werden die hybridisierten
mRNAs durch Phospho-Imaging oder Autoradiographie detektiert. Die
Experimente werden zweifach ausgeführt und anschließend wird
eine quantitative Analyse differentiell exprimierter mRNAs durchgeführt.
-
Alternativ
kann die Expressionsanalyse der 5'-ESTs oder erweiterten cDNAs über Nukleotidarrays
mit hoher Dichte durchgeführt
werden, wie es von Lockhart et al. (Nature Biotechnology 14: 1675-1680,
1996) und Sosnowsky et al. (Proc. Natl. Acad. Sci. 94:1119-1123,
1997) beschrieben wird. Oligonukleotide mit 15–50 Nukleotiden, die den Sequenzen
der 5'-ESTs oder
erweiterten cDNAs entsprechen, werden direkt auf dem Chip synthetisiert
(Lockhard et al., supra) oder synthetisiert und anschließend an
den Chip adressiert (Sosnowsky et al., supra). Vorzugsweise sind
die Oligonukleotide etwa 20 Nukleotide lang.
-
Die
cDNA-Sonden, die mit einer geeigneten Verbindung, wie beispielsweise
Biotin, Digoxigenin oder einem fluoreszierenden Farbstoff markiert
sind, werden aus der geeigneten mRNA-Population synthetisiert und
anschließend
auf Zufallsbasis zu einer Durchschnittsgröße von 50–100 Nukleotiden fragmentiert.
Die Sonden werden anschließend
auf dem Chip hybridisiert. Nach Waschen, wie es in Lockhard et al.,
supra, beschrieben wird, und Anlegen verschiedener elektrischer
Felder (Sonowsky et al., supra) werden die Farbstoffe oder markierten
Verbindungen detektiert und quantifiziert. Die Hybridisierungen
werden zweifach durchgeführt.
Eine vergleichende Analyse der Signalintensitäten, die von cDNA-Sonden auf demselben
Zieloligonukleotid in verschiedenen cDNA-Proben stammen, zeigt eine
differentielle Expression der mRNA, die dem 5'-EST oder der erweiterten cDNA entspricht,
woraus die Oligonukleotidsequenz konzipiert wurde.
-
III. Verwendung von 5'-ESTs zur Klonierung
erweiterter cDNAs sowie zur Klonierung entsprechender genomischer
DNAs
-
Nachdem
die 5'-ESTs, die
das 5'-Ende der
entsprechenden mRNAs enthalten, unter Verwendung der oben beschriebenen
Verfahren selektiert wurden, können
sie verwendet werden, um erweiterte cDNAs zu isolieren, die Sequenzen
enthalten, die zu den 5'-ESTs
benachbart sind. Die erweiterten cDNAs können die vollständige codierende
Sequenz des Proteins enthalten, das durch die entsprechende mRNA
codiert wird, einschließlich
der authentischen Translationsstartstelle, der Signalsequenz und
der Sequenz, die für
das reife Protein codiert, das zurückbleibt, nachdem das Signalpeptid
abgespalten wurde. Solche erweiterten cDNAs werden hierin als „Volllängen-cDNAs" bezeichnet. Alternativ
können
die erweiterten cDNAs nur die Sequenz enthalten, die für das reife
Protein codiert, das zurückbleibt,
nachdem das Signalpeptid abgespalten wurde, oder nur die Sequenz,
die für
das Signalpeptid codiert.
-
Beispiel
27 unten beschreibt ein allgemeines Verfahren zum Erhalten erweiterter
cDNAs unter Verwendung von 5'-ESTs.
Beispiel 28 unten stellt unter Verwendung des in Beispiel 27 beschriebenen
Verfahrens experimentelle Ergebnisse zur Verfügung, die einige erweiterte
cDNAs beschreiben, einschließlich
der vollständigen
codierenden Sequenz und des authentischen 5'-Endes der entsprechenden mRNA für einige
sekretierte Proteine.
-
Die
Verfahren gemäß der Beispiele
27, 28 und 29 können
auch verwendet werden, um erweiterte cDNAs zu erhalten, die für weniger
als die vollständige
codierende Sequenz der sekretierten Proteine codieren, die durch
die Gene, die den 5'-ESTs
entsprechen, codiert werden. In einigen Ausführungsformen codieren die gemäß diesem
Verfahren isolierten cDNAs für
mindestens 10 Aminosäuren
des Proteins, das durch die Sequenz gemäß SEQ ID NO: 38-291 codiert
wird. In weiteren Ausführungsformen
codieren die erweiterten cDNAs für
mindestens 20 Aminosäuren
des Proteins, das durch die Sequenz gemäß SEQ ID NO: 38-291 codiert wird.
In weiteren Ausführungsformen
codieren die erweiterten cDNAs für
mindestens 30 Aminosäuren
der Sequenz gemäß SEQ ID
NO: 38-291. In einer bevorzugten Ausführungsform codieren die erweiterten
cDNAs für eine
Volllängen-Proteinsequenz,
welche die Protein codierende Sequenz gemäß SEQ ID NO: 38-291 umfasst.
-
Beispiel 27
-
Allgemeines Verfahren
zur Verwendung von 5'-ESTs
zur Klonierung und Sequenzierung von cDNAs, welche die vollständige codierende
Region und das authentische 5'-Ende
der entsprechenden mRNA umfassen
-
Das
folgende allgemeine Verfahren wurde verwendet, um erweiterte cDNAs
schnell und effizient zu isolieren, die sowohl die authentischen
5'-Enden ihrer entsprechenden
mRNAs als auch die vollständige
proteincodierende Sequenz aufweisen und die Sequenz umfassen, die
neben den Sequenzen der 5'-ESTs
liegt, welche zu deren Erhaltung die verwendet wurden. Dieses Verfahren
kann auf erweiterte cDNAs für
ein beliebiges 5'-EST
in der NetGeneTM-Datenbank angewandt werden,
einschließlich
solcher 5'-ESTs,
die für
Polypeptide codieren, die zu sekretierten Proteinen gehören. Dieses
Verfahren ist in 3 zusammengefasst.
-
I. Erhalten erweiterter
cDNAs
-
a) Erststrangsynthese
-
Dieses
Verfahren zieht seinen Vorteil aus der bekannten 5'-Sequenz der mRNA.
Eine reverse Transkriptionsreaktion wird mit gereinigter mRNA mit
einem Poly 14dT-Primer durchgeführt,
der eine 49 Nukleotidsequenz an seinem 5'-Ende enthält, wobei die Reaktion die
Addition einer bekannten Sequenz an das Ende der cDNA ermöglicht,
die dem 3'-Ende
der mRNA entspricht. Beispielsweise kann der Primer die folgende
Sequenz aufweisen: 5'-ATC
GTT GAG ACT CGT ACC AGC AGA GTC ACG AGA GAG ACT ACA CGG TAC TGG TTT
TTT TTT TTT TTVN-3' (SEQ
ID NO: 14). Der Fachmann erkennt, dass auch andere Sequenzen an
die Poly dT-Sequenz addiert und verwendet werden können, um
die Erststrangsynthese zu starten. Unter Verwendung dieses Primers
und einer Reversen Transkriptase, wie beispielsweise dem Enzym Superscript
II(Gibco BRL) oder Rnase H Minus M-MLV (Promega), wird ein reverses
Transkript erzeugt, das an der 3'-PolyA-Stelle der
RNAs verankert ist.
-
Nach
Entfernung der an den cDNA-Erststrang hybridisierten mRNA durch
alkalische Hydrolyse werden die Produkte der alkalischen Hydrolyse
und der verbleibende Poly dT-Primer durch eine Ausschluss-Säule, wie
beispielsweise einer AcA34 (Biosepra)-Matrix, entfernt, wie es in
Beispiel 11 erläutert
wird.
-
b) Zweitstrangsynthese
-
An
jedem Ende wird auf Grundlage der bekannten 5'-Sequenz des 5'-ESTs und des bekannten 3'-Endes, das durch
den während
der Erststrangsynthese verwendeten Poly dT-Primer hinzugefügt wurde,
ein Paar von Nested-Primern (verschachtelten Primern) konzipiert.
Softwareprogramme, die zur Konzeption von Primern verwendet werden,
basieren entweder auf dem GC-Gehalt und den Schmelztemperaturen
von Oligonukleotiden, wie beispielsweise OSP (Illier und Green,
PCR Meth. Appl. 1:124-128, 1991), oder beruhen auf dem Oktamerhäufigkeits-Disparitätsverfahren
(„octamer
frequency disparity method")
(Griffais et al., Nucleic Acids Res. 19:3887-3891, 1991), wie beispielsweise
PC-Rare (http://bioinformatics.weizmann.ac.il/software/PC-Rare/doc/manuel.html).
-
Vorzugsweise
sind die Nested-Primer am 5'-Ende
durch vier bis neun Basen voneinander getrennt. Die 5'-Primersequenzen
können
im Hinblick darauf ausgewählt
werden, dass sie Schmelztemperaturen und Spezifitäten aufweisen,
die zur Verwendung in PCR-Reaktionen geeignet sind.
-
Vorzugsweise
sind die Nested-Primer am 3'-Ende
durch vier bis neun Basen voneinander getrennt. Beispielsweise können die
Nested-3'-Primer
die folgenden Sequenzen aufweisen: (5'-CCA GCA GAG TCA CGA GAG AGA CTA CAC
GG-3' (SEQ ID NO:
15) und 5'-CAC GAG
AGA GAC TAC ACG GTA CTG G-3' (SEQ ID NO:
16). Diese Primer wurden ausgewählt,
da sie Schmelztemperaturen und Spezifitäten aufweisen, die mit ihrer
Verwendung in PCR-Reaktionen kompatibel sind. Der Fachmann erkennt
jedoch, dass auch andere Sequenzen als Primer verwendet werden können.
-
Der
erste PCR-Lauf mit 25 Zyklen wird unter Verwendung des Advantage
Tth Polymerase Mix (Clontech) und dem äußeren Primer von jedem der
Nested-Paare durchgeführt. Anschließend wird
eine zweite PCR-Reaktion mit 20 Zyklen unter Verwendung desselben
Enzyms und dem inneren Primer von jedem der Nested-Paare mit 1/2500
des ersten PCR-Produkts durchgeführt.
Danach werden die Primer und die Nukleotide entfernt.
-
2. Sequenzierung
von erweiterten cDNAs mit voller Länge oder Fragmenten davon
-
Aufgrund
des Fehlens von Positionsbeschränkungen
bei der Konzeption der zur PCR-Verwendung geeigneten 5'-Nested-Primer werden
unter Verwendung der OSP-Software zwei Typen von Amplicons erhalten.
Vorzugsweise ist der zweite 5'-Primer
stromaufwärts
vom Translationsinitationscodon lokalisiert und ergibt so ein Nested-PCR-Produkt,
das die vollständige
codierende Sequenz enthält.
Eine derartige erweiterte cDNA mit voller Länge wird direkt einem Klonierungsverfahren
unterzogen, wie es in Abschnitt a beschreiben ist. In einigen Fällen ist
der zweite 5'-Primer
jedoch stromabwärts
vom Translationsinitationscodon lokalisiert und führt so zu
einem PCR-Produkt, das nur einen Teil des ORF enthält. Derartige
unvollständige
PCR-Produkte werden einem modifiziertem Verfahren, das in Abschnitt
b beschrieben wird, unterzogen.
-
a) Nested PCR-Produkte,
die vollständige
ORFs enthalten
-
Wenn
das resultierende Nested PCR-Produkt die vollständige codierende Sequenz enthält, wie
es aus der 5'-EST-Sequenz
vorhergesagt ist, wird es, wie es in Abschnitt 3 beschrieben wird,
in einen geeigneten Vektor kloniert, wie beispielsweise pED6depc2.
-
b) Nested PCR-Produkte,
die unvollständige
ORFs enthalten
-
Wenn
das Amplicon nicht die vollständige
codierende Sequenz enthält,
sind Zwischenschritte notwendig, um sowohl die vollständige codierende
Sequenz als auch ein PCR-Produkt, das die vollständige codierende Sequenz enthält, zu erhalten.
Die vollständige
codierende Sequenz kann aus mehreren Teilsequenzen zusammengesetzt
werden, die aus verschiedenen PCR-Produkten direkt bestimmt werden,
wie es im folgenden Abschnitt beschrieben wird.
-
Nachdem
die vollständige
codierende Sequenz vollständig
bestimmt worden ist, werden neue Primer, die zur PCR-Verwendung
kompatibel sind, konzipiert, um Amplicons zu erhalten, welche die
vollständige
codierende Region umfassen. In solchen Fällen sind jedoch zur PCR-Verwendung
kompatible 3'-Primer
innerhalb der 3'UTR
der entsprechenden mRNA lokalisiert und führen so zu Amplicons, denen
ein Teil dieser Region fehlt, d.h. der PolyA-Teil und manchmal das
Polyadenylierungssignal, wie es in 3 dargestellt
ist. Solche erweiterten cDNAs mit voller Länge werden wie in Abschnitt
3 beschrieben anschließend
in einen geeigneten Vektor kloniert.
-
c) Sequenzierung erweiterter
cDNAs
-
Die
Sequenzierung erweiterter cDNAs wird unter Verwendung eines Matritzen-Terminator-Ansatzes („Die Terminator
approach") mit dem
AmpliTaq-DNA-Polymerase
FS Kit, der von Perkin Elmer erhältlich
ist, durchgeführt.
-
Um
die PCR-Fragmente zu sequenzieren wird Primer-Walking durchgeführt, wobei
zur Auswahl der Primer Software, wie beispielsweise OSP und automatisierte
Computersoftware wie etwa ASMG (Sutton et al., Genome Science Technol.,
1:9-19, 1995) verwendet wird, um Contigs der Walking-Sequenzen zu
konstruieren, wobei einschließlich
des 5'-Tags am Start
minimale Überlappungen
von 32 Nukleotiden verwendet werden. Vorzugsweise wird das Primer-Walking
solange durchgeführt,
bis die Sequenzen der Volllängen-cDNAs erhalten
werden.
-
Der
Abschluss der Sequenzierung eines bestimmten erweiterten cDNA-Fragments wird wie
folgt festgestellt. Da die Sequenzen, die nach dem PolyA-Teil lokalisiert
sind, im Falle nicht klonierter Produkte nur schwer genau zu bestimmen
sind, werden Verfahren zur Sequenzierung und zum Primer-Walking
für PCR- Produkte unterbrochen,
wenn ein PolyA-Teil in erweiterten cDNAs identifiziert wird, wobei
die cDNAs erhalten wurden, wie es in Fall b beschrieben wird. Die
Sequenzlänge
wird mit der Größe des Nested
PCR-Produkts verglichen, das wie oben beschrieben erhalten wurde.
Aufgrund der beschränkten
Genauigkeit der Bestimmung der PCR-Produktgröße durch Gelelektrophorese
wird eine Sequenz dann als vollständig angesehen, wenn die Größe der erhaltenen
Sequenz mindestens 70% der Größe des ersten
Nested PCR-Produkts beträgt.
Wenn die Länge
der durch Computeranalyse bestimmten Sequenz nicht mindestens 70%
der Länge des
Nested PCR-Produkts beträgt,
werden diese PCR-Produkte kloniert und die Sequenz der Insertion
wird bestimmt. Wenn Northern Blot-Daten zur Verfügung stehen, wird die Größe der mRNA,
die für
ein bestimmtes PCR-Produkt
detektiert wurde, verwendet, um abschließend zu bewerten, ob die Sequenz
vollständig
ist. Sequenzen, welche die obigen Kriterien nicht erfüllen, werden
verworfen und einem neuen Isolierungsverfahren unterzogen.
-
Die
Sequenzdaten aller erweiterten cDNAs werden anschließend auf
eine proprietäre
Datenbank überführt, wo
Schritte zur Qualitätskontrolle
und Validierung durchgeführt
werden, wie es in Beispiel 15 beschrieben wird.
-
3. Klonierung
von erweiterten cDNAs mit voller Länge
-
Das
die vollständige
codierende Sequenz enthaltende PCR-Produkt wird anschließend in
einen geeigneten Vektor kloniert. Beispielsweise können die
erweiterten cDNAs in den Expressionsvektor pED6dpc2 (DiscoverEase,
Genetics Institute, Cambridge, MA) wie folgt kloniert werden. Die
pED6dpc2-Vektor-DNA wird durch Durchführen eines EcoRI-Verdaus, woran
sich eine Auffüllreaktion
anschließt
mit glatten Enden bereitgestellt. Der Vektor mit glatten Enden wird
dephosphoryliert. Nach Entfernung der PCR-Primer und Ethanolpräzipitation
wird das PCR-Produkt, das die vollständige codierende Sequenz oder
die erweiterte cDNA wie oben beschrieben enthält, mit einer Kinase phosphoryliert,
die anschließend
durch Phenol-Sevag-Extraktion und Präzipitiation entfernt wird.
Die doppelsträngige
erweiterte cDNA wird anschließend
in den Vektor ligiert und das resultierende Expressionsplasmid wird
in geeignete Wirtszellen eingeführt.
-
Da
die wie oben beschrieben erhaltenen PCR-Produkte Moleküle mit glatten
Enden sind, die in beiden Richtungen kloniert werden können, wird
für jedes
PCR-Produkt die
Orientierung mehrerer Klone bestimmt. Anschließend werden 4 bis 10 Klone
in Mikrotiterplatten angeordnet und einer PCR-Reaktion unterzogen,
wobei ein erster Primer verwendet wird, der nahe der Klonierungsstelle
im Vektor lokalisiert ist, und ein zweiter Primer verwendet wird,
der in dem Abschnitt der erweiterten cDNA lokalisiert ist, der dem
3'-Ende der mRNA entspricht.
Dieser zweite Primer kann im Fall von direkter Klonierung (Fall
a) der Antisense-Primer sein, der in der Anchored-PCR-Reaktion verwendet
wurde, oder im Fall indirekter Klonierung (Fall b) der Antisense-Primer,
der innerhalb der 3'UTR
lokalisiert ist. Klone, in welchen das Startcodon der erweiterten
cDNA operativ mit dem Promotor im Vektor verknüpft sind, um so die Expression
des durch die erweiterte cDNA codierten Proteins zu ermöglichen,
werden aufbewahrt und sequenziert. Zusätzlich zu den Enden der cDNA-Inserts
werden auch etwa 50 bp Vektor-DNA auf jeder Seite des cDNA-Inserts
sequenziert.
-
Die
klonierten PCR-Produkte werden anschließend gemäß dem zuvor beschriebenen Verfahren
vollständig
sequenziert. In diesem Fall wird anschließend eine Anordnung langer
Fragmente zu Contigs („Contigation") hinsichtlich von
Walking-Sequenzen durchgeführt,
die bereits für
nicht klonierte PCR-Produkte während
des Primerwanderns contigiert worden waren. Die Sequenzierung der
klonierten Amplicons ist abgeschlossen, wenn die resultierenden
Contigs sowohl die vollständige
codierende Region als auch überlappende Sequenzen
mit Vektor-DNA an beiden Enden umfassen.
-
4. Computeranalyse
von erweiterter cDNA mit voller Länge
-
Sequenzen
von erweiterten cDNAs mit voller Länge werden, wie unten beschrieben,
einer weiteren Analyse unterzogen. Bevor die erweiterten cDNAs mit
voller Länge
nach Sequenzen von Interesse durchsucht werden, werden erweiterte
cDNAs, die nicht von Interesse sind (Vektor-RNAs, Transfer-RNAs,
ribosomale RNAs, mitochondrielle RNAs, prokaryotische RNAs und RNAs
aus Pilzen), unter Verwendung von Verfahren, die im Wesentlichen ähnlich zu
denen sind, die für
5'-ESTs in Beispiel
18 beschrieben wurden, verworfen.
-
a) Identifizierung struktureller
Merkmale
-
Strukturelle
Merkmale, z.B. PolyA-Schwanz und Polyadenylierungssignal, der Sequenzen
der erweiterten cDNAs mit voller Länge werden anschließend wie
folgt bestimmt.
-
Ein
PolyA-Schwanz ist als homopolymerer Abschnitt von mindestens 11
A mit höchstens
einer alternativen Base darin definiert. Die Suche nach einem PolyA-Schwanz
ist auf die letzten 100 Nukleotide der Sequenz begrenzt und auf
Abschnitte mit 11 aufeinander folgenden A beschränkt, da Sequenzierungsreaktionen nach
einem solchen PolyA-Abschnitt oft nicht lesbar sind. Abschnitte
mit mehr als 90% Homologie über
8 Nukleotide hinweg werden unter Verwendung von BLAST2N als PolyA-Schwänze identifiziert.
-
Um
nach einem Polyadenylierungssignal zu suchen, wird der PolyA-Schwanz von der Volllängensequenz
abgetrennt. Die 50 bp, die dem PolyA-Schwanz vorausgehen, werden als erstes
nach dem kanonischen Polyadenylierungssignal AAUAAA durchsucht und
wenn das kanonische Signal nicht detektiert wird, werden sie nach
dem alternativen AUUAAA-Signal durchsucht (Sheets et al., Nuc. Acids
Res. 18:5799-5805, 1990). Wenn keines dieser beiden Konsensus-Polyadenylierungssignale
nachgewiesen wird, wird das kanonische Motiv erneut durchsucht,
wobei eine Nichtübereinstimmung
zugelassen wird, um möglichen
Sequenzierungsfehlern Rechnung zu tragen. Mehr als 85% der identifizierten
Polyadenylierungssignale beider Typen enden tatsächlich 10 bis 30 bp vom PolyA-Schwanz
entfernt. Die alternativen AUUAAA-Signale stellen etwa 15% der Gesamtzahl
der identifizierten Polyadenylierungssignale dar.
-
b) Identifizierung funktioneller
Merkmale
-
Funktionelle
Merkmale, z.B. ORFs und Signalsequenzen, der Sequenzen der erweiterten
cDNAs mit voller Länge
wurden anschließend
wie folgt bestimmt.
-
Die
3 Leserahmen im oberen Strang erweiterter cDNAs werden nach ORFs
durchsucht, die als die Fragmente mit maximaler Länge definiert
sind, die mit einem Translationsinitatinoscodon beginnen und mit
einem Stopcodon enden. ORFs, die mindestens 20 Aminosäuren codieren,
sind bevorzugt.
-
Jeder
nachgewiesene ORF wird anschließend
auf das Vorliegen eines Signalpeptids in den ersten 50 Aminosäuren oder
wo angebracht ist in kürzeren
Regionen bis hin zu 20 Aminosäuren
oder weniger im ORF unter Verwendung des Matrixverfahrens nach von
Heijne (Nuc. Acids Res. 14:4683-4690, 1986) durchsucht, wie es in
Beispiel 22 beschrieben wird.
-
c) Homologie entweder
zu Nukleotid- oder Proteinsequenzen
-
Eine
Kategorisierung von Volllängen-Sequenzen
kann unter Verwendung von Verfahren, die im Wesentlichen zu denjenigen ähnlich sind,
die in Beispiel 24 für
5'-ESTs beschrieben
wurden, erreicht werden.
-
Erweiterte
cDNAs, die wie oben beschrieben hergestellt wurden, können anschließend bearbeitet
werden, um Nukleinsäuren
zu erhalten, die gewünschte
Abschnitte der erweiterten cDNA umfassen, wobei herkömmliche
Techniken, wie beispielsweise Subklonierung, PCR oder in vitro-Oligonukleotidsynthese
verwendet werden. Beispielsweise können Nukleinsäuren, die
nur die vollständig
codierenden Sequenzen umfassen (d.h. die Sequenzen, die für das Signalpeptid
und das reife Protein codieren, das zurückbleibt, nachdem das Signalpeptid
abgespalten worden ist), unter Verwendung von dem Fachmann bekannten
Techniken erhalten werden. Alternativ können herkömmliche Techniken verwendet
werden, um Nukleinsäuren
zu erhalten, die nur die codierenden Sequenzen für das reife Protein enthalten,
das zurückbleibt,
wenn das Signalpeptid abgespalten wurde, oder um Nukleinsäuren zu
erhalten, die nur die codierenden Sequenzen für die Signalpeptide enthalten.
-
In
gleicher Weise können
Nukleinsäuren,
die einen anderen beliebigen Abschnitt der für das sekretierte Protein codierenden
Sequenzen enthalten, erhalten werden. Beispielsweise kann die Nukleinsäure mindestens
10 aufeinander folgende Basen einer erweiterten cDNA enthalten,
wie beispielsweise eine der hierin unten beschriebenen erweiterten
cDNAs. In einer anderen Ausführungsform
kann die Nukleinsäure
mindestens 15 aufeinander folgende Basen einer erweiterten cDNA,
enthalten, wie beispielsweise einer der unten beschriebenen erweiterten
cDNAs. Alternativ kann die Nukleinsäure mindestens 20 aufeinander
folgende Basen einer erweiterten cDNA enthalten, wie beispielsweise
einer der unten beschriebenen erweiterten cDNAs. In einer anderen
Ausführungsform
kann die Nukleinsäure
mindestens 25 aufeinander folgende Basen einer erweiterten cDNA
enthalten, wie beispielsweise einer der unten beschriebenen erweiterten
cDNAs. In noch einer anderen Ausführungsform kann die Nukleinsäure mindestens
40 aufeinander folgende Basen einer erweiterten cDNA enthalten,
wie beispielsweise einer der unten beschriebenen erweiterten cDNAs.
-
Nachdem
eine erweiterte cDNA erhalten wurde, kann sie sequenziert werden,
um die Aminosäuresequenz
zu bestimmen, für
die sie codiert. Nachdem die codierte Aminosäuresequenz einmal bestimmt
worden ist, kann jede der vielen denkbaren cDNAs, die für das Protein
codieren, durch einfache Anwendung der Degeneration des genetischen
Codes erzeugt und identifiziert werden. Beispielsweise können allelische
Varianten und andere homologe Nukleinsäuren, wie unten beschrieben,
identifiziert werden. Alternativ können die Nukleinsäuren, welche
die gewünschte
Aminosäuresequenz
codieren, in vitro synthetisiert werden.
-
In
einer bevorzugten Ausführungsform
kann die codierende Sequenz unter Verwendung der bekannten Codon-
und Codonpaar-Präferenzen
des Wirtsorganismus, in dem die cDNA exprimiert werden soll, ausgewählt werden.
-
Die
aus den erfindungsgemäßen 5'-ESTs abgeleiteten
erweiterten cDNAs wurden wie in Beispiel 28 unten beschrieben erhalten.
-
Beispiel 28
-
Charakterisierung von
klonierten erweiterten cDNAs, die unter Verwendung von 5'-ESTs erhalten wurden
-
Das
oben in Beispiel 27 beschriebene Verfahren wurden verwendet, um
die erweiterten cDNAs, die von den hierin beschriebenen 5'-ESTs für eine Vielfalt
von Geweben abgeleitet wurden, zu erhalten. Die folgende Liste stellt
einige Beispiele der so erhaltenen erweiterten cDNAs zusammen.
-
Unter
Verwendung dieses Ansatzes wurde die Volllängen-cDNA gemäß SEQ ID
NO: 17 erhalten (interne Identifizierungsnummer 48-19-3-G1-FL1).
Diese cDNA fällt
in die oben beschriebene „EST-ext" Kategorie und codiert
das Signalpeptid MKKVLLLITAILAVAVG (SEQ ID NO: 18) mit einem von
Heijne-Score von 8.2.
-
Die
Volllängen-cDNA
gemäß SEQ ID
NO: 19 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten
(interne Identifizierungsnummer 58-34-2-E7-FL2). Diese cDNA fällt in die
oben beschriebene „EST-ext" Kategorie und codiert
das Signalpeptid MWWFQQGLSFLPSALVIWTSA (SEQ ID NO: 20) mit einem von
Heijne-Score von 5.5.
-
Eine
andere unter Verwendung des oben beschriebenen Verfahrens erhaltene
Volllängen-cDNA
weist die Sequenz gemäß SEQ ID
NO: 21 auf (interne Identifizierungsnummer 51-27-1-E8-FL1). Diese
cDNA fällt
in die oben beschriebene „EST-ext" Kategorie und codiert
das Signalpeptid MVLTTLPSANSANSPVNMPTTGPNSLSYASSALSPCLT (SEQ ID
NO: 22) mit einem von Heijne-Score von 5.9.
-
Das
obige Verfahren wurde ebenfalls verwendet, um eine Volllängen-cDNA
mit der Sequenz gemäß SEQ ID
NO: 23 zu erhalten (interne Identifizierungsnummer 76-4-1-G5-FL1).
Diese cDNA fällt
in die oben beschriebene „EST-ext" Kategorie und codiert
das Signalpeptid ILSTVTALTFAXA (SEQ ID NO: 24) mit einem von Heijne-Score
von 5.5.
-
Die
Volllängen-cDNA
gemäß SEQ ID
NO: 25 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten
(interne Identifizierungsnummer 51-3-3-B10-FL3). Diese cDNA fällt in die
oben beschriebene Kategorie „neu" und codiert ein
Signalpeptid LVLTLCTLPLAVA (SEQ ID NO: 26) mit einem von Heijne-Score
von 10.1.
-
Die
Volllängen-cDNA
gemäß SEQ ID
NO: 27 wurde ebenfalls unter Verwendung dieses Verfahrens erhalten
(interne Identifizierungsnummer 58-35-2-F10-FL2). Diese cDNA fällt in die
oben beschriebene Kategorie „neu" und codiert ein
Signalpeptid LWLLFFLVTAIHA (SEQ ID NO: 28) mit einem von Heijne-Score
von 10.7.
-
Bakterienklone,
die Plasmide enthalten, welche die oben beschriebenen Volllängen-cDNAs
enthalten, werden gegenwärtig
in den Laboren des Erfinders unter den oben bereitgestellten internen
Identifizierungsnummern gelagert. Die Inserts können aus den gelagerten Materialien
durch Anzucht eines Aliquots des entsprechenden Bakterienklons im
geeigneten Medium gewonnen werden. Anschließend kann die Plasmid-DNA unter
Verwendung von dem Fachmann bekannten Verfahren zur Plasmidisolierung,
wie beispielsweise alkalische Lyse von Minipreps oder alkalische
Lyse im Großmaßstab als
Verfahren zur Plasmidisolierung, isoliert werden. Wenn gewünscht, kann
die Plasmid-DNA ferner mittels Zentrifugation auf einem Cäsiumchloridgradienten,
Größenausschlusschromatografie
oder Anionenaustauschchromatografie weiter angereichert werden. Die
unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter
Verwendung von dem Fachmann bekannten Standardklonierungstechniken
manipuliert werden. Alternativ kann eine PCR mit Primern, die hinsichtlich
beider Enden der cDNA-Insertion konzipiert sind, durchgeführt werden.
Das der cDNA entsprechende PCR-Produkt kann anschließend unter
Verwendung von dem Fachmann vertrauten Standardklonierungstechniken
manipuliert werden.
-
Die
durch die erweiterten cDNAs codierten Polypeptide können auf
das Vorliegen bekannter struktureller oder funktioneller Motive
oder auf das Vorliegen von Signaturen, kleiner Aminosäuresequenzen,
die unter den Mitgliedern einer Proteinfamilie konserviert sind,
durchsucht werden. Die konservierten Regionen sind verwendet worden,
um Konsensusmuster oder Matrizen abzuleiten, die in der PROSITE-Datenbank
erfasst sind, insbesondere die Datei Prosite.dat (Version 13.0 vom
November 1995, die sich unter http://expasy.hcuge.ch/sprot/prosite.html
befindet). Die Programme Prosite_convert und Prosite_scan (http://ulrec3.unil.ch/ftpserveur/prosite_scan)
können
verwendet werden, um Signaturen auf erweiterten cDNAs zu finden.
-
Für jedes
Muster, das mit dem Prosite_convert-Programm aus der Prosite.dat-Datei
erhalten wurde, kann die Genauigkeit der Detektion einer neuen Proteinsequenz
durch Bewertung der Häufigkeit
irrelevanter Treffer im Hinblick auf die Population humaner sekretierter
Proteine, die von der SWISSPROT-Datenbank
umfasst sind, beurteilt werden. Das Verhältnis zwischen der Trefferzahl
im Hinblick auf verschobene bzw. durcheinander gemischte Proteine
(mit einer Fenstergröße von 20
Aminosäuren)
und der Trefferzahl Hinblick auf native (nicht verschobene bzw.
durcheinander gemischte) Proteine kann als Index verwendet werden.
Jedes Muster, für
das das Verhältnis
größer als
20% ist (ein Treffer in Bezug auf verschobene Proteine gegenüber 5 Treffern
in Bezug auf native Proteine) kann während der Suche mit Prosite_scan übergangen
werden. Das Programm, das verwendet wurde, um Proteinsequenzen zu
verschieben (db_shuffled) und das Programm, das verwendet wurde,
um Statistiken für
jedes Muster in den Proteindatenbanken zu bestimmen (Prosite_statistics),
stehen auf der ftp-Seite httpa/ulrec3.unil.ch/ftpserveur/prosite_scan
zur Verfügung.
-
Zusätzlich zu
den auf PCR basierenden Verfahren zum Erhalten erweiterter cDNAs
können
auch traditionelle Verfahren auf Grundlage von Hybridisierung verwendet
werden. Diese Verfahren können
auch verwendet werden, um genomische DNAs zu erhalten, die für mRNAs
codieren, von denen die 5'-ESTs
abgeleitet sind, mRNAs, die den erweiterten cDNAs entsprechen oder
Nukleinsäuren,
die zu den erweiterten cDNAs oder 5'-ESTs homolog sind. Beispiel 29 stellt
unten Beispiele für
solche Verfahren bereit.
-
Beispiel 29
-
Verfahren zum Erhalten
von cDNAs, welche die vollständige
codierende Region und das authentische 5'-Ende der entsprechenden mRNA umfassen
-
Eine
Volllängen-cDNA-Bibliothek
kann unter Verwendung der Strategien, die in den Beispielen 13,14,15
und 16 oben beschrieben sind, durch Austausch des in Beispiel 14
verwendeten willkürlichen
Nonamers mit einem Oligo-dT-Primer hergestellt werden. Beispielsweise
kann das Oligonukleotid gemäß SEQ ID NO:
14 verwendet werden.
-
Alternativ
kann eine cDNA-Bibliothek oder genomische DNA-Bibliothek von einer
kommerziellen Bezugsquelle bezogen oder durch Verwendung von dem
Fachmann bekannten Techniken hergestellt werden. Solche cDNA- oder
genomische DNA-Bibliotheken können
wie folgt verwendet werden, um erweiterte cDNAs zu isolieren, die
aus einem 5'-EST
oder von zu den erweiterten cDNAs oder 5'-ESTs homologen Nukleinsäuren erhalten
wurden. Die cDNA-Bibliothek oder genomische DNA-Bibliothek wird
mit einer detektierbaren Sonde hybridisiert, die mindestens 10 aufeinander
folgende Nukleotide des 5'-ESTs
oder der erweiterten cDNA umfasst, wobei herkömmliche Techniken verwendet
werden. Vorzugsweise umfasst die Probe mindestens 12, 15 oder 17
aufeinander folgende Nukleotide des 5'-ESTs oder der erweiterten cDNA. Mehr
bevorzugt umfasst die Probe mindestens 20 bis 30 aufeinander folgende
Nukleotide des 5'-ESTs
oder der erweiterten cDNA. In einigen Ausführungsformen umfasst die Sonde
mehr als 30 Nukleotide des 5'-ESTs
oder der erweiterten cDNA.
-
Techniken
zur Identifizierung von cDNA-Klonen in einer cDNA-Bibliothek, die
mit einer bestimmten Sondensequenz hybridisieren, sind in Sambrook
et al., Molecular Cloning: A Laboratory Manual 2. Ausgabe, Cold
Spring Harbor Laboratory Press, 1989, offenbart. Die gleichen Techniken
können
verwendet werden, um genomische DNAs zu isolieren.
-
In
Kürze,
cDNA- oder genomische DNA-Klone, die an die detektierbare Sonde
hybridisieren, werden identifiziert und zur weiteren Manipulierung
wie folgt isoliert. Eine Sonde, die mindestens 10 aufeinander folgende
Nukleotide des 5'-ESTs
oder der erweiterten cDNA umfasst, wird mit einer detektierbaren
Markierung, wie beispielsweise einem Radioisotop oder einem Fluoreszenzmolekül, markiert.
Die Probe umfasst vorzugsweise mindestens 12, 15 oder 17 aufeinander
folgende Nukleotide aus dem 5'-EST
oder der erweiterten cDNA. Mehr bevorzugt umfasst die Sonde 20 bis
30 aufeinander folgende Nukleotide aus dem 5'-EST oder der erweiterten cDNA. In einigen
Ausführungsformen
umfasst die Probe mehr als 30 Nukleotide aus dem 5'-EST oder der erweiterten
cDNA.
-
Techniken
zur Markierung der Sonde sind allgemein bekannt und umfassen Phosphorylierung
mit Polynukleotidkinase, Nick-Translation, in vitro-Transkription
und nicht radioaktive Techniken. Die cDNAs oder genomischen DNAs
in der Bibliothek werden auf Nitrocellulose- oder Nylonfilter überführt und
denaturiert. Nach Blockierung unspezifischer Stellen wird der Filter
mit der markierten Sonde für
eine ausreichende Zeitspanne inkubiert, um das Binden der Sonde
an cDNAs oder genomische DNAs, die eine Sequenz enthalten, die daran hybridisieren
kann zu ermöglichen.
-
Durch
Verändern
der Stringenz der Hybridisierungsbedingungen, die verwendet werden,
um erweiterte cDNAs oder genomische DNAs, die an die detektierbare
Sonde hybridisieren, zu identifizieren, können erweiterte cDNAs mit unterschiedlichen
Graden von Homologie gegenüber
der Sonde identifiziert und isoliert werden, wobei dies unten beschrieben
wird.
-
1. Identifizierung
erweiterter cDNA- oder genomischer cDNA-Sequenzen mit einem hohen
Maß an
Homologie zur markierten Sonde
-
Um
die erweiterten cDNAs oder genomischen DNAs mit einem hohen Grad
an Homologie zur Sondensequenz zu identifizieren, kann die Schmelztemperatur
der Sonde unter Verwendung der folgenden Formel berechnet werden:
Für Sonden
mit einer Länge
zwischen 14 und 70 Nukleotiden wird die Schmelztemperatur (Tm) unter
Verwendung der Gleichung Tm = 81,5 + 16,6(log [Na+])
+ 0,41 (Fraktion G + C) – (600/N)
berechnet, wobei N die Länge
der Sonde ist.
-
Wenn
die Hybridisierung in einer Formamid-haltigen Lösung durchgeführt wird,
kann die Schmelztemperatur unter Verwendung der Gleichung Tm = 81,5
+ 16,6(log[Na+]) + 0,41 (Fraktion G + C) – (0,63%
Formamid) – (600/N)
berechnet werden, wobei N die Länge
der Sonde ist.
-
Eine
Vorhybridisierung kann in 6 × SSC,
5 × Denhardt-Reagenz,
0,5% SDS, 100 μg
denaturierter fragmentierter Lachssperma-DNA oder 6 × SSC, 5 × Denhardt-Reagenz,
0,5% SDS, 100 μg
denaturierter fragmentierter Lachssperma-DNA, 50% Formamid durchgeführt werden.
Die Rezepte für
SSC und Denhardt-Lösungen sind
in Sambrook et al., supra, aufgeführt.
-
Die
Hybridisierung wird durch Zugabe der detektierbaren Sonde zu den
oben aufgeführten
Vorhybridisierungslösungen
durchgeführt.
Wenn die Sonde eine doppelsträngige
DNA umfasst, wird sie vor der Zugabe zur Hybridisierungslösung denaturiert.
Der Filter wird mit der Hybridisierungslösung für eine ausreichend lange Zeitspanne
in Kontakt gebracht, um es der Sonde zu ermöglichen, an erweiterte cDNAs
oder genomische DNAs, die zur Sonde komplementäre Sequenzen oder Homologe
enthalten, zu hybridisieren. Für
Sonden mit einer Länge
von über
200 Nukleotiden kann die Hybridisierung 15–25°C unterhalb des Tm durchgeführt werden.
Für kürzere Sonden,
wie beispielsweise Oligonukleotidsonden, kann die Hybridisierung
15–25°C unterhalb
des Tm durchgeführt
werden. Für
Hybridisierungen in 6 × SSC
wird die Hybridisierung vorzugsweise bei etwa 68°C ausgeführt. Für Hybridisierungen in 50% Formamid
enthaltenden Lösungen
wird die Hybridisierung vorzugsweise bei etwa 42°C ausgeführt.
-
Alle
vorausgehenden Hybridisierungen werden als „stringente" Bedingungen betrachtet.
-
Im
Anschluss an die Hybridisierung wird der Filter in 2 × SSC, 0,1%
SDS bei Raumtemperatur für
15 Minuten gewaschen. Anschließend
wird der Filter mit 0,1 × SSC,
0,5% SDS bei Raumtemperatur für
30 Minuten bis zu 1 Stunde gewaschen. Danach wird die Lösung bei
der Hybridisierungstemperatur in 0,1 × SSC, 0,5% SDS gewaschen.
Ein abschließender
Waschschritt wird in 0,1 × SSC
bei Raumtemperatur durchgeführt.
-
Erweiterte
cDNAs, Nukleinsäurehomologe
zu erweiterten cDNAs oder 5'-ESTs
oder genomische DNAs, die an die Sonde hybridisierten, werden durch
Autoradiographie oder andere herkömmliche Techniken identifiziert.
-
2. Erhalten
erweiterter cDNA- oder genomischer cDNA-Sequenzen mit einem niedrigeren
Maß an
Homologie zur markierten Sonde
-
Das
obige Verfahren kann modifiziert werden, um erweiterte cDNAs, Nukleinsäurehomologe
zu erweiterten cDNAs oder genomische DNAs mit einem abnehmenden
Maß an
Homologie zur Sondensequenz zu identifizieren. Beispielsweise können weniger
stringente Bedingungen verwendet werden, um erweiterte cDNAs, Nukleinsäurehomologe
zu erweiterten cDNAs oder genomische DNAs mit abnehmender Homologie
zu der detektierbaren Sonde zu erhalten. Beispielsweise kann die
Hybridisierungstemperatur in Schrittgrößen von 5°C von 68°C bis auf 42°C in einem Hybridisierungspuffer
mit einer Natriumkonzentration von etwa 1 M abgesenkt werden. Im
Anschluss an die Hybridisierung kann der Filter mit 2 × SSC, 0,5%
SDS bei der Hybridisierungstemperatur gewaschen werden. Diese Bedingungen
werden über
50°C als „moderate" Bedingungen und unter
50°C als „schwache" Bedingungen betrachtet.
-
Alternativ
kann die Hybridisierung in Puffern, wie beispielsweise Formamid
enthaltender 6 × SSC-Puffer
bei einer Temperatur von 42°C
durchgeführt
werden. In diesem Fall kann die Konzentration an Formamid im Hybridisierungspuffer
in 5%-Schritten von 50% auf 0% verringert werden, um Klone mit einem
niedrigeren Maß an
Homologie zu der Sonde zu identifizieren. Im Anschluss an die Hybridisierung
kann der Filter mit 6 × SSC,
0,5% SDS bei 50°C
gewaschen werden. Über
25% Formamid werden die Bedingungen als „moderate" Bedingungen und unter 25% Formamid
als „schwache" Bedingungen betrachtet.
-
Erweiterte
cDNAs, Nukleinsäurehomologe
zu erweiterten cDNAs oder genomische DNAs, die an die Sonde hybridisiert
haben, werden durch Autoradiographie identifiziert.
-
3. Bestimmung
des Grades an Homologie zwischen den erhaltenen erweiterten cDNAs
und der markierten Sonde
-
Wenn
es erwünscht
ist, Nukleinsäurehomologe
zu erweiterten cDNAs zu erhalten, wie beispielsweise allelische
Varianten davon, oder Nukleinsäuren,
die für
Proteine codieren, die mit den Proteinen, die durch die erweiterten
cDNAs codiert werden, in Zusammenhang stehen, kann der Grad an Homologie
zwischen der hybridisierten Nukleinsäure und der erweiterten cDNA
oder dem 5'-EST,
die als Sonde verwendet werden, unter Verwendung von BLAST2N weiter
bestimmt werden; die Parameter können
abhängig
von der Sequenzlänge und
dem untersuchten Grad an Homologie angepasst werden. Um den Grad
an Homologie zwischen der hybridisierten Nukleinsäure und
der erweiterten cDNA oder dem 5'-EST,
von denen die Sonde abgeleitet wurde, zu bestimmen, werden die Nukleotidsequenzen
der hybridisierten Nukleinsäure
und die der erweiterten cDNA oder des 5'-ESTs, von denen die Sonde abgeleitet
wurde, verglichen. Beispielsweise können unter Verwendung der obigen
Verfahren Nukleinsäuren
mit wenigsten 95% Nukleinsäurehomologie
zu der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet
wurde, erhalten und identifiziert werden. In ähnlicher Weise kann man unter
Verwendung fortschreitend weniger stringenter Hybridisierungsbedingungen
Nukleinsäuren
mit mindestens 90%, mindestens 85%, mindestens 80% oder mindestens
75% Homologie zu der erweiterten cDNA oder dem 5'-EST, von denen die Sonde abgeleitet
wurde, erhalten und identifizieren.
-
Um
zu bestimmen, ob ein Klon ein Protein mit einem gegebenen Maß an Homologie
zu dem Protein, das durch die erweiterte cDNA oder das 5'-EST codiert wird,
codiert, wird die Aminosäuresequenz,
die durch die erweiterte cDNA oder das 5'-EST codiert wird, mit der Aminosäuresequenz,
die durch die hybridisierende Nukleinsäure codiert wird, verglichen.
Es wird festgestellt, dass Homologie vorliegt, wenn eine Aminosäuresequenz
in der erweiterten cDNA oder dem 5'-EST mit einer Aminosäuresequenz
in der hybridisierenden Nukleinsäure
in enger Beziehung steht. Eine Sequenz steht in enger Beziehung,
wenn sie mit der Sequenz der erweiterten cDNA oder der des 5'-ESTs identisch ist
oder wenn sie eine oder mehrere Aminosäuresubstitutionen enthält, in denen
Aminosäuren
mit ähnlichen
Charaktereigenschaften untereinander substituiert worden sind. Unter
Verwendung der obigen Verfahren und Algorithmen, wie beispielsweise
FASTA, mit Parametern, die von der Sequenzlänge und dem untersuchten Grad
an Homologie abhängig
sind, kann man Nukleinsäuren
erhalten, die für
Proteine codieren, die mindestens 95%, mindestens 90%, mindestens
85%, mindestens 80% oder mindestens 75% Homologie zu den Proteinen
aufweisen, die von der erweiterten cDNA oder dem 5'-EST codiert werden,
von der/dem die Sonde abgeleitet wurde.
-
Um
erweiterte cDNAs unter Verwendung von 5'-ESTs zu erhalten stehen über die
oben beschriebenen Verfahren hinausgehend andere Protokolle zur
Verfügung,
wie es in den nachfolgenden Absätzen
ausgeführt wird.
-
Erweiterte
cDNAs können
durch das Erhalten von mRNA aus dem Gewebe, aus der Zelle oder dem Organismus
von Interesse hergestellt werden, wobei auf PolyA-Selektionsverfahren
zurückgreifende mRNA-Herstellungsverfahren
oder andere dem Fachmann bekannten Techniken verwendet werden. Ein
erster Primer, der zur Hybridisierung mit dem PolyA-Schwanz der
mRNA in der Lage ist, wird an die mRNA hybridisiert und eine reverse
Transkriptionsreaktion wird durchgeführt, um einen cDNA-Erststrang
zu erzeugen.
-
Der
erste cDNA-Strang wird mit einem zweiten Primer, der mindestens
10 aufeinander folgende Nukleotide der Sequenz SEQ ID NO: 38-291
enthält, hybridisiert.
Vorzugsweise umfasst der Primer mindestens 12, 15 oder 17 aufeinander
folgende Nukleotide der Sequenz SEQ ID NO: 38-291. Mehr bevorzugt
umfasst der Primer 20 bis 30 aufeinander folgende Nukleotide der
Sequenz SEQ ID NO: 38-291. In einigen Ausführungsformen umfasst der Primer
mehr als 30 Nukleotide der Sequenz SEQ ID NO: 38-291. Wenn es gewünscht ist,
erweiterte cDNAs zu erhalten, welche die für das gesamte Protein codierende
Sequenz einschließlich
der authentischen Translationsinitiationsstelle enthalten, enthält der verwendete
zweite Primer Sequenzen, die stromaufwärts der Translationsinitiationsstelle
lokalisiert sind. Zur Erzeugung eines zum cDNA-Erststrang komplementären zweiten
cDNA-Strangs ist der zweite Primer erweitert. Alternativ kann wie oben
beschrieben wird, eine RT-PCR-Reaktion durchgeführt werden, wobei Primer von
beiden Enden der cDNA, die erhalten werden soll, eingesetzt werden.
-
Erweiterte
cDNAs, die 5'-Fragmente
der mRNA enthalten, können
durch Hybridisierung einer mRNA, welche die Sequenz für das 5'-EST umfasst, für das eine
erweiterte cDNA erwünscht
ist, mit einem Primer, der mindestens 10 aufeinander folgende Nukleotide
der Sequenzen umfasst, die komplementär zu dem 5'-EST sind, und reverses Transkribieren
des hybridisierten Primers zur Erstellung eines cDNA-Erststrang
der mRNAs, erzeugt werden. Vorzugsweise umfasst der Primer mindestens
12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs. Mehr bevorzugt
umfasst der Primer 20 bis 30 aufeinander folgende Nukleotide des 5'-ESTs.
-
Danach
wird ein cDNA-Zweitstrang, der komplementär zum cDNA-Erststrang ist,
synthetisiert. Der cDNA-Zweitstrang kann durch Hybridisierung eines
Primers, der komplementär
zu Sequenzen im cDNA-Erststrang ist, an den cDNA-Erststrang und
Verlängern
des Primers zur Erzeugung des cDNA-Zweitstrangs hergestellt werden.
-
Die
doppelsträngigen
erweiterten cDNAs, die unter Verwendung der oben beschriebenen Verfahren hergestellt
wurden, werden isoliert und kloniert. Die erweiterten cDNAs können in
Vektoren, wie beispielsweise Plasmide, oder virale Vektoren kloniert
werden, die zur Replikation in einer entsprechenden Wirtszelle fähig sind.
Die Wirtszelle kann beispielsweise eine Bakterienzelle, eine Säugerzelle,
eine Geflügelzelle
oder eine Insektenzelle sein.
-
Techniken
zur Isolierung von mRNA, zum reversen Transkribieren eines Primers,
der mit mRNA hybridisiert wird, um einen cDNA-Erststrang zu erzeugen,
Verlängern
eines Primers, um einen cDNA-Zweitstrang zu erzeugen, der komplementär zum cDNA-Erststrang
ist, Isolieren der doppelsträngigen
cDNA und Klonieren der doppelsträngigen
cDNA sind einem Fachmann allgemein bekannt und in „Current
Protocols in Molecular Biology",
John Wiley and Sons, Inc. 1997 und Sambrook et al., Molecular Cloning:
A Laboratory Manual, zweite Ausgabe, Cold Spring Harbor Laboratory
Press, 1989, beschrieben.
-
Alternativ
können
Verfahren, wie beispielsweise das in Beispiel 29 beschriebene, zum
Erhalten von Volllängen-cDNAs
oder erweiterten cDNAs verwendet werden. In diesem Ansatz werden
Volllängen-
oder erweiterte cDNAs aus mRNA hergestellt und wie folgt in doppelsträngige Phagemide
kloniert. Die cDNA-Bibliothek in den doppelsträngigen Phagemiden wird anschließend durch
Behandlung mit einer Endonuklease, wie beispielsweise dem Gene II-Produkt
des Phagen F1, und einer Exonuklease (Chang et al., Gene 127:95-8, 1993)
in eine einzelsträngige
Form gebracht. Ein biotinyliertes Oligonukleotid, das die Sequenz
eines 5'-ESTs oder
die Sequenz eines mindestens 10 Nukleotide davon enthaltenden Fragments
umfasst, wird an die einzelsträngigen
Phagemide hybridisiert. Vorzugsweise umfasst das Fragment mindestens
12, 15 oder 17 aufeinander folgende Nukleotide des 5'-ESTs. Mehr bevorzugt
umfasst das Fragment 20 bis 30 aufeinander folgende Nukleotide des
5'-ESTs. In einigen
Verfahren kann das Fragment mehr als 30 aufeinander folgende Nukleotide des
5'-ESTs umfassen.
-
Hybride
zwischen dem biotinylierten Oligonukleotid und Phagemiden mit Inserts,
welche die 5'-EST-Sequenz
enthalten, werden durch Inkubation der Hybride mit Streptavidin
beschichteten paramagnetischen Beads und Gewinnung der Beads mit
einem Magneten isoliert (Fry et al., Biotechniques, 13:124-131, 1992).
Danach werden die resultierenden Phagemide, welche die 5'-EST-Sequenz enthalten,
von den Beads abgelöst
und unter Verwendung eines Primers, der für die 5'-EST-Sequenz spezifisch ist, in doppelsträngige DNA
umgewandelt. Alternativ können
Protokolle, wie beispielsweise der Gene Trapper Kit (Gibco BRL)
verwendet werden. Die so erhaltene doppelsträngige DNA wird in Bakterien
transformiert. Erweiterte cDNAs, welche die 5'-EST-Sequenz enthalten, werden durch
Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
-
Unter
Verwendung eines beliebigen der oben in Abschnitt III beschriebenen
Verfahren kann eine Vielzahl erweiterter cDNAs, die für Volllängenprotein
codierende Sequenzen oder Sequenzen enthalten, die nur für das reife
Protein codieren, das zurückbleibt
nachdem das Signalpeptid abgespalten wurde, als cDNA-Bibliotheken
für eine
nachfolgende Bewertung der codierten Proteine oder zur Verwendung
in diagnostischen Assays, wie es unten beschrieben wird, bereitgestellt
werden.
-
IV. Expression von Proteinen,
die durch erweiterte cDNAs codiert werden, welche unter Verwendung
von 5'-ESTs isoliert
wurden
-
Erweiterte
cDNAs, welche die für
das Gesamtprotein codierenden Sequenzen ihrer entsprechenden mRNAs
oder Abschnitte davon enthalten, wie beispielsweise cDNAs, die für das reife
Protein codieren, können verwendet
werden, um die codierten sekretierten Proteine oder Abschnitte davon
zu exprimieren, wie es in Beispiel 30 unten beschrieben wird. Wenn
gewünscht,
können
die erweiterten cDNAs die Sequenzen enthalten, die für das Signalpeptid
codieren, um so die Sekretion des exprimierten Proteins zu vereinfachen.
Es wird erkannt, dass eine Vielzahl von erweiterten cDNAs, die Gesamtprotein
codierende Sequenzen oder Abschnitte davon enthalten, gleichzeitig
in Expressionsvektoren kloniert werden können, um so eine Expressionsbibliothek
zur Analyse der codierten Proteine zu erzeugen, wie es unten beschrieben
wird.
-
Beispiel 30
-
Expression der Proteine,
die durch die Gene codiert werden, welche 5'-ESTs oder Teilen davon entsprechen
-
Um
die Proteine zu exprimieren, die durch die Gene codiert werden,
welche 5'-ESTs (oder
Teilen davon) entsprechen, werden Volllängen-cDNAs erhalten, welche
die vollständige
proteincodierende Region enthalten, oder erweiterte cDNAs, die Sequenzen
in Nachbarschaft zu den 5'-ESTs
(oder Abschnitten davon) enthalten, wie es in den Beispielen 27–29 beschrieben
wird, und in einen geeigneten Expressionsvektor kloniert. Wenn gewünscht, können die
Nukleinsäuren
die Sequenzen enthalten, die für
das Signalpeptid codieren, um so die Sekretion des exprimierten
Proteins zu erleichtern. Die Nukleinsäuren, die in die Expressionsvektoren insertiert
werden, können
auch Sequenzen enthalten, die sich stromaufwärts der Sequenzen befinden,
die für das
Signalpeptid codieren, wie beispielsweise Sequenzen, die Expressionsmengen
regulieren oder Sequenzen, die eine gewebespezifische Expression übertragen.
-
Die
Nukleinsäure,
die für
das zu exprimierende Protein oder das Polypeptid codiert, wird operativ
mit einem Promotor in einem Expressionsvektor verknüpft, wobei
hierzu herkömmliche
Klonierungstechnologien verwendet werden. Der Expressionsvektor
kann ein beliebiges, im Fachbereich bekanntes Säuger-, Hefe-, Insekten- oder
bakterielles Expressionssystem sein. Kommerziell erhältliche
Vektoren und Expressionssysteme stehen von einer Vielzahl von Lieferanten
zur Verfügung,
einschließlich
Genetics Institut (Cambridge, MA), Stratagene (La Jolla, Kalifornien),
Promega (Madison, Wisconsin) und Invitrogen (San Diego, Kalifornien). Wenn
gewünscht,
kann der Codonkontext und die Codonpaarung der Sequenz für den bestimmten
Expressionsorganismus, in den der Expressionsvektor eingeführt wird,
optimiert werden, wie es von Hatfield, et al., US-Patent Nr. 5,082,767
erläutert
wird, um so die Expression zu steigern und um eine passende Proteinfaltung zu
ermöglichen.
-
Die
in den Expressionsvektor einklonierte cDNA kann das vollständige Protein
(d.h. das Signalpeptid und das reife Protein), das reife Protein
(d.h. das Protein, das durch Abspalten des Signalpeptids erzeugt
wurde), nur das Signalpeptid oder einen anderen beliebigen Abschnitt
davon enthalten.
-
Das
folgende Verfahren wird als ein beispielhaftes Verfahren zur Expression
der Proteine bereitgestellt, die durch die erweiterten cDNAs codiert
werden, die den 5'-ESTs
oder den Nukleinsäuren
entsprechen, wie oben beschrieben wird. Zuerst werden das Methionininitiationscodon
für das
Gen und das PolyA-Signal des Gens identifiziert. Wenn die Nukleinsäure, die
das zu exprimierende Polypeptid codiert, kein Methionin aufweist,
das als Initiationsstartstelle dient, kann ein initiierendes Methionin
neben dem ersten Codon der Nukleinsäure eingefügt werden, wobei herkömmliche
Techniken verwendet werden. In gleicher Weise kann, wenn die erweiterte
cDNA kein PolyA-Signal aufweist, diese Sequenz an das Konstrukt
angefügt
werden, beispielsweise durch Spleißen des PolyA-Signals aus pSG5
(Stratagene), wobei BgIII- und SaII-Restriktionsendonukleaseenzyme
verwendet werden, und Einfügen
dieses PolyA-Signals in den Säugerexpressionsvektor
pXT1 (Stratagene). pXT1 enthält
die LTRs und einen Teil des gag-Gens des Moloney Murine Leukemia-Virus.
Die Position der LTRs im Konstrukt ermöglicht eine effiziente stabile
Transfektion. Der Vektor umfasst den Herpes Simplex-Tymidinkinasepromotor
und das selektierbare Neomycingen. Die erweiterte cDNA oder ein
Abschnitt davon, die bzw. der für
das zu exprimierende Polypeptid codiert, wird durch eine PCR-Reaktion
aus dem bakteriellen Vektor erhalten, wobei Oligonukleotidprimer
verwendet werden, die komplementär
zu der erweiterten cDNA oder einem Abschnitt davon sind und die
Restriktionsendonuklease-Sequenzen für PstI enthalten, die in den
5'-Primer eingebracht
sind, und für
BgIII am 5'-Ende
des entsprechenden cDNA 3'-Primers,
wobei darauf geachtet wird, sicherzustellen, dass die erweiterte
cDNA mit dem PolyA-Signal positioniert ist. Das gereinigte Fragment,
das aus der entsprechenden PCR-Reaktion erhalten wird, wird mit
PstI verdaut, mit einer Exonuklease mit glatten Enden versehen,
mit BgIII verdaut, gereinigt und in den pXT1-Vektor ligiert, der
ein PolyA-Signal enthält
und für
diese Ligation (glatt/BgIII) vorbereitet wurde.
-
Das
ligierte Produkt wird unter Verwendung von Lipofectin (Life Technologies,
Inc., Grand Island, New York) in NIH 3T3-Mauszellen transfiziert,
wobei Bedingungen wie sie in der Produktbeschreibung beschrieben sind,
eingehalten werden. Nach Aufzucht der transfizierten Zellen in 600 μg/ml G418
(Sigma, St. Louis, Missouri) werden positive Transfektanten selektiert.
Das exprimierte Protein wird vorzugsweise in das Kulturmedium abgegeben,
wodurch die Aufreinigung vereinfacht wird.
-
Alternativ
können
die erweiterten cDNAs, wie es oben beschrieben wird, in pED6dpc2
kloniert werden. Die resultierenden pED6dpc2-Konstrukte können in eine
geeignete Wirtszelle, wie beispielsweise COS 1-Zellen, transfiziert
werden. Methotrexat-resistente Zellen werden selektiert und expandiert.
Vorzugsweise wird das Protein, das von der erweiterten cDNA exprimiert
wird, in das Kulturmedium abgegeben, wodurch die Aufreinigung vereinfacht
wird.
-
Proteine
im Kulturmedium werden durch Gelelektrophorese abgetrennt. Falls
gewünscht,
können
die Proteine durch Ammoniumsulfat präzipitiert werden oder vor der
Elektrophorese auf Grundlage ihrer Größe oder Ladung getrennt werden.
-
Als
Kontrolle wird der Expressionsvektor, der kein cDNA-Insert aufweist,
in Wirtszellen oder Organismen eingebracht und die Proteine im Medium
werden geerntet. Die sekretierten Proteine, die im Medium vorliegen,
werden unter Verwendung von dem Fachmann bekannten Techniken detektiert,
wie beispielsweise Coomassie Blau- oder Silberfärbung, oder unter Verwendung
von Antikörpern
gegen das durch die erweiterte cDNA codierte Protein.
-
Antikörper, die
in der Lage sind, das Protein von Interesse spezifisch zu erkennen,
können
unter Verwendung synthetischer 15-mer Peptide erzeugt werden, die
eine Sequenz aufweisen, die durch das geeignete 5'-EST, die geeignete
erweiterte cDNA oder einen Abschnitt davon codiert wird. Die synthetischen
Peptide werden in Mäuse
injiziert, um einen Antikörper
zu dem Polypeptid, das durch das 5'-EST, die erweiterte cDNA oder den Abschnitt
davon codiert wird, zu erzeugen.
-
Sekretierte
Proteine aus den Wirtszellen oder Organismen, die einen Expressionsvektor
enthalten, der die erweiterte cDNA enthält, die aus einem 5'-EST oder einem Abschnitt
davon abgeleitet ist, werden mit denen aus den Kontrollzellen oder
dem Kontrollorganismus verglichen. Die Gegenwart einer Bande im
Medium von den Zellen, die den Vektor enthalten, die im Medium aus
Kontrollzellen nicht vorliegt, zeigt, dass die erweiterte cDNA für ein sekretiertes
Protein codiert. Im Allgemeinen hat die Bande, die dem Protein entspricht,
das von der erweiterten cDNA codiert wird, eine Mobilität nahe bei
der erwarteten Mobilität,
wobei dies auf der Zahl der Aminosäuren im offenen Leserahmen
der erweiterten cDNA beruht. Jedoch kann die Bande in Folge von
Modifikationen, wie beispielsweise Glykosylierung, Ubiquitinierung
oder enzymatischer Spaltung, eine Mobilität aufweisen, die sich von der
erwarteten Mobilität
unterscheidet.
-
Wenn
das durch die obigen Expressionsvektoren exprimierte Protein keine
Sequenzen enthält,
welche seine Sekretion steuern, können alternativ die von den
Wirtszellen exprimierten Proteine, wobei die Wirtszellen einen Expressionsvektor
mit einem Insert enthalten, das für ein sekretiertes Protein
oder einen Abschnitt davon codiert, mit den Proteinen verglichen
werden, die in Kontrollwirtszellen exprimiert werden, die den Expressionsvektor
ohne Insert enthalten. Das Vorliegen einer Bande in Proben von Zellen,
die den Expressionsvektor mit einem Insert enthalten, die in Proben
von Zellen, die den Expressionsvektor ohne Insert enthalten, nicht vorliegt,
zeigt, dass das gewünschte
Protein oder der Abschnitt davon exprimiert wird. Im Allgemeinen
weist die Bande die Mobilität
auf, welche für
das sekretierte Protein oder den Abschnitt davon erwartet wird.
Jedoch kann die Bande in Folge von Modifizierungen, wie beispielsweise
Glykosylierung, Ubiquitinierung oder enzymatischer Spaltung, eine
von der erwarteten Mobilität
abweichende Mobilität
aufweisen.
-
Das
durch die erweiterte cDNA codierte Protein kann unter Verwendung
von standardmäßigen Immunochromatografie-Techniken
gereinigt werden. In derartigen Verfahren wird eine Lösung, die
das sekretierte Protein enthält,
wie beispielsweise Kulturmedium oder Zellextrakt, auf eine Säule aufgebracht,
die Antikörper gegen
das sekretierte Protein aufweist, wobei die Antikörper an
der Chromatografiematrix angebracht sind. Man lässt das sekretierte Protein
an die Immunochromatografiesäule
binden. Danach wird die Säule
gewaschen, um nicht spezifisch gebundene Proteine zu entfernen.
Das spezifisch gebundene sekretierte Protein wird anschließend von
der Säule
freigesetzt und unter Verwendung von Standardtechniken gewonnen.
-
Falls
eine Antikörperherstellung
nicht möglich
ist, kann die erweiterte cDNA-Sequenz
oder der Abschnitt davon in Expressionsvektoren eingebracht werden,
die zur Verwendung in Reinigungsschemata konzipiert worden sind,
die auf chimäre
Polypeptide zurückgreifen.
In derartigen Strategien ist die codierende Sequenz der erweiterten
cDNA oder des Abschnitts davon im Rahmen mit einem Gen insertiert,
das die andere Hälfte
der Chimäre
codiert. Die andere Hälfte
der Chimäre
kann β-Globin
oder ein nickelbindendes Polypeptid sein. Eine Chromatografiematrix
mit einem daran angebrachten Antikörper gegen β-Globin oder Nickel wird anschließend verwendet,
um das chimäre
Protein zu reinigen. Proteasespaltstellen können zwischen dem β-Globin-Gen
oder dem nickelbindendem Polypeptid und der erweiterten cDNA oder
dem Abschnitt davon konstruiert sein. Daher können die zwei Polypeptide der
Chimäre
durch Proteaseverdau voneinander getrennt werden.
-
Ein
zur Erzeugung von β-Globin-Chimären nützlicher
Expressionsvektor ist pSG5 (Stratagene), der für Kaninchen-β-Globin codiert.
Intron II des Kaninchen-β-Globin-Gens ermöglicht das
Spleißen
des exprimierten Transkripts und das in dieses Konstrukt eingebrachte
Polyadenylierungssignal erhöht
die Expressionsmenge. Diese Verfahren sind so wie beschrieben dem
Fachmann im Bereich der Molekularbiologie allgemein bekannt. Standardverfahren
sind in Texten über
Verfahren, wie beispielsweise Davis et al., („Basic Methods in Molecular Biology", Davis, Dibner und
Battex, Hg., Elsevier Press, NY, 1986) beschrieben und viele andere
Verfahren stehen von Stratagene, Life Technologies, Inc. oder Promega
zur Verfügung.
Zusätzlich
können
von dem Konstrukt Polypeptide hergestellt werden unter Verwendung
von in vitro-Translationssystemen, wie beispielsweise dem In vitro-ExpressTM-Translations-Kit (Stratagene).
-
Im
Anschluss an die Expression und Reinigung der sekretierten Proteine,
die durch die 5'-ESTs,
erweiterten cDNAs oder Fragmente davon codiert werden, können die
gereinigten Proteine auf ihre Fähigkeit, an
die Oberfläche
verschiedener Zelltypen zu binden, getestet werden, wie es in Beispiel
31 unten beschrieben wird. Es wird erkannt, dass eine Vielzahl von
Proteinen, die durch diese cDNAs exprimiert werden, von einem Panel
von Proteinen umfasst sein kann, um so gleichzeitig sowohl hinsichtlich
ihrer unten genau beschrieben Aktivitäten, als auch im Hinblick auf
andere biologische Rollen, für
die Assays zur Aktivitätsbestimmung
zur Verfügung
stehen, beurteilt zu werden.
-
Beispiel 31
-
Analyse sekretierter Proteine
zur Bestimmung, ob die Proteine an die Zelloberfläche binden
-
Die
durch die 5'-ESTs,
erweiterten cDNAs oder Fragmente davon codierten Proteine werden
in Expressionsvektoren, wie diejenigen, die in Beispiel 30 beschrieben
sind, kloniert. Die Proteine werden über Größe, Ladung, Immunchromatografie
oder andere dem Fachmann vertraute Techniken gereinigt. Im Anschluss an
die Reinigung werden die Proteine unter Verwendung von dem Fachmann
bekannten Techniken markiert. Die markierten Proteine werden mit
Zellen oder Zelllinien inkubiert, die aus einer Vielfalt von Organismen
oder Geweben abgeleitet sind, um es den Proteinen zu ermöglichen,
an einen beliebigen Rezeptor auf der Zelloberfläche zu binden. Im Anschluss
an die Inkubation werden die Zellen gewaschen, um unspezifisch gebundenes
Protein zu entfernen. Die markierten Proteine werden durch Autoradiografie
detektiert. Alternativ können
nicht markierte Proteine mit den Zellen inkubiert werden und unter
Verwendung von daran anhaftenden Antikörpern, die eine detektierbare
Markierung aufweisen, wie beispielsweise ein fluoreszierendes Molekül, detektiert
werden.
-
Die
Spezifität
der Zelloberflächenbindung
kann durch Durchführung
einer Kompetitionsanalyse analysiert werden, wobei verschiedene
Mengen an nicht markiertem Protein zusammen mit dem markierten Protein inkubiert
werden. Die Menge an markiertem Protein, das an die Zelloberfläche gebunden
ist, nimmt ab, wenn die Menge an kompetitivem unmarkiertem Protein
ansteigt. Als Kontrolle sind in einigen Bindereaktionen verschiedene
Mengen an nicht markiertem Protein umfasst, das mit dem markierten
Protein nicht in Beziehung steht. Die Mengen an markiertem Protein,
das an die Zelloberfläche
gebunden ist, sinkt in solchen Bindereaktionen nicht ab, die steigende
Mengen an nicht verwandten nicht markierten Proteinen enthalten,
was zeigt, dass das Protein, das durch die cDNA codiert wird, spezifisch
an die Zelloberfläche
bindet.
-
Wie
oben diskutiert, zeigen sekretierte Proteine eine Vielzahl von wichtigen
physiologischen Effekten und stellen in der Konsequenz eine wertvolle
therapeutische Quelle dar. Die sekretierten Proteine, die durch die
erweiterten cDNAs oder Teile davon codiert werden, die gemäß den Beispielen
27–29
hergestellt wurden, können
wie unten beschrieben beurteilt werden, um ihre physiologischen
Wirkungen zu bestimmen.
-
Beispiel 32
-
Untersuchen der durch
die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine
hinsichtlich der Zytokin-, Zellproliferations- oder Zelldifferenzierungs-Aktivität
-
Wie
oben diskutiert, können
sekretierte Proteine als Zytokine wirken oder können die zelluläre Proliferation
oder Differenzierung beeinflussen. Viele bis heute entdeckte Proteinfaktoren,
einschließlich
aller bekannten Zytokine, weisen in einem oder mehreren faktorabhängigen Zellproliferationsassays
Aktivität
auf und daher dienen diese Assays als zweckmäßige Bestätigung der Zytokinaktivität. Die Aktivität eines
Proteins, das durch die erweiterten cDNAs codiert wird, wird durch
einen beliebigen aus einer Reihe von routinemäßigen faktorabhängigen Zellproliferationsassays
für Zelllinien,
einschließlich,
ohne Beschränkung,
32D, DA2, DA1G, T10, B9, B9/11, BaF3, MC9/G, M+ (preB
M+), 2E8, RB5, DA1, 123, T1165, HT2, CTLL2,
TF-1, Mo7c und CMK, bewiesen. Die Proteine, die durch die oben beschriebenen
erweiterten cDNAs oder Abschnitte davon codiert werden, können bezüglich ihrer
Fähigkeit,
die T-Zell- oder Thymozytproliferation in Assays, wie beispielsweise diejenigen,
die oben oder in den folgenden Referenzen beschrieben sind, beurteilt
werden: „Current
Protocols in Immunology",
Hrsg. von Coligan et al., Greene Publishing Associates and Wiley-Interscience;
Takai et al., J. Immunol. 137:3494-3500, 1986; Bertagnolli et al.,
J. Immunol. 145:1706-1712, 1990; Bertagnolli et al., Cell. Immunol.
133:327-341, 1991; Bertagnolli et al., J. Immunol. 149:3778-3783
1992; Bowman et al., J. Immunol. 152:1756-1761, 1994.
-
Zusätzlich sind
zahlreiche Assays zur Zytokinproduktion und/oder der Proliferation
von Milzzellen, Lymphknotenzellen und Thymozyten bekannt. Diese
umfassen die Techniken, die in „Current Protocols in Immunology", supra, 1:3.12.1-3.12.14
und von Schreiber in „Current
Protocols in Immunology",
supra, 1:6.8.1-6.8.8 offenbart werden.
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihrer
Fähigkeit,
Proliferation und Differenzierung hämatopoetischer oder lymphopoetischer
Zellen zu regulieren, untersucht werden. Viele Assays hinsichtlich
einer derartigen Aktivität
sind dem Fachmann bekannt, einschließlich der Assays in den folgenden Referenzen:
Bottomly et al., in „Current
Protocols in Immunology",
supra, 1:6.3.1-6.3.12; de Vries et al., J. Exp. Med. 173:1205-1211,
1991; Moreau et al., Nature 36:690-692, 1988; Greenberger et al.,
Proc. Natl. Acad. Sci. U.S.A., 80:2931-2938, 1983; Nordan, R., in
Current Protocols in Immunology, supra 1:6.6.1-6.6.5; Smith et al., Proc.
Natl. Acad. Sci. U.S.A., 83:1857-1861, 1986; Bennett et al., in "Current Protocols
Immunology", supra, 1:6.15.1;
Ciarletta et al., in "Current
Protocols Immunology",
supra, 1:6.13.1.
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihrer
Fähigkeit,
die Antworten von T-Zellen auf Antigene zu regulieren, untersucht
werden. Viele Assays hinsichtlich einer derartigen Aktivität sind dem
Fachmann bekannt, einschließlich
der Assays, welche in den folgenden Referenzen beschrieben werden: Kapitel
3 (In vitro-Assays zur Maus Lymphozytenfunktion), Kapitel 6 (Zytokine
und ihre zellulären
Rezeptoren) und Kapitel 7 (Immunologische Studien in Menschen) in „Current
Protocols in Immunology" supra,
Weinberger et al., Proc. Natl. Acad. Sci. USA 77:6091-6095, 1980;
Weinberger et al., Eur. J. Immun. 11:405-411, 1981; Takai et al.,
J. Immunol. 137:3494-3500, 1986; Takai et al., J. Immunol. 140:508-512,
1988.
-
Derartige,
eine Zytokin-, Zellproliferations- oder Zelldifterenzierungsaktivität aufweisende
Proteine können
anschließend
als Pharmazeutika formuliert oder verwendet werden, um klinische
Beschwerden zu behandeln, bei welchen die Induktion von Zellproliferation
oder -differenzierung günstig
ist. Alternativ können
Gene, welche diese Proteine codieren oder Nukleinsäuren, welche
die Expression dieser Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen, wobei dies unten ausführlicher beschrieben wird.
-
Beispiel 33
-
Untersuchung
der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten
Proteine hinsichtlich einer Aktivität als Regulatoren des Immunsystems
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihrer
Wirkungen als Immunregulatoren beurteilt werden. Beispielsweise
können
diese Proteine bezüglich
ihrer Aktivität,
die Thymozyten- oder Splenozyten-Zytotoxizität zu beeinflussen, beurteilt
werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem
Fachmann bekannt, einschließlich
der Assays, die in den folgenden Referenzen beschrieben werden:
Kapitel 3 (In vitro-Assays zur Maus-Lymphozytenfunktion 3.1-3.19) und Kapitel
7 (Immunologische Studien in Menschen) in „Current Protocols in Immunology", Coligan et al.,
Hrsg., Greene Publishing Associates and Wiley-Interscience; Herrmann
et al., Proc. Natl. Acad. Sci. USA 78:2488-2492, 1981; Herrmann et
al., J. Immunol. 128:1968-1974, 1982; Handa et al., J. Immunol.
135:1564-1572, 1985; Takai et al., J. Immunol. 137:3494-3500, 1986;
Takai et al., J. Immunol. 140:508-512, 1988; Bowman et al., J. Virology 61:1992-1998;
Bertagnolli et al., Cell. Immunol. 133:327-341, 1991; Brown et al.,
J. Immunol. 153:3079-3092, 1994.
-
Die
durch die cDNAs codierten Proteine können auch bezüglich ihrer
Wirkungen auf T-Zell abhängige Immunglobulinreaktionen
und Isotyp-Switching beurteilt werden. Zahlreiche Assays hinsichtlich
einer derartigen Aktivität
sind dem Fachmann bekannt, einschließlich der Assays, die in den
folgenden Referenzen beschrieben werden: Maliszewski, J. Immunol.
144:3028-3033, 1990; Mond et al., in Current Protocols in Immunology,
1:3.8.1-3.8.16, supra.
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihrer
Wirkung auf Immuneffektorzellen, einschließlich ihrer Wirkung auf Th1-Zellen
und zytotoxische Lymphozyten beurteilt werden. Zahlreiche Assays
hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt,
einschließlich
der Assays, die in den folgenden Referenzen beschrieben werden:
Kapitel 3 (in vitro-Assays zur Maus-Lymphozytenfunktion 3.1-3.19)
und Kapitel 7 (Immunologische Studien in Menschen) in „Current
Protocols in Immunology",
supra; Takai et al., J. Immunol. 137:3494-3500, 1986; Takai et al.,
J. Immunol. 140:508-512, 1988; Bertagnolli et al., J. Immunol. 149:3778-3783,
1992.
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihrer
Wirkung auf die durch dendritische Zellen vermittelte Aktivierung
von naiven T-Zellen
beurteilt werden. Zahlreiche Assays hinsichtlich einer derartigen
Aktivität
sind dem Fachmann bekannt, einschließlich der Assays, die in den
folgenden Referenzen beschrieben werden: Guery et al., J. Immunol.,
134:536-544, 1995; Inaba et al., J. Exp. Med. 173:549-559, 1991;
Macatonia et al., J. Immunol. 154:5071-5079, 1995; Porgador et al.,
J. Exp. Med. 182:255-260, 1995; Nair et al., J. Virol. 67:4062-4069,
1993; Huang et al., Science 264:961-965, 1994; Macatonia et al.,
J. Exp. Med. 169:1255-1264, 1989; Bhardwaj et al., Journal of Clinical
Investigation 94:797-807, 1994 und Inaba et al., J. Exp. Med. 172:631-640,
1990.
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihres
Einflusses auf die Lebensdauer von Lymphozyten beurteilt werden.
Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem
Fachmann bekannt, einschließlich
der Assays, die in den folgenden Referenzen beschrieben werden:
Darzynkiewicz et al., Cytometry 13:795-808, 1992; Gorczyca et al.,
Leukemia 7:659-670, 1993; Gorczyca et al., Cancer Res. 53:1945-1951,
1993; Itoh et al., Cell 66:233-243, 1991; Zacharchuk, J. Immunol.
145:4037-4045, 1990; Zamai et al., Cytometry 14:891-897, 1993; Gorczyca
et al., Int. J. Oncol. 1:639-648, 1992.
-
Die
durch die cDNAs codierten Proteine können auch hinsichtlich ihres
Einflusses auf frühe
Stufen des T-Zell-Deteminierung und der T-Zell-Entwicklung beurteilt
werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem
Fachmann bekannt, einschließlich
aber ohne Beschränkung
auf die Assays, die in den folgenden Referenzen beschrieben werden:
Antica et al., Blood 84:111-117,
1994; Fine et al., Cell. Immunol. 155:111-122, 1994; Galy et al.,
Blood 85:2770-2778, 1995; Toki et al., Proc. Natl. Acad. Sci. USA 88:7548-7551,
1991.
-
Diejenigen
Proteine, die eine Aktivität
als Regulatoren der Aktivität
des Immunsystems zeigen, können dann
als Pharmazeutika formuliert werden und verwendet werden, um klinische
Erkrankungen zu behandeln, bei welchen die Regulation der Immunaktivität günstig ist.
Beispielsweise kann das Protein bei der Behandlung verschiedener
Immunschwächen
und Erkrankungen nützlich
sein (einschließlich
schwerer kombinierter Immunschwächen),
z.B. sowohl beim Regulieren (nach oben oder nach unten) von Wachstum
und Proliferation von T- und/oder
B-Lymphozyten als auch beim Einwirken auf die zytolytische Aktivität von NK-Zellen
und anderen Zellpopulationen. Diese Immunschwächen können genetischen Ursprungs
sein oder können
sowohl durch virale (z.B. HIV) als auch durch bakterielle Infektionen
oder von Pilzinfektionen verursacht werden oder können sich
aus Autoimmunerkrankungen ergeben. Insbesondere können infektiöse Erkrankungen
behandelt werden, die durch virale oder bakterielle Infektionen
oder durch Pilze oder andere Infektionen verursacht werden, unter
Verwendung eines Proteins, das durch erweiterte cDNAs codiert wird,
die von den 5'-ESTs
der vorliegenden Erfindung abgeleitet sind, einschließlich Infektionen
mit HIV, Hepatitis-Viren, Herpes-Viren, Mycobakterien, Leishmania
spp., Plasmodium und verschiedenen Pilzinfektionen, wie zum Beispiel
Candidiasis. In diesem Zusammenhang kann ein Protein, das durch
erweiterte cDNAs codiert wird, die von den 5'-ESTs der vorliegenden Erfindung abgeleitet
sind, selbstverständlich
ebenfalls nützlich
sein, wenn eine Stimulierung des Immunsystems im Allgemeinen wünschenswert
ist, d.h. bei der Behandlung von Krebs.
-
Alternativ
können
Proteine, die von erweiterten cDNAs codiert werden, die von den
hierin beschriebenen 5'-ESTs
abgeleitet sind, bei der Behandlung von Autoimmunerkrankungen verwendet
werden, einschließlich
beispielsweise Bindegewebserkrankungen, Multiple Sklerose, systemischer
Lupus erythematosus, Rheumatoide Arthritis, Autoimmun-Lungenentzündung, Guillian
Barre-Syndrom, autoimmune Thyroiditis, insulinabhängiger Diabetes
mellitus, Myasthenia gravis, Transplantat-Wirt-Reaktion („graft-versus-host
disease", GVHD)
und autoimmune entzündliche
Augenerkrankungen. Ein derartiges Protein, das durch erweiterte
cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet
sind, kann auch bei der Behandlung allergischer Reaktionen und Erkrankungen,
wie zum Beispiel Asthma (insbesondere allergisches Asthma) oder
anderen Atemwegserkrankungen, nützlich
sein. Andere Erkrankungen, bei denen eine Immunsuppression wünschenswert
ist (einschließlich
beispielsweise Organtransplantation), können auch unter Verwendung
eines Proteins behandelbar sein, das durch erweiterte cDNAs codiert
wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind.
-
Unter
Verwendung der erfindungsgemäßen Proteine
kann es ebenfalls möglich
sein, Immunantworten nach oben oder nach unten zu regulieren.
-
Eine
Regulation nach unten kann das Hemmen oder Blockieren einer Immunantwort,
die bereits abläuft,
umfassen, oder kann das Verhindern der Induktion einer Immunantwort
umfassen. Die Funktionen aktivierter T-Zellen können durch Supprimieren der
T-Zell-Antworten oder durch Induzieren spezifischer Toleranz in
T-Zellen oder durch beides gehemmt werden. Die Immunsuppression
von T-Zell-Antworten ist im Allgemeinen ein aktiver, nicht antigenspezifischer
Prozess, der einer kontinuierlichen Exposition von T-Zellen gegenüber dem
suppressiven Mittel bedarf. Toleranz, die eine Induktion von Unempfindlichkeit
oder Anergie in T-Zellen umfasst, ist von Immunsuppression dadurch
unterscheidbar, dass sie im Allgemeinen antigenspezifisch ist und
nach dem Ende der Exposition gegenüber dem toleranzverleihenden
Mittel andauert. Praktisch kann Toleranz durch das Fehlen einer
T-Zell-Antwort auf Reexposition gegenüber einem spezifischen Antigen
in der Abwesenheit eines Toleranz verleihenden Mittels gezeigt werden.
-
Regulierung
nach unten oder Verhinderung einer oder mehrerer Antigenfunktionen
(einschließlich aber
ohne Beschränkung
auf B-Lymphozyt-Antigenfunktionen, wie zum Beispiel B7-Costimulation),
z.B. Verhinderung eines hohen Grads an Lymphokinsynthese durch aktivierte
T-Zellen, sind unter den Umständen
einer Gewebe-, Haut- und Organtransplantation und bei einer Transplantat-Wirt-Reaktion
(GVHD) nützlich.
Beispielsweise sollte die Blockierung der T-Zell-Funktion bei einer
Gewebetransplantation zu einer verringerten Zerstörung von
Gewebe führen.
Normalerweise wird in Gewebetransplantaten die Abstoßung des
Transplantats über
seine Fremderkennung durch T-Zellen initiiert, woran sich eine Immunreaktion
anschließt,
die das Transplantat zerstört.
Die Verabreichung eines Moleküls
vor der Transplantation, das die Wechselwirkung eines B-7-Lymphozyt-Antigens
mit seinem natürlichen
Ligand (seinen natürlichen
Liganden) auf Immunzellen hemmt oder blockiert (wie beispielsweise
eine lösliche,
monomere Form eines Peptids mit B7-2-Aktivität allein oder in Verbindung
mit einer monomeren Form eines Peptids mit einer Aktivität eines
anderen B-Lymphozyt-Antigens (z.B. B7-1, B7-3) oder einem blockierenden
Antikörper),
kann zum Binden des Moleküls
an den/die natürlichen
Ligand(en) auf den Immunzellen führen,
ohne das entsprechende kostimulatorische Signal zu übertragen.
In diesem Fall verhindert die Blockierung der B-Lymphozyt-Antigenfunktion eine
Zytokinsynthese durch Immunzellen, wie beispielsweise T-Zellen, und wirkt
daher als ein Immunsuppressor. Darüber hinaus kann das Fehlen
der Costimulation auch ausreichen, zu einem Nichtreagieren der T-Zellen
bei herabgesetzter Immunlage zu führen, wodurch in einem Probanden
Toleranz induziert wird. Durch Induktion einer lang andauernden
Toleranz durch mittel, welche B-Lymphozyt-Antigene blockieren, kann
durch das Bedürfnis
nach einer wiederholten Verabreichung dieser blockierenden Mittel
vermieden werden. Um eine ausreichende Immunsuppression oder Toleranz
in einem Probanden zu erreichen, kann es auch notwendig sein, die
Funktion einer Kombination von B-Lymphozyt-Antigenen
zu blockieren.
-
Die
Wirksamkeit bestimmter blockierender Mittel beim Verhindern der
Abstoßung
eines Organtransplantats oder von GVHD kann unter Verwendung von
Tiermodellen beurteilt werden, die zur Vorhersage über die
Wirksamkeit in Menschen geeignet sind. Beispiele geeigneter Systeme,
die verwendet werden können, umfassen
allogene Herztransplantate in Ratten und xenogene Bauchspeicheldrüsen-Inselzelltransplantate
in Mäusen,
wobei beide Transplantate eingesetzt wurden, um die immunsuppressiven
Wirkungen des CTLA4Ig-Fusionsproteins in vivo zu untersuchen, wie
es in Lenschow et al., Science 257:789-792, 1992 und Turka et al.,
Proc. Natl. Acad. Sci. USA, 89:11102-11105, 1992, beschrieben wird.
Zusätzlich
können
GVHD-Mausmodelle (siehe Paul, Hrsg., Fundamental Immunology. Raven
Press, New York, 1989, Seiten 846–847) verwendet werden, um
in vivo die Wirkung der Blockierung der B-Lymphozyt-Antigenfunktion auf
die Entwicklung dieser Erkrankung zu untersuchen.
-
Eine
Blockierung der Antigenfunktion kann auch bei der Behandlung von
Autoimmunerkrankungen therapeutisch nützlich sein. Viele Autoimmunerkrankungen
sind das Ergebnis einer unpassenden Aktivierung von T-Zellen, die
gegen Eigengewebe reaktiv sind, und welche die Herstellung von Zytokinen
und Autoantikörpern
fördern,
die an der Pathologie dieser Erkrankungen beteiligt sind. Die Verhinderung
der Aktivierung autoreaktiver T-Zellen kann Krankheitssymptome verringern
oder beseitigen. Eine Verabreichung von Mitteln, die auf die Kostimulierung
von T-Zellen durch Stören
der Rezeptor/Ligandwechselwirkungen der B-Lymphozyt-Antigene blockierend
wirken, können
verwendet werden, um die T-Zell-Aktivierung zu hemmen und um die
Erzeugung von Autoantikörpern
oder T-Zell abgeleiteten
Zytokinen zu verhindern, die am Krankheitsprozess möglicherweise
beteiligt sind. Zusätzlich
können
blockierende Mittel eine antigenspezifische Toleranz autoreaktiver
T-Zellen induzieren, die zu einer langfristigen Entlastung von der
Krankheit führen
könnte.
Die Wirksamkeit blockierender Mittel bei der Verhinderung oder Linderung
von Autoimmunerkrankungen kann unter Verwendung einer Vielzahl gut
charakterisierter Tiermodelle für
humane Autoimmunerkrankungen bestimmt werden. Beispiele umfassen
experimentelle murine Autoimmunencephalitis, systemischen Lupus
erythematosis in MRL/pr/pr-Mäusen
oder NZB-Hybridmäusen,
murine Autoimmuncollagenarthritis, Diabetes mellitus in OD-Mäusen und
BB-Ratten und experimentelle murine Myasthenia gravis. (siehe Paul
Ed., supra, Seiten 840–856).
-
Eine
Hochregulierung einer Antigenfunktion (vorzugsweise einer B-Lymphozyt-Antigenfunktion)
als Mittel zur Hochregulierung von Immunantworten kann in der Therapie
auch nützlich
sein. Die Hochregulierung von Immunantworten kann entweder eine
Steigerung einer bestehenden Immunantwort oder das Auslösen einer
Inititalimmunantwort umfassen, wie es durch die folgenden Beispiele
gezeigt wird. Beispielsweise kann das Steigern einer Immunantwort
durch Stimulierung der B-Lymphozyt-Antigenfunktion in Fällen viraler
Infektionen nützlich
sein. Zusätzlich
können
systemische virale Erkrankungen, wie beispielsweise Grippe, Schnupfen
und Encephalitis durch Verabreichung einer stimulatorischen Form
von B-Lymphozyt-Antigenen systemisch gelindert werden.
-
Alternativ
können
antivirale Immunantworten in einem infizierten Patienten dgesteigert
werden durch Entfernen der T-Zellen aus dem Patienten, Kostimulieren
der T-Zellen in vitro mit viral antigen-gepulsten APCs, wobei entweder
ein Peptid exprimiert wird, das durch die erweiterten cDNAs codiert
wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, oder zusammen
mit einer stimulatorischen Form eines löslichen Peptids, das durch
die erweiterten cDNAs codiert wird, die von den hierin beschriebenen
5'-ESTs abgeleitet
ist, und Wiedereinführen
der in vitro präparierten
T-Zellen in den Patienten. Die infizierten Zellen sind nun in der Lage,
ein kostimulatorisches Signal an T-Zellen in vivo abzugeben, wodurch
die T-Zellen aktiviert werden.
-
In
einer anderen Anwendung kann die Hochregulierung oder Steigerung
der Antigenfunktion (vorzugsweise B-Lymphozyt-Antigenfunktion) bei
der Induktion von Tumorimmunität
nützlich
sein. Tumorzellen (z.B. Sarcom, Melanom, Lymphom, Leukämie, Neuroblastom,
Carcinom), die mit einer Nukleinsäure transfiziert sind, die
für mindestens
ein Peptid codiert, das durch cDNAs codiert wird, die von den hierin
beschriebenen 5'-ESTs
abgeleitet sind, können
einem Probanden verabreicht werden, um eine tumorspezifische Toleranz
in dem Probanden zu überwinden.
Wenn gewünscht,
kann die Tumorzelle transfiziert werden, um eine Kombination von
Peptiden zu exprimieren. Beispielsweise können von einem Patienten erhaltene
Tumorzellen ex vivo mit einem Expressionsvektor transfiziert werden,
der die Expression eines Peptids mit ausschließlich B7-2-artiger Aktivität oder in
Verbindung mit einem Peptid mit B7- 1-artiger Aktivität und/oder B7-3-artiger Aktivität steuert.
Die transfizierten Tumorzellen werden an den Patienten zurückgegeben,
um eine Expression der Peptide auf der Oberfläche der transfizierten Zelle
zu bewirken. Alternativ können
Gentherapietechniken verwendet werden, um eine Tumorzelle als Zielstruktur
für eine
Transfektion in vivo anzusprechen.
-
Das
Vorliegen der durch die erweiterten cDNAs codierten Peptide, die
von den erfindungsgemäßen 5'-ESTs abgeleitet
sind, mit der Aktivität
eines/von B-Lymphozyt-Antigens/Antigenen
auf der Tumorzellenoberfläche
stellt das notwendige Kostimulierungssignal für T-Zellen bereit, um eine
T-Zell vermittelte Immunantwort gegen die transfizierten Tumorzellen
zu induzieren. Darüber
hinaus können
Tumorzelyen, die keine MWC Klasse I- oder MHC Klasse II-Moleküle reexprimieren
können
oder unzureichende Mengen davon reexprimieren, mit Nukleinsäuren transfiziert
werden, die eine vollständige
oder einen Teil (z.B. ein verkürzter
Abschnitt einer zytoplasmatischen Domäne) einer MHC Klasse I α-Kette und β2-Microglobulin
oder einer MHC Klasse II α-Kette
und einer MHC Klasse II β-Kette
codieren, um so MHC Klasse I- bzw. MHC Klasse II-Proteine auf der Zelloberfläche zu exprimieren.
Die Expression geeigneter MHC Klasse I- oder MHC Klasse II-Moleküle in Verbindung
mit einem Peptid, das die Aktivität eines B-Lymphozyten-Antigens aufweist (z.B.
B7-1, B7-2, B7-3), induziert eine T-Zell vermittelte Immunantwort
gegen die transfizierte Tumorzelle. Gegebenenfalls kann auch ein
für ein
Antisense-Konstrukt codierendes Gen, das die Expression eines MHC
Klasse II assoziierten Proteins blockiert, wie beispielsweise die
Invariante Kette, ebenfalls mit einer für ein Peptid codierenden DNA
kotransfiziert werden, wobei dieses Peptid die Aktivität eines
B-Lymphozyten-Antigens aufweist, um so die Präsentation tumorassoziierter
Antigene zu fördern
und die tumorspezifische Immunität
zu induzieren. Daher kann die Induktion einer T-Zell vermittelten
Immunantwort in einem humanen Probanden ausreichen, um die tumorspezifische
Toleranz in dem Probanden zu überwinden.
Alternativ können,
wie unten ausführlicher
beschrieben wird, Gene, welche für
diese Immunsystemregulatorproteine codieren, oder Nukleinsäuren, welche
für die Expression
derartiger Proteine regulieren, in eine geeignete Wirtszelle eingeführt werden,
um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen.
-
Beispiel 34
-
Untersuchung
der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten
Proteine hinsichtlich einer Blutdruck-regulierenden Aktivität
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch hinsichtlich ihrer Blutdruck-regulierenden Aktivität beurteilt
werden. Beispielsweise kann die Wirkung der Proteine auf die embryonale
Stammzelldifferenzierung beurteilt werden. Zahlreiche Assays hinsichtlich
einer derartigen Aktivität
sind dem Fachmann bekannt, einschließlich der Assays, die in den
folgenden Referenzen beschrieben sind: Johansson et al., Cell. Biol.
15:141-151, 1995; Keller et al., Mol. Cell. Biol. 13:473-486, 1993;
McClanahan et al., Blood 81:2903-2915, 1993.
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine,
können
auch hinsichtlich ihres Einflusses auf die Lebensdauer von Stammzellen
und die Stammzelldifferenzierung beurteilt werden. Zahlreiche Assays
hinsichtlich einer derartigen Aktivität sind dem Fachmann bekannt,
einschließlich
der Assays, die in den folgenden Referenzen beschrieben sind: Freshney,
Methylzellulosekoloniebildende Assays, in „Culture of Hematopoietic
Cells", Freshney
et al., Hrsg., Seiten 265–268,
Wiley-Liss, Inc., New York, NY. 1994; Hirayama et al., Proc. Natl.
Acad. Sci. USA 89:5907–5911,
1992; McNiece und Briddell, in "Culture
of Hematopoietic Cells",
supra; Neben et al., Exp. Hematol. 22:353-359, 1994; Ploemacher
und Cobblestone in "Culture of
Hematopoietic Cells",
supra, 1–21;
Spooncer et al., in "Culture
of Hematopoietic Cells",
supra 163–179
und Sutherland in Culture of Hematopoietic Cells, supra, 139–162.
-
Diejenigen
Proteine, welche eine Blutdruck-regulierende Aktivität aufweisen,
können
dann als Pharmazeutika formuliert werden und verwendet werden, um
klinische Erkrankungen zu behandeln, bei welchen eine Regulierung
des Blutdrucks günstig
ist, wie beispielsweise bei der Behandlung von Knochenmark- oder Lymphoidzellmängeln. Eine
Beteiligung bei der Regulierung von Blutdruck wird sogar auch durch
eine geringfügige
biologische Aktivität
zugunsten von koloniebildenden Zellen oder von faktorabhängigen Zelllinien
deutlich. Zum Beispiel zeigen Proteine einen Nutzen, die das Wachstum
und die Proliferation von Erythroidvorläuferzellen allein oder in Kombination
mit anderen Zytokinen stimulieren, beispielsweise bei der Behandlung verschiedener
Anämien
oder zur Verwendung in Verbindung mit Bestrahlung/Chemotherapie,
um die Produktion von Erythroidvorläufer und/oder Erythroidzellen
zu stimulieren. Proteine, die das Wachstum und die Proliferation
von Knochenmarkszellen stimulieren, wie beispielsweise Granulozyten
und Monozyten/Macrophagen (d.h. herkömmliche CSF-Aktivität), können beispielsweise
in Verbindung mit Chemotherapie nützlich sein, um einer nachfolgenden
Knochenmarksdepression vorzubeugen oder diese zu behandeln. Proteine,
die das Wachstum und die Proliferation von Megakaryozyten und infolge
dessen von Plättchen
unterstützen,
ermöglichen
die Vorbeugung oder die Behandlung verschiedener Plättchenerkrankungen,
wie beispielsweise von Thrombozytopenie, und können im Allgemeinen anstelle
von oder ergänzend
zu Plättchentransfusionen
verwendet werden. Proteine, die das Wachstum und die Proliferation
von hämatopoetischen
Stammzellen unterstützen,
die in der Lage sind, zu beliebigen und allen oben erwähnten hämatopoetischen
Zellen zu reifen, können
deshalb sowohl bei verschiedenen Stammzellerkrankungen ihren therapeutischen
Nutzen finden (wie beispielsweise denjenigen, die gewöhnlich mit
Transplantation behandelt werden, einschließlich aber ohne Beschränkung auf
aplastische Anämie
und paroxysmale nächtliche
Hämoglobinurie),
als auch bei der Neubesiedlung des Stammzellkompartiments nach Bestrahlung/Chemotherapie
entweder in vivo oder ex vivo (d.h. in Verbindung mit einer Knochenmarktransplantation
oder mit einer peripheren Stammzelltransplantation (homolog oder
heterolog)), als auch als normale oder genetisch veränderte Zellen
zur Gentherapie. Alternativ können,
wie es unten ausführlicher
beschrieben wird, Gene, die für
Proteine mit Blutdruck-regulierender Aktivität codieren, oder Nukleinsäuren, welche
die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingebracht
werden, um wie gewünscht
die Expression der Proteine zu steigern oder zu verringern.
-
Beispiel 35
-
Untersuchung der durch
die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine
hinsichtlich der Regulation von Gewebewachstum
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch hinsichtlich ihrer Wirksamkeit auf Gewebewachstum beurteilt
werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem
Fachmann bekannt, einschließlich
der Assays, die in der internationalen Patentveröffentlichung Nr. WO 95/16035,
der internationalen Patentveröffentlichung
Nr. WO 95/05846 und der internationalen Patentveröffentlichung
Nr. WO 91/07491 offenbart sind.
-
Assays
zur Wundheilungsaktivitätumfassen
ohne Beschränkung
die Assays, die beschrieben sind in: Winter, Epidermal Wound Healing,
Seiten 71–112,
Maibach und Rovee, Hrsg., Year Book Medical Publishers, Inc., Chicago,
modifiziert von Eaglstein und Mertz, J. Invest. Dermatol. 71:382-84,
1978.
-
Diejenigen
Proteine, die an der Regulation von Gewebewachstum beteiligt sind,
können
dann als Pharmazeutika formuliert werden und verwendet werden, um
klinische Erkrankungen zu behandeln, bei denen die Regulation von
Gewebewachstum günstig
ist. Beispielsweise kann ein Protein, das durch erweiterte cDNAs
codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, sowohl in Zusammensetzungen nützlich sein,
die zum Knochen-, Knorpel-, Sehnen-, Bänder- und/oder Nervengewebewachstum
oder zur Regeneration verwendet werden, als auch bei der Wundheilung
und zur Erneuerung und zum Ersatz von Gewebe, sowie bei der Behandlung
von Verbrennungen, Schnittwunden und Entzündungen Verwendung finden.
-
Ein
Protein, das durch erweiterte cDNAs codiert wird, die aus den hierin
beschriebenen 5'-ESTs
abgeleitet sind, das Knorpel- und/oder Knochenwachstum unter Umständen induziert,
unter denen Knochen normalerweise nicht gebildet wird, findet bei
der Heilung von Knochenbrüchen
und eines Knorpelschadens oder Defektes bei Menschen oder anderen
Tieren Anwendung. Eine derartige Präparation, die auf ein erfindungsgemäßes Protein
zurückgreift,
kann prophylaktisch zur Linderung sowohl von geschlossenen als auch
offenen Brüchen
und auch für
eine verbesserte Fixierung künstlicher
Verbindungsstücke
verwendet werden. Eine de novo-Knochensynthese, die durch ein osteogenes
Mittel induziert wird, trägt
zur Reparatur congenitaler, traumainduzierter oder onkologischer resektionsinduzierter,
den Schädel
betreffender Defekte bei und ist in der kosmetisch-plastischen Chirurgie
ebenfalls nützlich.
-
Ein
erfindungsgemäßes Protein
kann auch bei der Behandlung peridontaler Erkrankungen und anderen
Verfahren zur Zahnreparatur verwendet werden. Solche Mittel können eine
Umgebung bereitstellen, um knochenbildende Zellen anzuziehen, das
Wachstum knochenbildender Zellen zu stimulieren oder die Differenzierung
von Vorläufern
knochenbildender Zellen zu induzieren. Ein erfindungsgemäßes Protein
kann auch bei der Behandlung von Osteoporose und Osteoarthritis
nützlich
sein, wie beispielsweise durch Stimulation der Knochen- und/oder Knorpelreparatur
oder durch Blockieren von Entzündungen
oder Prozessen des Gewebeabbaus (Collagenaseaktivität, Osteoklastenaktivität etc.),
die durch Entzündungsprozesse
vermittelt werden.
-
Eine
andere Kategorie geweberegenerierender Aktivität, die dem Protein zugeschrieben
werden kann, das durch erweiterte cDNAs codiert wird, die von den
hierin beschriebenen 5'-ESTs
abgeleitet sind, ist die Sehnen/Bänderbildung. Ein Protein, das
von erweiterten cDNAs codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet
sind, das sehnen/bänderartiges
Gewebe oder andere Gewebebildung unter Umständen induziert, unter welchen
sich Gewebe normalerweise nicht bildet, findet beim Heilen von Sehnen-
oder Bänderrissen,
Fehlbildungen oder anderen Sehnen- oder Bänderdefekten bei Menschen oder
anderen Tieren Anwendung. Eine derartige Präparation, die ein Protein verwendet,
welches sehnen/bänderartiges
Gewebe induziert, kann sowohl bei der Schadensvorbeugung für Sehnen-
oder Bändergewebe
prophylaktische Anwendung finden als auch für eine verbesserten Fixierung
von Sehnen oder Bändern
gegenüber
Knochen oder anderen Geweben, sowie beim Reparieren von Defekten
von Sehnen- oder Bändergewebe
verwendet werden. Eine de novo-Bildung
von sehnen/bänderartigen
Geweben, das durch eine Zusammensetzung induziert wird, die durch
erweiterte cDNAs codiert wird, die von den hierin beschriebenen
5'-ESTs abgeleitet
sind, trägt
zur Reparatur von Sehnen- oder Bänderdefekten
mit congenitalem, traumatischem oder anderem Ursprung bei und ist
in der kosmetisch-plastischen Chirurgie zum Anbringen oder Reparieren
von Sehnen oder Bändern
ebenfalls anwendbar. Die Zusammensetzungen, die durch erweiterte
cDNAs codiert werden, die von den hierin beschriebenen 5'-ESTs abgeleitet
sind, können
eine Umgebung bereitstellen, um bänder- oder sehnenbildende Zellen
anzuziehen, das Wachstum von bänder-
oder sehnenbildenden Zellen zu stimulieren, die Differenzierung
von Vorläufern
von bänder-
oder sehnenbildenden Zellen zu induzieren oder das Wachstum von
Bänder-/Sehnenzellen
oder Vorläuferzellen
ex vivo für
eine Rückgabe
in vivo zu induzieren, um dort eine Gewebereparatur zu bewirken.
Die hierin beschriebenen Zusammensetzungen können auch bei der Behandlung von
Tendinitis, Carpaltunnelsyndrom und anderen Sehnen- oder Bänderdefekten
nützlich
sein. Die Zusammensetzungen können
wie im Fachbereich bekannt auch eine geeignete Matrix und/oder ein
absonderndes Mittel als Träger
enthalten.
-
Das
Protein, das durch erweiterte cDNAs codiert wird, die von den hierin
beschriebenen 5'-ESTs
abgeleitet sind, kann auch bei der Proliferation neuraler Zellen
und zur Regenerierung von Nerven- und Gehirngewebe anwendbar sein,
d.h. sowohl zur Behandlung von Erkrankungen des zentralen und peripheren
Nervensystems und Neuropathien als auch von mechanischen und traumatischen
Erkrankungen, die eine Degenerierung, ein Absterben oder Trauma
von neuralen Zellen oder Nervengewebe umfassen. Insbesondere kann ein
Protein zur Behandlung von Erkrankungen des peripheren Nervensystems
verwendet werden, wie beispielsweise Verletzungen peripherer Nerven,
peripherer Neuropathie und lokalisierten Neuropathien und Erkrankungen
des zentralen Nervensystems, wie beispielsweise Alzheimer-Erkrankung,
Parkinson-Erkrankung, Huntington-Erkrankung, amyotropher Lateralsklerose
und Shy-Drager-Syndrom. Weitere Erkrankungen, die in Übereinstimmung
mit der vorliegenden Erfindung behandelt werden können, umfassen
mechanische und traumatische Erkrankungen, wie beispielsweise Rückenmarkserkrankungen,
Schädeltrauma
und cerebrovaskuläre
Erkrankungen, wie beispielsweise Apoplexie. Periphere Neuropathien,
die von einer Chemotherapie oder anderen medizinischen Therapien
herrühren,
können
ebenfalls unter Verwendung eines erfindungsgemäßen Proteins behandelbar sein.
-
Erfindungsgemäße Proteine
können
auch nützlich
sein, um ein besseres Verschließen
von nicht heilenden Wunden zu fördern,
einschließlich
aber ohne Beschränkung
auf Druckgeschwüre,
mit vaskulärer
Insuffizienz im Zusammenhang stehende Geschwüre, chirurgische und traumatische
Wunden und dergleichen.
-
Es
wird erwartet, dass ein Protein, das durch erweiterte cDNAs codiert
wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch eine Aktivität hinsichtlich
der Erzeugung oder Regenerierung anderer Gewebe aufweist, wie beispielsweise
von Organen (einschließlich
zum Beispiel Bauchspeicheldrüse,
Leber, Darm, Niere, Haut, Endothel), Muskeln (glatt, quergestreift
oder Herz) und vaskulärem
Gewebe (einschließlich
vaskulärem
Endothel) oder zur Wachstumsförderung
von Zellen dient, die solches Gewebe umfassen. Ein Teil der gewünschten
Wirkungen kann durch Hemmung oder Veränderung fibrotischer Narbenbildung erreicht
werden, um so eine Bildung von normalem Gewebe zu ermöglichen.
Ein erfindungsgemäßes Protein kann
auch angiogenetische Aktivität
aufweisen.
-
Ein
Protein, das durch erweiterte cDNAs codiert wird, die von den hierin
beschriebenen 5'-ESTs
abgeleitet sind, kann ebenfalls zum Schutz oder zur Regeneration
des Darms, sowie zur Behandlung von Lungen- oder Leberfibrose, für Reperfusionsverletzungen
in verschiedenen Geweben und Zuständen, die aus einem systemischen
Zytokinschaden herrühren,
anwendbar sein.
-
Ein
Protein, das durch erweiterte cDNAs codiert wird, die von den hierin
beschriebenen 5'-ESTs
abgeleitet sind, kann auch beim Fördern oder Hemmen der Differenzierung
von oben beschriebenen Geweben aus Vorläufergeweben oder -zellen oder
zur Hemmung des Wachstums von oben beschriebenen Geweben nützlich sein.
-
Alternativ
können,
wie unten ausführlicher
beschrieben wird, Gene, die für
Proteine mit wachstumsregulierender Aktivität codieren, oder Nukleinsäuren, welche
die Expression derartiger Proteine regulieren, in geeignete Wirtszellen
eingebracht werden, um die Expression der Proteine wie gewünscht zu
erhöhen
oder zu erniedrigen.
-
Beispiel 36
-
Untersuchung
der durch die erweiterten cDNAs oder durch Abschnittn davon exprimierten
Proteine hinsichtlich der Regulation von Fortpflanzungshormonen
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch hinsichtlich ihrer Fähigkeit
beurteilt werden, Fortpflanzungshormone, wie beispielsweise Follikel
stimulierende Hormone, zu regulieren. Zahlreiche Assays hinsichtlich
einer derartigen Aktivität
sind dem Fachmann bekannt, einschließlich der Assays, die in den
folgenden Referenzen beschrieben werden: Vale et al., Endocrinol. 91:562-572,
1972; Ling et al., Nature 321:779-782, 1986; Vale et al., Nature
321:776-779, 1986; Mason et al., Nature 318:659-663, 1985; Forage
et al., Proc. Natl. Acad. Sci. USA 83:3091-3095, 1986, Kapitel 6.12
in "Current Protocols
in Immunology",
Coligan et al. Hrsg. Greene Publishing Associates and Wiley-Interscience;
Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS
103:140-146, 1995; Muller et al., Eur. J. Immunol. 25:1744-1748;
Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al.,
J. Immunol. 153:1762-1768, 1994.
-
Diejenigen
Proteine, welche eine Aktivität
wie Fortpflanzungshormone oder wie Regulatoren der Zellbewegung
aufweisen, können
dann als Pharmazeutika formuliert werden und verwendet werden, um
klinische Erkrankungen zu behandeln, bei welchen die Regulation
von Fortpflanzungshormonen günstig
ist. Beispielsweise kann ein Protein, das durch erweiterte cDNAs
codiert wird, die von den hierin beschriebenen 5'-ESTs abgeleitet sind, auch mit Activin
oder Inhibin in Zusammenhang stehende Aktivitäten aufweisen. Inhibine sind durch
ihre Fähigkeit
gekennzeichnet, die Freisetzung des follikelstimulierenden Hormons
(FSH) zu hemmen, während
Activine durch ihre Fähigkeit
gekennzeichnet sind, die Freisetzung von FSH zu stimulieren. Daher kann
ein Protein, das durch erweiterte cDNAs codiert wird, die von den
hierin beschriebenen 5'-ESTs
abgeleitet sind, allein oder in Form von Heterodimeren mit einem
Mitglied der Inhibin α-Familie
als Verhütungsmittel
anwendbar sein, wobei dies auf der Fähigkeit der Inhibine basiert,
die Fruchtbarkeit in weiblichen Säugern sowie die Spermatogenese
in männlichen
Säugern
zu senken. Die Verabreichung ausreichender Mengen anderer Inhibine
kann in diesen Säugern
Unfruchtbarkeit induzieren. Alternativ kann das erfindungsgemäße Protein
als Homodimer oder Heterodimer mit anderen Proteinuntereinheiten
der Inhibin-B-Gruppe als Fruchtbarkeitinduzierendes Therapeutikum
verwendet werden, wobei dies auf der Fähigkeit von Activinmolekülen basiert,
die FSH-Freisetzung aus Zellen des Hypophysenvorderlappens zu stimulieren.
Siehe zum Beispiel US-Patent 4,798,885. Ein erfindungsgemäßes Protein
kann auch zur Förderung
des Beginns der Fruchtbarkeit in nicht geschlechtsreifen Säugetieren
anwendbar sein, um so die reproduktive Lebensleistung von Haustieren,
wie beispielsweise Kühen,
Schafen und Schweinen, zu erhöhen.
-
Alternativ
können,
wie es unten ausführlicher
beschrieben wird, Gene, die für
Proteine mit regulierender Aktivität im Hinblick auf Fortpflanzungshormone
codieren, oder Nukleinsäuren,
welche die Expression derartiger Proteine regulieren, in geeignete
Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen.
-
Beispiel 37
-
Untersuchung der durch
die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine
hinsichtlich ihrer chemotaktischen/chemokinetischen Aktivität
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch bezüglich
ihrer chemotaktischen/chemokinetischen Aktivität beurteilt werden. Beispielsweise
kann ein Protein, das durch erweiterte cDNAs codiert wird, die von
den hierin beschriebenen 5'-ESTs
abgeleitet sind, chemotaktische oder chemokinetische Aktivität für Säugetierzellen
aufweisen (z.B. als ein Chemokin wirken), einschließlich zum Beispiel
Monozyten, Fibroblasten, Neutrophile, T-Zellen, Mastzellen, Eosinophile,
Epithel- und/oder Endothelzellen. Chemotaktische und chemokinetische
Proteine können
verwendet werden, um eine gewünschte
Zellpopulation zu einen gewünschten
Wirkungsort hin zu mobilisieren oder anzuziehen. Chemotaktische
oder chemokinetische Proteine stellen sowohl bestimmte Vorteile
bei der Behandlung von Wunden und anderen Gewebetrauma als auch
bei der Behandlung lokalisierter Infektionen bereit. Beispielsweise
kann das Anziehen von Lymphozyten, Monozyten oder Neutrophilen zu
Tumoren oder Infektionsstellen zu verbesserten Immunantworten gegen
den Tumor oder das infektiöse
Mittel führen.
-
Ein
Protein oder Peptid weist für
eine bestimmte Zellpopulation chemotaktische Aktivität auf, wenn
es die gerichtete Orientierung oder Bewegung einer solchen Zellpopulation
direkt oder indirekt stimulieren kann. Vorzugsweise weist das Protein
oder Peptid die Fähigkeit
auf, die gerichtete Bewegung der Zellen direkt zu stimulieren. Ob
ein bestimmtes Protein chemotaktische Aktivität für eine Zellpopulation aufweist,
kann unter Verwendung eines derartigen Proteins oder Peptids auf
einfache Weise in jedem bekannten Assay zur Chemotaxis von Zellen
bestimmt werden.
-
Die
Aktivität
eines erfindungsgemäßen Proteins
kann neben anderen Möglichkeiten
durch die folgenden Verfahren gemessen werden: Assays zur chemotaktischen
Aktivität
(die Proteine identifizieren, die Chemotaxis induzieren oder verhindern)
bestehen aus Assays, die sowohl die Fähigkeit eines Proteins messen, die
Wanderung von Zellen über
eine Membran hinweg zu induzieren als auch die Fähigkeit eines Proteins, die Adhäsion einer
Zellpopulation an eine andere Zellpopulation zu induzieren. Geeignete
Assays zur Bewegung und Adhäsion
umfassen ohne Beschränkung
diejenigen, welche beschrieben sind in: „Current Protocols in Immunology", Hrsg. von Coligan,
Kruisbeek, Margulies, Shevach und Strober, Pub. Greene Publishing
Associates and Wiley-Interscience, Kapitel 6.12:6.12.1-6.12.28;
Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS
103:140-146, 1995; Mueller et al., Eur. J. Immunol. 25:1744-1748;
Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al.,
J. Immunol., 153:1762-1768, 1994.
-
Beispiel 38
-
Untersuchung
der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten
Proteine hinsichtlich der Regulation der Blutgerinnung
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch hinsichtlich ihrer Wirkungen auf die Blutgerinnung beurteilt
werden. Zahlreiche Assays hinsichtlich einer derartigen Aktivität sind dem
Fachmann bekannt, einschließlich
der Assays, die in den folgenden Referenzen offenbart sind: Linet
et al., J. Clin. Pharmacol. 26:131-140, 1986; Burdick et al., Thrombosis
Res. 45:413-419, 1987; Humphrey et al., Fibrinolysis 5:71-79, 1991;
Schaub, Prostaglandins 35:467-474, 1988.
-
Diejenigen
Proteine, welche an der Regulierung der Blutgerinnung beteiligt
sind, können
dann als Pharmazeutika formuliert werden und verwendet werden, um
klinische Erkrankungen zu behandeln, bei welchen die Regulierung
der Blutgerinnung günstig
ist. Beispielsweise kann ein erfindungsgemäßes Protein hämostatische
oder thrombolytische Aktivität
aufweisen. Im Ergebnis wird von einem derartigen Protein erwartet, dass
es bei der Behandlung verschiedener Gerinnungskrankheiten (einschließlich Erbrankheiten,
wie zum Beispiel Bluterkrankheiten) oder zur Steigerung der Gerinnung
und anderen hämostatischen
Ereignissen beim Behandeln von Wunden, die aus Trauma, chirurgischen
Eingriffen oder anderen Gründen
herrühren,
nützlich ist.
Ein erfindungsgemäßes Protein
kann auch nützlich
sein zur Auflösung
oder zur Hemmung der Bildung von Thrombosen und zur Behandlung und
Vorbeugung von Erkrankungen, die sich daraus ergeben (wie beispielsweise
Herzinfarkt und Infarkt von Gefäßen des
zentralen Nervensystems (z.B. Apoplexie)). Alternativ können, wie
unten ausführlicher
beschrieben wird, Gene, die für
Proteine mit Blutgerinnungsaktivität codieren, oder Nukleinsäuren, welche
die Expression derartiger Proteine regulieren, in geeignete Wirtszellen
eingefügt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen.
-
Beispiel 39
-
Untersuchung der durch
die erweiterten cDNAs oder durch Abschnitte davon exprimierten Proteine
hinsichtlich ihrer Beteiligung bei Rezeptor/Ligand-Wechselwirkungen
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch hinsichtlich ihrer Beteiligung bei Rezeptor/Ligandwechselwirkungen
beurteilt werden. Zahlreiche Assays im Hinblick auf eine derartige
Beteiligung sind dem Fachmann bekannt, einschließlich der Assays, die in den
folgenden Referenzen offenbart werden: Kapitel 7. 7.28.1-7.28.22
in "Current Protocols
in Immunology",
Coligan et al. Hrsg. Greene Publishing Associates and Wiley-Interscience; Takai
et al., Proc. Natl. Acad. Sci. USA 84:6864-6868, 1987; Bierer et
al., J. Exp. Med. 168:1145-1156, 1988; Rosenstein et al., J. Exp.
Med. 169:149-160,
1989; Stoltenborg et al., J. Immunol. Methods 175:59-68, 1994; Stitt
et al., Cell 80:661-670, 1995; Gyuris et al., Cell 75:791-803, 1993.
-
Beispielsweise
können
die Proteine, die durch erweiterte cDNAs codiert werden, die von
den hierin beschriebenen 5'-ESTs
abgeleitet sind, auch eine Aktivität als Rezeptoren, Rezeptorliganden
oder Inhibitoren oder als Agonisten von Rezeptor/Ligandwechselwirkungen
aufweisen. Beispiele für
solche Rezeptoren und Liganden umfassen ohne Beschränkung Zytokinrezeptoren
und ihre Liganden, Rezeptorkinasen und ihre Liganden, Rezeptorphosphatasen
und ihre Liganden, Rezeptoren, die an Zell-Zell-Wechselwirkungen
beteiligt sind und ihre Liganden (einschließlich aber ohne Beschränkung auf
zelluläre
Adhäsionsmoleküle (wie
beispielsweise Selektine, Integrine und ihre Liganden) und Rezeptor/Ligandpaare,
die bei der Antigenpräsentation,
Antigenerkennung und an der Entwicklung zellulärer und humoraler Immunantworten
beteiligt sind). Rezeptoren und Liganden sind auch zum Screening
nach möglichen
Peptiden oder kleinen Molekülen,
die als Inhibitoren der relevanten Rezeptor/Ligandwechselwirkung
wirken, nützlich.
Ein Protein, das durch erweiterte cDNAs codiert wird, die von den
hierin beschriebenen 5'-ESTs
abgeleitet sind (einschließlich
aber ohne Beschränkung auf
Fragmente von Rezeptoren und Liganden), kann selbst als Inhibitor
von Rezeptor/Ligandwechselwirkungen verwendet werden. Alternativ,
wie es unten ausführlicher
beschrieben wird, können
Gene, die für
Proteine codieren, die bei Rezeptor/Ligandwechselwirkungen beteiligt
sind, oder Nukleinsäuren,
welche die Expression derartiger Proteine regulieren, in geeignete
Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen.
-
Beispiel 40
-
Untersuchung
der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten
Proteine hinsichtlich entzündungshemmender
Aktivität
-
Die
durch die erweiterten cDNAs oder einen Abschnitt davon codierten
Proteine können
auch hinsichtlich ihrer entzündungshemmenden
Aktivität
beurteilt werden. Die entzündungshemmenden
Aktivität
kann erreicht werden durch Bereitstellen eines Stimulus für an der
Entzündungsreaktion
beteiligte Zellen, durch Hemmung oder Förderung von Zell-Zell-Wechselwirkungen
(wie zum Beispiel Zelladhäsion),
durch Hemmung oder Förderung
von am Entzündungsprozess
beteiligter Zellchemotaxis, durch Hemmung oder Förderung von Flüssigkeitsaustritt
aus der Zelle oder durch Stimulierung oder Unterdrückung der
Produktion anderer Faktoren, die eine Entzündungsreaktion auf direktere
Weise hemmen oder fördern.
Proteine, die solche Aktivitäten
aufweisen, können
verwendet werden, um entzündliche
Zustände
zu behandeln, einschließlich
chronischer oder akuter Zustände,
einschließlich
aber ohne Beschränkung
auf Entzündungen,
die im Zusammenhang stehen mit einer Infektion (wie zum Beispiel
einem septischen Schock, einer Sepsis oder einem systemischem Entzündungsreaktionssyndrom),
Ischämie-Reperfusionsverletzung,
Endotoxin-Sterblichkeit, Arthritis, komplementvermittelte hyperakute
Abstoßungsreaktion,
Nephritis, Zytokin- oder chemokininduzierte Lungenverletzung, entzündliche
Darmerkrankung, Crohn-Erkrankung oder Erkrankungen, welche sich
aus einer Überproduktion von
Zytokinen ergeben, wie beispielsweise TNF oder IL-1. Erfindungsgemäße Proteine
können
auch nützlich sein,
um Anaphylaxie und Hyperempfindlichkeit gegenüber einer anti genen Substanz
oder einem antigenen Material zu behandeln. Alternativ können, wie
unten ausführlicher
beschrieben wird, Gene, die für
Proteine mit entzündungshemmender
Aktivität
codieren, oder Nukleinsäuren,
welche die Expression derartiger Proteine regulieren, in geeignete
Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen.
-
Beispiel 41
-
Untersuchung
der durch die erweiterten cDNAs oder durch Abschnitte davon exprimierten
Proteine hinsichtlich einer Aktivität bei der Hemmung von Tumoren
-
Die
durch die erweiterten cDNAs oder Abschnitte davon codierten Proteine
können
auch hinsichtlich ihrer Aktivität
bei der Hemmung von Tumoren beurteilt werden. Zusätzlich zu
den oben beschriebenen Aktivitäten
zur immunologischen Behandlung oder Vorbeugung von Tumoren kann
ein erfindungsgemäßes Protein eine
andere Antitumoraktivität
aufweisen. Ein Protein kann Tumorwachstum direkt oder indirekt (wie
zum Beispiel durch ADCC) hemmen. Ein Protein kann seine Wirkung
bei der Tumorhemmung zeigen durch Einwirken auf Tumorgewebe oder
Tumorvorläufergewebe,
durch Hemmung der Bildung von Geweben, die notwendig sind, um das
Tumorwachstum zu unterstützen
(wie beispielsweise durch Hemmung von Angiogenese), durch Auslösen der
Produktion anderer Faktoren, Mittel oder Zelltypen, welche das Tumorwachstum
hemmen, oder durch Unterdrücken,
Entfernen oder Hemmen von Faktoren, Mitteln oder Zelltypen, welche
das Tumorwachstum fördern.
Alternativ können,
wie unten ausführlicher
beschrieben wird, Gene, die für
Proteine mit einer Tumor hemmenden Aktivität codieren, oder Nukleinsäuren, welche
die Expression derartiger Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu
erniedrigen.
-
Ein
erfindungsgemäßes Protein
kann auch eine oder mehrere der folgenden zusätzlichen Aktivitäten oder
Wirkungen aufweisen: Hemmung des Wachstums, Infektion oder Funktion
von, oder das Abtöten
von infektiösen
Mitteln, einschließlich,
aber ohne Beschränkung
auf Bakterien, Viren, Pilze und andere Parasiten; Einwirkung auf
körperliche
Merkmale (unterdrückend
oder verstärkend),
einschließlich,
aber ohne Beschränkung
auf Größe, Gewicht,
Haarfarbe, Augenfarbe, Haut, Fett-zu-Fettfreiverhältnis oder
eine andere Gewebepigmentierung oder Größe oder Form von Organen oder
des Körpers
(beispielsweise Brustvergrößerung oder -verkleinerung, Änderung
der Knochenform oder -gestalt); Einwirken auf den Biorhythmus oder
24-Stunden-Zyklen oder Rhythmen: Einwirken auf die Fruchtbarkeit
von männlichen
oder weiblichen Probanden; Einwirken auf den Metabolismus, Katabolismus,
Anabolismus, die Verarbeitung, die Verwertung, Speicherung oder
Entfernung von diätischem
Fett, Lipid, Protein, Kohlenhydrat, Vitaminen, Mineralien, Cofaktoren
oder anderen Ernährungsfaktoren
oder -komponente(n); Einwirken auf Verhaltensmerkmale, einschließlich, aber
ohne Beschränkung
auf Appetit, Libido, Stress, Denkfähigkeit (einschließlich kognitiver
Erkrankungen), Depression (einschließlich depressiver Erkrankungen)
und gewalttätigen
Verhaltensmustern; Bereitstellung analgetischer Wirkungen oder anderer
schmerzverringernder Wirkungen; Förderung von Differenzierung
und Wachstum von embryonalen Stammzellen in Linien, die sich von
hämotopoetischen
Linien unterscheiden; hormonelle oder endokrine Aktivität; im Fall
von Enzymen Korrektur von Mangelfunktionen des Enzyms und Behandlung
von Erkrankungen, die mit einer Mangelfunktion im Zusammenhang stehen;
Behandlung hyperproliferativer Erkrankungen (wie beispielsweise
Psoriasis); immunglobulinartiger Aktivität (wie beispielsweise die Fähigkeit, Antigene
oder ein Komplement zu binden); und die Fähigkeit, als Antigen in einer
Impfstoffzusammensetzung zu wirken, um eine Immunantwort gegen ein
derartiges Protein oder ein anderes Material oder eine Einheit, die
mit einem derartigen Protein kreuzreaktiv ist, hervorzurufen. Alternativ
können,
wie es unten ausführlicher beschrieben
wird, Gene, die für
Proteine codieren, die mit einer der oben dargelegten Aktivitäten in Zusammenhang
stehen, oder Nukleinsäuren,
welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu erniedrigen.
-
Beispiel 42
-
Identifizierung von Proteinen,
welche mit Polypeptiden wechselwirken, welche durch erweiterte cDNAs
codiert werden
-
Proteine,
die mit den Polypeptiden wechselwirken, die durch erweiterte cDNAs
codiert werden, die von den 5'-ESTs
oder Fragmenten davon abgeleitet sind, wie beispielsweise Rezeptorproteine,
können
unter Verwendung von zwei Hybridsystemen identifiziert werden, wie
beispielsweise dem Matchmaker Two Hybrid System 2 (Katalog Nr. K1604-1,
Clontech). Wie es im dem Kit beigelegten Handbuch beschrieben wird,
welches hierin durch Bezugnahme umfasst ist, werden die cDNAs, die
von den 5'-ESTs
abgeleitet sind, oder Fragmente davon in einen Expressionsvektor
insertiert, so dass sie sich im Leserahmen mit DNA befinden, welche
für die DNA-Bindungsdomäne des Hefetranskriptionsaktivators
GAL4 codiert. cDNAs in einer cDNA-Bibliothek, die für Proteine
codiert, die mit den Polypeptiden, die durch die erweiterten cDNAs
oder Abschnitte davon codiert werden, wechselwirken könnten, werden
in einen zweiten Expressionsvektor insertiert, so dass sie sich
im Leserahmen mit der DNA befinden, welche für die Aktivierungsdomäne von GAL4
codiert. Die zwei Expressionsplasmide werden in Hefe transformiert
und die Hefe wird auf Selektionsmedium ausplattiert, das sowohl
hinsichtlich einer Expression selektierbarer Marker auf jedem der
beiden Expressionsvektoren als auch hinsichtlich der GAL4-abhängigen Expression
des HIS3-Gens selektiert. Transformanten, die in der Lage sind,
auf Medium ohne Histidin zu wachsen, werden hinsichtlich GAL4-abhängiger IacZ-Expression
gescreent. Solche Zellen, die sowohl bezüglich der Histidinselektion
und des IacZ-Assays
positiv sind, enthalten Plasmide, die für Proteine codieren, die mit
den Polypeptiden wechselwirken, die durch die erweiterten cDNAs
oder Abschnitte codiert werden.
-
Alternativ
kann das System, das in Lustig et al., Methods in Enzymology 283:83-99,
1997 und im US-Patent Nr. 5,654,150 beschrieben wird, verwendet
werden, um Moleküle
zu identifizieren, die mit den Polypeptiden wechselwirken, die durch
erweiterte cDNAs codiert werden. In solchen Systemen werden in vitro-Transkriptionsreaktionen
bezüglich
eines Pools von Vektoren durchgeführt, die erweiterte cDNA-Inserts
enthalten, die stromabwärts
eines Promotors kloniert sind, der die in vitro-Transkription lenkt.
Die resultierenden mRNA-Pools werden in Xenopus laevis-Oozyten eingeführt. Die
Oozyten werden anschließend
hinsichtlich einer gewünschten
Aktivität
untersucht.
-
Alternativ
können
die vereinigten, wie oben beschrieben hergestellten in vitro-Transkriptionsprodukte in
vitro translatiert werden. Die vereinigten in vitro-Translationsprodukte
können
hinsichtlich einer gewünschten Aktivität oder hinsichtlich
einer Wechselwirkung mit einem bekannten Polypeptid untersucht werden.
-
Proteine
oder andere Moleküle,
die mit Polypeptiden wechselwirken, die durch erweiterte cDNAs codiert
werden, können
durch eine Vielfalt zusätzlicher
Techniken nachgewiesen werden. In einem Verfahren können Affinitätssäulen erstellt
werden, die das Polypeptid enthalten, das durch die erweiterte cDNA
oder einen Abschnitt davon codiert wird. In einigen Versionen dieses
Verfahrens enthält
die Affinitätssäule chimäre Proteine,
in denen das Protein, das durch die erweiterten cDNAs oder einen
Abschnitt davon codiert wird, mit einer Glutathion-S-Transferase fusioniert
ist. Ein Gemisch zellulärer
Proteine oder ein Pool wie oben beschrieben exprimierter Proteine
wird auf die Affinitätssäule aufgetragen.
Proteine, die mit dem Polypeptid wechselwirken, das an die Säule angefügt ist,
können
anschließend
isoliert und auf einem 2-D-Elektrophoresegel analysiert werden,
wie es in Rasmunsen et al., Electrophoresis 18:588-598, 1997, beschrieben
wird. Alternativ können
die Proteine, die auf der Affinitätssäule zurückgehalten werden, durch Verfahren,
die auf Elektrophorese basieren, gereinigt und sequenziert werden.
Das gleiche Verfahren kann verwendet werden, um Antikörper zu
isolieren, um Phagen-Display-Produkte zu screenen oder um humane
Phagen-Display-Antikörper
zu screenen.
-
Proteine,
die mit Polypeptiden wechselwirken, die durch erweiterte cDNAs oder
Abschnitte davon codiert werden, können auch unter Verwendung
eines optischen Biosensors durchmustert werden, wie er in Edwards
und Leatherbarrow, Analytical Biochemistry 246:1-6,1997, beschrieben
wird. Der Hauptvorteil des Verfahrens ist, dass es die Bestimmung
der Assoziierungsrate zwischen dem Protein und anderen wechselwirkenden
Molekülen
ermöglicht.
Daher ist es möglich,
spezifisch wechselwirkende Moleküle
mit einer hohen oder niedrigen Assoziierungsrate zu selektieren.
Normalerweise wird ein Zielmolekül
mit einer Sensoroberfläche
verknüpft
(über eine
Carboxymethyldextranmatrix) und eine Probe mit Testmolekülen wird
mit den Zielmolekülen
in Kontakt gebracht. Das Binden eines Testmoleküls an das Zielmolekül führt zu einer
Veränderung hinsichtlich
des Brechungsindex und/oder der Dicke. Diese Veränderung wird durch den Biosensor
detektiert, vorausgesetzt sie vollzieht sich im evaneszenten Feld
(das sich einige hundert Nanometer von der Sensoroberfläche ausdehnt).
In diesen Screening-Assays kann das Zielmolekül eines der Polypeptide sein,
die durch erweiterte cDNAs oder einen Abschnitt davon codiert werden,
und die Testprobe kann eine Sammlung von Proteinen sein, die aus
Geweben oder Zellen extrahiert wurde, ein Pool exprimierter Proteine,
kombinatorische Peptide und/oder chemische Bibliotheken oder Peptide
aus einem Phagen-Display. Die Gewebe oder Zellen, von welchen die
Testproteine extrahiert werden, können von jeder beliebigen Spezies
stammen.
-
In
anderen Verfahren wird ein Zielmolekül immobilisiert und die Testpopulation
ist eine Kollektion einzelner Polypeptide, die durch die erweiterten
cDNAs oder Abschnitte davon codiert wird.
-
Um
die Wechselwirkung der Proteine, die durch die erweiterten cDNAs
oder Abschnitte davon codiert werden, mit Arzneimitteln zu untersuchen,
kann das mit Mikrodialyse gekoppelte HPLC-Verfahren, das von Wang
et al., Chromatographia 44:205-208, 1997, beschrieben wurde, oder
das Affinitätskapillarelektrophoreseverfahren,
das von Busch et al., J. Chromatogr. 777:311-328, 1997, beschrieben
wurde, verwendet werden.
-
Es
wird vom Fachmann erkannt, dass die von den erweiterten cDNAs oder
Abschnitten davon exprimierten Proteine zusätzlich zu den oben spezifisch
aufgezählten
Aktivitäten
hinsichtlich zahlreicher anderer Aktivitäten untersucht werden können. Beispielsweise
können
die exprimierten Proteine im Hinblick auf Anwendungen beurteilt
werden, die Kontrolle und Regulierung von Entzündungen, Tumorproliferation
oder Metastasis, Infektionen oder andere klinische Zustände umfassen.
Zusätzlich
können
die von den erweiterten cDNAs oder Abschnitten davon exprimierten
Proteine als Nahrungsmittel oder kosmetische Mittel nützlich sein.
-
Die
von den cDNAs oder Abschnitten davon exprimierten Proteine können verwendet
werden, um Antikörper
zu erzeugen, die in der Lage sind, spezifisch an das exprimierte
Protein oder Fragmente davon zu binden, wie es in Beispiel 40 unten
beschrieben wird. Die Antikörper
können
in der Lage sein, an ein Volllängenprotein,
das durch eine cDNA codiert wird, die von einem 5'-EST abgeleitet ist,
an ein reifes Protein (d.h. das Protein, das durch Abspaltung des
Signalpeptids erzeugt wird), das durch eine cDNA codiert ist, die
von einem 5'-EST
abgeleitet ist, oder an ein Signalpeptid zu binden, das durch eine
cDNA codiert wird, die von einem 5'-EST abgeleitet ist. Alternativ können die
Antikörper
in der Lage sein, Fragmente mit mindestens 10 Aminosäuren der
Proteine, die durch die obigen cDNAs codiert werden, zu binden.
In einigen Ausführungsformen können die
Antikörper
in der Lage sein, Fragmente mit mindestens 15 Aminosäuren der
durch die obigen cDNAs codierten Proteine zu binden. In anderen
Ausführungsformen
können
die Antikörper
in der Lage sein, Fragmente mit mindestens 25 Aminosäuren der
Proteine, die durch die erweiterten cDNAs exprimiert werden, die
mindestens 25 Aminosäuren
der Proteine umfassen, die durch die obigen cDNAs codiert werden,
zu binden. In anderen Ausführungsformen
können
die Antikörper
in der Lage sein, Fragmente von mindestens 40 Aminosäuren der
durch die obigen cDNAs codierten Proteine zu binden.
-
Beispiel 43
-
Herstellung
eines Antikörpers
für ein
humanes Protein
-
Ein
im Wesentlichen reines Protein oder Polypeptid wird, wie in Beispiel
30 beschrieben, aus den transfizierten und transformierten Zellen
isoliert. Die Konzentration des Proteins in der Endpräparation
wird auf einen Wert im Bereich von wenigen μg/ml angepasst, beispielsweise
durch Konzentrierung auf einer Amicon-Filtervorrichtung. Ein monoklonaler
oder polyklonaler Antikörper
gegen das Protein kann anschließend
wie folgt hergestellt werden:
-
1. Herstellung
monoklonaler Antikörper
durch Hybridom-Fusion
-
Monoklonale
Antikörper
gegen Epitope beliebiger Peptide, die wie oben beschrieben identifiziert
und isoliert worden sind, können
gemäß dem klassischen
Verfahren von Kohler und Milstein, Nature 256:495, 1975, oder davon
abgeleiteten Verfahren aus murinen Hybridomen hergestellt werden.
In Kürze,
eine Maus wird wiederholt mit wenigen Mikrogramm des ausgewählten Proteins
oder davon abgeleiteter Peptide über
einen Zeitraum von wenigen Wochen beimpft. Die Maus wird anschließend getötet und
die Antikörper
erzeugenden Milzzellen werden isoliert. Die Milzzellen werden mittels
Polyethylenglycol mit Mausmyelomzellen fusioniert und der Überschuss
an unfusionierten Zellen wird zerstört durch Anzucht des Systems
auf selektiven Medien, die Aminopterin umfassen (HAT-Medien). Die erfolgreich
fusionierten Zellen werden verdünnt
und Aliquote der Verdünnung
werden in Wells einer Mikrotiterplatte platziert, wobei das Kulturwachstum
dort fortgeführt wird.
Antikörper-erzeugende
Klone werden durch Immunoassayverfahren über die Detektion eines Antikörpers im Überstandfluid
der Wells und davon abgeleiteten Verfahren identifiziert, wie beispielsweise
durch einen ELISA, der ursprünglich
von Engvall, Meth. Enzymol. 70:419, 1980, beschrieben wird. Ausgewählte positive
Klone können
expandiert werden und ihr monoklonales Antikörperprodukt kann zur Verwendung
geerntet werden. Ausführliche
Verfahren zur Herstellung monoklonaler Antikörper werden in Davis et al.,
in Basic Methods in Molecular Biology Elsevier, New York, Abschnitt
21-2 beschrieben.
-
2. Erzeugung
polyklonaler Antikörper
durch Immunisierung
-
Polyklonales
Antiserum, das Antikörper
für heterogene
Epitope eines einzelnen Proteins enthält, kann durch Immunisierung
geeigneter Tiere mit dem exprimierten Protein oder davon abgeleiteten
Peptiden hergestellt werden, wobei diese unverändert oder verändert sein
können,
um die Immunogenität
zu steigern. Eine effektive Herstellung polyklonaler Antikörper wird
durch viele Faktoren beeinflusst, die sowohl mit dem Antigen als
auch der Wirtsspezies im Zusammenhang stehen. Beispielsweise neigen
kleine Moleküle
dazu, weniger immunogen als andere zu sein und können die Verwendung von Trägern und
Adjuvantien erfordern. Die Reaktion der Wirtstiere kann in Abhängigkeit
von der Impfstelle und den Dosierungen ebenfalls variieren, wobei sowohl
unzureichende als auch überschüssige Dosen
an Antigen zu Antiseren mit niedrigem Titer führen. Geringe Dosen (ng-Mengen)
an Antigen, die an mehreren intradermalen Stellen verabreicht werden,
scheinen am verlässlichsten
zu sein. Ein effektives Immunisierungsprotokoll für Kaninchen
kann Vaitukaitis et al., J. Clin. Endocrinol. Metab. 33:988-991
(1971) entnommen werden.
-
Auffrischungsinjektionen
können
in regelmäßigen Abständen verabreicht
werden und Antiserum kann geerntet werden, wenn der Antikörpertiter
des Antiserums zu fallen beginnt, wobei dies halb quantitativ bestimmt
wird, wie beispielsweise durch doppelte Immunodiffusion in Agar
gegen bekannte Konzentrationen des Antigens. Siehe zum Beispiel
Ouchterlony et al., Kapitel 19 in: Handbook of Experimental Immunology
D. Wier (Hrsg.) Blackwell (1973). Die Plateaukonzentration des Antikörpers liegt
gewöhnlich
im Bereich von 0,1 bis 0,2 mg/ml Serum (etwa 12 μM). Die Affinität der Antiseren
für das
Antigen wird durch Erstellung kompetetiver Bindungskurven bestimmt,
wie es beispielsweise durch Fisher, D., Kapitel 42 in: Manual of
Clinical Immunology, 2. Ausgabe (Rose und Friedman, Hrsg.) Amer.
Soc. For Microbiol., Washington, D.C. (1980) beschrieben wird.
-
Nach
einem der beiden Protokolle hergestellte Antikörperpräparationen sind in quantitativen
Immunoassays zur Konzentrationsbestimmung von antigentragenden Substanzen
in biologischen Proben nützlich;
sie werden halb-quantitativ oder qualitativ verwendet, um das Vorliegen
eines Antigens in einer biologischen Probe zu identifizieren. Die
Antikörper
können
auch in therapeutischen Zusammensetzungen zum Abtöten von Zellen
verwendet werden, die das Protein exprimieren, oder sie können zur
Verringerung der Menge an Protein im Körper verwendet werden.
-
V. Verwendung von 5'-ESTs oder Sequenzen,
die davon erhältlich
sind oder Abschnitten davon, als Reagenzien
-
Die
hierin beschriebenen 5'-ESTs
(oder cDNAs oder genomische DNAs, die davon erhältlich sind) können als
Reagenzien in Isolierungsverfahren, diagnostischen Assays und forensischen
Verfahren verwendet werden. Beispielsweise können Sequenzen aus den 5'-ESTs (oder den cDNAs
oder den genomischen DNAs, die davon erhältlich sind) detektierbar markiert
werden und als Sonden verwendet werden, um andere Sequenzen zu isolieren,
die mit ihnen hybridisieren können.
Zusätzlich
können
Sequenzen aus 5'-ESTs
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) verwendet werden,
um PCR- Primer zu
konzipieren, die in Isolierungsverfahren, diagnostischen und forensischen
Verfahren verwendet werden.
-
I. Verwendung von 5'-ESTs oder davon
erhältlichen
Sequenzen oder Abschnitten davon in Isolierungsverfahren, diagnostischen
und forensischen Verfahren
-
Beispiel 44
-
Herstellung
von PCR-Primern und Amplifizierung von DNA
-
Die
5'-EST-Sequenzen
(oder cDNAs oder genomische DNAs, die davon erhältlich sind) können verwendet
werden, um PCR-Primer für
eine Vielfalt von Anwendungen herzustellen, einschließlich Isolierungsverfahren
zur Klonierung von Nukleinsäuren,
die in der Lage sind, an derartigen Sequenzen zu hybridisieren,
diagnostischen Techniken und forensischen Techniken. Die PCR-Primer sind mindestens
10 Basen und vorzugsweise mindestens 12, 15 oder 17 Basen lang.
Mehr bevorzugt sind die PCR-Primer mindestens 20–30 Basen lang. In einigen
Ausführungsformen
können
die PCR-Primer mehr als 30 Basen lang sein. Es ist bevorzugt, dass
die Primerpaare in etwa das gleiche G/C-Verhältnis aufweisen, so dass die
Schmelztemperaturen in etwa die gleichen sind. Eine Vielfalt an
PCR-Techniken ist dem Fachmann bekannt. Für eine Übersicht zur PCR-Technologie
siehe Molecular Cloning to Genetic Engineering, White Hrsg. In Methods
in Molecular Biology 67:Humana Press, Totowa 1997. In jedem dieser
PCR-Verfahren werden PCR-Primer an beiden Seiten der zu amplifizierenden
Nukleinsäuresequenzen
zusammen mit dNTPs und einer thermostabilen Polymerase, wie beispielsweise
Taq-Polymerase, Pfu-Polymerase oder Vent-Polymerase, zu einer geeignet hergestellten Nukleinsäureprobe
zugegeben. Die Nukleinsäure
in der Probe wird denaturiert und die PCR-Primer werden spezifisch
an komplementäre
Nukleinsäuresequenzen
in der Probe hybridisiert. Die hybridisierten Primer werden verlängert. Danach
wird ein weiterer Zyklus aus Denaturierung, Hybridisierung und Verlängerung
begonnen. Zur Erzeugung eines amplifizierten Fragments, das die
Nukleinsäuresequenz
zwischen den Primerstellen enthält,
werden die Zyklen mehrmals wiederholt.
-
Beispiel 45
-
Verwendung von 5'-ESTs als Sonden
-
Sonden,
die von 5'-ESTs
abgeleitet sind (oder von cDNAs oder genomischen DNAs, die davon
erhältlich
sind), einschließlich
Volllängen-cDNAs
oder genomischen Sequenzen, können
mit dem Fachmann bekannten detektierbaren Markierungen, einschließlich Radioisotopen
und nicht radioaktiven Markierungen, markiert werden, um eine detektierbare
Sonde bereitzustellen. Die detektierbare Sonde kann einzelsträngig oder
doppelsträngig
sein und kann unter Verwendung von dem Fachmann bekannten Techniken
hergestellt werden, einschließlich
in vitro-Transkription, Nick-Translation oder Kinasereaktionen.
Eine Nukleinsäureprobe, die
eine Sequenz enthält,
die in der Lage ist, mit der markierten Sonde zu hybridisieren,
wird mit der markierten Sonde in Kontakt gebracht. Wenn die Nukleinsäure in der
Probe doppelsträngig
ist, kann sie vor dem Inkontaktbringen mit der Sonde denaturiert
werden. In einigen Anwendungen kann die Nukleinsäureprobe auf einer Oberfläche, wie
beispielsweise einer Nitrozellulose- oder einer Nylonmembran, immobilisiert
werden. Die Nukleinsäureprobe
kann Nukleinsäuren
umfassen, die aus einer Vielfalt an Quellen erhalten wurden, einschließlich genomischer
DNA, cDNA-Bibliotheken, RNA oder Gewebeproben.
-
Verfahren,
die verwendet werden, um das Vorliegen von Nukleinsäuren zu
detektieren, die in der Lage sind, an die detektierbare Sonde zu
hybridisieren, umfassen allgemein bekannte Techniken, wie beispielsweise
Southern Blotting, Northern Blotting, Dot Blotting, Koloniehybridisierung
und Plaquehybridisierung. In einigen Anwendungen kann die Nukleinsäure, die
zur Hybridisierung an die markierte Sonde fähig ist, in Vektoren kloniert
werden, wie beispielsweise Expressionsvektoren, Sequenzierungsvektoren
oder in vivo-Transkriptionsvektoren, um die Charakterisierung und
Expression der hybridisierenden Nukleinsäuren in der Probe zu ermöglichen.
Beispielsweise können
derartige Techniken verwendet werden, um Sequenzen in einer genomischen
Bibliothek oder einer cDNA-Bibliothek zu isolieren und zu klonieren,
die in der Lage sind, an die detektierbare Probe zu hybridisieren,
wie es in Beispiel 30 oben beschrieben wird.
-
PCR-Primer,
die, wie in Beispiel 44 oben beschrieben, hergestellt wurden, können in
forensischen Analysen verwendet werden, wie beispielsweise den DNA-Fingerprint-Techniken,
wobei dies in den Beispielen 46–50
unten beschrieben wird. In solchen Analysen können detektierbare Sonden oder
Primer verwendet werden, die auf den Sequenzen der 5'-ESTs oder der cDNAs
oder der genomischen DNAs, die unter Verwendung der 5'-ESTs isoliert wurden,
basieren.
-
Beispiel 46
-
Forensischer
Abgleich durch DNA-Sequenzierung
-
In
einem beispielhaften Verfahren werden DNA-Proben, die aus forensischen
Einzelproben isoliert wurden, zum Beispiel Haar-, Sperma-, Blut- oder Hautzellen,
durch herkömmliche
Verfahren isoliert. Ein Panel an PCR-Primern, welche basieren auf einer Anzahl
der 5'-ESTs aus
Beispiel 25 oder cDNAs oder genomischen DNAs, die daraus wie oben
beschrieben isoliert wurden, wird anschließend in Übereinstimmung mit Beispiel
44 verwendet, um DNA mit einer Länge
von etwa 100–200
Basen aus den forensischen Einzelproben zu amplifizieren. Entsprechende
Sequenzen werden aus einem Testprobanden erhalten. Jede dieser Identifizierungs-DNAs
wird anschließend
unter Verwendung von Standardtechniken sequenziert und ein einfacher
Datenbankvergleich bestimmt die Unterschiede, falls vorhanden, zwischen
den Sequenzen aus dem Probanden und denen aus der Probe. Statistisch
signifikante Unterschiede zwischen DNA-Sequenzen des Verdächtigen und
denen aus der Probe belegen beweiskräftig ein Fehlen von Identität. Dieses
Fehlen an Identität
kann beispielsweise mit nur einer Sequenz bestätigt werden. Andererseits sollte
Identität
mit einer großen
Zahl von Sequenzen, die alle übereinstimmen,
gezeigt werden. Vorzugsweise wird ein Minimum von 50 statistisch
identischen Sequenzen mit 100 Basen Länge verwendet, um die Identität zwischen
dem Verdächtigen
und der Probe zu beweisen.
-
Beispiel 47
-
Positive Identifizierung
durch DNA-Sequenzierung
-
Die
im vorausgehenden Beispiel aufgezeigte Technik kann in einem größeren Maßstab auch
verwendet werden, um eine eindeutige Identifizierung in der Art
eines Fingerabdrucks von einem beliebigen Individuum bereitzustellen.
In dieser Technik werden Primer aus einer großen Anzahl von 5'-EST-Sequenzen aus
Beispiel 25 oder cDNA oder genomische DNA-Sequenzen, die davon erhältlich sind,
hergestellt. Vorzugsweise werden 20 bis 50 verschiedene Primer verwendet.
Diese Primer werden verwendet, um eine entsprechende Anzahl PCR-generierter DNA-Segmente
des fraglichen Individuums in Übereinstimmung
mit Beispiel 44 zu erzeugen. Jedes dieser DNA-Segmente wird unter
Verwendung der in Beispiel 46 dargelegten Verfahren sequenziert.
Die Sequenzdatenbanken, die durch dieses Verfahren erzeugt wurden,
identifizieren eindeutig das Individuum, von dem die Sequenzen erhalten
wurden. Das gleiche Panel an Primern kann dann zu einem beliebigen
späteren
Zeitpunkt verwendet werden, um Gewebe oder andere biologische Einzelproben
mit diesem Individuum in absoluten Bezug zu setzen.
-
Beispiel 48
-
Forensische Southern Blotting-Identifizierung
-
Das
Verfahren gemäß Beispiel
47 wird wiederholt, um ein Panel von mindestens 10 amplifizierten
Sequenzen aus einem Individuum und einer Einzelprobe zu erhalten.
Vorzugsweise enthält
das Panel mindestens 50 amplifizierte Sequenzen. Mehr bevorzugt
enthält
das Panel 100 amplifizierte Sequenzen. In einigen Ausführungsformen
enthält
das Panel 200 amplifizierte Sequenzen. Diese PCR-erzeugte DNA wird
anschließend
mit einem oder einer Kombination, vorzugsweise 4 basenspezifischen
Restriktionsenzymen verdaut. Solche Enzyme sind kommerziell erhältlich und
dem Fachmann bekannt. Nach dem Verdau werden die resultierenden
Genfragmente bezüglich
ihrer Größe in mehreren
doppelten Wells auf einem Agarosegel aufgetrennt und auf Nitrozellulose
unter Verwendung von dem Fachmann bekannten Southern Blotting-Techniken übertragen.
Für eine Übersicht
bezüglich
Southern Blotting-Übertragung
siehe Davis et al. (Basic Methods in Molecular Biology, 1986, Elsevier
Press, Seiten 62–65).
-
Ein
Panel an Proben, die auf den 5'-EST-Sequenzen
(oder den cDNAs oder den genomischen DNAs, die davon erhältlich sind)
oder Fragmenten davon mit mindestens 10 Basen basieren, werden radioaktiv
oder colorimetrisch markiert unter Verwendung von dem Fachmann bekannten
Verfahren, wie beispielsweise Nick-Translation oder Endmarkierung,
und auf dem Southern Blot unter Verwendung von im Fachbereich bekannten
Techniken hybridisiert (Davis et al., supra). Vorzugsweise umfasst
die Sonde mindestens 12, 15 oder 17 aufeinander folgende Nukleotide
des 5'-ESTs (oder
der cDNAs oder der genomischen DNAs, die davon erhältlich sind).
Mehr bevorzugt umfasst die Sonde mindestens 20–30 aufeinander folgende Nukleotide
des 5'-ESTs (oder
der cDNAs oder der genomischen DNAs, die davon erhältlich sind).
In einigen Ausführungsformen
umfasst die Sonde mehr als 30 Nukleotide des 5'-ESTs (oder der cDNAs oder der genomischen
DNAs, die davon erhältlich
sind).
-
Vorzugsweise
werden mindestens 5 bis 10 dieser markierten Sonden verwendet und
mehr bevorzugt werden mindestens etwa 20 oder 30 verwendet, um ein
eindeutiges Muster bereitzustellen. Die resultierenden Banden, die
in Folge der Hybridisierung einer großen 5'-EST-Probe (oder einer cDNA-Probe oder
einer genomischen DNA-Probe, die davon erhältlich sind) erscheinen, sind
ein eindeutiger Identifikator. Da die Restriktionsenzymspaltung
für jedes
Individuum unterschiedlich ist, ist auch das Bandenmuster auf dem
Southern Blot eindeutig. Eine Erhöhung der Zahl an 5'-EST-Sonden (oder
an cDNA- oder genomischen DNA-Sonden, die davon erhältlich sind)
stellt ein statistisch höheres
Maß an
Zuverlässigkeit
bezüglich
der Identifizierung bereit, da eine erhöhte Zahl an Bandensätzen zur
Identifizierung verwendet wird.
-
Beispiel 49
-
Dot Blot-Identifizierungsverfahren
-
Eine
andere Technik zur Identifizierung von Individuen unter Verwendung
der hierin offenbarten 5'-EST-Sequenzen
greift auf eine Dot Blot-Hybridisierungstechnik zurück.
-
Genomische
DNA wird aus dem Kern eines Probanden, der identifiziert werden
soll, isoliert. Oligonukleotidsonden mit einer Länge von etwa 30 bp werden synthetisiert,
die mindestens 10, vorzugsweise 50 Sequenzen der 5'-ESTs oder cDNAs
oder genomischen DNAs, die davon erhältlich sind, entsprechen. Die
Sonden werden verwendet, um die genomische DNA unter dem Fachmann bekannten
Bedingungen zu hybridisieren. Die Oligonukleotide werden unter Verwendung
von Polynukleotidkinase (Pharmacia) mit P32 endmarkiert. Die
Dot Blots werden durch Platzieren der genomischen DNA auf Nitrozellulose
oder ähnlichem
unter Verwendung eines Vakuum Dot Blot-Manifolds (BioRad, Richmond,
Kalifornien) aufgetragen. Der Nitrozellulosefilter, der die genomischen
Sequenzen enthält,
wird gebacken oder die Sequenzen werden mittels UV mit dem Filter verknüpft, prehybridisiert
und unter Verwendung von im Fachbereich bekannten Techniken (Davis
et al., supra) hybridisiert. Die 32P markierten
DNA-Fragmente werden
anschließend
nacheinander unter stufenweise veränderten stringenten Bedingungen
hybridisiert, um minimale Unterschiede zwischen der 30 bp Sequenz
und der DNA zu detektieren. Tetramethylammoniumchlorid ist bei der
Identifizierung von Klonen, die eine geringe Zahl an Nukleotid-Fehlabgleichen
enthalten, nützlich
(Wood et al., Proc. Natl. Acad. Sci. USA 82(6):1585-1588, 1985).
Ein einzigartiges Muster der Dots unterscheidet ein Individuum von
einem anderen Individuum.
-
5'-EST-Sequenzen (oder
cDNAs oder genomische DNAs, die davon erhältlich sind) oder Oligonukleotide,
die mindestens 10 aufeinander folgende Basen aus diesen Sequenzen
enthalten, können
als Sonden in der nachfolgend beschriebenen alternativen Fingerprint-Technik
verwendet werden. Vorzugsweise umfasst die Sonde mindestens 12,
15 oder 17 aufeinander folgende Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomische
DNAs, die davon erhältlich
sind). Mehr bevorzugt umfasst die Sonde mindestens 20–30 aufeinander
folgende Nukleotide der 5'-EST-Sequenzen
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen
umfasst die Sonde mehr als 30 Nukleotide der 5'-EST-Sequenzen (oder cDNAs oder genomischen
DNAs, die davon erhältlich
sind).
-
Vorzugsweise
wird in dieser alternativen Fingerprinting-Technik eine Vielzahl
an Sonden mit Sequenzen aus verschiedenen Genen verwendet. Beispiel
50 unten stellt ein repräsentatives
alternatives Fingerprint-Verfahren bereit, in dem die Sonden von
5'-EST abgeleitet
sind.
-
Beispiel 50
-
Alternative „Fingerprint"-Identifizierungstechnik
-
20-mer
Oligonukleotide werden aus einer großen Anzahl, z.B. 50, 100 oder
200 von 5'-ESTs,
unter Verwendung kommerziell zur Verfügung stehender Oligonukleotid-Dienstleistungsunternehmen,
wie beispielsweise Genset, Paris, Frankreich, hergestellt. Zellproben
aus dem Testprobanden werden unter Verwendung von im Fachbereich
bekannten Techniken auf DNA hin aufgereinigt. Die Nukleinsäure wird
mit Restriktionsenzymen, wie beispielsweise EcoRI und XbaI, verdaut.
Nach dem Verdau werden die Proben auf Wells zur Elektrophorese aufgetragen.
Dieses im Fachbereich bekannte Verfahren kann abgeändert werden,
um Polyacrylamidelektrophorese einsetzen zu können, jedoch werden in diesem
Beispiel Proben, die 5 μg
DNA enthalten, in Wells aufgetragen und auf 0,8% Agarosegel aufgetrennt.
Die Gele werden unter Verwendung von standardmäßigen Southern Blotting auf
Nitrozellulose überführt.
-
10
ng von jedem der Oligonukleotide werden vereinigt und mit 32P endmarkiert. Die Nitrozellulose wird mit
Blockierlösung
prehybridisiert und mit den markierten Sonden hybridisiert. Im Anschluss
an die Hybridisierung und Waschen wird der Nitrozellulosefilter
gegenüber
einem X-Omat AR-Röntgenfilm
exponiert. Das resultierende Hybridisierungsmuster ist für jedes
Individuum eindeutig.
-
Es
wird im Rahmen dieses Beispiels zusätzlich in Erwägung gezogen,
dass die Anzahl der verwendeten Probensequenzen zum Zwecke zusätzlicher
Genauigkeit und Klarheit verändert
werden kann.
-
Die
Proteine, die durch die erweiterten cDNAs codiert werden, können auch
verwendet werden, um Antikörper
zu erzeugen, wie es in den Beispielen 30 und 43 erklärt wird,
um so den Gewebetyp oder die Zellspezies, von dem/der die Probe
abgeleitet wurde, zu identifizieren, wobei dies in Beispiel 51 beschrieben
wird.
-
Beispiel 51
-
Identifizierung von Gewebetypen
oder Zellspezies mittels markierter gewebespezifischer Antikörper
-
Die
Identifizierung spezifischer Gewebe wird durch die Visualisierung
gewebespezifischer Antigene mittels Antikörperpräparationen gemäß den Beispielen
30 und 43 ermöglicht,
die mit einem detektierbaren Marker direkt oder indirekt konjugiert
sind. Ausgewählte
markierte Antikörperspezies
binden an ihren spezifischen Antigenbindepartner in Gewebeabschnitten,
Zellsuspensionen oder in Extrakten löslicher Proteine aus einer
Gewebeprobe, um so ein Muster für
eine qualitative oder halb-qualitative Interpretation bereitzustellen.
-
Für diese
Verfahren müssen
Antiseren einen Wirkstoffgehalt aufweisen, der über dem der nativen Präparation
liegt, und deshalb werden Antikörper
durch Isolierung der Gammaglobulinfraktion bis zu einer Menge von
mg/ml aufkonzentriert, beispielsweise durch Ionenaustauschchromatografie
oder durch Ammoniumsulfatfraktionierung. Um die spezifischsten Antiseren
bereitzustellen, müssen
unerwünschte
Antikörper,
zum Beispiel gegen gewöhnliche
Proteine, aus der Gammaglobulinfraktion entfernt werden, beispielsweise
mittels unlöslicher
Immunoabsorbentien, bevor die Antikörper mit dem Marker markiert
werden. Sowohl monoklonale als auch heterologe Antikörper sind
für beide
Verfahren geeignet.
-
A. Immunohistochemische
Techniken
-
Gereinigte
Antikörper
mit hohem Titer, die wie oben beschrieben hergestellt wurden, werden
mit einem detektierbaren Marker konjugiert, wie es beispielsweise
von Fudenberg, Kapitel 26 in: Basic and Clinical Immunology, 3.
Ausgabe, Lange, Los Altos, Kalifornien, 1980 oder Rose et al., Kapitel
12 in: Methods in Immunodiagnosis, 2. Ausgabe John Wiley and Sons,
New York (1980) beschrieben wird.
-
Ein
Fluoreszenzmarker, entweder Fluorescein oder Rhodamin, ist bevorzugt,
aber die Antikörper
können
auch mit einem Enzym markiert sein, das eine farberzeugende Reaktion
mit einem Substrat unterstützt, wie
beispielsweise Meerrettich-Peroxidase. Wie unten beschrieben wird,
können
in einem zweiten Schritt Marker zu einem gewebegebundenen Antikörper hinzugegeben
werden. Alternativ können
spezifische Antigewebe-Antikörper
mit Ferritin oder anderen Partikeln mit hoher Elektronendichte markiert
werden und die Lokalisierung der Ferritin-gekoppelten Antigen-Antikörper-Komplexe
kann mittels eines Elektronenmikroskops erfolgen. In noch einem
weiteren Ansatz können
die Antikörper
radiomarkiert werden, beispielsweise mit 125I,
und durch Überschichten
der mit Antikörper
behandelten Präparation
mittels einer fotografischen Emulsion detektiert werden.
-
Präparationen
zur Ausführung
der Verfahren können
monoklonale oder polyklonale Antikörper für ein einzelnes Protein oder
Peptid umfassen, deren Spezifität
für einen
Gewebetyp, wie beispielsweise Hirngewebe, identifiziert worden ist,
oder es können
Antikörperpräparationen
für mehrere
antigenisch unterschiedliche gewebespezifische Antigene in Panelen
verwendet werden, je nach dem wie erforderlich, unabhängig voneinander
oder in Gemischen.
-
Gewebeabschnitte
und Zellsuspensionen zur immunohistochemischen Untersuchung werden
gemäß herkömmlichen
histologischen Techniken hergestellt. Mehrere Cryostatabschnitte
(etwa 4 μm,
nicht fixiert) des unbekannten Gewebes und der bekannten Kontrolle
werden montiert und jeder Objektträger wird mit unterschiedlichen
Verdünnungen
der Antikörperpräparation
bedeckt. Abschnitte bekannter und unbekannter Gewebe sollten auch
mit Präparationen
behandelt werden, um eine Positivkontrolle, eine Negativkontrolle,
beispielsweise Pre-Immunseren, und eine Kontrolle für unspezifische
Färbung,
beispielsweise Puffer, bereitzustellen.
-
Die
behandelten Abschnitte werden in einer feuchten Kammer für etwa 30
min bei Raumtemperatur inkubiert, gespült und anschließend in
Puffer für
30–45
min gewaschen. Überschüssige Flüssigkeit
wird abgetupft und der Marker wird entwickelt.
-
Falls
der gewebespezifische Antikörper
während
der ersten Inkubation nicht markiert wurde, kann er zu diesem Zeitpunkt
in einer zweiten Antikörper-Antikörper-Reaktion
markiert werden, beispielsweise durch Zugabe von Fluorescein- oder
Enzym-konjugiertem Antikörper
gegen die Immunoglobulinklasse der das Antiserum erzeugenden Spezies,
zum Beispiel Fluoresceinmarkierter Antikörper gegen Maus-IgG. Derartige
markierte Seren sind kommerziell erhältlich.
-
Das
Antigen, das durch das obige Verfahren in den Geweben nachgewiesen
worden ist, kann durch Messung der Farb- oder Fluoreszenz-Intensität im Gewebeabschnitt
und Kalibrierung des Signals unter Verwendung von geeigneten Standards
quantifiziert werden.
-
B. Identifizierung gewebespezifischer
löslicher
Proteine
-
Die
Visualisierung gewebespezifischer Proteine und die Identifizierung
unbekannter Gewebe gemäß diesem
Verfahren wird unter Verwendung markierter Antikörperreagenzien und einer Detektionsstrategie,
wie sie für
die Immunohistochemie beschrieben wurde, durchgeführt; jedoch
wird die Probe nach einer elektrophoretischen Technik hergestellt,
um die Proteine, die aus dem Gewebe extrahiert wurden, zur Detektion
in einem systematischen Array auf Grundlage des Molekulargewichts
zu verteilen.
-
Eine
Gewebeprobe wird unter Verwendung einer Virtis-Vorrichtung homogenisiert;
Zellsuspensionen werden, wie im Fachbereich üblich, durch Dounce-Homogenisierung oder
osmotische Lyse aufgebrochen, wobei in beiden Fällen, falls nötig, Detergenzien
verwendet werden, um Zellmembranen aufzubrechen. Unlösliche Zellkomponenten,
wie beispielsweise Zellkerne, Microsomen und Membranfragmente, werden
durch Ultrazentrifugation entfernt und die lösliche proteinenthaltende Fraktion,
falls nötig,
aufkonzentriert und zur Analyse zurückbehalten.
-
Eine
Probe der Lösung
mit löslichen
Proteinen wird durch herkömmliche
SDS-Polyacrylamidelektrophorese in einzelne Proteinspezies aufgelöst, wie
es beispielsweise durch Davis et al., Abschnitt 19-2 in: Basic Methods
in Molecular Biology, Leder Hrsg., Elsevier, New York, 1986 beschrieben
wird, wobei in einem Satz von Gelen ein Bereich von Polyacrylamidmengen
verwendet wird, um den vollständigen
Molekulargewichtsbereich der Proteine, die in der Probe detektiert
werden sollen, aufzulösen.
Ein Größenmarker
wird parallel aufgetrennt, um so die Molekulargewichte der einzelnen
Proteine abschätzen
zu können.
Die zu analysierende Probengröße entspricht
einem zweckmäßigen Volumen
von 5 bis 55 μl
und enthält
etwa 1 bis 100 μg
Protein. Ein Aliquot von jedem der aufgelösten Proteine wird durch Blotting
auf ein Nitrozellulosefilterpapier übertragen, wobei dieses Verfahren
das Auflösungsmuster
erhält.
Es werden mehrere Kopien hergestellt. Das Verfahren, das als Western
Blotting-Analyse bekannt ist, ist in Davis, L. Et al., supra Abschnitt
19-3, gut beschrieben. Ein Satz der Nitrozelluloseblots wird mit
Coomassie Blau-Farbstoff angefärbt,
um den vollständigen
Satz an Proteinen zum Vergleich mit den antikörpergebundenen Proteinen sichtbar
zu machen. Die verbleibenden Nitrozellulosefilter werden anschließend mit
einer Lösung
aus einem oder mehreren spezifischen Antiseren von gewebespezifischen
Proteinen, die wie in den Beispielen 30 und 43 beschrieben hergestellt
wurden, inkubiert. In diesen Verfahren werden, wie in Verfahren
A oben beschrieben, geeignete Positiv- und Negativproben und Reagenzkontrollen
mitgeführt.
-
In
beiden Verfahren A oder B kann eine detektierbare Markierung an
den Primärgewebeantigen-Primärantikörper-Komplex
angebracht werden, gemäß verschiedener
Strategien und Abänderungen
der Verfahren. In einem direkten Ansatz kann der primärspezifische
Antikörper
markiert werden; alternativ kann der unmarkierte Komplex durch einen
markierten sekundären
Anti-IgG-Antikörper
gebunden werden. In anderen Ansätzen
ist entweder der primäre
oder der sekundäre
Antikörper
mit einem Biotinmolekül
konjugiert, das in einem nachfolgenden Schritt an einen avidinkonjugierten
Marker binden kann. Gemäß noch einer
weiteren Strategie wird ein enzymmarkiertes oder radioaktives Protein
A, das die Fähigkeit
besitzt, an jedes beliebige IgG zu binden, in einem abschließenden Schritt
entweder an den primären
oder den sekundären
Antikörper
gebunden.
-
Das
Sichtbarmachen gewebespezifischer Antigenbindung in einem Ausmaß, das über dem
liegt, das in Kontrollgeweben für
einen oder mehrere gewebespezifische Antikörper beobachtet wird, wobei
die Antikörper
aus den Gensequenzen hergestellt wurden, die aus erweiterten cDNA-Sequenzen
identifiziert wurden, kann Gewebe unbekannten Ursprungs identifizieren,
wie beispielsweise forensische Proben oder differenziertes Tumorgewebe,
das an fremden Körperstellen
metastasiert hat.
-
Zusätzlich zu
ihren Anwendungen in der Forensik und bei der Identifizierung können 5'-ESTs (oder cDNAs
oder genomische DNAs, die davon erhältlich sind) bezüglich ihrer
Lage auf den Chromosomen kartiert werden. Beispiel 52 unten beschreibt
RH („Radiation
Hybrid")-Kartierung
von humanen chromosomalen Abschnitten unter Verwendung von 5'-ESTs. Beispiel 53
unten beschreibt ein repräsentatives
Verfahren zur Kartierung eines 5'-ESTs
bezüglich
seiner Lage auf einem humanen Chromosom. Beispiel 54 beschreibt
die Kartierung von 5'-ESTs
bezüglich
Chromosomen in der Metaphase durch Fluoreszenz-in-situ-Hybridisierung (FISH).
Der Fachmann erkennt, dass die Verfahren gemäß den Beispielen 52–54 auch
verwendet werden können,
um cDNAs oder genomische DNAs, die aus den 5'-ESTs erhalten werden können, bezüglich ihrer
chromosomalen Lage zu kartieren.
-
2. Verwendung von 5'-ESTs oder Sequenzen,
die daraus erhältlich
sind oder Abschnitten davon, bei der Chromosomenkartierung
-
Beispiel 52
-
Strahlungshybrid-Kartierung
von 5'-ESTs hinsichtlich
des humanen Genoms
-
RH
(„Radiation
Hybrid")-Kartierung
ist ein genetischer Ansatz für
somatische Zellen, der zur hochaufgelösten Kartierung des humanen
Genoms verwendet werden kann. In diesem Verfahren werden Zelllinien, die
eines oder mehrere humane Chromosomen enthalten, in einem tödlichen
Ausmaß bestrahlt,
wobei jedes Chromosom in Fragmente zerbricht, deren Größe von der
Strahlendosis abhängig
ist. Diese Fragmente werden durch Fusion mit kultivierten Nagerzellen
gewonnen, was zu Subklonen führt,
die verschiedene Abschnitte des humanen Genoms enthalten. Dieses
Verfahren wird von Benham et al., Genomics 4:509-517, 1989, und Cox
et al., Science 250:245-250, 1990, beschrieben. Die zufällige und
unabhängige
Art der Subklone ermöglicht
eine effiziente Kartierung eines beliebigen humanen Genommarkers.
Humane DNA, die aus einem Panel von 80–100 Zelllinien isoliert wurde,
stellt ein Kartierungsreagenz zur 5'-EST-Anordnung bereit. In diesem Verfahren
wird die Bruchhäufigkeit
zwischen Markern herangezogen, um den Abstand zu bestimmen, wobei
dies die Konstruktion hochaufgelöster
Karten ermöglicht,
wie es für
die Verwendung herkömmlicher
ESTs bereits ausgeführt
wurde (Schuler et al.; Science 274:540-546, 1996).
-
Die
RH-Kartierung wurde verwendet, um eine hochaufgelöste Strahlungshybridkarte
des vollständigen
Genoms des humanen Chromosoms 17q22-q25.3 über die Gene für das Wachstumshormon
(GH) und die Tymidinkinase (TK) (Foster et al., Genomics 33:185-192,
1996), den Abschnitt, der das Gorlin-Syndromgen umgibt (Obermayr et al.,
Eur. J. Hum. Genet. 4:242-245, 1996), die Loci, die den vollständigen kurzen
Arm von Chromosom 12 abdecken (Raeymaekers et al., Genomics 29:170-178,
1995), den Abschnitt des humanen Chromosoms 22, der den Locus des
Neurofibromatosistyps 2 enthält
(Frazer et al., Genomics 14:574-584, 1992), und die 13 Loci auf
dem langen Arm von Chromosom 5 (Warrington et al., Genomics 11:701-708,
1991) herzustellen.
-
Beispiel 53
-
Kartierung von 5'-ESTs auf humanen
Chromosomen unter Verwendung von PCR-Techniken
-
5'-ESTs (oder cDNAs
oder genomische DNAs, die davon erhältlich sind) können unter
Verwendung von Methoden auf PCR-Basis humanen Chromosomen zugeordnet
werden. In solchen Ansätzen
werden Oligonukleotid-Primerpaare aus den 5'-ESTs (oder den cDNAs oder den genomischen
DNAs, die davon erhältlich sind)
konzipiert, um die Wahrscheinlichkeit einer Amplifizierung über ein
Intron zu minimieren. Vorzugsweise weisen die Oligonukleotid-Primer
eine Länge
von 18–23
bp auf und sind zur PCR-Amplifizierung konzipiert. Die Erstellung
von PCR-Primern
aus bekannten Sequenzen ist dem Fachmann allgemein bekannt. Für eine Übersicht
zur PCR-Technologie siehe Erlich in PCR Technology, Principles and
Applications for DNA Amplification, Freeman und Co., New York, 1992.
-
Zur
Amplifizierung von Matrizen aus humaner genomischer Gesamt-DNA werden
Primer in Polymerasekettenreaktionen (PCR) eingesetzt. Die PCR-Bedingungen sind
wie folgt: 60 ng genomische DNA wird als Matrize für eine PCR
mit 80 ng eines jeden Oligonukleotid-Primers, 0,6 Einheiten Taq-Polymerase
und 1 μCu eines 32P-markierten Deoxycytidintriphosphats verwendet.
Die PCR wird in einem Microplate-Thermocycler (Techne) unter den
folgenden Bedingungen durchgeführt:
30 Zyklen bei 94°C,
1,4 min; 55°C,
2 min; und 72°C, 2
min; mit einer abschließenden
Verlängerung
bei 72°C
für 10
min. Die amplifizierten Produkte werden auf einem 6%igen Polyacrylamidsequenzierungsgel
analysiert und durch Autoradiografie visualisiert. Wenn die Länge des
resultierenden PCR-Produkts
identisch ist zum Abstand zwischen den Enden der Primersequenzen
in der erweiterten cDNA, aus der die Primer abgeleitet wurden, wird
die PCR-Reaktion
anschließend
mit DNA-Matrizen aus zwei Panelen somatischer Mensch-Nager-Zellhybride,
BIOS PCRable DNA (BIOS Corporation) und dem NIGMS „Human-Rodent
Somatic Cell Hybrid Mapping Panel" Number 1 (NIGMS, Camden, NJ) wiederholt.
-
Die
PCR wird eingesetzt, um eine Reihe somatischer Zellhybrid-Zelllinien
zu screenen, die definierte Sätze
an humanen Chromosomen enthalten, im Hinblick auf das Vorliegen
eines bestimmten 5'-ESTs
(oder einer cDNA oder einer genomischen DNA, die davon erhältlich ist).
Die DNA wird aus den somatischen Hybriden isoliert und als Ausgangsmatrizen
für PCR-Reaktionen
unter Verwendung der Primerpaare des 5'-ESTs (oder einer cDNA oder einer genomischen
DNA, die davon erhältlich
ist) verwendet. Nur diejenigen somatischen Zellhybride mit Chromosomen,
die das humane Gen enthalten, das dem 5'-EST (oder der cDNA oder der genomischen
DNA, die daraus erhältlich
ist) entspricht, führen
zu einem amplifizierten Fragment. Das 5'-EST (oder die cDNA oder die genomische
DNA, die daraus erhältlich
ist) wird dem Chromosom durch Analyse des Trennungsmusters der PCR-Produkte
aus den somatischen Hybrid-DNA-Matrizen zugeordnet. Das einzige
humane Chromosom, das in allen Zellhybriden vorliegt, die zu einem
amplifizierten Fragment führen, ist
das Chromosom, das das 5'-EST
(oder die cDNA oder die genomische DNA, die daraus erhältlich ist)
enthält.
Für eine Übersicht
zu Techniken und Analysen von Ergebnissen zu Gen-Kartierungsexperimenten
mit somatischen Zellen siehe Ledbetter et al., Genomics 6:475-481,
1990.
-
Beispiel 54
-
Kartierung erweiterter
5'-ESTs auf Chromosomen
unter Verwendung von in situ-Fluoreszenzhybridisierung
-
Die
in situ-Fluoreszenzhybridisierung ermöglicht, dass das 5'-EST (oder die cDNA
oder die genomische DNA, die davon erhältlich ist) an einer bestimmter Stelle
auf einem bestimmten Chromosom kartiert wird. Die Chromosomen, die
für in
situ-Fluoreszenzhybridisierungstechniken verwendet werden, können aus
einer Vielfalt von Quellen, einschließlich Zellkulturen, Geweben
oder Vollblut, erhalten werden.
-
In
einer bevorzugten Ausführungsform
wird fie chromosomale Lage eines 5'-ESTs (oder einer cDNA oder genomischen
DNA, die davon erhältlich
ist) durch FISH erhalten, wie es von Cherif et al. (Proc. Natl.
Acad. Sci. USA, 87:6639-6643, 1990) beschrieben wird. Chromosomen
in der Metaphase werden aus Phytohemagglutinin (PHA)-stimulierten
Blutzelldonoren hergestellt. PHS-stimulierte Lymphozyten aus gesunden
Männern werden
für 72
h in RPMI 1640-Medium kultiviert. Zur Synchronisierung wird Methotrexat
(10 μM)
für 17
h zugegeben, wobei im Anschluss 5-Bromdesoxyuridin (5-BrdU, 0,1
mM) für
6 h zugegeben wird. Colcemid (1 μg/ml)
wird für
die letzten 15 min vor der Ernte der Zellen zugegeben. Die Zellen
werden gesammelt, in RPMI gewaschen, mit einer hypotonischen Lösung aus
KCl (75 mM) bei 37°C
für 15
min inkubiert und unter dreimaligem Wechseln in Methanol:Essigsäure (3:1)
fixiert. Die Zellsuspension wird auf einen Glasobjektträger aufgetropft
und luftgetrocknet. Das 5'-EST
(oder die cDNA oder die genomische DNA, die davon erhältlich ist)
wird mit Biotin-16 dUTP durch Nick-Translation gemäß den Anweisungen
des Herstellers (Bethesda Research Laboratories, Bethesda, MD) markiert,
unter Verwendung einer Sephadex G-50-Säule (Pharmacia, Upsala, Schweden)
gereinigt und präzipitiert.
Kurz vor der Hybridisierung wird das DNA-Pellet in Hybridisierungspuffer (50%
Formamid, 2 × SSC,
10% Dextransulfat, 1 mg/ml mit Ultraschall behandelte Lachssperma-DNA,
pH 7) gelöst
und die Probe wird bei 70°C
für 5–10 min
denaturiert.
-
Die
bei –20°C gelagerten
Objektträger
werden für
1 h bei 37°C
mit RNase A (100 μg/ml)
behandelt, dreimal in 2 × SSC
gespült
und in einer Ethanolreihe dehydriert. Die Chromosompräparationen
werden in 70% Formamid, 2 × SSC
für 2 min
bei 70°C
denaturiert, anschließend
bei 4°C
dehydriert. Die Objektträger
werden mit Proteinase K (10 μg/100
ml in 20 mM Tris-HCl, 2 mM CaCl2) bei 37°C für 8 min
behandelt und dehydriert. Das Hybridisierungsgemisch, das die Sonde
enthält,
wird auf dem Objektträger
platziert, mit einem Deckglas abgedeckt, mit Gummikitt versiegelt
und über
Nacht in einer feuchten Kammer bei 37°C hybridisiert. Nach der Hybridisierung
und Waschschritten im Anschluss an die Hybridisierung wird die biotinylierte
Sonde durch Avidin-FITC detektiert und mit zusätzlichen Schichten von biotinyliertem
Ziege-Anti-Avidin und Avidin-FITC amplifiziert. Zur chromosomalen
Lagebestimmung werden fluoreszierende R-Banden erhalten, wie zuvor beschrieben
(Cherif et al., supra). Die Objektträger werden unter einem LEICA-Fluoreszenzmikroskop
(DMRXA) beobachtet. Die Chromosomen werden mit Propidiumjodid gegengefärbt und
das Fluoreszenzsignal der Sonde erscheint als zwei symmetrisch gelbgrüne Punkte
auf beiden Chromatiden des fluoreszierenden R-Band-Chromosoms (rot).
Daher kann ein bestimmtes 5'-EST
(oder eine cDNA oder genomische DNA, die daraus erhältlich ist)
einer bestimmten zytogenetischen R-Bande auf einem bestimmten Chromosom
zugeordnet werden.
-
Nachdem
das 5'-EST (oder
die cDNA oder die genomische DNA, die daraus erhältlich ist) unter Verwendung
der in den Beispielen 52–54
oben beschriebenen Techniken einmal bestimmten Chromosomen zugeordnet
worden ist, können
sie verwendet werden, um eine hochaufgelöste Chromosomenkarte zu erstellen, auf
der sie lokalisiert sind oder um die Chromosomen in der Probe zu
identifizieren.
-
Beispiel 55
-
Verwendung von 5'-ESTs zur Konstruktion
oder Erweiterung von Chromosomenkarten
-
Chromosomenkartierung
umfasst das Zuordnen einer bestimmten eindeutigen Sequenz zu einem
bestimmten Chromosom, wie es oben beschrieben wurde. Nachdem die
eindeutige Sequenz einmal auf einem bestimmten Chromosom kartiert
worden ist, wird sie relativ zu anderen eindeutigen Sequenzen zugeordnet, die
auf demselben Chromosom lokalisiert sind. Ein Ansatz zur Chromosomenkartierung
verwendet eine Serie künstlicher
Hefechromosomen (YACs), die mehrere tausend lange Inserts tragen,
die aus den Chromosomen des Organismusabgeleitet wurden, von denen
die erweiterten cDNAs (oder die genomische DNAs, die daraus erhältlich sind)
erhalten wurden. Dieser Ansatz wird in Nagaraja et al., Genome Research
7:210-222, 1997, beschrieben. In Kürze, in diesem Ansatz wird
jedes Chromosom in überlappende
Stücke
zerbrochen, die in den YAC-Vektor insertiert werden. Die YAC-Inserts
werden unter Verwendung von PCR oder anderen Verfahren gescreent,
um zu bestimmen, ob sie das 5'-EST
(oder die cDNA oder die genomische DNA, die daraus erhältlich ist)
umfassen, dessen Position bestimmt werden soll. Sobald das Insert,
das das 5'-EST (oder
die cDNA oder die genomische DNA, die daraus erhältlich ist) umfasst, einmal
nachgewiesen worden ist, kann das Insert durch PCR oder andere Verfahren
analysiert werden, um zu bestimmen, ob das Insert auch andere Sequenzen
enthält,
welche sich bekanntermaßen
auf dem Chromosom in dem Abschnitt befinden, von dem das 5'-EST (oder die cDNA
oder die genomische DNA, die daraus erhältlich ist) abgeleitet wurde.
Dieses Verfahren kann für
jedes Insert in der YAC-Bibliothek wiederholt werden, um die Lokalisierung
einer jeden der erweiterten cDNAs (oder der genomischen DNAs, die
daraus erhältlich
sind) relativ zueinander und zu anderen bekannten chromosomalen
Markern zu bestimmen. Auf diese Weise kann eine hochaufgelöste Karte
der Verteilung einer Vielzahl eindeutiger Marker über jedes
einzelne der Chromosomen des Organismus erhalten werden.
-
Wie
in Beispiel 56 unten beschrieben, können erweiterte cDNAs (oder
genomische DNAs, die daraus erhältlich
sind) auch zur Identifizierung von Genen verwendet werden, die mit
einem bestimmten Phänotyp
verbunden sind, wie beispielsweise einer Erbkrankheit oder einer
Wirkstoffantwort.
-
3. Verwendung von 5'-ESTs oder Sequenzen,
die daraus erhältlich
sind, oder Fragmenten davon zur Identifizierung von Genen
-
Beispiel 56
-
Identifizierung von Genen,
die mit Erbkrankheiten oder Ansprechen auf einen Wirkstoff im Zusammenhang
stehen
-
Dieses
Beispiel zeigt einen Ansatz, der zum Erstellen eines Zusammenhangs
von 5'-ESTs (oder
cDNA oder genomischer DNA, die daraus erhältlich ist) mit bestimmten
phänotypischen
Merkmalen nützlich
ist. In diesem Beispiel wird ein bestimmtes 5'-EST (oder eine cDNA oder genomische
DNA, die daraus erhältlich
ist) als Testsonde verwendet, um dieses 5'-EST (oder die cDNA oder die genomische
DNA, die daraus erhältlich ist)
mit einem bestimmten phänotypischen
Merkmal in Zusammenhang zu setzen.
-
5'-ESTs (oder cDNA
oder genomische DNA, die daraus erhältlich ist) werden an bestimmten
Stelle auf einem humanen Chromosom kartiert unter Verwendung von
Techniken, wie denjenigen, die in den Beispielen 52 und 53 beschrieben
sind, oder anderen, im Fachbereich bekannten Techniken. Eine Suche
zur Mendelschen Vererbung im Menschen (McKusick in Mendelian Inheritance
in Man (Online verfügbar über Johns
Hopkins University Welch Medical Library) offenbart, dass der Abschnitt
des humanen Chromosoms, der das 5'-EST (oder die cDNA oder die genomische
DNA, die daraus erhältlich
ist) enthält,
eine sehr genreiche Region darstellt, die mehrere bekannte Gene
und einige Krankheiten oder Phänotypen
umfasst, für
die keine Gene identifiziert wurden. Das Gen, das diesem 5'-EST (oder der cDNA
oder der genomischen DNA, die daraus erhältlich ist) entspricht, ist
deshalb ein unmittelbar ein Kandidat für jede dieser genetischen Erkrankungen.
-
Zellen
aus Patienten mit diesen Erkrankungen oder Phänotypen werden isoliert und
in Kultur expandiert. PCR-Primer des 5'-ESTs (oder der cDNA oder der genomischen
DNA, die daraus erhältlich
ist) werden verwendet, um genomische DNA, mRNA oder cDNA, die von
den Patienten erhalten wurde, zu screenen. 5'-ESTs (oder cDNA oder genomische DNA,
die daraus erhältlich
ist), die in den Patienten nicht amplifiziert werden, können durch
weitere Untersuchungen mit einer bestimmten Krankheit positiv in
Zusammenhang gebracht werden. Wenn die Proben von einem Individuum
abgeleitet sind, das den Phänotyp
aufweist, der mit der Erkrankung in Zusammenhang steht, kann alternativ
die PCR-Untersuchung zu Fragmenten mit Längen führen, welche von den Längen abweichen,
wenn die Probe von einem gesunden Individuum abgeleitet ist, wobei
dies zeigt, dass das Gen, das das 5'-EST enthält, für die genetische Erkrankung
verantwortlich sein kann.
-
VI. Verwendung eines 5'-ESTs (oder cDNA
oder genomischer DNA, die daraus erhältlich ist) zur Konstruktion von
Vektoren
-
Die
vorliegenden 5'-ESTs
(oder cDNA oder genomische DNA, die daraus erhältlich ist) können auch verwendet
werden, um Sekretionsvektoren zu konstruieren, die in der Lage sind,
die Sekretion der Proteine zu steuern, die durch Gene in den Vektoren
codiert werden. Solche Sekretionsvektoren können die Reinigung oder Anreicherung
der Proteine erleichtern, die durch Gene codiert werden, die im
Sekretionsvektor insertiert sind, wobei die Zahl an Hintergrundproteinen,
von welchen das gewünschte
Protein gereinigt oder angereichert werden muss, verringert wird.
Beispielhafte Sekretionsvektoren werden in Beispiel 57 unten beschrieben.
-
1. Konstruktion
von Sekretionsvektoren
-
Beispiel 57
-
Konstruktion von Sekretionsvektoren
-
Die
Sekretionsvektoren umfassen einen Promotor, der in der Lage ist,
die Genexpression in der Wirtszelle, im Gewebe oder einem Organismus
von Interesse zu steuern. Solche Promotoren umfassen den Rous Sarcoma
Virus-Promotor,
den SV40-Promotor, den humanen Zytomegalovirus-Promotor und andere
dem Fachmann vertraute Promotoren.
-
Eine
Signalsequenz eines 5'-ESTs
(oder einer cDNA oder einer genomischen DNA, die daraus erhältlich ist)
ist mit dem Promotor operativ so verknüpft, dass die mRNA, die vom
Promotor transkribiert wird, die Translation des Signalpeptids steuert.
Die Wirtszelle, das Gewebe oder der Organismus kann eine beliebige Zelle,
ein beliebiges Gewebe oder ein beliebiger Organismus sein, der das
Signalpeptid erkennt, das durch die Signalsequenz im 5'-EST (oder der cDNA
oder der genomischen DNA, die daraus erhältlich ist) codiert wird. Geeignete
Wirtszellen umfassen Säugerzellen,
Gewebe aus Säugern
oder Säugerorganismen,
Vogelzellen, Vogelgewebe oder Vogelorganismen, Insektenzellen, Insektengewebe
oder Insektenorganismen oder Hefe.
-
Zusätzlich enthält der Sekretionsvektor
Klonierungsstellen zum Insertieren der Gene, welche für die Proteine
codieren, die sekretiert werden sollen. Die Klonierungsstellen ermöglichen
die Klonierung des insertierten Gens im Leserahmen mit der Signalsequenz,
so dass ein Fusionsprotein, in dem das Signalpeptid mit dem Protein
fusioniert ist, das durch das insertierte Gen codiert wird, von
der mRNA exprimiert wird, die vom Promotor transkribiert wird. Das
Signalpeptid steuert die extrazelluläre Sekretion des Fusionsproteins.
-
Der
Sekretionsvektor kann DNA oder RNA sein und kann sich in das Chromosom
des Wirts integrieren, wobei er als ein extrachromosomales Replikon
stabil im Wirt verbleiben kann, der Sekretionsvektor kann ein künstliches
Chromosom sein oder er kann transient im Wirt vorliegen. Viele Nukleinsäuregerüste, die
zur Verwendung als Sekretionsvektoren geeignet sind, sind dem Fachmann
bekannt, einschließlich
retroviraler Vektoren, SV40-Vektoren, Bovine Papilloma Virus-Vektoren,
hefeintegrierender Plasmide, hefeepisomaler Plasmide, künstlicher
Chromosomen aus Hefe, künstlicher
humaner Chromosomen, P-Element-Vektoren,
Baculovirus-Vektoren oder bakterieller Plasmide, die transient in
den Wirt eingebracht werden können.
-
Der
Sekretionsvektor kann auch ein PolyA-Signal enthalten, so dass das
PolyA-Signal stromabwärts des
Gens, das in den Sekretionsvektor insertiert ist, lokalisiert ist.
-
Nachdem
das Gen, welches für
das Protein codiert, für
das eine Sekretion erwünscht
ist, in den Sekretionsvektor insertiert worden ist, wird der Sekretionsvektor
unter Verwendung von Calciumphosphatpräzipitiation, DEAE-Dextran,
Elektroporation, liposomenvermittelter Transfektion, viraler Partikel
oder als bloße
DNA in die Wirtszelle, das Gewebe oder den Organismus eingeführt. Das
durch das insertierte Gen codierte Protein wird anschließend unter
Verwendung konventioneller Techniken, wie beispielsweise Ammoniumsulfatpräzipitiation,
Immunopräzipitiation,
Immunochromatografie, Größenausschlusschromatografie,
Ionenaustauschchromatografie und HPLC, aus dem Überstand aufgereinigt oder
angereichert. Alternativ kann das sekretierte Protein in ausreichendem
Maß angereichert
oder in reinen Zustand im Überstand
oder im Wachstumsmedium des Wirts vorliegen, so dass es möglich ist,
es für
den beabsichtigten Zweck ohne weitere Anreicherung zu verwenden.
-
Die
Signalsequenzen können
auch in Vektoren insertiert werden, die zur Gentherapie konzipiert
sind. In derartigen Vektoren ist die Signalsequenz operativ mit
einem Promotor verknüpft,
so dass die mRNA, die vom Promotor transkribiert wird, für das Signalpeptid
codiert. Eine Klonierungsstelle ist stromabwärts der Signalsequenz lokalisiert,
so dass ein Gen, das für
ein Protein codiert, dessen Sekretion erwünscht ist, leicht in den Vektor
insertiert und mit der Signalsequenz fusioniert werden kann. Der
Vektor wird in eine geeignete Wirtszelle eingeführt. Das Protein, das vom Promotor
exprimiert wird, wird extrazellulär sekretiert, wodurch ein therapeutischer
Effekt erzeugt wird.
-
Die
5'-ESTs können auch
verwendet werden, um Sequenzen zu klonieren, die stromaufwärts der 5'-ESTs lokalisiert
sind und in der Lage sind, die Genexpression zu regulieren, einschließlich Promotorsequenzen,
Enhancer-Sequenzen
und anderen stromaufwärts
liegenden Sequenzen, die den Grad an Transkription oder Translation
beeinflussen. Nachdem sie identifiziert und kloniert worden sind,
können
diese stromaufwärts liegenden
regulatorischen Sequenzen in Expressionsvektoren verwendet werden,
die konzipiert wurden, um die Expression eines insertierten Gens
in einer räumlichen,
zeitlichen, entwicklungsspezifischen oder quantitativen Weise zu
steuern. Beispiel 58 beschreibt ein Verfahren zur Klonierung von
Sequenzen, die stromaufwärts
der erweiterten cDNAs oder 5'-ESTs
liegen.
-
2. Identifizierung
von stromaufwärts
liegenden Sequenzen mit Promotoraktivität oder regulatorischer Aktivitäten
-
Beispiel 58
-
Verwendung erweiterter
cDNAs oder 5'-ESTs
zur Klonierung von stromaufwärts
liegenden Sequenzen aus genomischer DNA
-
Aus
erweiterten cDNAs oder 5'-ESTs
abgeleitete Sequenzen können
verwendet werden, um die entsprechenden Gene unter Verwendung von
Chromosomen-Walking-Techniken zu isolieren. In einer Chromosomen-Walking- Technik, die den
von Clontech verfügbaren
GenomeWalkerTM-Kit verwendet, werden fünf Gesamtgenom-DNA-Proben
mit einem jeweils einem unterschiedlichen Restriktionsenzym verdaut,
das eine 6 Basen-Erkennungsstelle aufweist und ein glattes Ende
zurücklässt. Im
Anschluss an den Verdau werden Oligonukleotidadapter an jedes Ende
der resultierenden genomischen DNA-Fragmente ligiert.
-
Für jede der
fünf genomischen
DNA-Bibliotheken wird eine erste PCR-Reaktion gemäß den Anweisungen des Herstellers
durchgeführt,
wobei ein äußerer Adapterprimer,
der im Kit bereitgestellt wird, und ein äußerer genspezifischer Primer
verwendet wird. Der genspezifische Primer sollte so gewählt werden,
dass er für
die erweiterte cDNA oder das 5'-EST
von Interesse spezifisch ist und sollte eine Schmelztemperatur,
eine Länge
und eine Lage in der erweiterten cDNA oder dem 5'-EST aufweisen, die mit seiner Verwendung
in den PCR-Reaktionen vereinbar sind. Jede erste PCR-Reaktion enthält 5 ng
genomische DNA, 5 μl
10 × Tth-Reaktionspuffer,
0,2 mM eines jeden dNTP, jeweils 0,2 μM äußeren Adapterprimer und äußeren genspezifischen Primer,
1,1 mM Mg(OAc)2 und 1 μl des Tth-Polymerase 50 × Mix in
einem Gesamtvolumen von 50 μl.
Der Reaktionszyklus für
die erste PCR-Reaktion ist der folgende: 1 min – 94°C/2 sec – 94°C, 3 min – 72°C (7 Zyklen)/2 sec – 94°C, 3 min – 67°C (32 Zyklen)/5
min – 67°C.
-
Das
Produkt der ersten PCR-Reaktion wird verdünnt und als Matrize für eine zweite
PCR-Reaktion gemäß den Anweisungen
des Herstellers verwendet, wobei ein Paar von Nested-Primern verwendet
wird, die innerhalb des Amplicons lokalisiert sind, das sich aus
der ersten PCR-Reaktion ergibt. Beispielsweise können 5 μl des Reaktionsprodukts aus
dem ersten PCR-Reaktionsgemisch 180-fach verdünnt werden. Die Reaktion werden
in einem 50 μl
Volumen mit einer Zusammensetzung durchgeführt, die der der ersten PCR-Reaktion entspricht,
außer
das Nested-Primer verwendet werden. Der erste Nested-Primer ist
spezifisch für
den Adapter und wird mit dem GenomeWalkerTM-Kit
bereitgestellt. Der zweite Nested-Primer ist spezifisch für die bestimmte erweiterte
cDNA oder das 5'-EST,
für das
der Promotor kloniert werden soll und sollte eine Schmelztemperatur, Länge und
Lage in der erweiterten cDNA oder dem 5'-EST aufweisen, die mit seiner Verwendung
in den PCR-Reaktionen vereinbar ist. Die Reaktionsparameter der
zweiten PCR-Reaktion sind die folgenden: 1 min – 94°C/2 sec – 94° C, 3 min – 72°C (6 Zyklen)/2 sec – 94°C, 3 min – 67°C (25 Zyklen)/5
min – 67°C. Das Produkt der
zweiten PCR-Reaktion wird unter Verwendung von Standardtechniken
gereinigt, kloniert und sequenziert.
-
Alternativ
können
zwei oder mehrere humane genomische DNA-Bibliotheken unter Verwendung
von zwei oder mehr Restriktionsenzymen konstruiert werden. Die verdaute
genomische DNA wird in Vektoren kloniert, die in einzelsträngige, zirkuläre oder
lineare DNA umgewandelt werden können.
Ein biotinyliertes Oligonukleotid, das mindestens 15 Nukleotide
der erweiterten cDNA oder der 5'-EST-Sequenz umfasst,
wird an die einzelsträngige
DNA hybridisiert. Die Hybride zwischen dem biotinylierten Oligonukleotid
und der einzelsträngigen
DNA, welche die erweiterte cDNA oder 5'-EST-Sequenz enthält, werden isoliert wie in
Beispiel 29 oben beschrieben. Danach wird die einzelsträngige DNA,
welche die erweiterte cDNA oder 5'-EST-Sequenz enthält, von den Beads abgelöst und unter
Verwendung eines Primers, der für
die erweiterte cDNA oder 5'-EST-Sequenz
spezifisch ist, oder eines Primers, der einer Sequenz entspricht,
die vom Klonierungsvektor umfasst ist, in doppelsträngige DNA
umgewandelt. Die resultierende doppelsträngige DNA wird in Bakterien
transformiert. DNAs, welche die 5'-EST- oder erweiterte cDNA-Sequenzen
enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
-
Nachdem
die stromaufwärts
liegenden genomischen Sequenzen einmal wie oben beschrieben kloniert
und sequenziert worden sind, können
voraussichtliche Promotoren und Transkriptionsstartstellen innerhalb
der stromaufwärts
liegenden Sequenzen identifiziert werden durch Vergleich der Sequenzen,
die stromaufwärts
der erweiterten cDNAs oder 5'-ESTs
liegen, mit Datenbanken, die bekannte Transkriptionsstartstellen,
Transkriptionsfaktorbindungsstellen oder Promotorsequenzen enthalten.
-
Zusätzlich können Promotoren
in stromaufwärts
liegende Sequenzen unter Verwendung von Promotorreportervektoren
identifiziert werden, wie es in Beispiel 59 beschrieben wird.
-
Beispiel 59
-
Identifizierung
von Promotoren in klonierten stromaufwärts liegenden Sequenzen
-
Die
stromaufwärts
liegenden genomischen Sequenzen der erweiterten cDNAs oder 5'-ESTs werden in einen
geeigneten Promotorreportervektor kloniert, wie beispielsweise die
Promotorreportervektoren pSEAP-Basic, pSEAP-Enhancer, pβgal-Basic,
pβgalEnhancer
oder pEGFP-1, die von Clontech erhältlich sind. In Kürze, jeder
dieser Promotorreportervektoren umfasst multiple Klonierungsstellen,
die stromaufwärts
eines Reportergens liegen, das für
ein Protein codiert, für
das in einfacher Weise eine Probenbestimmung durchgeführt werden
kann, wie beispielsweise sekretierte alkalische Phosphatase, β-Galactosidase
oder grün
fluoreszierendes Protein. Die Sequenzen, die stromaufwärts der
erweiterten cDNAs oder 5'-ESTs
liegen, werden in die Klonierungsstellen stromaufwärts des
Reportergens in beiden Orientierungen kloniert und in eine geeignete
Wirtszelle eingeführt.
Hinsichtlich der Menge an Reporterprotein wird eine Untersuchung
durchgeführt
und mit der Menge verglichen, die von einem Vektor erhalten wird,
der kein Insert in der Klonierungsstelle trägt. Das Vorliegen einer erhöhten Expressionsmenge
in dem Vektor mit dem Insert im Hinblick auf den Kontrollvektor
zeigt das Vorliegen eines Promotors im Insert. Wenn nötig, können die
stromaufwärts
liegenden Sequenzen in Vektoren kloniert werden, die einen Enhancer
für eine
Erhöhung
der Transkriptionsmengen von schwachen Promotorsequenzen enthält. Eine
signifikant höhere
Menge an Expression als die, welche bei dem Vektor ohne Insert beobachtet
wird, zeigt, dass eine Promotorsequenz in der insertierten stromaufwärts liegenden
Sequenz vorliegt.
-
Geeignete
Wirtszellen für
die Promotorreportervektoren können
auf Grundlage der Ergebnisse zur oben beschriebenen Bestimmung der
Expressionsmuster der erweiterten cDNAs und 5'-ESTs ausgewählt werden. Wenn die Expressionsmusteranalyse
beispielsweise zeigt, dass die mRNA, die einer bestimmten erweiterten
cDNA oder einem 5'-EST
entspricht, in Fibroblasten exprimiert wird, kann der Promotorreportervektor
in eine humane Fibroblastenzelllinie eingeführt werden.
-
Promotorsequenzen
innerhalb der stromaufwärts
liegenden genomischen DNA können
ferner durch Konstruktion von verschachtelten Deletionen („nested
deletions") in der
stromaufwärts
liegenden DNA bestimmt werden, wobei herkömmliche Techniken, wie beispielsweise
Exonuklease III-Verdau, verwendet werden. Die resultierenden deletierten
Fragmente können
in den Promotorreportervektor insertiert werden, um zu bestimmen,
ob die Deletion eine verringerte oder ausgeschaltete Promotoraktivität aufweist.
Auf diese Weise können
die Grenzen der Promotoren bestimmt werden. Wenn gewünscht, können die
möglichen
einzelnen regulatorischen Stellen innerhalb des Promotors unter
Verwendung von ortsgerichteter Mutagenese (side directed mutagenesis)
oder Linkerscanning identifiziert werden, um die möglichen
Transkriptionsfaktorbindungsstellen innerhalb des Promotors einzeln
oder in Kombination zu auszuschalten. Die Wirkungen dieser Mutationen
auf das Transkriptionsniveau können
unter Einführung
der Mutationen in die Klonierungsstellen in die Promotorreportervektoren
bestimmt werden.
-
Beispiel 60
-
Klonierung
und Identifizierung von Promotoren
-
Unter
Verwendung des Verfahrens, das in Beispiel 58 oben mit 5'-ESTs beschrieben
wird, wurden stromaufwärts
liegende Sequenzen von mehreren Genen erhalten. Unter Verwendung
des Primerpaares GGG AAG ATG GAG ATA GTA TTG CCT G (SEQ ID NO: 29)
und CTG CCA TGT ACA TGA TAG AGA GAT TC (SEQ ID NO: 30) wurde der
Promotor mit der internen Bezeichnung P13H2 (SEQ ID NO: 31) erhalten.
-
Unter
Verwendung des Primerpaares GTA CCA GGGG ACT GTG ACC ATT GC (SEQ
ID NO: 32) und CTG TGA CCA TTG CTC CCA AGA GAG (SEQ ID NO: 33) wurde
der Promotor mit der internen Bezeichnung P15B4 (SEQ ID NO: 34)
erhalten.
-
Unter
Verwendung des Primerpaares CTG GGA TGG AAG GCA CGG TA (SEQ ID NO:
35) und GAG ACC ACA CAG CTA GAC AA (SEQ ID NO: 36) wurde der Promotor
mit der internen Bezeichnung P29B6 (SEQ ID NO: 37) erhalten.
-
4 stellt
eine schematische Beschreibung der isolierten Promotoren und der
Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengesetzt sind, bereit.
Die stromaufwärts
liegenden Sequenzen wurden gescreent hinsichtlich des Vorliegens
von Motiven, die Transkriptionsfaktorbindungsstellen oder bekannten
Transkriptionsstartstellen ähneln,
wobei das Computerprogramm Matlnspector Version 2.0, August 1996 verwendet
wurde.
-
Tabelle
VII beschreibt die Transkriptionsfaktorbindungsstellen, die in jedem
dieser Promotoren vorliegen. Die mit Matrix bezeichneten Spalten
zeigen den Namen der verwendeten Matlnspector-Matrix an. Die mit Position
bezeichnete Spalte zeigt die 5'-Position
der Promotorstelle an. Die Nummerierung der Sequenzen beginnt mit
der Transkriptionsstelle, wie sie durch Abgleich der Genomsequenz
mit der 5'-EST-Sequenz
bestimmt wird. Die Spalte, die mit „Orientierung" bezeichnet ist,
zeigt den DNA-Strang an, auf dem die Stelle nachgewiesen wird, wobei
der +-Strang der codierende Strang ist, wie durch Abgleich der Genomsequenz
mit der Sequenz des 5'-ESTs
bestimmt. Die Spalte, die mit „Score" bezeichnet ist,
zeigt den Matlnspector Score an, der für diese Stelle nachgewiesen
wurde. Die Spalte, die mit „Länge" bezeichnet ist,
zeigt die Länge
der Stelle in Nukleotiden. Die Spalte, die mit „Sequenz" bezeichnet ist, zeigt die Sequenz der
gefundenen Stelle.
-
Bakterienklone,
die Plasmide enthalten, welche die oben beschriebenen Promotorsequenzen
enthalten, werden gegenwärtig
in den Laboratorien des Erfinders unter den oben bereitgestellten
internen Identifizierungsnummern gelagert. Die Inserts können aus
den hinterlegten Materialien durch Anzucht eines Aliquotes eines
geeigneten Bakterienklons in dem geeigneten Medium gewonnen werden.
Die Plasmid-DNA kann anschließend
unter verwendung von dem Fachmann bekannten Plasmidisolierungsverfahren
isoliert werden, wie beispielsweise Verfahren zur alkalischen Lyse
im Miniprep-Maßstab
oder Plasmidisolierung auf Basis alkalischer Lyse im Großmaßstab. Wenn
gewünscht,
kann die Plasmid-DNA durch Zentrifugation auf einem Cäsiumchloridgradienten,
Größenausschlusschromatografie
oder Anionenaustauschchromatografie weiter angereichert werden.
Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann
anschließend
unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken
manipuliert werden. Alternativ kann eine PCR mit Primern, die an
beiden Enden der EST-Insertion konzipiert worden sind, durchgeführt werden. Das
dem 5'-EST entsprechende
PCR-Produkt kann anschließend
unter Verwendung von dem Fachmann bekannten Standardklonierungstechniken
manipuliert werden.
-
Die
Promotoren und andere regulatorische Sequenzen, die stromaufwärts der
erweiterten cDNAs oder 5'-ESTs
lokalisiert sind, können
verwendet werden, um Expressionsvektoren zu konzipieren, die in
der Lage sind, die Expression eines insertierten Gens in einer gewünschten
räumlichen,
zeitlichen, entwicklungsspezifischen oder quantitativen Weise zu
steuern. Ein Promotor, der in der Lage ist, die gewünschten
räumlichen, zeitlichen,
entwicklungsspezifischen und quantitativen Muster zu steuern, kann
unter Verwendung der Ergebnisse zur Expressionsanalyse, die in Beispiel
26 oben beschrieben wird, selektiert werden. Beispielsweise kann,
wenn ein Promotor erwünscht
ist, der ein hohes Maß an
Expression im Muskel verleiht, die Promotorsequenz, die stromaufwärts einer erweiterten
cDNA oder eines 5'-EST
liegt, die von einer mRNA abgeleitet sind, die im Muskel in hohem
Maße exprimiert
wird, im Expressionsvektor verwendet werden, wie es durch das Verfahren
gemäß Beispiel
26 bestimmt ist.
-
Vorzugsweise
wird der gewünschte
Promotor nahe einer multiplen Restriktionsschnittstelle platziert, um
die Klonierung des gewünschten
Inserts stromabwärts
des Promotors zu ermöglichen,
so dass der Promotor in der Lage ist, die Expression des insertierten
Gens zu steuern. Der Promotor kann in herkömmliche Nukleinsäuregerüste insertiert
werden, die für
eine extrachromosomale Replikation, eine Integration in die Wirtschromosomen
oder eine transiente Expression konzipiert sind. Geeignete Gerüste für die vorliegenden
Expressionsvektoren umfassen retrovirale Gerüste, Gerüste von eukaryotischen Episomen,
wie beispielsweise SV40 oder dem Bovine Papilloma-Virus, Gerüste von
bakteriellen Episomen oder künstliche
Chromosomen.
-
Vorzugsweise
umfassen die Expressionsvektoren ein PolyA-Signal stromabwärts der
multiplen Restriktionsstelle, dass zur Polyadenylierung von mRNA
dient, die von dem Gen transkribiert wird, das in den Expressionsvektor
insertiert ist.
-
Im
Anschluss an die Identifizierung von Promotorsequenzen unter Verwendung
von Verfahren gemäß den Beispielen
58–60
können
Proteine, die mit dem Promotor wechselwirken, wie in Beispiel 61
unten beschrieben identifiziert werden.
-
Beispiel 61
-
Identifizierung von Proteinen,
die mit Promotorsequenzen, stromaufwärts liegenden regulatorischer
Sequenzen oder mit mRNA wechselwirken
-
Sequenzen
innerhalb der Promotorregion, die wahrscheinlich Transkriptionsfaktoren
binden, können durch
Homologie mit bekannten Transkriptionsfaktorbindungsstellen oder
durch herkömmliche
Mutagenese- oder Deletionsanalysen von Reporterplasmiden identifiziert
werden, welche die Promotorsequenz enthalten. Beispielsweise können Deletionen
in einem Reporterplasmid erzeugt werden, das die Promotorsequenz
von Interesse enthält,
die operativ mit einem nachweisbaren Reportergen verknüpft ist.
Die Reporterplasmide, die verschiedene Deletionen innerhalb der
Promotorregion tragen, werden in eine geeignete Wirtszelle transfiziert und
die Wirkung der Deletionen auf die Expressionsniveaus wird beurteilt.
Transkriptionsfaktorbindungsstellen innerhalb der Regionen, in welchen
Deletionen die Expressionsniveaus absenken, können ferner unter Verwendung
von ortsgerichteter Mutagenese, Linkerscanning-Analyse oder anderen, dem Fachmann bekannten Techniken,
lokalisiert werden.
-
Nukleinsäuren, die
für Proteine
codieren, die mit Sequenzen im Promotor wechselwirken, können unter
Verwendung von Ein-Hybridsystemen identifiziert werden, wie beispielsweise
den Ein-Hybridsystemen, die im Handbuch beschrieben sind, das dem
Matchmaker One-Hybrid System-Kit beiliegt, welches von Clontech erhältlich ist
(Katalog Nr. K1603-1), dessen Offenbarung hierin durch Referenz
enthalten ist. In Kürze,
das Matchmaker One-Hybrid System wird wie folgt verwendet. Die Zielsequenz,
für die
es erwünscht
ist, bindende Proteine zu identifizieren, wird stromaufwärts von
einem selektierbaren Reportergen kloniert und in das Hefegenom integriert.
Vorzugsweise werden mehrere Kopien der Zielsequenzen als Tandem
in das Reporterplasmid insertiert. Eine Bibliothek, die aus Fusionsprodukten
von cDNAs, die hinsichtlich ihrer Fähigkeit an den Promotor zu
binden, beurteilt werden sollen, und der Aktivierungsdomäne eines
Hefetranskriptionsfaktors, wie beispielsweise GAL4, besteht, wird
in den Hefestammtransformiert, welcher die integrierte Reportersequenz enthält. Die
Hefe wird auf selektiven Medien ausplattiert, um Zellen zu selektieren,
die den selektierbaren Marker exprimieren, der mit der Promotorsequenz
verknüpft
ist. Die Kolonien, die auf den selektiven Medien wachsen, enthalten
Gene, die für
Proteine codieren, die an die Zielsequenz binden. Die Inserts in
den Genen, welche für
die Fusionsproteine codieren, werden ferner durch Sequenzierung
charakterisiert. Zusätzlich
können die
Inserts in Expressionsvektoren oder in in vitro-Transkriptionsvektoren
insertiert werden. Das Binden der durch Inserts codierten Polypeptide
an die Promotor-DNA kann durch Techniken, die dem Fachmann bekannt sind,
bestätigt
werden, wie beispielsweise Gelshift-Analysen oder DNAse-Protection-Analyse.
-
VII. Verwendung von 5'-ESTs (oder cDNAs
oder genomischer DNAs, die davon erhältlich sind) in der Gentherapie
-
Die
vorliegende Erfindung umfasst auch die Verwendung von 5'-ESTs (oder cDNA
oder genomischer DNA, die daraus erhältlich ist) in Strategien zur
Gentherapie, einschließlich
Antisense- und Triple Helix-Strategien, wie sie in den Beispielen
62 und 63 unten beschrieben werden. In Antisense-Ansätzen werden
zu einer mRNA komplementäre
Nukleinsäuresequenzen
intrazellulär
mit der mRNA hybridisiert, wodurch sie die Expression des durch
die mRNA codierten Proteins blockieren. Die Antisense-Sequenzen
können
die Genexpression durch eine Vielfalt an Mechanismen verhindern.
Beispielsweise können
die Antisense-Sequenzen
die Fähigkeit
der Ribosomen hemmen, die mRNA zu translatieren. Alternativ können die
Antisense-Sequenzen den Transport der mRNA aus dem Kern ins Zytoplasma
blockieren, wodurch die zur Translation zur Verfügung stehende mRNA-Menge beschränkt wird.
Ein anderer Mechanismus, über
den Antisense-Sequenzen die Genexpression hemmen können, ist
eine Wechselwirkung mit dem mRNA-Spleißen. In noch einer anderen
Strategie kann die Antisense-Nukleinsäure Teil eines Ribozyms sein,
das in der Lage ist, die ZielmRNA spezifisch zu spalten.
-
Beispiel 62
-
Herstellung
und Verwendung von Antisense-Oligonukleotiden
-
Die
Antisense-Nukleinsäuremoleküle, die
in der Gentherapie verwendet werden sollen, können entweder DNA- oder RNA-Sequenzen
sein. Sie können
eine Sequenz umfassen, die komplementär zu der Sequenz des 5'-ESTs (oder der cDNA
oder der genomischen DNA, die davon erhältlich ist) ist. Die Antisense-Nukleinsäuren können eine
Länge und
eine Schmelztemperatur aufweisen die ausreicht, die Bildung eines
intrazellulären
Duplex mit ausreichender Stabilität zu ermöglichen, um so die Expression
der mRNA in dem Duplex zu hemmen. Strategien zur Konzipierung von
Antisense-Nukleinsäuren,
die zur Verwendung in der Gentherapie geeignet sind, sind in Green
et al., Anm. Rev. Biochem. 55:569-597, 1986, und Izant und Weintraub,
Cell 36:1007-1015, 1984, offenbart.
-
In
einigen Strategien werden Antisense-Moleküle von einer Proteincodierenden
Nukleotidsequenz durch Umkehrung der Orientierung der codierenden
Region im Hinblick auf einen Promotor erhalten, um so den Gegenstrang
von dem Strang zu transkribieren, der normalerweise in der Zelle
transkribiert wird. Die Antisense-Moleküle können unter Verwendung von in
vitro-Transkriptionssystemen
transkribiert werden, wie beispielsweise denjenigen Systemen, die
T7- oder SP6-Polymerase verwenden, um das Transkript zu erzeugen. Ein
anderer Ansatz betrifft die Transkription der Antisense-Nukleinsäuren in
vivo, wobei eine DNA, welche eine Antisense-Sequenz enthält, in einem
Expressionsvektor operativ mit einem Promotor verknüpft wird.
-
Alternativ
können
Oligonukleotide, die zu dem Strang komplementär sind, der in der Zelle normalerweise
transkribiert wird, in vitro synthetisiert werden. Daher sind die
Antisense-Nukleinsäuren
komplementär zu
der entsprechenden mRNA und in der Lage, mit der mRNA zu hybridisieren,
um so ein Duplex zu erzeugen. In einigen Ausführungsformen können die
Antisense-Sequenzen modifizierte Zuckerphosphatgerüste enthalten,
um die Stabilität
zu erhöhen
und um sie weniger sensitiv für
einen RNAse-Angriff zu machen. Beispiele für Modifikationen, die zur Verwendung
in Antisense-Strategien geeignet sind, werden von Rossi et al.,
Pharmacol. Ther. 50(2):245-254, 1991, beschrieben.
-
Es
können
verschiedene Typen von Antisense-Oligonukleotiden verwendet werden,
die zu der Sequenz des 5'-ESTs
(oder der cDNA oder der genomischen DNA, die davon erhältlich ist)
komplementär
sind. In einer bevorzugten Ausführungsform
werden stabile und semi-stabile Antisense-Oligonukleotide verwendet, wie
in der internationalen Patentanmeldung Nr. PCT WO 94/23026 beschrieben
ist. In diesen Molekülen
sind das 3'-Ende
oder beide 3'- und
5'-Enden mit intramolekularen
Wasserstoffbrücken
zwischen komplementären Basenpaaren
belegt. Im Vergleich zu herkömmlichen
Antisense-Oligonukleotiden sind diese Moleküle besser in der Lage, Exonuklease-Angriffen
zu widerstehen und weisen eine erhöhte Stabilität auf.
-
In
einer anderen bevorzugten Ausführungsform
werden die Antisense-Oligodeoxynukleotide
gegen Herpes simplex Virus-Typ 1 und 2 verwendet, wie es in der
internationalen Patentanmeldung Nr. WO 95/0414 1 beschrieben ist.
-
In
noch einer weiteren bevorzugten Ausführungsform werden die kovalent
querverknüpften
Antisense-Oligonukleotide verwendet, die in der internationalen
Patentanmeldung Nr. WO 96/31523 beschrieben sind. Diese doppel-
oder einzelsträngigen
Oligonukleotide umfassen eine bzw. mehrere kovalente Inter- oder
Intraoligonukleotid-Querverknüpfungen,
wobei die Querverknüpfung
aus einer Amidbindung zwischen einer primären Amingruppe des einen Strangs
und einer Carboxylgruppe des anderen Strangs oder des gleichen Strangs besteht,
wobei die primäre
Amingruppe in der 2'-Position
des Strangnukleotid-Monosaccharidrings direkt substituiert ist und
die Carboxylgruppe durch eine aliphatische Spacergruppe getragen
wird, substituiert an einem Nukleotid oder Nukleotidanalogon des
anderen oder des gleichen Strangs.
-
Es
können
auch die Antisense-Oligodeoxynukleotide und Oligonukleotide, die
in der internationalen Anmeldung Nr. WO 92/18522 offenbart sind,
verwendet werden. Diese Moleküle
sind gegenüber
einem Abbau stabil und enthalten mindestens eine Transkriptionskontrollerkennungssequenz,
die an Kontrollproteine bindet und dafür als Köder wirksam ist. Diese Moleküle können "Haarnadel"-Strukturen, "Hantel-Strukturen" ("dumbbell" structures), "modifizierte Hantel"-Strukturen", "quervernetzte" Lockstrukturen" ("cross-linked" decoy structures)
und "Schleifen"-Strukturen enthalten.
-
In
einer weiteren bevorzugten Ausführungsform
werden die zyklischen doppelsträngigen
Oligonukleotide, die in der europäischen Patentanmeldung Nr.
0 572 287 A2 beschrieben sind, verwendet. Diese ligierten Oligonukleotid-"Hanteln" enthalten die Bindungsstelle
für einen
Transkriptionsfaktor und hemmen die Expression des unter Kontrolle
des Transkriptionsfaktors stehenden Gens durch Beschlagnahme des
Faktors.
-
Die
Verwendung der geschlossenen Antisense-Oligonukleotide, die in der
internationalen Anmeldung Nr. WO 92/19732 offenbart sind, ist ebenfalls
umfasst. Da diese Moleküle
keine freien Enden aufweisen, sind sie gegenüber Abbau durch Exonukleasen
resistenter als herkömmliche
Oligonukleotide. Diese Oligonukleotide können multifunktional sein und
können
mit mehreren Regionen, die zur Ziel-mRNA nicht benachbart sind, wechselwirken.
-
Die
geeignete Menge an Antisense-Nukleinsäuren, die benötigt wird,
um die Genexpression zu hemmen, kann unter Verwendung einer in vitro-Expressionsanalyse
bestimmt werden. Das Antisense-Molekül kann durch Diffusion, Injektion,
Infusion, Transfektion oder h-Region vermitteltem Import unter Verwendung von
im Fachbereich bekannten Verfahren in die Zellen eingeführt werden.
Beispielsweise kann die Antisense-Nukleinsäure als bloßes oder nacktes Oligonukleotid,
als in Lipid verkapseltes Oligonukleotid, als Oligonukleotidsequenz,
die durch ein virales Protein verkappselt ist, oder als eine Oligonukleotidsequenz,
die mit einem in einem Expressionsvektor enthaltenem Promotor operativ
verknüpft
ist, in den Körper
eingeführt
werden. Der Expressionsvektor kann ein beliebiger Vektor aus der
Vielfalt von im Fachbereich bekannten Expressionsvektoren sein,
einschließlich
retroviraler oder viraler Vektoren, Vektoren die zur extrachromosomalen
Replikation fähig
sind oder integrierenden Vektoren. Die Vektoren können DNA
oder RNA sein.
-
Die
Antisense-Moleküle
werden in Zellproben mit einer Reihe von verschiedenen Konzentrationen, vorzugsweise
zwischen 1 × 10–10 M
bis 1 × 10–10 M
eingeführt.
Nachdem die minimale Konzentration, welche die Genexpression adäquat kontrollieren
kann, identifiziert worden ist, wird die optimierte Dosis in eine
Dosierung umgerechnet, die zur Verwendung in vivo geeignet ist.
Beispielsweise wird eine Hemmkonzentration in Kultur von 1 × 10–10 zu
einer Dosis von etwa 0,6 mg/kg Körpergewicht
umgerechnet. Oligonukleotidmengen, die 100 mg/kg Körpergewicht
oder höher
erreichen, können
möglich
sein, nachdem die Toxizität
der Oligonukleotide an Labortieren getestet wurde. Es ist zusätzlich umfasst,
dass Zellen aus Wirbeltieren entnommen werden, mit Antisense-Oligonukleotiden
behandelt werden und wieder in das Wirbeltier eingeführt werden.
-
Es
ist ferner umfasst, dass die Antisense-Oligonukleotidsequenz in
eine Ribozymsequenz eingebracht wird, um eine spezifische Bindung
des Antisense-Elements
zu ermöglichen
und seine Ziel-mRNA zu spalten. Für technische Anwendungen im
Hinblick auf Ribozyme und Antisense-Oligonukleotide siehe Rossi
et al., supra.
-
In
einer bevorzugten Ausführungsform
dieser Erfindung wird das durch das Gen codierte Polypeptid zuerst
identifiziert, so dass die Wirkung der Antisense-Hemmung auf die Translation unter Verwendung
von Techniken überwacht
werden kann, die Antikörper-vermittelte
Tests, wie beispielsweise RIAs und ELISA, funktionale Assays oder
Radiomarkierung umfassen, aber nicht darauf beschränkt sind.
-
Die
erfindungsgemäßen 5'-ESTs (oder cDNAs
oder genomische DNAs, die davon erhältlich sind) können auch
in Gentherapieansätzen
verwendet werden, die auf der Bildung einer intrazellulären Triplehelix
beruhen. Triplehelix-Oligonukleotide werden verwendet, um die Transkription
von einem Genom zu hemmen. Sie sind insbesondere für Untersuchungen
hinsichtlich Veränderungen
der Zellaktivität
nützlich,
da sie mit einem bestimmten Gen in Zusammenhang stehen. Die erfindungsgemäßen 5'-EST-Sequenzen (oder
cDNAs oder genomische DNAs, die davon erhältlich sind) oder mehr bevorzugt
ein Abschnitt dieser Sequenzen kann verwendet werden, um die Genexpression
in Individuen mit Krankheiten, die mit der Expression eines bestimmten Gens
in Zusammenhang stehen, zu hemmen. In ähnlicher Weise kann ein Abschnitt
der 5'-EST-Sequenzen (oder der
cDNAs oder der genomischen DNAs, die davon erhältlich sind) verwendet werden,
um die Wirkung der Hemmung der Transkription eines bestimmten Gens
innerhalb der Zelle zu untersuchen. Herkömmlich wurden Homopurinsequenzen
im Rahmen von Triplehelix-Strategien für am nützlichsten gehalten. Jedoch können Homopyrimidinsequenzen
ebenfalls die Genexpression hemmen. Derartige Homopyrimidinoligonukleotide
binden an die große
Furche bei Homopurin/Homopyrimidinsequenzen. Deshalb sind beide
Arten von Sequenzen des 5'-ESTs
oder des Gens, das dem 5'-EST
entspricht, umfasst.
-
Beispiel 63
-
Herstellung
und Verwendung von Triplehelix-Sonden
-
Die
Sequenzen der 5'-ESTs
(oder der cDNAs oder der genomischen DNAs, die davon erhältlich sind) werden
durchsucht, um 10-mer oder 20-mer Homopyrimidin- oder Homopurinabschnitte
zu identifizieren, die in Strategien auf Grundlage von Triplehelices
zur Hemmung von Genexpression verwendet werden könnten. Im Anschluss an die
Identifizierung von potentiellen Homopyrimidin- oder Homopurinabschnitten
wird deren Wirksamkeit bei der Hemmung der Genexpression durch Einbringen
von verschiedenen Mengen an Oligonukleotiden, welche die Kandidatensequenzen
enthalten, in Gewebekulturzellen, die normalerweise das Zielgen exprimieren,
beurteilt. Die Oligonukleotide können
mit einem Oligonukleotid-Synthesizer hergestellt werden oder können kommerziell
von einer Firma bezogen werden, die sich auf die Oligonukleotidsynthese
für Kunden spezialisiert
hat, wie beispielsweise GENSET, Paris, Frankreich.
-
Die
Oligonukleotide können
in die Zellen unter Verwendung einer Vielfalt von dem Fachmann bekannten
Verfahren eingeführt
werden, einschließlich
aber nicht beschränkt
auf Calciumphosphatpräzipitiation, DEAE-Dextran,
Elektroporation, liposomvermittelte Transfektion oder native Aufnahme.
-
Behandelte
Zellen werden auf eine veränderte
Zellfunktionen oder verringerte Genexpression hin überwacht,
wobei Techniken, wie beispielsweise Northern Blotting, RNAse Protection-Assays
oder Strategien auf Grundlage von PCR verwendet werden, um die Transkriptionsmengen
des Zielgens in den Zellen zu überwachen,
die mit dem Oligonukleotid behandelt wurden. Die zu überwachenden
Zellfunktionen werden auf Grundlage der Homologien des Zielgens,
das der erweiterten cDNA entspricht, von der das Oligonukleotid
abgeleitet wurde, mit bekannten Gensequenzen, die mit einer bestimmten
Funktion im Zusammenhang stehen, vorhergesagt. Die Zellfunktionen
können
auch auf Grundlage des Vorliegens abnormaler Physiologien innerhalb
der Zellen, die aus Individuen mit einer Erbkrankheit abgeleitet
wurden, vorhergesagt werden, insbesondere wenn die erweiterte cDNA
mit der Krankheit verbunden ist, wobei die in Beispiel 56 beschriebenen
Techniken verwendet werden.
-
Die
Oligonukleotide, die bei der Hemmung der Genexpression in den Gewebekulturzellen
wirksam sind, können
anschließend
unter Verwendung von Techniken, die oben und in Beispiel 62 beschrieben
sind, mit einer Dosierung, die auf Grundlage der in vitro-Ergebnisse
berechnet wurde, wie es in Beispiel 62 beschrieben wird, eingeführt werden.
-
In
einigen Ausführungsformen
können
die natürlichen
(beta-) Anomere der Oligonukleotideinheiten durch alpha-Anomere
ersetzt werden, um so die Oligonukleotide gegenüber Nukleasen resistenter zu
machen. Ferner kann ein interkalierendes Mittel, wie beispielsweise
Ethidiumbromid oder dergleichen, an das 3'-Ende des alpha Oligonukleotids angebracht
werden, um die Triplehelix zu stabilisieren. Für Informationen zur Herstellung
von Oligonukleotiden, die zur Triplehelixbildung geeignet sind,
siehe Griffin et al., Science 245:967-971, 1989.
-
Beispiel 64
-
Verwendung von cDNAs,
welche unter Verwendung der 5'-ESTs
erhalten werden, Expression eines codierten Protein in einem Wirtsorganismus
-
Die
cDNAs, die wie oben beschrieben unter Verwendung der hierin beschriebenen
5'-ESTs erhalten wurden,
können
auch verwendet werden, um ein codiertes Protein in einem Wirtsorganismus
zu exprimieren, um eine vorteilhafte Wirkung zu erzielen. In solchen
Verfahren kann das codierte Protein transient im Wirtsorganismus
exprimiert werden oder das codierte Protein kann stabil im Wirtsorganismus
exprimiert werden. Das codierte Protein kann eine beliebige der
oben beschriebenen Aktivitäten
aufweisen. Das codierte Protein kann ein Protein sein, das im Wirtsorganismus
nicht vorhanden ist oder das codierte Protein kann alternativ die
im Wirtsorganismus vorkommenden Proteinmengen erhöhen.
-
Eine
erweiterte cDNA mit voller Länge,
die für
das Signalpeptid und für
das reife Protein codiert, oder eine erweiterte cDNA, die nur für das reife
Protein codiert, wird in den Wirtsorganismus eingeführt. Die
erweiterte cDNA kann in den Wirtsorganismus unter Verwendung einer
Vielfalt von dem Fachmann bekannten Techniken eingeführt werden.
Beispielsweise kann die erweiterte cDNA als nackte DNA in den Wirtsorganismus
injiziert werden, so dass das codierte Protein im Wirtsorganismus
exprimiert wird, wodurch eine vorteilhafte Wirkung erzielt wird.
-
Alternativ
kann die erweiterte cDNA in einen Expressionsvektor stromabwärts eines
Promotors kloniert werden, der im Wirtsorganismus aktiv ist. Der
Expressionsvektor kann ein beliebiger der Expressionsvektoren sein,
die zur Verwendung in der Gentherapie konzipiert sind, einschließlich viraler
oder retroviraler Vektoren. Der Expressionsvektor kann direkt in
den Wirtsorganismus eingeführt
werden, so dass das codierte Protein im Wirtsorganismus exprimiert
wird, um eine vorteilhafte Wirkung zu erzeugen. In einem anderen
Ansatz kann der Expressionsvektor in vitro in Zellen eingefügt werden.
Die Zellen, die den Expressionsvektor enthalten, werden danach selektiert
und in den Wirtsorganismus eingeführt, wo sie das codierte Protein
exprimieren, um eine vorteilhafte Wirkung zu erzeugen.
-
Beispiel 65
-
Verwendung von Signalpeptiden,
die durch 5'-ESTs
oder daraus erhaltenen Sequenzen codiert werden, um Proteine in
Zellen zu importieren
-
Die
kurze hydrophobe Kernregion (h) von Signalpeptiden, die durch die
5'-ESTs oder erweiterten
cDNAs codiert werden, die von den SEQ ID Nos: 38-185 abgeleitet
sind, können
auch als Träger
verwendet werden, um ein Peptid oder Protein von Interesse, eine
so genannte Fracht, in Gewebekulturzellen zu importieren (Lin et
al., J. Biol. Chem., 270:14225-14258, 1995; Du et al., J. Peptide
Res., 51:235-243, 1998; Rojas et al., Nature Biotech., 16:370-375,
1998).
-
Wenn
zellpermeable Peptide von beschränkter
Größe (etwa
bis zu 25 Aminosäuren) über eine
Zellmembran transloziert werden sollen, kann auf eine chemische
Synthese zurückgegriffen
werden, um die h-Region entweder an den C-Terminus oder an den N-Terminus
des Frachtpeptids von Interesse anzufügen. Alternativ können, wenn
längere
Peptide oder Proteine in Zellen importiert werden sollen, Nukleinsäuren genetisch verändert werden,
wobei dem Fachmann bekannte Techniken verwendet werden, um die erweiterte
cDNA-Sequenz, welche die h-Region codiert, mit dem 5'- oder 3'-Ende der DNA-Sequenz,
die das Frachtpolypeptid codiert, zu verknüpfen. Derartig genetisch veränderte Nukleinsäuren werden
anschließend
entweder in vitro oder in vivo nach der Transfektion in geeignete
Zellen translatiert, wobei herkömmliche
Techniken verwendet werden, um das resultierende zellpermeable Polypeptid
herzustellen. Geeignete Wirtszellen werden anschließend mit
dem zellpermeablen Polypeptid einfach inkubiert, das anschließend über die
Membran hinweg transloziert wird.
-
Dieses
Verfahren kann angewandt werden, um verschiedene intrazelluläre Funktionen
oder zelluläre Prozesse
zu untersuchen. Beispielsweise wurde es verwendet, um funktionell
relevante Domänen
intrazellulärer
Proteine zu sondieren und um Protein-Protein-Wechselwirkungen, die
an Signaltransduktionswegen beteiligt sind, zu untersuchen (Lin
et al., supra; Lin et al., J. Biol. Chem., 271:5305-5308, 1996;
Rojas et al., J. Biol. Chem., 271:27456-27461, 1996; Liu et al.,
Proc. Natl. Acad. Sci. USA, 93:11819-11824, 1996; Rojas et al.,
Bioch. Biophys. Res. Commun., 234:675-680, 1997).
-
Solche
Techniken können
in der Zelltherapie eingesetzt werden, um Proteine zu importieren,
wobei therapeutische Wirkungen erzielt werden. Beispielsweise können Zellen,
die aus einem Patienten isoliert wurden, mit importierten therapeutischen
Proteinen behandelt werden und anschließend wieder in den Wirtsorganismus
eingeführt
werden.
-
Alternativ
kann die h-Region von Signalpeptiden der vorliegenden Erfindung
in Kombination mit einem Kernlokalisierungssignal verwendet werden,
um Nukleinsäuren
in den Zellkern abzugeben. Derartige Oligonukleotide können Antisense-Oligonukleotide
oder Oligonukleotide sein, die konzipiert wurden, um Triplehelices zu
bilden, wie es in den Beispielen 62 bzw. 63 beschrieben wird, um
die Prozessierung und/oder Reifung einer zellulären Ziel-RNA zu hemmen.
-
Wie
oben beschrieben, können
die cDNAs oder Abschnitte davon, die unter Verwendung der hierin beschriebenen
5'-ESTs erhalten
wurden, für
verschiedene Zwecke verwendet werden. Die Polynukleotide können verwendet
werden, um rekombinantes Protein zur Analyse, Charakterisierung
oder therapeutischen Verwendung zu exprimieren; als Marker für Gewebe,
in denen das entsprechende Protein vorzugsweise exprimiert wird
(entweder konstitutiv oder in einer bestimmten Phase der Gewebedifferenzierung
oder -entwicklung oder bei Krankheitszuständen); als Molekulargewichtsmarker
auf Southern-Gelen; als Chromosomenmarker oder Tags (wenn markiert),
um Chromosomen zu identifizieren oder um miteinander in Beziehung
stehende Genpositionen zu kartieren; um sie mit endogenen DNA-Sequenzen
in Patienten zu vergleichen, um so mögliche genetische Erkrankungen
zu identifizieren; als Sonden zur Hybridisierung und zur Entdeckung
neuer miteinander in Beziehung stehender DNA-Sequenzen; als Informationsquelle,
um PCR-Primer für
genetisches Fingerprinting abzuleiten; für eine Auswahl und Herstellung
von Oligomeren zur Befestigung auf einem „Genchip" oder einem anderem Träger, einschließlich der
Untersuchung von Expressionsmustern; zur Herstellung von Anti-Protein-Antikörpern unter
Verwendung von DNA-Immunisierungstechniken und als Antigen zur Herstellung
von Anti-DNA-Antikörpern
oder um andere Immunantworten auszulösen. In Fällen, in denen das Polynukleotid
für ein
Protein codiert, das an ein anderes Protein bindet oder möglicherweise
bindet (beispielsweise in einer Rezeptor-Ligand-Wechselwirkung)
kann das Polynukleotid auch in Interaction Trap-Assays verwendet
werden (wie beispielsweise dem der in Gyuris et al., Cell 75:791-803,
1993 beschrieben wird), um Polynukleotide zu identifizieren, welche
für das
andere Protein codieren, mit welchen die Bindung stattfindet, oder
um Hemmstoffe der Bindewechselwirkung zu identifizieren.
-
Die
Proteine oder Polypeptide, die durch die vorliegende Erfindung bereitgestellt
werden, können
in ähnlicher
Weise in Assays verwendet werden, um die biologische Aktivität zu bestimmen,
einschließlich
einem Panel multipler Proteine für
Hochdurchsatz-Screening; um Antikörper zu erzeugen oder um eine
andere Immunantwort auszulösen;
als ein Reagenz (einschließlich
des markierten Reagenz) in Assays, die konzipiert sind, die Mengen
des Proteins (oder seines Rezeptors) in biologischen Fluiden quantitativ
zu bestimmen; als Marker für
Gewebe, in denen das entsprechende Protein vorzugsweise exprimiert
wird (entweder konstitutiv oder in einer bestimmten Phase der Gewebedifferenzierung
oder -entwicklung oder in einem Krankheitszustand); und selbstverständlich um
korrelierende Rezeptoren oder Liganden zu isolieren. In Fällen, in
denen das Protein bindet oder möglicherweise
bindet (wie beispielsweise in einer Rezeptor-Ligand-Wechselwirkung), kann das Protein
verwendet werden, um andere Proteine zu identifizieren, mit denen
eine Bindung stattfindet, oder um Hemmstoffe der Bindungswechselwirkung
zu identifizieren. Proteine, die bei diesen Bindungswechselwirkungen
beteiligt sind, können
auch verwendet werden, um nach Peptidhemmstoffen oder kleinen Molekülhemmstoffen
oder Agonisten dieser Bindewechselwirkung zu screenen.
-
Beliebige
oder alle dieser Forschungsmöglichkeiten
können
weiterentwickelt werden, dass sie als Reagenz geeignet sind, oder
für ein
Kit-Format zur Kommerzialisierung als Forschungsprodukte.
-
Die
oben aufgeführten
Verfahren zur Durchführung
der Verwendungen sind dem Fachmann allgemein bekannt. Referenzen,
die derartige Verfahren offenbaren, umfassen ohne Beschränkung Molecular
Cloning; A Laboratory Manual, 2. Ausgabe, Cold spring Harbor Laboratory
Press, Sambrook, Fritsch und Maniatis Hrsg., 1989, und Methods in
Enzymology; Guide to Molecular Cloning Techniques, Academic Press,
Berger und Kimmel Hrsg., 1987.
-
Erfindungsgemäße Polynukleotide
und Proteine können
auch als Nahrungsmittelquellen oder Nahrungsergänzungsstoffe verwendet werden.
Derartige Verwendungen umfassen ohne Beschränkung die Verwendung als Protein-
oder Aminosäurezusatz,
die Verwendung als Kohlenstoffquelle, die Verwendung als Stickstoffquelle
und die Verwendung als Kohlenwasserstoffquelle. In derartigen Fällen kann
das erfindungsgemäße Protein
oder Polynukleotid der Nahrung für
einen bestimmten Organismus zugefügt werden oder es kann als
getrennte feste oder flüssige
Präparation
verabreicht werden, wie beispielsweise in Form eines Puders, als
Pillen, Lösungen,
Suspensionen oder als Kapseln. Im Fall von Mikroorganismen kann
das erfindungsgemäße Protein
oder Polynukleotid dem Medium zugegeben werden, in oder auf welchem
der Mikroorganismus kultiviert wird. Tabelle
1: Parameter, welche für
jeden Schritt der EST-Analyse verwendet wurden
- * Verwendung des „Quick Fast" Datenbank-Scanners
- † Anordnung,
welche weiterhin so eingeschränkt,
dass näher
als 10 bp zum EST\5'-Ende
begonnen wird
- ¤ Verwendung
einer BLOSUM62 Substitutionsmatrix
Tabelle
II Tabelle
III Tabelle
IN Tabelle
V Tabelle
VI Tabelle
VII Beschreibung
von Transkritionsfaktorbindungsstellen, welche auf Promotoren vorliegen,
isoliert von Signal-Tag-Sequenzen SEQUENZPROTOKOLL