-
Hintergrund der Erfindung
-
Die
geschätzten
50000 bis 100000 Gene, die auf den humanen Chromosomen verteilt
sind, bieten ein großes
Versprechen für
das Verständnis,
die Diagnose und die Behandlung humaner Krankheiten. Darüber hinaus
finden Sonden, die in der Lage sind, spezifische an Loci zu hybridisieren,
die in dem humanen Genom verteilt sind, Anwendungen bei der Konstruktion
hoch aufgelöster
Chromosomenkarten und bei der Identifikation von Individuen.
-
In
der Vergangenheit war die Charakterisierung selbst eines einzigen
humanen Gens ein mühsames Verfahren,
das Jahre des Bemühens
erforderten. Kürzliche
Entwicklungen auf dem Gebiet der Klonierungsvektoren, der DNA-Sequenzierung
und der Computertechnik haben zusammen dazu geführt, die Rate mit der humane
Gene isoliert, sequenziert, kartiert und charakterisiert werden
können,
stark zu beschleunigen. Klonierungsvektoren wie z.B. künstliche
Hefechromosomen (yeast artificial chromosomes, YACs) und künstliche bakterielle
Chromosomen (bacterial artificial chromosomes, BACs) sind in der
Lage, DNA-Inserts mit einer Länge
im Bereich von 300 bis 1000 Kilobasen (kb) bzw. 100 bis 400 kb aufzunehmen,
wodurch die Manipulierung und das Ordnen von DNA-Sequenzen, die über große Distanzen auf den humanen
Chromosomen verteilt sind, erleichtert wird. Automatisierte DNA-Sequenzierungsmaschinen
erlauben die rasche Sequenzierung humaner Gene. Bioinformatik-Software
ermöglicht
den Vergleich von Nukleinsäure-
und Proteinsequenzen, wodurch sie bei der Charakterisierung humaner
Genprodukte behilflich ist.
-
Derzeit
werden zwei verschiedene Ansätze
verfolgt, die im humanen Genom verteilt sind, zu charakterisieren.
In einem Ansatz werden große
Fragmente genomischer DNA isoliert, kloniert und sequenziert. Mögliche offene
Leserahmen in diesen genomischen Sequenzen werden unter Verwendung
von Bioinformatik-Software identifiziert. Jedoch macht es dieser
Ansatz erforderlich, große
Abschnitte humaner DNA zu sequenzieren, die nicht für Proteine
kodiert, um Proteinkodierende Sequenzen zu finden, die in dem Genom
verteilt sind. Neben dem Erfordernis der umfangreichen Sequenzierung
kann die Bioinformatik-Software die erhaltenen genomischen Sequenzen
falsch charakterisieren. Folglich kann die Software Falschpositive
produzieren, in denen nicht-kodierende DNA fälschlich als kodierende DNA
charakterisiert wird oder Falschnegative, in denen kodierende DNA
als nicht-kodierende DNA falsch bezeichnet wird.
-
Ein
alternativer Ansatz geht einen direkteren Weg zur Identifizierung
und Charakterisierung humaner Gene. In diesem Ansatz werden komplementäre DNAs
(cDNAs) von den isolierten Messenger-RNAs (mRNAs) synthetisiert,
die für
humane Proteine kodieren. Bei der Verwendung dieses Ansatzes wird
eine Sequenzierung nur mit DNA durchgeführt, die von Proteinkodierenden
Teilen des Genoms stammt. Häufig
werden nur kurze Abschnitte der DNA sequenziert, um Sequenzen zu
erhalten, die exprimierte sequenzmarkierte Stellen (expressed sequence
tags, ESTs) genannt werden. Die ESTs können anschließend verwendet
werden, um verlängerte
cDNAs zu isolieren oder zu reinigen, die Sequenzen enthalten, die
benachbart zu den EST-Sequenzen sind. Die verlängerten cDNAs können die
gesamte Sequenz der EST enthalten, die verwendet wurde, um sie zu
erhalten, oder nur einen Teil der Sequenz der EST, die verwendet
wurde, um sie zu erhalten. Darüber hinaus
können
die verlängerten
cDNAs die vollständige
kodierende Sequenz des Gens enthalten, von dem die EST abgeleitet
war, oder alternativ können
die verlängerten
cDNAs Teile der kodierenden Sequenz des Gens enthalten, von dem
die EST stammt. Es wird einem bewusst sein, dass es mehrere verlängerte cDNAs
geben kann, welche die EST-Sequenz als Resultat eines alternativen
Splicings oder der Aktivität
verschiedener Promotoren enthalten.
-
In
der Vergangenheit wurden diese kurzen EST-Sequenzen häufig aus
Oligo-dT-geprimten
cDNA-Bibliotheken erhalten. Folglich entsprechen sie hauptsächlich dem
3' untranslatierten
Bereich der mRNA. Teilweise ist das Vorherrschen von EST-Sequenzen, die von
den 3'-Enden der
mRNA stammen, ein Ergebnis der Tatsache, dass übliche Verfahren zum Erhalten
von cDNAs zur Isolierung von cDNA-Sequenzen, die von den 5'-Enden der mRNAs
abgeleitet sind, nicht gut geeignet sind (Adams et al., Nature 377:3-174,
1996; Hillier et al., Genome Res. 6:807-828, 1996).
-
Darüber hinaus
entsprechen in Fällen,
in denen berichtet wurde, dass längere
cDNA-Sequenzen erhalten
wurden, die bezeichneten Sequenzen üblicherweise kodierenden Sequenzen
und enthalten den nicht den vollständigen 5' untranslatierten Bereich der mRNA,
von der die cDNA abgeleitet ist. Derartige unvollständige Sequenzen
können
das erste Exon der mRNA nicht enthalten, insbesondere in Situationen,
in denen das erste Exon kurz ist. Darüber hinaus können sie
einige Exons nicht enthalten, häufig
kür zere,
die stromaufwärts der
Splicingstellen lokalisiert sind. Folglich gibt es einen Bedarf,
Sequenzen zu erhalten, die von den 5'-Enden der mRNAs stammen.
-
Während zahlreiche
Sequenzen, die von humanen Chromosomen stammen, praktische Anwendungen
haben, sind Ansätze,
die auf der Identifizierung und Charakterisierung solcher chromosomaler
Sequenzen basieren, die für
ein Proteinprodukt kodieren, für
diagnostische und therapeutische Verwendungen besonders relevant.
Von den 50000 bis 100000 Protein-kodierenden Genen sind diejenigen
Gene, die für
Proteine kodieren, die von den Zellen sezerniert werden, in denen
sie synthetisiert werden, ebenso wie die sezernierten Proteine selbst,
besonders wertvoll als mögliche
therapeutische Wirkstoffe. Derartige Proteine sind häufig an
der Zell-Zell-Kommunikation beteiligt und können für die Produktion einer klinisch
relevanten Antwort in ihren Zielzellen verantwortlich sein.
-
Tatsächlich werden
derzeit mehrere sekretorische Proteine, einschließlich dem
Gewebe-Plasminogen-Aktivator
(tissue plasminogen activator) G-CSF, GM-CSF, Erythropoetin, dem
humanen Wachstumshormon, Insulin, Interferon-α, Interferon-β, Interferon-γ und Interleukin-2
klinisch verwendet. Diese Proteine werden verwendet, um einen weiten
Bereich von Krankheitszuständen,
einschließlich
dem akuten myokardialen Infarkt, dem akuten ischämischen Schlaganfall, der Anämie, der
Diabetes, der Wachstumshormondefizienz, Hepatitis, Nierenkarzinom,
Chemotherapie-induzierter Neutropenie und multipler Sklerose, zu
behandeln. Aus diesen Gründen
stellen verlängerte
cDNAs, die für
sezernierte Proteine oder Teile davon kodieren, eine besonders wertvolle
Quelle für
therapeutische Wirkstoffe dar. Folglich gibt es einen Bedarf zur
Identifizierung und Charakterisierung sezernierter Proteine sowie
der Nukleinsäuren,
die für
sie kodieren.
-
Sekretorische
Proteine sind nicht nur selbst therapeutisch nützlich, sondern umfassen außerdem kurze
Peptide, die Signalpeptide genannt werden, an ihren Aminotermini,
die ihre Sekretion steuern. Diese Signalpeptide werden von den Signalsequenzen
kodiert, die an 5'-Enden
der kodierenden Sequenzen der für
die sezernierten Proteine kodierenden Gene lokalisiert sind. Da
diese Signaipeptide die extrazelluläre Sekretion eines jeden Proteins
vermitteln, an das sie funktionell geknüpft sind, können die Signalsequenzen genutzt
werden, um die effiziente Sekretion irgendeines Proteins zu steuern,
indem die Signalsequenzen funktionell mit einem Gen verbunden werden,
das für
das Protein kodiert, dessen Sekretion gewünscht ist. Darüber hinaus können auch
Teile der Signalsequenzen verwendet werden, um den intrazellulären Import
eines Peptids oder Proteins von Interesse zu steuern. Dies könnte sich
nützlich
bei Gentherapie-Strategien er weisen, in denen es gewünscht wird,
ein bestimmtes Genprodukt an andere Zellen zu liefern als die Zelle,
in der es produziert wird. Signalsequenzen, die für Signalpeptide
kodieren, werden außerdem
bei der Vereinfachung von Protein-Reinigungsmethoden angewendet.
Bei solchen Verwendungen erleichtert die extrazelluläre Sekretion
des gewünschten
Proteins die Reinigung deutlich, indem die Anzahl ungewünschter
Proteine, aus denen das gewünschte
Protein selektiert werden muss, reduziert wird. Folglich gibt es
einen Bedarf zur Identifizierung und Charakterisierung der 5'-Bereiche der Gene
für sekretorische
Proteine, die für
Signalpeptide kodieren.
-
Öffentliche
Informationen über
die Anzahl humaner Gene, für
die die Promotoren und stromaufwärts gelegenen
regulatorischen Regionen identifiziert und charakterisiert worden
sind, sind ziemlich limitiert. Teilweise könnte dies zurückzuführen sein
auf die Schwierigkeit, derartige regulatorische Sequenzen zu isolieren. Stromaufwärts gelegene
regulatorische Sequenzen, wie z.B. Bindungsstellen für Transkriptionsfaktoren,
sind üblicherweise
zu kurz, um als Sonden zur Isolierung von Promotoren aus humanen
Genombibliotheken verwendet zu werden. Kürzlich wurden einige Ansätze entwickelt,
um humane Promotoren zu isolieren. Einer dieser Ansätze besteht
aus der Herstellung einer CpG-Insel-Bibliothek (Cross et al., Nature
Genetics 6:236-244, 1994). Der zweite besteht aus der Isolierung
humaner genomischer DNA-Sequenzen, die Spel-Bindungsstellen enthalten, durch die
Verwendung von Spel-bindenden Proteinen (Mortlock et al., Genome
Res. 6:327-335, 1996). Beide Ansätze
weisen Limitationen aufgrund eines Fehlens von Spezifität oder Umfassenheit
auf.
-
Die
vorliegenden 5'-ESTs
können
verwendet werden, um stromaufwärts
gelegene regulatorische Bereiche effizient zu identifizieren und
zu isolieren, welche die Lokalisierung, das Entwicklungsstadium,
die Geschwindigkeit und Menge der Proteinsynthese, ebenso wie die
Stabilität
der mRNA kontrollieren (Theil, BioFactors 4:87-93, 1993). Sobald
diese regulatorischen Bereiche identifiziert und charakterisiert
wurden, können sie
bei der Gentherapie oder bei der Proteinreinigung verwendet werden,
um die gewünschte
Menge oder Lokalisierung der Proteinsynthese zu erhalten oder die
Synthese ungewünschter
Genprodukte zu inhibieren, zu reduzieren oder zu verhindern.
-
Darüber hinaus
können
die ESTs, die die 5'-Enden
sekretorischer Proteingene enthalten, Sequenzen umfassen, die als
Sonden zur Chromosomenkartierung oder zur Identifizierung von Individuen
nützlich
sind. Folglich gibt es einen Bedarf zur Identifizierung und Charakterisierung
der Sequenzen, die stromaufwärts
der 5' kodierenden
Sequenzen von Genen liegen, die für sekretorische Proteine kodieren.
-
Zusammenfassung der Erfindung
-
Die
vorliegende Erfindung bezieht sich auf ein Signalpeptid, das die
Sequenz der Aminosäuren
-22 bis -1 der SEQ ID NR: 307 hat. Außerdem werden gereinigte, isolierte
oder rekombinante ESTs beschrieben, die Sequenzen enthalten, die
von den authentischen 5'-Enden
oder ihren korrespondierenden mRNAs stammen. Der Begriff "korrespondierende
mRNA" bezieht sich
die mRNA, die das Template für
die cDNA-Synthese war, die die 5'-EST
hervorbrachte. Diese Sequenzen werden hierin im Folgenden als "5'-ESTs" bezeichnet. Wie hierin
verwendet, erfordert der Begriff "gereinigt" keinen absolute Reinheit; vielmehr
ist er als relative Definition gedacht. Individuelle 5'-EST-Klone, die aus
einer cDNA-Bibliothek isoliert wurden, wurden konventionell gereinigt
bis zur elektrophoretischen Homogenität. Die aus diesen Klonen erhaltenen
Sequenzen konnten nicht direkt aus der Bibliothek oder aus gesamter
humaner DNA erhalten werden. Die cDNA-Klone kommen als solche nicht
natürlich
vor, sondern werden durch Manipulation einer teilweise gereinigten
natürlich
vorkommenden Substanz (Messenger-RNA) erhalten. Die Konversion von
mRNA in eine cDNA-Bibliothek umfasst die Erzeugung einer synthetischen
Substanz (cDNA), und reine individuelle cDNA-Klone können durch
klonale Selektion aus der synthetischen Bibliothek erhalten werden.
Folglich führt
die Erzeugung einer cDNA-Bibliothek aus Messenger-RNA und die anschließende Isolierung
individueller Klone aus dieser Bibliothek zu einer etwa 104- bis 106-fachen
Reinigung der nativen Message. Die Reinigung des Ausgangsmaterials
oder natürlichen
Materials auf wenigstens eine Größenordnung,
vorzugsweise zwei oder drei Größenordnungen,
oder noch bevorzugter vier oder fünf Größenordnungen, ist ausdrücklich vorgesehen.
-
Wie
hierin verwendet, erfordert die Bezeichnung "isoliert", dass das Material aus dessen ursprünglichen
Umgebung entnommen wird (z.B. der natürlichen Umgebung, wenn es natürlich vorkommt).
Zum Beispiel ist ein natürlich
vorkommendes Polynukleotid, das in einem lebenden Tier vorhanden
ist, nicht isoliert, jedoch dasselbe Polynukleotid, das von einigen
oder dem gesamten koexistierenden Material in dem natürlichen
System abgetrennt ist, ist isoliert.
-
Wie
hierin verwendet, bedeutet der Begriff "rekombinant", dass die 5'-EST neben einer "Backbone"-Nukleinsäure liegt, neben der sie in
ihrer natürlichen
Umgebung nicht liegt. Zusätzlich
werden die 5'-ESTs,
um "angereichert" zu sein, 5% oder
mehr der Anzahl von Nukleinsäureinserts
in einer Population von Nukleinsäure-Backbone-Molekülen repräsentieren.
Backbone-Moleküle
gemäß der vorliegenden
Erfindung schließen
Nukleinsäuren,
wie z.B. Expressionsvektoren, selbstreplizierende Nukleinsäuren, Viren,
integrierende Nukleinsäuren
und andere Vektoren oder Nukleinsäure, die verwendet werden,
um ein Nukleinsäureinsert von
Interesse aufrechtzuerhalten oder zu manipulieren ein. Vorzugsweise
repräsentieren
die angereicherten 5'-ESTs
15% oder mehr der Anzahl von Nukleinsäureinserts in der Population
rekombinanter Backbone-Moleküle.
Bevorzugter repräsentieren
die angereicherten 5'-ESTs
50% oder mehr der Anzahl von Nukleinsäureinserts in der Population
rekombinanter Backbone-Moleküle.
In einer höchstbevorzugten
Ausführungsform
repräsentieren
die angereicherten 5'-ESTs
90% oder mehr der Anzahl von Nukleinsäureinserts in der Population rekombinanter
Backbone-Moleküle.
-
"Stringente", "moderate" und "schwache" Hybridisierungsbedingungen
sind wie in Beispiel 29 definiert.
-
Soweit
nicht anders angegeben, ist eine "komplementäre" Sequenz vollständig komplementär. Folglich
sind 5'-ESTs in
cDNA-Bibliotheken, in den eine oder mehrere 5'-ESTs 5% oder mehr der Anzahl von Nukleinsäureinserts
in den Backbone-Molekülen
ausmachen, "angereicherte
rekombinante 5'-ESTs", wie hierin definiert. Ähnlich sind
5'-ESTs in einer
Population von Plasmiden, in denen eine oder mehrere 5'-ESTs gemäß der vorliegenden
Erfindung insertiert wurden, so dass sie 5% oder mehr der Anzahl
von Inserts in den Plasmid-Backbones ausmachen, "angereicherte rekombinante 5'-ESTs", wie hierin definiert.
Jedoch sind 5'-ESTs in
cDNA-Bibliotheken, in denen 5'-ESTs
weniger als 5% der Anzahl von Nukleinsäureinserts in der Population von
Backbone-Molekülen
ausmachen, wie z.B. Bibliotheken, in denen Backbone-Molekülen, die
ein 5'-EST-Insert
aufweisen, sehr rar sind, keine "angereicherten
rekombinanten 5'-ESTs".
-
Insbesondere
werden 5'-ESTs beschrieben,
die von Genen stammen, die für
sezernierte Proteine kodieren. Wie hierin verwendet, ist ein "sezerniertes" Protein eines, um
das, wenn es in einer geeigneten Wirtszelle exprimiert wird, über oder
durch eine Membran transportiert wird, einschließlich einem Transport als Ergebnis
von Signalpeptiden in dessen Aminsosäuresequenz. "Sezernierte" Proteine schließen ohne
Einschränkung
Proteine ein, die vollständig
sezerniert werden (z.B. Flüssigproteine)
oder teilweise sezerniert werden (z.B. Rezeptoren) von den Zellen,
in denen sie exprimiert werden. "Sezernierte" Proteine schließen außerdem ohne
Einschränkung
Proteine ein, die über
die Membran des endoplasmatischen Reticulums transportiert werden.
-
Solche
5'-ESTs schließen Nukleinsäuresequenzen
ein, die Signalsequenzen genannt werden, die für Signalpeptide kodieren, die
die extrazelluläre
Sekretion der Proteine steuern, die durch die Gene kodiert werden,
von denen die 5'-ESTs
abgeleitet sind. Im Allgemeinen sind die Signalpeptide an dem Aminoterminus
der sezernierten Proteine lokalisiert.
-
Sezernierte
Proteine werden von Ribosomen translatiert, die mit dem "rauen" endoplasmatischen
Reticulum assoziiert sind. Im Allgemeinen werden sezernierte Proteine
kotranslationell zu der Membran des endoplasmatischen Reticulums
transferiert. Die Assoziation des Ribosoms mit dem endoplasmatischen
Reticulum während
der Translation sezernierter Proteine wird durch das Signalpeptid
vermittelt. Das Signalpeptid wird typischerweise nach dessen kotranslationellen
Eintritt in das endoplasmatische Reticulum abgespalten. Nach der
Lieferung an das endoplasmatische Reticulum können die sezernierten Proteine
durch den Golgi-Apparat weitergehen. In dem Golgi-Apparat können die
Proteine einer posttranslationellen Modifikation unterzogen werden,
bevor sie in sekretorische Vesikel eintreten, welche sie über die
Zellmembran transportieren.
-
Die
hierin beschriebenen 5'-ESTs
haben mehrere wichtige Anwendungen. Zum Beispiel können sie verwendet
werden, um cDNA-Klone zu erhalten und zu exprimieren, welche die
kodierenden Sequenzen des vollständigen
Proteins der korrespondierenden Genprodukte enthalten, einschließlich den
authentischen Translationsstartstellen, die von den 5'-Enden der kodierenden
Sequenzen der mRNAs stammen, von denen die 5'-ESTs abgeleitet sind. Diese cDNAs werden
hierin im Folgenden als "vollständig lange
cDNAs" bezeichnet.
Diese cDNAs können
außerdem
DNA enthalten, die von mRNA-Sequenzen stromaufwärts der Translationsstartstellen
stammen. Die vollständig
langen cDNA-Sequenzen
können
verwendet werden, um die Proteine zu exprimieren, die den 5'-ESTs entsprechen.
Wie oben erläutert,
sind sezernierte Proteine therapeutisch wichtig. Folglich können die
von den cDNAs exprimierten Proteine verwendet werden bei der Behandlung
oder dem Beherrschen einer Vielzahl humaner Zustände. Die 5'-ESTs können außerdem verwendet werden, um
die korrespondierende/entsprechende genomische DNA zu erhalten.
Der Begriff "korrespondierende/entsprechende
genomische DNA" bezeichnet
die genomische DNA, die die mRNA kodiert, von welcher der 5'-EST abgeleitet wurde.
-
Alternativ
können
die 5'-ESTs verwendet
werden, um verlängerte
cDNAs zu erhalten und zu exprimieren, die für Teile der sezernierten Proteine
kodieren. Die Teile können die
Signalpeptide der sezernierten Proteine oder die reifen Proteine
umfassen, die erzeugt werden, wenn das Signalpeptid abgespalten
wird. Die Teile können
außerdem
Polypeptide umfassen, die wenigstens 10 konsekutive Aminosäuren aufweisen,
die durch die verlängerten
cDNAs oder vollständig
langen cDNAs kodiert werden. Alternativ können die Teile wenigstens 15
konsekutive Aminsäuren
umfassen, die von den verlängerten
cDNAs oder den vollständig
langen cDNAs kodiert werden. In einigen Ausführungsformen können die
Teile wenigstens 25 konsekutive Aminosäuren umfassen, die von den
verlängerten
cDNAs oder vollständig
langen cDNAs kodiert werden. In anderen Ausführungsformen können die
Teile wenigstens 40 Aminosäuren
umfassen, die durch die verlängerten
cDNAs oder vollständig
langen cDNAs kodiert werden.
-
Antikörper, die
die gesamten sezernierten Proteine spezifisch erkennen, welche von
den verlängerten cDNAs,
vollständig
langen cDNAs oder Fragmenten davon mit wenigstens 10 konsekutiven
Aminosäuren,
wenigstens 25 konsekutiven Aminosäuren oder wenigstens 40 konsekutiven
Aminosäuren,
können
ebenfalls wie unten beschrieben erhalten werden. Antikörper, die
das reife Protein spezifisch erkennen, das erzeugt wird, wenn das
Signalpeptid abgespalten wird, können
ebenfalls wie unten beschrieben erhalten werden. In ähnlicher
Weise können
Antikörper,
die die Signalpeptide, die durch die verlängerten cDNAs oder vollständig langen
cDNAs kodiert werden, erkennen, ebenfalls erhalten werden.
-
Die
verlängerten
cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, können die
Signalsequenz umfassen. Alternativ können die verlängerten
cDNA-Sequenzen, die unter Verwendung der 5'-ESTs erhalten wurden, die vollständigen kodierenden
Sequenzen für
das reife Protein enthalten (d. h. das Protein, das erzeugt wird,
wenn das Signalpeptid abgespalten wird). Zusätzlich können die unter Verwendung der
5'-ESTs erhaltenen
cDNAs regulatorische Regionen stromaufwärts der Translationsstartstelle
oder stromabwärts
des Stoppkodons enthalten, welche die Menge, die Lokalisierung oder
das Entwicklungsstadium der Genexpression steuern.
-
Wie
oben erläutert,
sind sezernierte Proteine therapeutisch wichtig. Folglich können die
Proteine, die von den verlängerten
cDNAs oder vollständig
langen cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, exprimiert werden,
bei der Behandlung oder dem Beherrschen einer Vielzahl von humanen
Zuständen nützlich sein.
-
Die
5'-ESTs (oder cDNAs
oder genomischen DNAs, die davon erhalten wurden), können verwendet werden
bei forensischen Verfahren, um Individuen zu identifizieren oder
in diagnostischen Verfahren, um Individuen zu identifizieren, die
genetische Krankheiten haben, die aus einer anomalen Expression
der Gene resultieren, die den 5'-ESTs
entsprechen. Zusätzlich
ist die vorliegende Erfindung nützlich
zur Konstruktion einer hoch auflösenden
Kartierung der humanen Chromosomen.
-
Die
vorliegende Erfindung bezieht sich außerdem auf Sekretionsvektoren,
die fähig
sind, die Sekretion eines Proteins von Interesse zu steuern. Derartige
Vektoren können
bei Gentherapiestrategien verwendet werden, in denen es gewünscht ist,
ein Genprodukt in einer Zelle zu produzieren, die zu einer anderen
Stelle im Körper
geliefert werden soll. Sekretionsvektoren können außerdem die Reinigung von gewünschten
Proteinen erleichtern.
-
Die
vorliegende Erfindung bezieht sich außerdem auf Expressionsvektoren,
die fähig
sind, die Expression eines insertierten Gens auf gewünschte räumliche
oder zeitliche Art und Weise oder mit einer gewünschten Konzentration zu steuern.
Derartige Vektoren können
Sequenzen stromaufwärts
der 5'-ESTs enthalten,
wie z.B. Promotoren oder upstream-regulatorische Sequenzen.
-
Signalpeptide
können
an heterologe Proteine fusioniert werden, um deren extrazelluläre Sekretion
zu steuern.
-
Bakterielle
Klone, die Bluescript-Plasmide enthalten, die Inserts haben, welche
die 5'-EST (SEQ ID NR: 149)
enthalten, werden zur Zeit bei 80°C
n 4% (v/v) Glycerin in Laboratorien des Erfinders unter den neben der
SEQ ID NR: in II aufgeführten
Bezeichnungen gelagert. Die Inserts können aus dem hinterlegten Material durch
Wachsenlassen der geeigneten Klone in einem geeigneten Medium gewonnen
werden. Die Bluescript-DNA
kann anschließend
unter Verwendung von Plasmid-Isolationsverfahren isoliert werden,
welche den Fachleuten auf dem Gebiet bekannt sind, wie z.B. die
alkalische Lyse Minipreps- oder alkalische Lyse Plasmid-Isolationsverfahren
in großem
Maßstab.
Wenn dies gewünscht
wird, kann die Plasmid-DNA weiter durch Zentrifugation auf einem
Cäsiumfluoridgradienten,
durch Größen-Ausschlusschromatographie
oder Anionenaustauschchromatographie angereichert werden. Die unter
Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter
Verwendung von Standard-Klonierungstechniken,
die den Fachleuten auf dem Gebiet bekannt sind, manipuliert werden.
Alternativ kann eine PCR durchgeführt werden mit Primern, die an
beiden Enden der EST-Insertion entworfen werden. Das PCR-Produkt,
das dem 5'-EST entspricht, kann dann
unter Verwendung von Standard-Klonierungstechniken, die den Fachleuten
auf dem Gebiet bekannt sind, manipuliert werden.
-
Beschrieben
wird eine gereinigte oder isolierte Nukleinsäure, die die Sequenz der SEQ
ID NR: 149 aufweist oder eine Sequenz, die komplementär dazu ist.
In einer Ausführungsform
ist die Nukleinsäure
rekombinant.
-
Beschrieben
wird eine gereinigte oder isolierte Nukleinsäure, die wenigstens 10 konsekutive
Basen der Sequenz der SEQ ID NR: 149 oder eine dazu komplementäre Sequenz
umfasst.
-
Beschrieben
wird eine gereinigte oder isolierte Nukleinsäure, die wenigstens 15 konsekutive
Basen der Sequenz der SEQ ID NR: 149 oder eine dazu komplementäre Sequenz
umfasst. In einer Ausführungsform ist
die Nukleinsäure
rekombinant.
-
Weiterhin
beschrieben wird eine gereinigte oder isolierte Nukleinsäure mit
wenigstens 15 Basen, die in der Lage ist, unter stringenten Bedingungen
mit der Sequenz der SEQ ID NR: 149 oder einer Sequenz, die komplementär zu der
SEQ ID NR: 149 ist, zu hybridisieren. In einer Ausführungsform
ist die Nukleinsäure
rekombinant.
-
Ebenfalls
beschrieben wird eine gereinigte oder isolierte Nukleinsäure, die
für ein
humanes Genprodukt kodiert, wobei das genannte humane Genprodukt
eine Sequenz hat, die teilweise durch die Sequenz der SEQ ID NR:
149 kodiert wird.
-
Ebenfalls
beschrieben wird ein Verfahren zur Herstellung eine cDNA, die für ein humanes
sekretorisches Protein kodiert, wobei das genannte humane sekretorische
Protein teilweise durch die SEQ ID NR: 149 kodiert wird, und das
Verfahren die Schritte des Inkontaktbringens einer Sammlung von
mRNA-Molekülen
aus humanen Zellen mit einem Primer, den wenigstens 15 konsekutive
Nukleotide einer Sequenz umfasst, die komplementär zur SEQ ID NR: 149 ist; das
Hybridisieren des genannten Primers mit einer mRNA in der genannten
Sammlung, die für
das genannte Protein kodiert; die reverse Transkription des genannten
hybridisierten Primers, um einen ersten cDNA-Strang von der genannten
mRNA herzustellen; das Herstellen eines zweiten cDNA-Strangs, der
komplementär
zu dem ersten cDNA-Strang ist; und das Isolieren der resultierenden
cDNA, die für
das genannte Protein kodiert, und den genannten ersten cDNA-Strang
und den genannten zweiten cDNA-Strang umfasst, umfasst.
-
Ebenfalls
beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes
sekretorisches Protein kodiert, wobei das genannte humane sekretorische
Protein das Protein umfasst, das durch die SEQ ID NR: 149 oder ein
Fragment davon von wenigstens 10 Aminosäuren kodiert wird, wobei die
genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen
Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA
die für
das vollständige
Protein kodierende Sequenz des genannten Proteins, wobei die Sequenz
teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
-
Ebenfalls
beschrieben wird ein Verfahren zur Herstellung einer cDNA, die für ein humanes
sekretorisches Protein kodiert, das teilweise durch die SEQ ID NR:
149 kodiert wird, umfassend die Schritte des Erhaltens einer cDNA,
umfassend die Sequenz der SEQ ID NR: 149; das Inkontaktbringen der
genannten cDNA mit einer detektierbaren Sonde, die wenigstens 15
konsekutive Nukleotide der genannten Sequenz der SEQ ID NR: 149
umfasst oder mit einer Sequenz, die dazu komplementär ist, unter
Bedingungen, welche der genannten Sonde erlauben, mit der genannten
cDNA zu hybridisieren. Das Identifizieren einer cDNA, die mit der
genannten detektierbaren Sonde hybridisiert; und das Isolieren der
genannten cDNA, die mit der genannten Sonde hybridisiert.
-
Ebenfalls
beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes
sekretorisches Protein kodiert, wobei das genannte humane sekretorische
Protein das Protein umfasst, das durch die SEQ ID NR: 149 oder ein
Fragment davon mit wenigstens 10 Aminosäuren kodiert wird; wobei die
genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen
Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA
die für
das vollständige
Protein kodierende Sequenz, die teilweise in der Sequenz der SEQ
ID NR: 149 enthalten ist.
-
Ebenfalls
beschrieben wird ein Verfahren zur Herstellung einer cDNA, die die
Sequenz der SEQ ID NR: 149 umfasst, umfassend die Schritte des Inkontaktbringens
einer Sammlung von mRNA-Molekülen
aus humanen Zellen mit einem ersten Primer, der fähig ist,
mit dem PolyA-Schwanz der genannten mRNA zu hybridisieren; Hybridisieren
des genannten ersten Primers mit dem genannten PolyA-Schwanz; reverse
Transkription der genannten mRNA, um einen ersten cDNA-Strang herzustellen;
Herstellen eines zweiten cDNA-Strangs, der komplementär zu dem
genannten ersten cDNA-Strang ist, unter Verwendung von wenigstens einem
Primer, der wenigstens 15 Nukleotide der Se quenz der SEQ ID NR:
149 umfasst; und Isolieren der resultierenden cDNA, die den genannten
ersten cDNA-Strang und den genannten zweiten cDNA-Strang umfasst.
-
Ebenfalls
beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes
sekretorisches Protein kodiert, wobei das genannte humane sekretorische
Protein das Protein umfasst, das durch die SEQ ID NR: 149 oder ein
Fragment davon mit wenigstens 10 Aminosäuren kodiert wird, wobei die
genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen
Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA
die kodierende Sequenz für
das vollständige
Protein, die teilweise in der Sequenz der SEQ ID NR: 149 enthalten
ist.
-
In
einer Ausführungsform
des Verfahrens, das in den beiden Abschnitten oben beschrieben wird,
wird der zweite cDNA-Strang durch Inkontaktbringen des genannten
ersten cDNA-Strangs mit einem ersten Primerpaar hergestellt, wobei
das genannte erste Primerpaar einen zweiten Primer umfasst, der
wenigstens 15 konsekutive Nukleotide der Sequenz der SEQ ID NR:
149 umfasst, sowie einen dritten Primer, der eine Sequenz darin
aufweist, die innerhalb der Sequenz des genannten ersten Primers
enthalten ist; durch Durchführen
einer ersten Polymerasekettenreaktion mit dem genannten ersten Paar
der nested Primer, um ein erstes PCR-Produkt zu erzeugen; durch
Inkontaktbringen des genannten ersten PCR-Produktes mit einem zweiten
Primerpaar, wobei das genannte zweite Primerpaar einen vierten Primer
umfasst, und der genannte vierte Primer wenigstens 15 konsekutive
Nukleotide der genannten Sequenz der SEQ ID NR: 149 umfasst, sowie
einen fünften Primer,
wobei die genannten vierten und fünften Primer in der Lage sind,
mit Sequenzen innerhalb des genannten ersten PCR-Produktes; und
durch Durchführen
einer zweiten Polymerasekettenreaktion, wodurch ein zweites PCR-Produkt erzeugt wird.
-
Ebenfalls
beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes
sekretorisches Protein kodiert, wobei das genannte sekretorische
Protein umfasst, das durch die SEQ ID NR: 149 kodiert wird, oder
ein Fragment davon mit wenigstens 10 Aminosäuren, wobei die genannte cDNA
mit Hilfe der in dem vorangehenden Abschnitt beschriebenen Verfahrens
zu erhalten ist. In einer Ausführungsform
umfasst die cDNA die kodierende Sequenz für das vollständige Protein,
die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
-
Ebenfalls
beschrieben wird das in den vier Abschnitten oben beschriebene Verfahren,
in dem der zweite cDNA-Strang mittels dem Kontaktring des genannten
ersten cDNA- Strangs
mit einem zweiten Primer hergestellt wird, der wenigstens 15 konsekutive
Nukleotide der Sequenz der SEQ ID NR: 149 umfasst, durch Hybridisieren
des genannten zweiten Primers mit dem genannten ersten cDNA-Strang;
und durch Verlängern
des genannten hybridisierten zweiten Primers, um den genannten zweiten
cDNA-Strang zu erzeugen.
-
Ebenfalls
beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes
sekretorisches Protein kodiert, wobei das genannte humane sekretorische
Protein das Protein umfasst, das teilweise durch die SEQ ID NR:
149 kodiert wird, oder ein Fragment davon mit wenigstens 10 Aminosäuren umfasst,
wobei die genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt
beschriebenen Verfahrens zu erhalten ist. In einer Ausführungsform
umfasst die cDNA die kodierende Sequenz des vollständigen Proteins,
die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
-
Ebenfalls
beschrieben wird ein Verfahren zur Herstellung eines Proteins, das
die Sequenz der SEQ ID NR: 307 umfasst, welches die Schritte des
Erhaltens einer cDNA, die für
die vollständige
Proteinsequenz kodiert, die teilweise in der Sequenz der SEQ ID
NR: 149 enthalten ist; das Insertieren der genannten cDNA in einen
Expressionsvektor, so dass die genannte cDNA funktionell mit einem
Promotor verbunden wird; das Einführen des genannten Expressionsvektors
in eine Wirtszelle, wodurch die genannte Wirtszelle das durch die genannte
cDNA kodierte Protein produziert; und das Isolieren des genannten
Proteins umfasst.
-
Ebenfalls
beschrieben wird ein isoliertes Protein, das mit Hilfe des in dem
vorangehenden Abschnitt beschriebenen Verfahrens erhältlich ist.
-
Ebenfalls
beschrieben wird ein Verfahren zum Erhalt einer Promotor-DNA, das
die Schritt des Gewinnens von cDNAs, die stromaufwärts der
Nukleinsäure
der SEQ ID NR: 149 oder von dazu komplementären Sequenzen; das Screenen
der genannten Upstream-DNAs, um einen Promotor zu identifizieren,
der fähig
zur Steuerung der Transkriptionsinitiation ist; und das Isolieren
der genannten DNA, die den genannten identifizierten Promotor umfasst,
umfasst. In einer Ausführungsform
umfasst der Schritt des Erhaltens ein Chromosomen-Walking von der
genannten Nukleinsäure
der SEQ ID NR: 149 oder einer dazu komplementären Sequenz. In einer weiteren
Ausführungsform
umfasst der Schritt des Screenens das Insertieren der genannten Upstream-Sequenzen
in einen Promotor-Reportervektor. In einer weiteren Ausführungsform
umfasst der Schritt des Screenens die Identifizierung von Motiven
in den genannten Upstream-DNAs, bei denen es sich um Bindungsstellen
für Transkriptionsfaktoren
oder Transkriptionsstartstellen handelt.
-
Ebenfalls
beschrieben wird ein isoliertes oder gereinigtes Protein, das die
Sequenz der SEQ ID NR: 307 umfasst.
-
Ebenfalls
beschrieben wird die Aufnahme der Sequenz der SEQ ID NR: 149 oder
der zu der Sequenz der SEQ ID NR: 149 komplementären Sequenz oder eines Fragmentes
davon mit wenigstens 15 konsekutiven Nukleotiden in ein Array einzelner
ESTs oder Fragmente davon mit wenigstens 15 Nukleotiden Länge.
-
Ebenfalls
beschrieben wird ein Promotor, der eine Sequenz hat, die ausgewählt ist
aus der Gruppe bestehend aus den SEQ ID NRn: 31; 34 UND 37.
-
Kurze Beschreibung der Abbildungen
-
1 ist
eine Zusammenfassung der Methode zum Erhalt von cDNAs, die so ausgewählt wurden, dass
sie die 5'-Enden
der mRNAs enthalten, von denen sie abgeleitet sind.
-
2 zeigt
die Verteilung der von Heijne-Auswertung für 5'-ESTs in jeder der hierin beschriebenen
Kategorien und die Wahrscheinlichkeit, dass diese 5'-ESTs für ein Signalpeptid
kodieren.
-
3 fasst
ein allgemeines Verfahren zusammen, das zum Klonieren und Sequenzieren
verlängerter cDNAs
verwendet wurde, die an 5'-ESTs
angrenzende Sequenzen enthalten.
-
4 (Beschreibung
von Promotorenstrukturen, die von SignalTag 5'-ESTs isoliert wurden) stellt eine schematische
Beschreibung isolierten Promotoren zur Verfügung und die Art und Weise
wie sie mit den korrespondierenden 5'-Tags zusammengesetzt sind.
-
Detaillierte Beschreibung
der bevorzugten Ausführungsformen
-
Tabelle
IV zeigt eine Analyse der 43 Aminosäuren, die sich an dem N-Terminus
sämtlicher
humaner SwissProt-Proteine befinden, um die Frequenz von Falschpositiven
und Falschnegativen zu bestimmen, unter Verwendung der für die Identifikation
von Signalpeptiden hierin beschriebenen Methoden.
-
Tabelle
V zeigt die Verteilung der 5'-ESTs
in jeder Kategorie, die hierin beschrieben wird, sowie die Anzahl
von 5'-ESTs in jeder
Kategorie, die ein bestimmtes Minimum der von Heijne-Punktzahl erreichen.
-
Tabelle
VI zeigt die Verteilung von 5'-ESTs
in jeder Kategorie, die hierin beschrieben wird, im Hinblick auf
die Gewebe, aus denen die 5'-ESTs
der korrespondierenden mRNA erhalten wurden.
-
Tabelle
VII zeigt die Bindungsstellen für
Transkriptionsfaktoren, die in jedem dieser Promotoren vorhanden
sind.
-
I. Allgemeine Verfahren zum Erhalt von
5'-ESTs, die von
mRNAs mit intakten 5'-Enden abgeleitet
sind
-
Um
die hierin beschriebenen 5'-ESTs
zu erhalten, müssen
mRNAs mit intakten 5'-Enden
erhalten werden. Zur Zeit gibt es zwei Ansätze zum Erhalt solcher mRNAs
mit intakten 5'-Enden,
wie unten beschrieben: entweder chemisch (1) oder enzymatisch (2).
-
1. Chemische Verfahren zum Erhalt von
mRNAs mit intakten 5'-Enden
-
Einer
dieser Ansätze
ist ein chemisches Modifikationsverfahren, das die Derivatisierung
der 5'-Enden der
mRNAs und die Auswahl der derivatisierten mRNAs umfasst. Die 5'-Enden von eukaryontischen mRNAs besitzen
eine Struktur, die als "Cap" bezeichnet wird,
die eine methyliertes Guanosin an der Position 7 umfassen. Die Cap-Struktur
ist an die erste transkribierte Phase der mRNA durch eine 5',5'-Triphosphatbindung
angefügt.
In einigen Fällen
ist das 5'-Guanosin
sowohl an den Positionen 2 als auch 7 methyliert. Selten ist das 5'-Guanosin dreifach
methyliert an den Positionen 2, 7 und 7. In dem chemischen Verfahren
zum Erhalt von mRNAs mit intakten 5'-Enden, wird die 5'-Cap-Struktur
spezifisch derivatisiert und an eine reaktive Gruppe auf einem immobilisierenden
Substrat gebunden. Diese spezifische Derivatisierung basiert auf
der Tatsache, dass nur die Ribose, die mit dem methylierten Guanosin
an dem 5'-Ende der
mRNA verbunden ist und die Ribose, die mit der Base an dem 3'-Terminus der mRNA
verbunden ist, 2',3'-Cis-Diole besitzen.
-
Optional
kann das 2',3'-Cis-Diol der 3'-terminalen Ribose
chemisch modifiziert, substituiert, konvertiert oder eliminiert
werden, was dazu führt,
dass nur die mit dem methylierten Guanosin an dem 5'-Ende der mRNA verbundene
Ribose mit einem 2',3'-Cis-Diol verbunden
ist. Eine Vielzahl von Methoden sind verfügbar, um das 2',3'-Cis-Diol in der 3'-terminalen Ribose
zu eliminieren. Zum Beispiel kann die kontrollierte alkalische Hydrolyse
verwendet werden, um mRNA-Fragmente zu erzeugen, in denen die 3'-terminale Ribose
ein 3'-Phosphat, 2'-Phosphat oder 2',3'-Cyclophosphat ist.
Danach kann das Fragment, das die ursprüngliche 3'-Ribose enthält, aus der Mischung über eine
Chromatographie auf eine Oligo-dT-Säule entfernt werden. Alternativ
kann eine Base, der das 2',3'-Cis-Diol fehlt,
an das 3'-Ende der
mRNA unter Verwendung einer RNA-Ligase, wie z.B. der T4 RNA-Ligase
angefügt
werden. Beispiel 1 unten beschreibt ein Verfahren zum Legieren eines
Nukleosiddiphosphates an das 3'-Ende
einer Messenger-RNA.
-
BEISPIEL 1
-
Ligation des Nukleosiddiphosphates pCp
an das 3'-Ende von
mRNA
-
1 μg RNA wurde
in einem Endreaktionsmedium von 10 μl in der Gegenwart von 5 U T4 Phagen-RNA-Ligase in dem von dem Hersteller
zur Verfügung
gestellten Puffer (Gibco – BRL)
inkubiert, 40 U des RNase-Inhibitors Rnasin (Promega) und 2 μl 32pCp (Amersham #PB 10208). Die Inkubation
wurde bei 37°C für 2 Stunden
oder über
Nacht bei 7-8°C
durchgeführt.
-
Nach
der Modifikation oder Elimination des 2',3'-Cis-Diols
an der 3'-Ribose
kann das 2',3'-Cis-Diol, das an
dem 5'-Ende der
mRNA vorhanden ist, unter Verwendung von Reagenzien, wie z.B. NaBH4, NaBH3CN oder Natriumperiodat
oxidiert werden, wodurch das 2',3'-Cis-Diol zu einem
Dialdehyd umgewandelt wird. Beispiel 2 beschreibt die Oxidation
des 2',3'-Cis-Diols an dem
5'-Ende der mRNA
mit Natriumperiodat.
-
BEISPIEL 2
-
Oxidation des 2',3'-Cis-Diols
an dem 5'-Ende der
mRNA mit Natriumperiodat
-
0,1
OD-Einheit entweder eines Oligoribonukleotids mit Cap-Struktur mit
47 Nukleotiden (einschließlich der
Cap oder eines Oligoribonukleotids ohne Cap-Struktur mit 46 Nukleotiden
wurden wie folgt behandelt. Die Oligoribonukleotide wurden mittels
in vitro-Transkription
unter Verwendung des Transkriptionskits "AmpliScribe T7" (Epicentre Technologies) hergestellt.
Wie unten angegeben enthielt das DNA-Template für das RNA-Transkript ein einziges
Cytosin. Um die RNA ohne Cap zu synthetisieren, wurden vier NTPs
in die in vitro-Transkriptionsreaktion eingeschlossen. Um die RNA
mit Cap zu erhalten, wurde GTP durch ein Analog der Cap-Struktur,
m7G(5')ppp(5')G ersetzt. Diese
Verbindung, die von der Polymerase erkannt wird, wurde in das 5'-Ende des im Entste hen
begriffenen Transkripts während
der Einleitung der Transkription eingebaut, wurde jedoch nicht während des
Verlängerungsschrittes
eingebaut. Folglich enthielt die resultierende RNA eine Cap-Struktur
an deren 5'-Ende.
Die Sequenzen der Oligoribonukleotide, die mittels der in vitro-Transkriptionsreaktion
hergestellt wurden, waren:
-
+Cap:
-
- 5'm7GpppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NR: 1)
-
–Cap:
-
- 5'-pppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NR: 2)
-
Die
Oligoribonukleotide wurden in 9 μl
Acetatpuffer (0,1 M Natriumacetat, pH 5,2) und 3 μl frisch
hergestellter 0,1 M Natriumperiodatlösung gelöst. Die Mischung wurde 1 Stunde
lang im Dunkeln oder bei 4°C oder
Raumtemperatur inkubiert. Anschließend wurde die Reaktion durch
Hinzugeben von 4 μl
eines 10%igen Ethylenglycols gestoppt. Das Produkt wurde mit Ethanol
präzipitiert,
in wenigstens 10 μl
Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser
dialysiert.
-
Die
resultierenden Aldehydgruppen können
anschließend
mit Molekülen
gekoppelt werden, die eine reaktive Aminogruppe aufweisen, wie z.B.
Hydrazin, Carbazid, Thiocarbazid oder Semicarbazidgruppen, um die
Anreicherung der 5'-Enden
der mRNAs zu erleichtern. Moleküle,
die reaktive Aminogruppen aufweisen, die geeignet sind zur Verwendung
bei dem Selektieren von mRNAs, die intakte 5'-Enden aufweisen, schließen Avidin,
Proteine, Antikörper,
Liganden, die fähig
sind, spezifisch an Rezeptormoleküle zu binden, oder Oligonukleotide
ein. Beispiel 3 unten beschreibt die Kopplung des resultierenden
Dialdehyds an Biotin.
-
BEISPIEL 3
-
Kopplung des Dialdehyds an das 5'-Ende von Transkripten
mit Biotin
-
Das
in Beispiel 2 erhaltene Oxidationsprodukt wurde in 50 μl Natriumacetat
bei einem pH zwischen 5 und 5,2 sowie 50 μl frisch hergestellter 0,02
M Lösung
von Biotinhydrazid in einer Methoxy/Ethanol-Wassermischung (1:1)
mit der Formel
gelöst.
-
In
der in diesen Beispielen verwendeten Verbindung ist n=5. Jedoch
wird man erkennen, dass andere, kommerziell erhältliche Hydrazide ebenfalls
verwendet werden können,
wie z.B. Moleküle
der oben genannten Formel, in denen n zwischen 0 und 5 schwankt.
Die Mischung wurde anschließend
für 2 Stunden
bei 37°C
inkubiert, mit Ethanol präzipitiert
und gegen destilliertes Wasser dialysiert. Beispiel 4 zeigt die
Spezifität
der Biotinylierungsreaktion.
-
BEISPIEL 4
-
Spezifität der Biotinylierung von Transkripten
mit Cap
-
Die
Spezifität
der Biotinylierung für
mRNAs mit Cap wurde mittels Gelelektrophorese der folgenden Proben
bestimmt.
-
Probe
1. Das in Beispiel 2 hergestellte in vitro-Transkript ohne Cap mit
46 Nukleotiden, das wie in Beispiel 1 mit 32pCp
markiert wurde.
-
Probe
2. Das in Beispiel 2 hergestellte in vitro-Transkript ohne Cap mit
46 Nukleotiden, das wie in Beispiel 1 markiert wurde, mit der Oxidationsreaktion
gemäß Beispiel
2 behandelt wurde und den Biotinylierungsbedingungen gemäß Beispiel
3 unterzogen wurde.
-
Probe
3. Das in Beispiel 2 hergestellte in vitro-Transkript mit Cap mit
47 Nukleotiden, das wie in Beispiel 1 beschrieben mit 32pCp
markiert wurde.
-
Probe
4. Das in Beispiel 2 hergestellte in vitro-Transkript mit Cap mit
47 Nukleotiden, das wie in Beispiel 1 beschrieben mit 32pCp
markiert wurde, mit der Oxidationsreaktion gemäß Beispiel 2 behandelt wurde und
den Biotinylierungsbedingungen gemäß Beispiel 3 unterzogen wurde.
-
Proben
1 und 2 hatten identische Migrationsraten, was zeigte, dass die
RNAs ohne Cap nicht oxidiert oder biotinyliert waren. Probe 3 migrierte
langsamer als Proben 1 und 2, während
Probe 4 die langsamste Migration zeigte. Die Unterschiede in der
Migration der RNA in den Proben 3 und 4 zeigt, dass die RNAs mit
Cap spezifisch biotinyliert waren.
-
In
einigen Fällen
können
RNAs mit intakten 5'-Enden
durch Bindung des Moleküls,
das eine reaktive Aminogruppe enthält, an ein geeignetes feste
Phase-Substrat angereichert werden, wie z.B. das Innere der die
mRNAs enthaltenden Gefäßes, magnetische
Beads, Chromatographiematrizes oder Nylon- oder Nitrocellulose-Membrane.
Zum Beispiel kann, wenn das Molekül mit der reaktiven Aminogruppe
ein Biotin ist, das feste Phase-Substrat
an Avidin oder Streptavidin gekoppelt werden. Alternativ kann, wenn
das Molekül
mit der reaktiven Aminogruppe ein Antikörper oder Rezeptorligand ist,
das feste Phase-Substrat an das verwandte Antigen oder Rezeptor
binden. Schließlich
kann, wenn das Molekül
mit der reaktiven Aminogruppe ein Oligonukleotid umfasst, das feste
Phase-Substrat ein komplementäres
Oligonukleotid umfassen.
-
Die
mRNAs mit den intakten 5'-Enden
können
nach dem Anreicherungsverfahren von der festen Phase freigesetzt
werden. Zum Beispiel können
die mRNAs, wenn das Dialdehyd an Biotinhydrazid gekoppelt ist und
die feste Phase Streptavidin umfasst, von der festen Phase einfach
durch Erhitzen auf 95°C
in 2% SDS freigesetzt werden. In einigen Verfahren kann das Molekül, das eine
reaktive Aminogruppe hat, auch von der mRNA mit intakten 5'-Enden nach der Anreicherung
abgespalten werden. Beispiel 5 beschreibt das Abfangen biotinylierter
mRNAs mit Beads, die mit Streptavidin beschichtet sind sowie die
Freisetzung der biotinylierten mRNAs von den Beads nach der Anreicherung.
-
BEISPIEL 5
-
Abfangen und Freisetzen der
biotinylierten mRNAs unter Verwendung von mit Streptavidin beschichteten
Beads
-
Die
mit Streptavidin beschichteten Beads wurden in Übereinstimmung mit den Angaben
des Herstellers (CPG Inc., USA) hergestellt. Die biotinylierten
mRNAs wurden zu einem Hybridisierungspuffer (1,5 M NaCl, pH 5-6)
gegeben. Nach der Inkubation für
30 Minuten wurde das ungebundene und nicht biotinylierte Material
entfernt. Die Beads wurden anschließend mehrere Male in Wasser
mit 1% SDS gewaschen. Die so erhaltenen Beads wurden für 15 Minuten
bei 95°C
in Wasser mit 2% SDS inkubiert.
-
Beispiel
6 zeigt die Effizienz, mit der biotinylierte mRNAs von mit Streptavidin
beschichteten Beads gewonnen wurden.
-
BEISPIEL 6
-
Effizienz der Gewinnung biotinylierter
mRNAs
-
Die
Effizienz des Gewinnungsverfahrens wurde wie folgt bestimmt. mRNAs
mit Cap wurden mit 32pCp markiert, oxidiert,
biotinyliert und an mit Streptavidin beschichtete Beads wie oben
beschrieben gebunden. Anschließend
wurden die gebundenen RNAs 5, 15 oder 30 Minuten bei 95°C in der
Gegenwart von 2% SDS inkubiert.
-
Die
Reaktionsprodukte wurden mittels Elektrophorese auf 12% Polyacrylamidgelen
unter denaturierenden Bedingungen (7 M Harnstoff) analysiert. Die
Gele wurden einer Autoradiografie unterzogen. Während dieser Manipulation wurden
die Hydrazonbindungen nicht reduziert.
-
Zunehmende
Mengen an Nukleinsäuren
wurden mit zunehmenden Inkubationszeiten in 2% SDS gewonnen, was
zeigt, dass die biotinylierten mRNAs effizient gewonnen wurden.
-
In
einem alternativen Verfahren zum Erhalt von mRNAs mit intakten 5'-Enden wird ein Oligonukleotid, das
derivatisiert wurde, so dass es eine reaktive Aminogruppe enthält, spezifisch
an mRNAs mit intakten Cap-Strukturen gekoppelt. Vorzugsweise wird
das 3'-Ende der mRNA vor
dem Schritt, in dem die Aldehydgruppen mit dem derivatisierten Oligonukleotid
zusammengebracht werden, wie oben beschrieben blockiert, um zu verhindern,
dass das derivatisierte Oligonukleotid mit dem 3'-Ende der mRNA zusammengefügt wird.
Zum Beispiel kann pCp an das 3'-Ende
der mRNA unter Verwendung der T4 RNA-Ligase wie in Beispiel 1 beschrieben angefügt werden.
Jedoch ist das Blockierendes 3'-Endes
der mRNA ein optionaler Schritt. Derivatisierte Oligonukleotide
können
wie in Beispiel 7 beschrieben hergestellt werden.
-
BEISPIEL 7
-
Derivatisierung von Oligonukleotiden
-
Ein
Oligonukleotid, das an seinem 3'-Ende
phosphoryliert ist, wurde zu einem 3'-Hydrazid
in 3' mittels Behandlung
mit einer wässrigen
Lösung
von Hydrazin oder von Hydrazid der Formel H2N(R1)NH2 bei etwa 1 bis 3 M und bei einem pH von
4,5 bei einer Temperatur von 8°C über Nacht
umgewandelt. Diese Inkubation wurde in der Gegen wart eines Carbodiimid-artigen
Agens, das in Wasser löslich
ist, wie z.B. 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid
mit einer Endkonzentration von 0,3 M durchgeführt.
-
Das
derivatisierte Oligonukleotid wurde anschließend von den anderen Agenzien
und Produkten unter Verwendung einer Standardmethode zur Isolierung
von Oligonukleotiden getrennt.
-
Wie
oben beschrieben können
die mRNAs, die angereichert werden sollen, behandelt werden, um
die 3'-OH-Gruppen
zu eliminieren, die auf ihnen vorhanden sein können. Dies kann durch enzymatische
Ligation, in der Sequenzen erreicht werden, denen ein 31 OH fehlt,
wie z.B. pCp, wie in Beispiel 1 beschrieben. Alternativ können die
3'-OH-Gruppen durch alkalische
Hydrolyse wie in Beispiel 8 unten beschrieben eliminiert werden.
-
BEISPIEL 8
-
Eliminierung der 3'-OH-Gruppen von mRNA unter Verwendung
der alkalischen Hydrolyse
-
In
einem Gesamtvolumen von 100 μl
0,1 N Natriumhydroxid werden 1,5 μg
für 40
bis 60 Minuten bei 4°C
inkubiert. Die Lösung
wird mit Essigsäure
neutralisiert und mit Ethanol präzipitiert.
-
Nach
der optionalen Eliminierung 3'-OH-Gruppen
werden die Diolgruppen an den 5'-Enden der mRNAs wie
unten in Beispiel 9 beschrieben oxidiert.
-
BEISPIEL 9
-
Oxidation der Diole der mRNA
-
Bis
zu 1 OD-Einheit RNA wurde in 9 μl
Puffer (0,1 M Natriumacetat, pH 6-7) oder Wasser sowie 3 μl frisch
hergestellter 0,1 M Natriumperiodatlösung gelöst. Die Reaktion wurde 1 Stunde
im Dunkeln bei 4°C
oder Raumtemperatur inkubiert. Nach der Inkubation wurde die Reaktion
durch Hinzufügen
von 4 μl
10% Ethylenglycol gestoppt. Anschließend wurde die Mischung bei
Raumtemperatur 15 Minuten lang inkubiert. Nach der Ethanolpräzipitation
wurde das Produkt in wenigstens 10 μl Wasser oder einem geeigneten
Puffer resuspendiert und gegen Wasser dialysiert.
-
Nach
der Oxidation der Diolgruppen an den 5'-Enden der mRNAs wurde das derivatisierte
Oligonukleotid mit den resultierenden Aldehyden wie in Beispiel
10 beschrieben verbunden.
-
BEISPIEL 10
-
Ligation der Aldehyde der mRNA mit derivatisierten
Oligonukleotiden
-
Die
oxidierte mRNA wurde in einem acidischen Medium wie z.B. 50 μl Natriumacetat
pH 4-6 gelöst.
50 μl einer
Lösung
des derivatisierten Oligonukleotids wurden dazugegeben, um ein mRNA:derivatisiertes
Oligonukleotid-Verhältnis
von 1:20 zu erhalten. Die Mischung wurde mit einem Borhydrid reduziert
und für
2 Stunden bei 37°C
oder über
Nacht (14 Stunden) bei 10°C
inkubiert. Die Mischung wurde anschließend mit Ethanol präzipitiert,
in 10 μl
oder mehr Wasser oder einem geeigneten Puffer resuspendiert und
gegen destilliertes Wasser dialysiert. Wenn gewünscht kann das resultierende
Produkt unter Verwendung der Acrylamid-Gelelektrophorese, HPLC-Analyse,
oder anderen konventionellen Methoden analysiert werden.
-
Nach
dem Anfügen
des derivatisierten Oligonukleotids an die mRNAs kann eine reverse
Transkriptionsreaktion wie unten in Beispiel 11 beschrieben durchgeführt werden.
-
BEISPIEL 11
-
Reverse Transkription der mRNAs, die mit
einem derivatisierten Oligonukleotid ligiert sind
-
Ein
Oligodeoxyribonukieotid wurde wie folgt derivatisiert. Drei OD-Einheiten
eines Oligodeoxyribonukleotids mit der Sequenz 5'ATCAAGAATTCGCACGAGACCATTA3' (SEQ ID NR: 3),
das 5'-OH und 3'-P-Enden hat, wurden
in 70 μl
einer 1,5 M Hydroxybenzotriazollösung,
pH 5,3, hergestellt in Dimethylformamid/Wasser (75:25), enthaltend
2 μg 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid,
gelöst.
Die Mischung wurde für
2 Stunden 30 Minuten bei 22°C
inkubiert und anschließend
zweimal in LiClO4/Aceton präzipitiert.
Das Pellet wurde in 200 μl
0,25 M Hydrazin resuspendiert und bei 8°C zwischen 3 bis 14 Stunden
inkubiert. Im Anschluss an die Hydrazinreaktion wurde die Mischung
zweimal in LiClO4/Aceton präzipitiert.
-
Die
Messenger-RNAs, die revers transkribiert werden sollten, wurden
aus Blöcken
von Plazenta mit Seitenlängen
von 2 cm, die bei –80°C gelagert
wurden, extrahiert. Gesamt- RNA
wurde unter Verwendung herkömmlicher
saurer Phenoltechniken extrahiert. Eine Oligo-dT-Chromatographie
wurde verwendet, um die mRNAs zu reinigen. Die Intaktheit der mRNAs
wurde mittels Northern Blotting überprüft.
-
Die
Diolgruppen auf 7 μg
der plazentalen mRNAs wurden oxidiert wie oben in Beispiel 9 beschrieben. Das
derivatisierte Oligonukleotid wurde mit den mRNAs wie in Beispiel
10 oben verbunden, außer
dass der Präzipitationsschritt
durch einen Austausch-Chromatographieschritt
ersetzt wurde, um die derivatisierten Oligodeoxyribonukleotide,
die nicht an die mRNAs angefügt
wurden, zu entfernen. Die Ausschlusschromatographie wurde wie folgt
durchgeführt:
10
ml Ultrogel AcA34 (BioSepra #230151)-Gel, eine Mischung aus Agarose
und Acrylamid, wurden in 50 ml einer Lösung aus 10 mM Tris pH 8,0,
300 mM NaCl, 1 mM EDTA und 0,05% SDS äquilibriert. Der Mischung wurde
erlaubt, zu sedimentieren. Der Überstand
wurde entfernt und das Gel wurde in 50 ml Puffer resuspendiert.
Dieses Verfahren wurde zwei- oder dreimal wiederholt.
-
Eine
Glaskugel (Durchmesser 3 mm) wurde in eine 2 ml Einwegpipette (Länge 25 cm)
eingeführt.
Die Pipette wurde mit der Gelsuspension gefüllt, bis sich die Höhe des Gels
1 cm von dem oberen Ende der Pipette stabilisierte. Die Säule wurde
anschließend
mit 20 ml Äquilibrierungspuffer
(10 mM Tris HCl pH 7,4, 20 mM NaCl) äquilibriert.
-
10 μl der mRNA,
die mit dem derivatisierten Oligonukleotid reagiert hatte, wurden
in 39 μl
von 10 mM Harnstoff und 2 μl
Blue-Glycerinpuffer gemischt, der durch Auflösen von 5 mg Bromphenolblau
in 60% Glycerin (v/v) und Gabe der Mischung durch einen Filter mit
0,45 μm
Durchmesser hergestellt wurde.
-
Die
Säule wurde
anschließend
mit der an das Oligonukleotid gekoppelten mRNAs beladen. Sobald
die Probe durchgedrungen war, wurde Äquilibrierungspuffer dazugegeben.
Fraktionen mit 100 μl
wurden anschließend
gesammelt. Das derivatisierte Oligonukleotid, das nicht an die mRNA
angefügt
worden war, erschien in Fraktion 16 und späteren Fraktionen. Folglich
wurden die Fraktionen 3 bis 15 zusammengegeben und mit Ethanol präzipitiert.
-
Um
festzustellen, ob das derivatisierte Oligonukleotid tatsächlich mit
mRNA verbunden war, wurde ein Zehntel der zusammengegebenen Fraktionen
zweimal auf einer Nylonmembran gespottet und mit einer radioaktiven
Sonde unter Verwendung herkömmlicher Methoden
hybridisiert. Die mit 32P markierte Sonde,
die in diesen Hybridisierungen verwendet wurde, war ein Oligodeoxyribonukleotid
mit der Sequenz 5'TAATGGTCTCGTGCGAATTCTTGAT3' (SEQ ID NR: 4),
die antikomplementär
zu dem derivatisierten Oligonukleotid ist. Ein nach der Autoradiografie
beobachtetes Signal zeigte an, dass das derivatisierte Oligonukleotid
tatsächlich
mit der mRNA verbunden war.
-
Die
verbleibenden neun Zehntel der mRNAs, die mit dem derivatisierten
Oligonukleotid zur Reaktion gebracht wurden, wurden wie folgt revers
transkribiert. Eine reverse Transkriptionsreaktion wurde mit reverser Transkriptase
in Übereinstimmung
mit den Angaben des Herstellers und 50 pmol Nonameren mit Zufallssequenzen
als Primern durchgeführt.
-
Um
sicherzustellen, dass die reverse Transkription durch die Cap-Struktur
durchgeführt
wurde, wurden zwei Arten von Experimenten durchgeführt.
-
In
dem ersten Ansatz wurde, nachdem die RNA der cDNA:RNA Heteroduplizes,
die von der reversen Transkriptionsreaktion erhalten wurden, durch
alkalische Hydrolyse entfernt wurden, ein Teil der resultierenden einzelsträngigen cDNAs
auf eine positiv geladene Membran gespottet und unter Verwendung
herkömmlicher Verfahren
mit einer mit 32P markierten Sonde hybridisiert,
die eine Sequenz hat, die identisch zu der des derivatisierten Oligonukleotids
ist. Kontrollspots, die 1 pmol, 100 fmol, 50 fmol, 10 fmol und 1
fmol eines Kontroll-Oligodeoxyribonukleotids mit einer Sequenz,
identisch zu der des derivatisierten Oligonukleotids ist, wurden
eingeschlossen. Das in den Spots, die die cDNA enthielten, erhaltene
Signal zeigte, dass etwa 15 fmol des derivatisierten Oligonukleotids
revers transkribiert worden waren. Diese Ergebnisse zeigen, dass
die reverse Transkription durch die Cap-Struktur hindurch durchgeführt werden
kann und, insbesondere, dass die reverse Transkriptase die 5'-P-P-P-5'-Bindung der Cap-Struktur
eukaryontischer Messenger-RNAs überwindet.
-
In
der zweiten Ausführung
des Experimentes wurden einzelsträngige cDNAs, die aus der oben
beschriebenen Synthese des ersten Strangs erhalten wurden, als Templates
für PCR-Reaktionen
verwendet. Zwei Arten von Reaktionen wurden durchgeführt. Zunächst wurde
eine spezifische Amplifikation der mRNAs für alpha-Globin, Dehydrogenase,
pp15 und Elongationsfaktor E4 unter Verwendung der folgenden Oligodeoxyribonukleotid-Primerpaare
durchgeführt.
-
alpha-Globin
-
- GLO-S: 5'CCG
ACA AGA CCA ACG TCA AGG CCG C3' (SEQ
ID NR: 5)
- GLO-As: 5'TCA
CCA GCA GGC AGT GGC TTA GGA G3' (SEQ
ID NR: 6)
-
Dehydrogenase
-
- 3 DH-S: 5'AGT
GAT TCC TGC TAC TTT GGA TGG C3' (SEQ
ID NR: 7)
- 3 DH-As: 5'GCT
TGG TCT TGT TCT GGA GTT TAG A3' (SEQ
ID NR: 8)
-
pp15
-
- PP15-S: 5'TCC
AGA ATG GGA GAC AAG CCA ATT T3' (SEQ
ID NR: 9)
- PP15-As: 5'AGG
GAG GAG GAA ACA GCG TGA GTC C3' (SEQ
ID NR: 10)
-
Elongationsfaktor E4
-
- EFA1-S: 5'ATG
GGA AAG GAA AAG ACT CAT ATC A3' (SEQ
ID NR: 11)
- EF1A-As: 5'AGC
AGC AAC AAT CAG GAC AGC ACA G3' (SEQ
ID NR: 12)
-
Zweitens
wurden auch nicht-spezifische Amplifikationen mit den Antisense-Oligodeoxyribonukleotiden der
oben beschriebenen Paare durchgeführt und mit einem Primer, der
von der Sequenz des derivatisierten Oligodeoxyribonukleotids abgeleitet
wurde (5'ATCAAGAATTCGCACGAGACCATTA3') (SEQ ID NR: 13).
-
Ein
Zwanzigstel der folgenden RT-PCR-Produktproben wurden auf einem
1,5% Agarosegel laufengelassen und mit Ethidiumbromid gefärbt.
-
Probe
1: Die Produkte einer PCR-Reaktion unter Verwendung der Globin-Primer
der SEQ ID NRn: 5 und 6 in Gegenwart von dazugegebener cDNA.
-
Probe
2: Die Produkte einer PCR-Reaktion unter Verwendung der Globin-Primer
der SEQ ID NRn: 5 und 6 in Abwesenheit von dazugegebner cDNA.
-
Probe
3: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer der SEQ ID NRn:
7 und 8 in Gegenwart von dazugegebener cDNA.
-
Probe
4: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer der SEQ ID NRn:
7 und 8 in Abwesenheit von dazugegebener cDNA.
-
Probe
5: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer
der SEQ ID NRn: 9 und 10 in Gegenwart von dazugegebener cDNA.
-
Probe
6: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer
der SEQ ID NRn: 9 und 10 in Abwesenheit von dazugegebener cDNA.
-
Probe
7: Die Produkte einer PCR-Reaktion unter Verwendung der ELF4-Primer
der SEQ ID NRn: 11 und 12 in Gegenwart von dazugegebener cDNA.
-
Probe
8: Die Produkte einer PCR-Reaktion unter Verwendung der ELF4-Primer
der SEQ ID NRn: 11 und 12 in Abwesenheit von dazugegebener cDNA.
-
Eine
Bande der erwarteten Größe für das PCR-Produkt
wurde nur in den Proben 1, 3, 5 und 7 beobachtet, was das Vorhandensein
der korrespondierenden Sequenz in der cDNA-Population anzeigt.
-
PCR-Reaktionen
wurden außerdem
mit den Antisensenukleotiden der Globin- und Dehydrogenase-Primern
(SEQ ID NRn: 6 und 8) und einem Oligonukleotid, dessen Sequenz der
der des derivatisierten Oligonukleotids entspricht, durchgeführt. Das
Vorhandensein von PCR-Produkten der erwarteten Größe in den Proben,
die den obigen Proben 1 und 3 entsprechen, zeigten, dass das derivatisierte
Oligonukleotid mit der mRNA verbunden worden war.
-
Die
obigen Beispiele fassen die chemischen Verfahren zur Anreicherung
von mRNAs mit intakten 5'-Enden
wie in
1 dargestellt zusammen. Weitere
Details bezüglich
der chemischen Ansätze
zum Erhalt solcher mRNAs sind in der internationalen Anmeldung Nr.
WO 96/34981 , veröffentlicht
am 7. November 1996, offenbart. Strategien auf Grundlage der oben
genannten chemischen Modifikationen der 5'-Cap-Strukturen können verwendet werden, um cDNAs
zu erzeugen, die so ausgewählt
sind, dass sie die 5'-Enden
der mRNAs, von denen sie abgeleitet sind, enthalten. In einer Version
derartiger Verfahren werden die 5'-Enden der mRNAs wie oben beschrieben
modifiziert. Anschließend
wird eine reverse Transkriptionsreaktion durchgeführt, um
einen Primer zu verlängern,
der komplementär
zu dem 5'-Ende der
mRNA ist. Einzelsträngige
RNAs werden eliminiert, um eine Population von cDNA/mRNA-Heteroduplizes
zu erhalten, in denen die mRNA ein intaktes 5'-Ende enthält. Die resultierenden Heteroduplizes
können
auf einer festen Phase, die mit einem Molekül beschichtet ist, das fähig ist,
mit dem für
die Derivatisierung des 5'-Endes
der mRNA verwendeten Moleküls
zu interagieren, abgefangen werden. Anschließend werden die Stränge der
Heteroduplizes voneinander getrennt, um einzelsträngige erste
cDNA-Stränge
zu gewinnen, die das 5'-Ende
der mRNA enthalten. Die cDNA-Synthese des zweiten Strangs kann anschließend unter
Verwendung her kömmlicher
Methoden durchgeführt
werden. Zum Beispiel können
die in
WO 96/34981 oder
in Carninci et al., Genomics 37:327-336, 1996, offenbarten Verfahren
verwendet werden, um cDNAs zu selektieren, welche die von dem 5'-Ende der kodierenden
Sequenz der mRNA abgeleitete Sequenz enthalten.
-
Nach
der Ligation des Oligonukleotid-Tags mit der 5'-Cap-Struktur der mRNA wird eine reverse
Transkriptionsreaktion durchgeführt,
um einen zu der mRNA des 5'-Endes
der mRNA komplementären
Primer zu verlängern.
Nach der Eliminierung der RNA-Komponente
aus der resultierenden Heteroduplex unter Verwendung von Standardmethoden
wird die cDNA-Synthese des zweiten Strangs mit einem zu dem Oligonukleotid-Tag komplementären Primer
durchgeführt.
-
2. Enzymatische Verfahren zum Erhalt von
mRNAs mit intakten 5'-Enden
-
Andere
Methoden zur Selektion von cDNAs, die sich bis zu dem 5'-Ende der mRNA erstrecken,
von denen sie abgeleitet wurden, sind vollständig enzymatisch. Einige Versionen
dieser Methoden sind in Dumas Milne Edwards J.B. (Doctoral Thesis
of Paris VI University, Le clonage des ADNc complets: difficultes
et perspectives nouvelles. Apports pour l'etude de la regulation de l'expression de la
tryptophane hydroxylase de rat, 20. Dez. 1993),
EPO 625572 und Kato et al, Gene 150:243-250,
1994 offenbart.
-
Kurz
beschrieben wird die isolierte mRNA in solchen Ansätzen mit
alkalischer Phosphatase behandelt, um die auf den 5'-Enden unvollständiger mRNAs
ohne Cap-Struktur vorhandenen Phosphatgruppen zu entfernen. Im Anschluss
an dieses Verfahren wird die Cap, die auf den vollständig langen
mRNAs vorhanden ist, enzymatisch mit einem Decapping-Enzym, wie
z.B. der T4-Polynukleotidkinase oder der sauren Pyrophosphatase
des Tabaks entfernt. Ein Oligonukleotid, das entweder ein DNA-Oligonukleotid
oder ein DNA-RNA-Hybridoligonukleotid sein kann, das eine RNA an
dessen 3'-Ende aufweist,
wird anschließend
an das an dem 5'-Ende
der mRNA mit entfernter Cap vorhandene Phosphat unter Verwendung
von T4-RNA-Ligase ligiert. Das Oligonukleotid kann eine Restriktionsstelle
enthalten, um die Klonierung der cDNAs im Anschluss an deren Synthese
zu erleichtern. Beispiel 12 unten beschreibt ein enzymatisches Verfahren
auf Grundlage der Doktorarbeit von Dumas.
-
BEISPIEL 12
-
Enzymatischer Ansatz zum Erhalt von 5'-ESTs
-
20 μg PolyA+-RNA
wurden unter Verwendung von Phosphatase aus dem Kälberdarm,
Calf Intestinal Phosphatase (Biolabs), dephosphoryliert. Nach einer
Phenol-Chloroform-Extraktion
wurde die Cap-Struktur der mRNA unter Verwendung der sauren Phosphatase
des Tabaks hydrolysiert (die wie von Shinshi et al, Biochemistry
15:2185-2190, 1976) gereinigt wurde, und ein Hemi-5'DNA/RNA-3'-Oligonukleotid,
das ein unphosphoryliertes 5'-Ende
aufweist, ein Abschnitt von Adenosinribophosphat an dem 3'-Ende und eine EcoRI-Schnittstelle
nahe dem 5'-Ende
wurden an die 5'P-Enden
der mRNA unter Verwendung der T4-RNA-Ligase (Biolabs) ligiert. Oligonukleotide,
die zur Verwendung in diesem Verfahren geeignet sind, weisen vorzugsweise 30
bis 50 Basen Länge
auf. Oligonukleotide, die ein unphosphoryliertes 5'-Ende haben, können durch
Hinzufügen
eines Fluorochroms an dem 5'-Ende
synthetisiert werden. Der Einschluss eines Abschnitts von Adenosinribophosphaten
an dem 3'-Ende des
Oligonukleotids erhöht
die Ligationseffizienz. Es wird verstanden, dass das Oligonukleotid
andere Klonierungsstellen als EcoRI enthalten kann.
-
Nach
der Ligation des Oligonukleotids an das an dem 5'-Ende der mRNA mit entferntem Cap vorhandene
Phosphat wird eine Synthese eines ersten und zweiten cDNA-Strangs
unter Verwendung herkömmlicher Verfahren
oder den in
EPO 625,572 und
Kato et al, s.o., und Dumas Milne Edwards, s. o., deren Offenbarung hiermit
durch Referenz eingeschlossen sind, durchgeführt. Die resultierende cDNA
kann anschließend
in Vektoren, wie z.B. den Kato et al., s. o., offenbarten oder anderen
Nukleinsäurevektoren,
die den Fachleuten auf dem Gebiet bekannt sind, unter Verwendung
von Methoden wie den in Sambrook et al., Molecular Cloning: A Laboratory
Manual 2d Ed., Cold Spring Harbor Laboratory Press, 1989 beschriebenen
ligiert werden.
-
II. Erhalt und Charakterisierung der 5'ESTs gemäß der vorliegenden
Erfindung
-
Die
hierin beschriebenen 5'-ESTs
wurden unter Verwendung der oben erwähnten chemischen und enzymatischen
Methoden zum Anreichern von mRNAs mit intakten 51 Enden wie unten
beschrieben erhalten.
-
1. Erhalt von 5'-ESTs unter Verwendung von mRNAs mit
intakten 5'-Enden
-
Zunächst wurden
mRNAs wie in Beispiel 13 unten beschrieben hergestellt.
-
BEISPIEL 13
-
Herstellung von mRNAs mit intakten 5'-Enden
-
Gesamte
humane RNAs oder PolyA+-RNAs, die aus 29
verschiedenen Geweben stammten, wurden entsprechend von LABIMO und
CLONTECH erworben und verwendet, um 44 cDNA-Bibliotheken wie folgt
zu erzeugen. Die gekaufte RNA war aus Zellen oder Geweben unter
Verwendung der sauren Guanidinthiocyanat-Phenol-Chloroform-Extraktion isoliert
worden (Chomczyniski und Sacchi, Analytical Biochemistry 162:156-159, 1987). PolyA+-RNA wurde aus Gesamt-RNA (LABIMO) isoliert
durch zwei Durchgänge
der Oligo-dT-Chromatographie, wie von Aviv und Leder, Proc. Natl.
Acad. Sd. USA 69:1408-1412, 1972 beschrieben, um ribosomale RNA
zu eliminieren.
-
Die
Qualität
und Integrität
der PolyA+-RNAs wurde überprüft. Northern Blots, die mit
einer Globinsonde hybridisierten, wurden verwendet, um zu bestätigen, dass
die mRNAs nicht degradiert waren. Kontaminationen der PolyA+-mRNAs durch ribosomale Sequenzen wurde
unter Verwendung von Northern Blots und einer von der Sequenz der
28S rRNA abgeleiteten Sonde überprüft. Präparationen
der mRNAs mit weniger als 5% rRNAs wurden bei der Konstruktion der
Bibliothek verwendet. Um zu vermeiden, dass Bibliotheken mit RNAs konstruiert
wurden, die durch exogene Sequenzen (prokaryontisch oder fungal)
kontaminiert waren, wurde die Gegenwart bakterieller 16S ribosomaler
Sequenzen oder von zwei stark exprimierten Pilz-mRNAs unter Verwendung
von PCR untersucht.
-
Nach
der Herstellung der mRNAs wurden die oben beschriebenen chemischen
und/oder die enzymatischen Verfahren zum Anreichern von mRNAs mit
intakten 5'-Enden
angewendet, um 5'-ESTs
aus den verschiedenen Geweben zu erhalten. In beiden Ansätzen wurde
ein Oligonukleotid-Tag an die 5'-Enden
der mRNAs angefügt.
Der Oligonukleotid-Tag
hatte eine EcoRI-Schnittstelle, um spätere Klonierungsverfahren zu erleichtern.
Um die Verarbeitung der einzelsträngigen und doppelsträngigen cDNA
zu erleichtern, die bei der Konstruktion der Bibliotheken erhalten
wurde, wurde dieselbe Nukleotidsequenz verwendet, um die ligierten Oligonukleotide
sowohl in den chemischen als auch enzymatischen Methoden zu konstruieren.
Nichtsdestotrotz war der in den chemischen Verfahren verwendete
Tag ein Oligodeoxyribonukleotid, das mit der Cap der mRNA verbunden
war, während
der Tag in der enzymatischen Ligation ein chimeres Hemi-5'DNA/RNA3'-Oligonukleotid war, das an das 5'-Ende der mRNA mit
entferntem Cap wie in Beispiel 12 beschrieben ligiert war.
-
Nach
dem Anfügen
des Oligonukleotid-Tags an die mRNA entweder durch chemische oder
enzymatische Verfahren wurde die Integrität der mRNA mittels Durchführung eines Northern
Blots mit 200 bis 500 ng mRNA unter Verwendung einer Sonde, die
komplementär
zu dem Oligonukleotid-Tag ist, untersucht, bevor die Synthese des
ersten Strangs wie in Beispiel 14 beschrieben durchgeführt wurde.
-
BEISPIEL 14
-
cDNA-Synthese unter Verwendung von mRNA-Templates
mit intakten 5'-Enden
-
Für die mRNAs,
die unter Verwendung sowohl von chemischen als auch enzymatischen
Verfahren mit Oligonukleotid-Tags verbunden wurden, wurde die Synthese
des ersten Strangs der cDNA unter Verwendung der Superscript II
(Gibco BRL) oder der RNase H Minus M-MLV (Promega) reversen Transkriptase
mit Zufallsnonameren als Primern durchgeführt. Um interne EcoRI-Schnittstellen
in der cDNA vor Verdau in späteren Schritten
des Verfahrens zu schützen,
wurde methyliertes dCTP für
die Synthese des ersten Strangs verwendet. Nach dem Entfernen der
RNA durch eine alkalische Hydrolyse wurde der erste Strang der cDNA
unter Verwendung von Isopropanol präzipitiert, um restliche Primer
zu beseitigen.
-
Sowohl
für die
chemischen als auch die enzymatischen Verfahren wurde der zweite
Strang der cDNA mit einem Klenow-Fragment unter Verwendung eines
Primers synthetisiert, der dem 5'-Ende
des in Beispiel 12 beschriebenen Oligonukleotids entspricht. Vorzugsweise
ist der Primer 20 bis 25 Basen lang. Methyliertes dCTP wurde ebenfalls
für die
Synthese des zweiten Strangs verwendet, um die internen EcoRI-Stellen
in der cDNA vor dem Verdau während
des Klonierungsverfahrens zu schützen.
-
Nach
der cDNA-Synthese wurden die cDNAs in pBlue Script wie in Beispiel
15 unten beschrieben kloniert.
-
BEISPIEL 15
-
Klonierung der von mRNA mit intakten 5'-Enden abgeleiteten
cDNAs in Blue Script
-
Nach
der Synthese des zweiten Strangs wurden die Enden der cDNA mit T4
DNA-Polymerase (Biolabs)
stumpf gemacht, und die cDNA wurde mit EcoRI verdaut. Da während der
cDNA-Synthese methyliertes dCTP verwendet wurde, war die in dem
Tag vorhandene EcoRI-Schnittstelle die einzige hemi-methylierte Schnittstelle,
und folglich die einzige Stelle, die empfindlich gegenüber einem
Verdau mit EcoRI war. Die cDNA wurde anschließend nach Größe fraktioniert
unter Verwendung einer Austauschchroma tographie (AcA, Biosepra)
und Fraktionen, die den cDNAs mit einer Länge von mehr als 150 bp entsprachen,
wurden vereinigt und mit Ethanol präzipitiert. Die cDNA wurde direkt
in die SmaI- und ExoRI-Enden des Phagemids pBlue Script-Vektors
(Stratagene) kloniert. Die Ligationsmischung wurde in Bakterien
elektroporiert und unter einer geeigneten Selektion mit Antibiotikum
propagiert.
-
Klone,
die den Oligonukleotid-Tag angefügt
enthielten, wurden anschließend
wie in Beispiel 16 unten beschrieben selektiert.
-
BEISPIEL 16
-
Selektion der Klone, die den Oligonukleotid-Tag
angefügt
haben
-
Die
Plasmid-DNAs, die 5'-EST-Bibliotheken
enthielten, wurden wie oben beschrieben gereinigt (Qiagen). Eine
positive Selektion der mit einem Tag versehenen Klone wurde wie
folgt durchgeführt.
Kurz beschrieben wurde die Plasmid-DNA in diesem Selektionsverfahren
unter Verwendung der Gen II-Endonuklease des F1-Phagens in Kombination
mit einer Exonuklease zu einzelsträngiger DNA umgewandelt (Chang
et al., Gene 127:95-8, 1993), wie z.B. der Exonuklease III oder
T7 Gen 6-Exonuklease. Die resultierende einzelsträngige wurde
anschließend
unter Verwendung von paramagnetischem Dienst wie von Fry et al.,
Biotechniques, 13:124-131, 1992 gereinigt. In diesem Verfahren wurde
die einzelsträngige
DNA mit einem biotinyliertem Oligonukleotid hybridisiert, das eine
Sequenz aufweist, die dem 3'-Ende
des in Beispiel 13 beschriebenen Oligonukleotids entspricht. Vorzugsweise
hat der Primer eine Länge
von 20 bis 25 Basen. Klone, die eine Sequenz enthalten, die komplementär zu dem
biotinylierten Oligonukleotid ist, wurden durch Inkubation mit magnetischen
Beads, die mit Streptavidin beschichtet sind, mittels magnetischer
Selektion gewonnen. Nach der Gewinnung der positiven Klone wurde
die Plasmid-DNA von den magnetischen Beads freigesetzt und unter
Verwendung einer DNA-Polymerase, wie z.B. der von Amersham Pharmacia
Biotech. erhaltenen Thermosequenase, in doppelsträngige DNA
umgewandelt. Alternativ können
Protokolle, wie z.B. das in dem Gene Trapper-Kit, das von Gibco
BRL erhältlich
ist, beschriebene, verwendet werden. Die doppelsträngige DNA
wurde anschließend
in Bakterien elektroporiert. Es wurde geschätzt, dass die Prozentzahl positiver
Klone, welche das 5'-Tag-Oligonukleotid
aufweisen, üblicherweise
zwischen 90 und 98% unter Verwendung der Dot Blot-Analyse lagen.
-
Nach
der Elektroporation wurden die Bibliotheken in 384 Mikrotiterplatten
(MTP) angeordnet. Eine Kopie der MTP wurde für zukünftige Verwendungen gelagert.
Anschließend
wurden die Bibliotheken in 96 MTP transferiert und wie unten beschrieben
sequenziert.
-
BEISPIEL 17
-
Sequenzierung der Inserts in ausgewählten Klonen
-
Die
Plasmid-Inserts wurden zunächst
mittels PCR auf PE 9600-Thermocyclern (perkin-Elmer, Applied Biosystems Division,
Foster City, CA) unter Verwendung von SETA-A und SETA-B-Standardprimern
(Genset SA), AmpliTaqGold (Perkin-Elmer), dNTPs (Boehringer), Puffer
und Zyklusbedingungen, wie sie von dem Unternehmen Perkin-Elmer empfohlen werden,
amplifiziert.
-
Die
PCR-Produkte wurden anschließend
unter Verwendung eines automatischen ABI Prism 377-Sequenzierers
(Perkin-Elmer) sequenziert. Die Sequenzierungsreaktionen wurden
unter Verwendung von PE 9600-Thermocyclern mit Farbstoff-Primer-Standardchemie und
Thermosequenase (Amersham Pharmacia Biotech) durchgeführt. Die
verwendeten Primer waren entweder T7 oder 221M13 (erhältlich von
Genset SA), wie geeignet. Die Primer wurden mit JOE-, FAM-, ROX-
und TAMRA-Farbstoffen markiert. Die in den Sequenzierungsreaktionen
dNTPs und ddNTPs wurden von Boehringer erworben. Der Sequenzierungspuffer,
Reagenzienkonzentrationen und Zyklusbedingungen waren wie von Amersham
empfohlen.
-
Nach
der Sequenzierungsreaktion wurden die Proben mit Ethanol präzipitiert,
in Formamid-Ladepuffer resuspendiert und auf ein 4% Standard-Acrylamidgel
geladen. Die Elektrophorese wurde für 2,5 Stunden bei 3000 V auf
einem ABI 377-Sequenzierer durchgeführt, und die Sequenzierungsdaten
wurden unter Verwendung der ABI Prism DNA-Sequenzierungs-Analysesoftware,
Version 2.1.2, gewonnen und analysiert.
-
2. Computeranalyse der erhaltenen 5'-ESTs: Konstruktion
von NetGene- und SignalTag-Datenbanken
-
Die
Sequenzdaten der 44 cDNA-Bibliotheken, die wie oben beschrieben
hergestellt wurden, wurden in eine geeignete Datenbank transferiert,
in der die Kontrolle der Qualität
und Auswertungsschritte durchgeführt
wurden. Ein geschützter
Base-Caller, der unter Verwendung eines Unix-Systems arbeitet, markierte
automatisch mutmaßliche
Peaks, wobei die Form der Peaks berücksichtigt wurde, die Zwischenpeakauflösung und
der Geräuschpegel.
Der geschützte
Base-Caller führte
außerdem
ein automatisches Zurechtschneiden durch. Jeder Abschnitt mit 25
oder weniger Basen, der mehr als vier verdächtige Peaks aufwies, wurde
als unzuverlässig
betrachtet und verworfen. Sequenzen, die den Klonierungsvektor oder
den Ligierungsoligonukleotiden entsprachen, wurden automatisch aus
den EST-Sequenzen entfernt. Jedoch können die resultierenden EST-Sequenzen
1 bis 5 Basen enthalten, die zu den oben genannten Sequenzen gehören, an
ihren 5'-Enden.
Wenn dies erforderlich ist, können
diese leicht auf einer Einzelfallgrundlage entfernt werden. Nach
der Durchführung
der Sequenzierung wie oben beschrieben wurden die Sequenzen der
5'-ESTs in NetGeneTM, einer geschützten Datenbank, die zur Lagerung
und Manipulation wie unten beschrieben erforderlich ist, eingegeben.
Die Fachleute auf dem Gebiet werden verstehen, dass die Daten in
jedem Medium, dass von einem Computer gelesen und zugänglich ist,
gelagert und manipuliert werden könnten. Computerlesbare Medien schließen magnetische,
optische oder elektronische lesbare Medien ein. Zum Beispiel kann
das computerlesbare Medium eine Festplatte, Diskette, ein Magnetband,
CR-ROM, RAM oder ROM ebenso wie andere Arten weiterer Medien, die
den Fachleuten auf dem Gebiet bekannt sind, sein.
-
Darüber hinaus
können
die Sequenzdaten in einer Vielzahl von Datenprozessorprogrammen
in verschiedensten Formaten gespeichert und manipuliert werden.
Zum Beispiel können
die Sequenzdaten als Text in einem Worddokument gespeichert werden,
wie z.B. Microsoft Word oder Word Perfect, oder als ASCII-Datei in
einer Vielzahl von Datenprogrammen, die den Fachleuten auf dem Gebiet
bekannt sind, wie z.B. DB2, SYBASE oder ORACLE.
-
Die
computerlesbaren Medien, auf denen die Sequenzinformation gespeichert
ist, können
in einen Personalcomputer, einem Netzwerk, einem Server oder anderen
Computersystemen, die den Fachleuten auf dem Gebiet bekannt sind,
sein. Das Computersystem oder andere System beinhaltet vorzugsweise
die oben beschriebenen Speichermedien sowie einen Prozessor, um
auf die Sequenzdaten zuzugreifen und sie zu manipulieren. Sobald
die Sequenzdaten gespeichert wurden, können sie manipuliert und recherchiert
werden, um solche gespeicherten Sequenzen zu lokalisieren, die eine
gewünschte
Nukleinsäuresequenz
enthalten oder die für
ein Protein mit einer bestimmten funktionellen Domäne kodieren.
Zum Beispiel kann die gespeicherte Sequenzinformation mit anderen
Sequenzen verglichen werden, um Homologien zu identifizieren, Motive,
die mit biologischen Funktionen im Zusammenhang stehen oder strukturelle
Motive.
-
Programme,
die verwendet werden können,
um die gespeicherten Sequenzen zu recherchieren oder zu vergleichen,
schließen
die Programmserien MacPattern (EMBL), BLAST und BLAST2 (NCBI) ein,
die Basic local alignment search tool programs für Nukleotide (BLASTN) und Peptide
(BLASTX) Vergleiche (Altschul et al., J. Mol. Biol. 215:403, 1990)
und FASIA (Pearson und Lipman, Proc. Natl. Acad. Sci. USA 85:2444,
1988). Die BLAST-Programme erweitern dann die Alignments auf Grundlage
definierter Kriterien zur Übereinstimmung
und Nichtübereinstimmung.
-
Motive,
die unter Verwendung der oben genannten Programme sowie den in Beispiel
28 beschriebenen ermittelt werden können, schließen Sequenzen
ein, die für
Leucin-Zipper, Helix-turn-Helix-Motive, Glycosylierungsstellen,
Ubiquitinierungsstellen, alpha-Helices und beta-Faltblätter, für Signalsequenzen,
die für
Signalpeptide kodieren, welche die Sekretion der kodierten Proteine
steuern, Sequenzen, die an der Transkriptionssteuerung beteiligt
sind, wie z.B. Homeoboxen, acidische Abschnitte, enzymatische Aktivierungsstellen, Substratbindungsstellen
und enzymatische Spaltstellen kodieren.
-
Bevor
die cDNAs in der NetGeneTM-Datenbank nach
Sequenzmotiven von Interesse durchsucht werden, wurden die cDNAs,
die von RNAs stammten, welche nicht von Interesse waren, identifiziert
und aus der weiteren Betrachtung wie in Beispiel 18 unten beschrieben,
ausgenommen.
-
BEISPIEL 18
-
Ausschließen ungewünschter Sequenzen von der weiteren
Betrachtung
-
5'-ESTs in der NetGeneTM-Datenbank, die von ungewünschten
Sequenzen abgeleitet waren, wie z.B. Transfer-RNAs, ribosomalen
RNAs, mitochondrialen RNAs, prokaryontischen RNAs, Pilz-RNAs, Alusequenzen,
L1-Sequenzen oder Wiederholungssequenzen, wurden unter Verwendung
der FASIA- und BLASTN-Programme mit den in Tabelle 1 angegebenen
Parametern identifiziert.
-
Um
5'-ESTs, die für tRNAs
kodieren, aus der weiteren Betrachtung auszuschließen, wurden
die 5'-EST-Sequenzen
mit den Sequenzen von 1090 bekannten tRNAs verglichen, die von dem
EMBL Release 38 stammten, von denen 100 menschlich war. Der Vergleich
wurde unter Verwendung von FASIA auf beiden Strängen der 5'-ESTs durchgeführt. Die Sequenzen, die mehr
als 80% Homologie über
einen Bereich von mehr als 60 Nukleotiden aufwiesen, wurden als
tRNAs identifiziert. Von den 144341 untersuchten Sequenzen wurden
26 als tRNAs identifiziert und von der weiteren Betrachtung ausgeschlossen.
-
Um
5'-ESTs von der
weiteren Betrachtung auszuschließen, die für rRNAs kodieren, wurden die 5'-EST-Sequenzen mit
den Sequenzen von 2497 bekannten rRNAs verglichen, die von EMBL
Release 28 erhalten wurden, von denen 73 human waren. Der Vergleich
wurde unter Verwendung von BLASTN auf beiden Strängen der 5'-ESTs mit dem Parameter S=108 durchgeführt. Sequenzen,
die mehr als 80% Homologie über Abschnitte
mit einer Länge
von mehr als 40 Nukleotiden aufwiesen, wurden als rRNAs identifiziert.
Von den 144341 untersuchten Sequenzen wurden 3312 als rRNAs identifiziert
und von der weiteren Betrachtung ausgeschlossen.
-
Um
5'-ESTs von der
weiteren Betrachtung auszuschließen, die für mtRNAs kodieren, wurden die 5'-EST-Sequenzen mit
den Sequenzen von 2 bekannten mitochondrialen Genomen verglichen,
für die
die gesamten genomischen Sequenzen erhältlich sind sowie sämtliche
transkribierte Sequenzen von diesen mitochondrialen Genomen, einschließlich tRNAs,
rRNAs und mRNAs für
insgesamt 38 Sequenzen. Der Vergleich wurde unter Verwendung von
BLASTN auf beiden Strängen
der 5'-ESTs mit
dem Parameter S=108 durchgeführt.
Sequenzen, die mehr als 80% Homologie über Abschnitte mit einer Länge von
mehr als 40 Nukleotiden aufwiesen, wurden als mtRNAs identifiziert.
Von den 144341 untersuchten Sequenzen wurden 6110 als mtRNAs identifiziert
und von der weiteren Betrachtung ausgeschlossen.
-
Sequenzen,
die von exogenen Kontaminanten stammen könnten, wurden von der weiteren
Betrachtung durch Vergleich der 5'-EST-Sequenzen mit Release 46 der EMBL
Bakteriellen Abteilung und Pilz-Abteilung unter Verwendung von BLASTN
mit dem Parameter S=144 verglichen. Alle Sequenzen, die mehr als
90% Homologie über
einen Bereich von wenigstens 40 Nukleotiden aufwiesen, wurden als
exogene Kontaminanten identifiziert. Von den 42 untersuchten cDNA-Bibliotheken
waren die durchschnittlichen Prozentzahlen prokaryontischer Sequenzen
und Pilzsequenzen, die darin enthalten waren, 0,2% bzw. 0,5%. Unter
diesen Sequenzen konnte nur eine als eine pilzspezifische Sequenz
identifiziert werden. Die anderen waren entweder Pilz- oder prokaryontische
Sequenzen, die Homologien zu vertebraten Sequenzen aufwiesen oder
Wiederholungssequenzen enthielten, die während dem elektronischen Vergleich
nicht ausgeblendet worden waren.
-
Zusätzlich wurden
die 5'-ESTs mit
6093 Alusequenzen und 1115 Li-Sequenzen verglichen, um 5'-ESTs auszublenden,
die derartige Wiederholungssequenzen enthalten. 5'-ESTs, die THE- und MER-Wiederholungen,
SSTR-Sequenzen oder Satelliten, Mikrosatelliten oder telomere Wiederholungen
enthalten, wurden ebenfalls von der weiteren Betrachtung ausgeschlossen.
Im Durchschnitt enthielten 11,5% der Sequenzen in den Bibliotheken
Wiederholungssequenzen. Von diesen 11,5% enthielten 7% Aluwiederholungen,
3,3% enthielten L1-Wiederholungen und die verbleibenden 1,2% waren
von den anderen untersuchten Arten repetitiver Sequenzen abgeleitet.
Diese Prozentzahlen sind in Übereinstimmung
mit den in cDNA-Bibliotheken festgestellten, die von anderen Forschungsgruppen
hergestellt wurden. Zum Beispiel enthielten die cDNA-Bibliotheken
von Adams et al. zwischen 0% und 7,4% Aluwiederholungen, abhängig von
der Quelle der RNA, die zur Herstellung der cDNA-Bibliothek verwendet
wurde (Adams et al, Nature 377:174, 1996).
-
Die
Sequenzen solcher 5'-ESTs,
die nach der Eliminierung ungewünschter
Sequenzen zurückblieben, wurden
mit den Sequenzen bekannter humaner mRNAs verglichen, um die Genauigkeit
der oben beschriebenen Sequenzierungsmethoden zu bestimmen.
-
BEISPIEL 19
-
Bestimmen der Sequenzierungsgenauigkeit
durch Vergleich mit bekannten Sequenzen
-
Um
weiterhin die Genauigkeit des oben beschriebenen Sequenzierungsverfahrens
zu bestimmen, wurden die Sequenzen der von bekannten Sequenzen abgeleiteten
5'-ESTs identifiziert
und mit den originalen bekannten Sequenzen verglichen. Zuerst wurde
eine FASTA-Analyse mit Überhängen von
einer Länge
von weniger als 5 bp an beiden Enden auf den 5'-ESTs durchgeführt, um solche ESTs zu identifizieren,
die mit einem Eintrag in der öffentlichen
humanen mRNA-Datenbank übereinstimmen.
Die 6655 5'-ESTs,
die mit einer bekannten humanen mRNA übereinstimmten, wurden anschließend mit
ihrer verwandten mRNA realigned, und eine dynamische Programmierung
wurde verwendet, um Substitutionen, Insertionen und Deletionen in
der Liste "Fehler", die erkannt werden
würden,
einzuschließen.
Fehler, die in den letzten zehn Basen der 5'-EST-Sequenzen auftraten, wurden ignoriert,
um den Einschluss störender
Klonierungsstellen bei der Analyse der Sequenzierungsgenauigkeit
zu vermeiden.
-
Diese
Analyse zeigte, dass die in die NetGeneTM-Datenbank
eingefügten
Sequenzen eine Genauigkeit von mehr als 99,5% aufwiesen.
-
Um
die Effizienz zu bestimmen, mit der die oben beschriebenen Selektionsverfahren
cDNAs auswählen,
die die 5'-Enden
ihrer entsprechenden mRNAs einschließen, wurde die folgende Analyse
durchgeführt.
-
BEISPIEL 20
-
Bestimmung der Effizienz der 5'-EST-Auswahl
-
Um
die Effizienz zu bestimmen, mit der das oben genannte Selektionsverfahren
5'-ESTs isolierte,
die Sequenzen nahe dem 5'-Ende
der mRNAs enthalten, von denen sie abgeleitet sind, wurden die Sequenzen der
Enden der 5'-ESTs,
die von den Genen der Untereinheit α des Elongationsfaktors 1 und
der schweren Kette von Ferritin abgeleitet sind, mit den bekannten
cDNA-Sequenzen dieser Gene verglichen. Da die Transkriptionsstartstellen
beider Gene gut charakterisiert sind, können sie verwendet werden,
um die Prozentzahl abgeleiteter 5'-ESTs zu bestimmen, welche die authentischen
Transkriptionsstartstellen beinhalten.
-
Für beide
Gene enthielten mehr als 95% der erhaltenen 5'-ESTs tatsächlich Sequenzen nahe der 5'-Enden oder stromaufwärts der
5'-Enden der entsprechenden
mRNAs.
-
Um
die Analyse auf die Zuverlässigkeit
des Verfahrens zur Isolierung von 5'-ESTs aus ESTs in der NetGeneTM-Datenbank auszudehnen, wurde eine ähnliche
Analyse unter Verwendung einer Datenbank durchgeführt, die
aus humanen mRNA-Sequenzen zusammengesetzt, die aus der GenBank-Datenbank
Release 97 stammen, zum Vergleich. Die 5'-Enden von mehr als 85% der 5'-ESTs, die von mRNAs
abgeleitet sind, die in der GenBank-Datenbank enthalten sind, wurden
nahe den 5'-Enden
der bekannten Sequenz lokalisiert. Da einige der mRNA-Sequenzen,
die in der GenBank-Datenbank verfügbar sind, von genomischen
Sequenzen abgeleitet sind, wird ein Übereinstimmen des 5'-Endes mit diesen Sequenzen als eine
interne Übereinstimmung gezählt. Folglich
unterschätzt
das hierin verwendete Verfahren die Ausbeute an ESTs, die die authentischen 5'-Enden ihrer korrespondierenden
mRNAs enthalten.
-
Die
oben hergestellten EST-Bibliotheken enthielten mehrere 5'-ESTs, die von derselben
mRNA abgeleitet waren. Die Sequenzen solcher 5'-ESTs wurden miteinander verglichen,
und die längste
5'-EST für jede mRNA
wurde identifiziert. Überlappende
cDNAs wurden in kontinuierliche Sequenzen (contigs) zusammengesetzt.
Die resultierenden fortlaufenden Sequenzen wurden anschließend mit öffentlichen
Datenbanken verglichen, um ihre Ähnlichkeit
mit bekannten Sequenzen zu ermitteln, wie in Beispiel 21 unten beschrieben.
-
BEISPIEL 21
-
Clustering der 5'-ESTs und Berechnung der Neuheitsindizes
für cDNA-Bibliotheken
-
Für jede sequenzierte
EST-Bibliothek wurden die Sequenzen mittels der 5'-Enden in Clustern
angeordnet. Jede Sequenz in der Bibliothek wurde mit anderen mit
BLASTN2 verglichen (direkter Strang, Parameter S=107). ESTs mit
High Scoring Segment Pairs (HSPs) von wenigstens 25 bp Länge, die
95% identische Basen aufwiesen und mehr als 10 bp von jedem 5'-Ende begannen, wurden
gruppiert. Die längste
in dem Cluster gefundene Sequenz wurde als repräsentative Sequenz der Gruppe
verwendet. Ein allgemeines Clustering zwischen den Bibliotheken
wurde anschließend
durchgeführt,
was zu der Definition von Super-Contigs führte.
-
Um
die Ausbeute neuer Sequenzen innerhalb der EST-Bibliotheken zu bestimmen,
wurde eine Neuheitsrate (novelty rate, NR) bestimmt, die definiert
war als: NR = 100 X (Anzahl der neuen einzigartigen Sequenzen, die
in der Bibliothek gefunden wurden/gesamte Anzahl von Sequenzen aus
der Bibliothek). Oblicherweise lag die Neuheitsrate im Bereich zwischen
10% und 41%, abhängig
von dem Gewebe, aus dem die EST-Bibliothek
erhalten wurde. Für
die meisten Bibliotheken wurde eine Zufallssequenzierung der 5'-EST-Bibliotheken
fortgeführt,
bis die Neuheitsrate 20% erreichte.
-
Nach
der Charakterisierung wie oben beschrieben wurde die Sammlung an
5'-ESTs in NetGeneTM untersucht, um solche 5'-ESTs zu identifizieren,
die eine mögliche
Signalsequenz enthielten, wie in Beispiel 22 unten beschrieben.
-
BEISPIEL 22
-
Identifikation möglicher Signalsequenzen in
5'-ESTs
-
Die
5'-ESTs in der NetGeneTM-Datenbank wurden untersucht, um solche
zu identifizieren, die einen ununterbrochenen offenen Leserahmen
(open reading frame, ORF) aufwiesen, der länger als 45 Nukleotide war und
mit einem ATG-Kodon begann und bis zu dem Ende der EST fortlief.
Etwa die Hälfte
der cDNA-Sequenzen in NetGeneTM enthielten
solch einen ORF. Die ORFs dieser 5'-ESTs wurden anschließend untersucht,
um mögliche
Signalmotive zu identifizieren, unter Verwendung von leichten Abänderungen des
Verfahrens, das in von Heijne, Nucleic Acids Res. 14:4683-4690,
1986, offenbart ist. Solche 5'-EST-Sequenzen,
die für
einen Abschnitt von wenigstens 15 Aminosäuren Länge mit einem Wert von wenigstens
3,5 in der von Heijne Signalpeptid-Identifikationsmatrix, wurden als eine
Signalsequenz besitzend betrachtet. Solche 5'-ESTs,
die mit einer bekannten humanen mRNA oder EST-Sequenz übereinstimmten
und ein 5'-Ende
mit mehr als 20 Nukleotiden stromabwärts des bekannten 5'-Endes enthielten,
wurden von der weiteren Analyse ausgeschlossen. Die übrigbleibenden
cDNAs, die eine Signalsequenz beinhalteten, wurden in eine Datenbank
eingefügt,
die Signal-TagTM heißt.
-
Um
die Genauigkeit des obigen Verfahrens zur Identifizierung von Signalsequenzen
zu bestätigen, wurde
die Analyse gemäß Beispiel
23 durchgeführt.
-
BEISPIEL 23
-
Bestätigung
der Genauigkeit der Identifikation möglicher Signalsequenzen in
5'-ESTs
-
Die
Genauigkeit des oben genannten Verfahrens zur Identifizierung von
Signalsequenzen, die für
Signalpeptide kodieren, wurde durch Anwenden des Verfahrens auf
die 43 Aminosäuren,
die an dem N-Terminus sämtlicher
humaner SwissProt-Proteine lokalisiert sind, bestimmt. Der computerberechnete
von Heijne-Wert für
jedes Protein wurde mit der bekannten Charakterisierung des Proteins
verglichen, und zwar als ein sezerniertes Protein oder als ein nichtsezerniertes
Protein. Auf diese Weise wurde die Anzahl nichtsezernierter Proteine,
die einen Wert höher
als 3,5 haben (Falschpositive) und die Anzahl sezernierter Proteine,
die einen Wert niedriger als 3,5 haben (Falschnegative) konnte berechnet
werden.
-
Unter
Verwendung der Ergebnisse der obigen Analyse wurde die Wahrscheinlichkeit,
dass ein durch die 5'-Region
der mRNA kodiertes Peptid tatsächlich
ein echtes Signalpeptid aufgrund seines von Heijne-Wertes ist, auf
Grundlage entweder der Annahme, dass 10% der Humanproteine sezerniert
sind oder auf Grundlage der Annahme, dass 20% der Humanproteine
sezerniert werden, berechnet. Die Ergebnisse dieser Analyse sind
in 2 und Tabelle IV gezeigt.
-
Unter
Verwendung des obigen Verfahrens zur Identifikation sekretorischer
Proteine wurden 5'-ESTs der
folgenden Peptide erhalten, von denen bekannt ist, dass sie sezerniert
werden: humanes Glucagon, Gammainterferon-induzierter monokiner
Vorläufer,
sezer niertes Cyclophilin-ähnliches
Protein, humanes Pleiotropin und humaner Biotinidasevorläufer. Folglich
identifizierte das obige Verfahren erfolgreich solche 5'-ESTs, die für ein Signalpeptid
kodieren.
-
Um
zu bestätigen,
dass das durch die 5'-ESTs
kodierte Signalpeptid tatsächlich
als ein Signalpeptid fungiert, können
die Signalsequenzen aus den 5'-ESTs
in einen Vektor kloniert werden, der für die Identifikation von Signalpeptiden
konstruiert wurde. Solche Vektoren sind so gestaltet, dass sie die
Fähigkeit
zum Wachstum in selektivem Medium nur Wirtszellen verleihen, die
einen Vektor mit einer funktionell verbundenen Signalsequenz enthalten.
Zum Beispiel kann die Signalsequenz des 5'-ESTs, um zu bestätigen, dass ein 5'-EST für ein echtes
Signalpeptid kodiert, stromaufwärts
und im Leserahmen mit einer nichtsezernierten Form des Invertasegens
aus Hefe in Signalpeptid-Selektionsvektoren,
wie z.B. den in
US-Patent Nr.
5,536,637 beschriebenen, insertiert werden. Das Wachstum
von Wirtszellen, die die Signalsequenz-Selektionsvektoren mit der
korrekt insertierten 5'-EST-Signalsequenz
enthalten, bestätigt,
dass die 5'-EST
für ein
echtes Signalpeptid kodiert.
-
Alternativ
kann die Gegenwart eines Signalpeptides durch Klonieren der verlängerten
cDNAs, die unter Verwendung der ESTs erhalten wurden, in Expressionsvektoren,
wie z.B. pXT1 (wie unten in Beispiel 30 beschrieben) oder durch
Konstruieren von Promotor-Signalsequenz-Reportergen-Vektoren,
die für
Fusionsproteine zwischen dem Signalpeptid und einem nachweisbaren
Reporterprotein bestätigt
werden. Nach Einführen
dieser Vektoren in eine geeignete Wirtszelle, wie z.B. COS-Zellen
oder NIH 3T3-Zellen, kann das Wachstumsmedium geerntet und auf die
Gegenwart de sezernierten Proteins hin analysiert werden. Das Medium
von diesen Zellen wird mit dem Medium von Kontrollzellen verglichen,
die Vektoren enthalten, denen die Signalsequenz oder das verlängerte cDNA-Insert
fehlt, um Vektoren zu identifizieren, die für ein funktionelles Signalpeptid
oder ein echtes sezerniertes Protein kodieren.
-
Die
5'-ESTs, die für ein Signalpeptid
kodieren, wie mit Hilfe des Verfahrens gemäß Beispiel 22 oben festgestellt,
wurden weiterhin in vier Kategorien eingeteilt auf Grundlage ihrer
Homologie mit bekannten Sequenzen, wie in Beispiel 24 unten beschrieben.
-
BEISPIEL 24
-
Kategorisierung von 5'-ESTs, die für ein Signalpeptid kodieren
-
Die
5'-ESTs, die eine
Sequenz aufweisen, die weder mit irgendeiner vertebraten Sequenz
noch mit irgendeiner öffentlich
verfügbaren
EST-Sequenz übereinstimmt,
wurden als "neu" bezeichnet. Von
den Sequenzen in der SignalTagTM-Datenbank
fielen 947 der 5'-ESTs,
die einen von Heijne-Wert von wenigstens 3,5 hatten, in diese Kategorie.
-
Die
5'-ESTs, die eine
Sequenz aufwiesen, die nicht mit einer vertebraten Sequenz übereinstimmten, jedoch
mit einer öffentlich
bekannten EST übereinstimmten,
wurden als "EST-ext" bezeichnet, vorausgesetzt, dass
die bekannte EST-Sequenz um wenigstens 40 Nukleotide in die 5'-Richtung verlängert war.
Von diesen Sequenzen in der Signal-TagTM-Datenbank
fielen 150 der 5'-ESTs
mit einem von Heijne-Wert von wenigstens 3,5 in diese Kategorie.
-
Die
ESTs, die nicht mit irgendeiner vertebraten Sequenz übereinstimmten,
jedoch mit einer öffentlich bekannten
EST übereinstimmten,
ohne dass die bekannte EST um wenigstens 40 Nukleotide in die 5'-Richtung verlängert wurden,
wurden "EST" genannt. Von den
Sequenzen in der SignalTagTM-Datenbank fielen
599 der 5'-ESTs
mit einem von Heijne-Wert von wenigstens 3,5 in diese Kategorie.
-
Die
5'-EST-Sequenzen,
die mit einer humanen mRNA-Sequenz übereinstimmten, jedoch die
bekannte Sequenz um wenigstens 40 Nukleotide in die 5'-Richtung verlängerten,
wurden "Wert-ext" genannt. Von den Sequenzen
in der SignalTagTM-Datenbank fielen 23 der
ESTs mit einem von Heijne-Wert von wenigstens 3,5 in diese Kategorie.
Eingeschlossen in diese Kategorie war ein 5'-EST, der die bekannte Sequenz der humanen Translocase-mRNA
um mehr als 200 Basen in die 5'-Richtung
verlängerte.
Ein 5'-EST, der
die Sequenz für
ein humanes Tumor-Suppresorgen in die 5'-Richtung verlängerte, wurde ebenfalls identifiziert.
-
Tabelle
V zeigt die Verteilung der 5'-ESTs
in jeder Kategorie und die Anzahl der 5'-ESTs in jeder Kategorie, die einen
bestimmten Minimum-von Heijne-Wert haben.
-
3. Auswertung der räumlichen und zeitlichen Expression
von mRNAs, die den 5'-ESTs
oder verlängerten
cDNAs entsprechen
-
Jeder
der 5'-ESTs wurde
außerdem
auf Grundlage des Gewebes, aus dem dessen korrespondierender mRNA
erhalten wurde, wie unten in Beispiel 25 beschrieben kategorisiert.
-
BEISPIEL 25
-
Kategorisierung des Expressionsmusters
-
Tabelle
VI zeigt die Verteilung der 5'-ESTs
in jeder der oben definierten Kategorien im Hinblick auf die Gewebe,
aus denen die 5'-ESTs
der korrespondierenden mRNA erhalten wurden.
-
Tabelle
II stellt die Sequenzidentifizierungsnummern der 5'-EST-Sequenzen zur
Verfügung,
die aus dem Hirn stammten, die Kategorien, in die diese Sequenzen
fallen und die von Heijne-Werte der Signalpeptide, für die sie
kodieren. Die 5'-EST-Sequenzen
und Aminosäurensequenzen,
für die
sie kodieren, werden in den angefügten Sequenzprotokollen bereitgestellt.
Tabelle III stellt die Sequenz-ID-Nummern der 5'-ESTs und die Sequenzen der Signalpeptide,
für die
sie kodieren, zur Verfügung.
Die Sequenzen der 5'-ESTs und die Polypeptide,
für die
sie kodieren, werden in dem Sequenzprotokoll, was hieran angefügt ist,
zur Verfügung
gestellt.
-
Die
DNA-Sequenz der SEQ ID NR: 149 kann leicht nach irgendwelchen Fehlern
darin untersucht werden, und jegliche Sequenzzweideutigkeiten können durch
erneutes Sequenzieren eines Fragmentes, das solche Fehler oder Zweideutigkeiten
enthält,
auf beiden Strängen
geklärt
werden. Solche Fragmente können
von den Plasmiden erhalten werden, die in dem Labor der Erfinder
gelagert werden, oder sie können
unter Verwendung der hierin beschriebenen Methoden isoliert werden.
Die Klärung
solcher Zweideutigkeiten oder Fehler kann durch Verwendung von Primern
erleichtert werden, die an Sequenzen hybridisieren, die nahe der zweideutigen
oder fehlerhaften Sequenzen lokalisiert sind. Zum Beispiel können die
Primer an Sequenzen innerhalb von 50-75 Basen der Zweideutigkeit
oder des Fehlers hybridisieren. Nach Klärung eines Fehlers oder einer
Zweideutigkeit kann die entsprechende Korrektur in der Proteinsequenz
durchgeführt
werden, die von einer DNA kodiert wird, die den Fehler oder die
Zweideutigkeit enthält.
-
Zusätzlich zur
Kategorisierung der 5'-ESTs
im Hinblick auf ihren Gewebeursprung können die räumlichen und zeitlichen Expressionsmuster
der mRNAs, die den 5'-ESTs
entsprechen, ebenso wie deren Expressionslevel, wie in Beispiel
26 unten beschrieben bestimmt werden. Die Charakterisierung der
räumlichen
und zeitlichen Expressionsmuster und der Expressionslevel dieser
mRNAs ist nützlich
zur Konstruktion von Expressionsvektoren, die fähig sind, eine gewünschte Konzentration
eines Genproduktes in einer gewünschten räumlichen
oder zeitlichen Art und Weise zu produzieren, wie detaillierter
unten erörtert
werden wird.
-
Darüber hinaus
können
5'-ESTs, deren korrespondierende
mRNAs mit Krankheitszuständen
in Zusammenhang stehen, ebenfalls identifiziert werden. Zum Beispiel
kann eine bestimmte Krankheit aus dem Mangel an Expression, der Überexpression
oder der Unterexpression einer mRNA resultieren, die einer 5'-EST entspricht.
Durch Vergleichen der mRNA-Expressionsmuster und Mengen in Proben,
die aus gesunden Individuen stammen, mit solchen aus Individuen,
die an einer bestimmten Krankheit leiden, können 5'-ESTs identifiziert werden, die für die Krankheit
verantwortlich sind.
-
Man
wird verstehen, dass die Ergebnisse der obigen Charakterisierungsverfahren
für 5'-ESTs auch für verlängerte cDNAs (erhältlich wie
unten beschrieben) anwendbar sind, die Sequenzen enthalten, die
den 5'-ESTs benachbart
sind. Man wird auch verstehen, dass, wenn dies gewünscht ist,
die Charakterisierung verschoben werden kann, bis verlängerte cDNAs
erhalten wurden, eher als dass die ESTs selbst charakterisiert werden.
-
BEISPIEL 26
-
Auswertung der Expressionslevel und -muster
von mRNAs, die den 5'-ESTs
und verlängerten
cDNAs entsprechen
-
Die
Expressionslevel und -muster von mRNAs, die den 5'-ESTs oder verlängerten
cDNAs (erhältlich wie
unten in Beispiel 27 beschrieben) entsprechen, können durch Lösungshybridisierung
mit langen Sonden, wie in der
internationalen
Patentanmeldung WO 97/05277 beschrieben, analysiert werden.
Kurz beschrieben wird ein 5'-EST,
eine verlängerte
cDNA oder ein Fragment davon, das dem Gen entspricht, das für die zu
charakterisierende mRNA kodiert, in eine Klonierungsstelle unmittelbar
stromabwärts
eines Bakteriophagen (T3, T7 oder SP6) RNA-Polymerase-Promotor insertiert,
um Antisense-RNA
herzustellen. Vorzugsweise hat der 5'-EST oder die verlängerte cDNA 100 oder mehr Nukleotide.
Das Plasmid wird linearisiert und in den Gegenwart von Ribonukleotiden,
die modifizierte Ribonukleotide umfassen (d. h. Biotin-UTP und DIG-UTP)
transkribiert. Ein Überschuss
dieser doppelt markierten RNA wird in Lösung mit mRNA hybridisiert,
die aus Zellen oder Gewebe von Interesse hybridisiert wurde. Die
Hybridisierungen werden unter stringenten Standardbedingungen (40-50°C für 16 Stunden
in einem 80% Formamid, 0,4 M NaCl-Puffer, pH 7-8) durchgeführt. Die
nichthybridisierte Sonde wird durch Verdau mit Ribonukleasen entfernt,
die spezifisch sind für
einzelsträngige
RNA (d. h. RNasen CL3, T1, Phy M, U2 oder A). Die Gegenwart der
Biotin-UTP-Modifizierung ermöglicht
die Bindung des Hybrids auf einer Mikrotiterplatte, die mit Streptavidin
beschichtet ist. Die Gegenwart der DIG-Modifikation ermöglicht es,
das Hybrid nachzuwei sen und mittels ELISA unter Verwendung eines
Anti-DIG-Antikörpers,
der an alkalische Phosphatase gekoppelt ist, zu quantifizieren.
-
Die
5'-ESTs, verlängerten
cDNAs oder Fragmente davon können
außerdem
mit Nukleotidsequenzen markiert werden zur seriellen Analyse der
Genexpression (serial analysis of gene expression, SAGE), wie in
UK-Patentanmeldung Nr. 2
305 241 A offenbart. In diesem Verfahren werden cDNAs aus
Zellen, Gewebe, Organismen oder anderen Quellen von Nukleinsäuren, für die Genexpressionsmuster
bestimmt werden müssen, präpariert.
Die resultierenden cDNAs werden in zwei Gruppen eingeteilt. Die
cDNAs in jeder Gruppe werden mit einer ersten Restriktionsendonuklease
gespalten, die Ankerenzym genannt wird, die eine Erkennungsstelle hat,
die vermutlich wenigstens einmal in den meisten cDNAs vorhanden
ist. Die Fragmente, welche die am meisten 5'- oder 3'- gelegene
Region der geschnittenen cDNA enthalten, werden durch Bindung an
ein Bindungsmedium, wie z.B. mit Streptavidin beschichtete Beads,
isoliert. Ein erster Oligonukleotidlinker, der eine erste Sequenz
zur Hybridisierung eines Amplifikationsprimers und einer internen
Restriktionsstelle für
eine so genannte Taggingendonuklease enthält, wird mit den verdauten
cDNAs des ersten der ersten Gruppe ligiert. Ein Verdau mit der zweiten
Endonuklease produziert kurze Tag-Fragmente von den cDNAs.
-
Ein
zweites Oligonukleotid, das eine zweite Sequenz für die Hybridisierung
eines Amplifikationsprimers und einer internen Restriktionsschnittstelle
enthält,
wird mit den verdauten cDNAs in der zweiten Gruppe ligiert. Die
cDNA-Fragmente in der zweiten Gruppe werden außerdem mit der Taggingendonuklease
verdaut, um kurze Tag-Fragmente zu erzeugen, die aus den cDNAs in
der zweiten Gruppen stammen. Die aus diesem Verdau der ersten und
zweiten Gruppe mit dem Ankerenzym und der Taggingendonuklease resultierenden Tags
werden miteinander ligiert, um so genannte Ditags zu erzeugen. In
einigen Ausführungsformen
werden die Ditags konkatamerisiert, um Ligationsprodukte herzustellen,
die zwischen 2 bis 200 Ditags enthalten. Die Tag-Sequenzen werden
anschließend
bestimmt und mit den Sequenzen der 5'-ESTs oder verlängerten cDNAs verglichen, um
zu bestimmen, welche 5'-ESTs
oder verlängerten
cDNAs in der Zelle, dem Gewebe oder dem Organismus oder der anderen
Nukleinsäurequelle,
aus der die Tags stammen, exprimiert sind. Auf diese Weise wird
das Expressionsmuster der 5'-ESTs
oder verlängerten
cDNAs in der Zelle, dem Gewebe, dem Organismus oder der anderen
Nukleinsäurequelle
erhalten.
-
Eine
quantitative Analyse der Genexpression kann ebenfalls unter Verwendung
von Arrays durchgeführt
werden. Wie hierin verwendet, bezeichnet der Begriff Array eine
eindimensionale, zweidimensionale oder multidimensionale Anordnung
von vollständig
langen cDNAs (d. h. verlängerten
cDNAs, welche die kodierende Sequenz für das Signalpeptid, die kodierende
Sequenz für
das reife Protein und ein Stoppkodon enthalten, von verlängerten
cDNAs, von 5'-ESTs
oder Fragmenten davon mit ausreichender Länge, um den spezifischen Nachweis
der Genexpression zu erlauben. Vorzugsweise sind die Fragmente wenigstens
15 Nukleotide lang. Bevorzugter sind die Fragmente wenigstens 100
Nukleotide lang. Noch bevorzugter sind die Fragmente mehr als 100
Nukleotide lang. In einigen Ausführungsformen
können
die Fragmente länger
als 500 Nukleotide sein.
-
Zum
Beispiel kann die quantitative Analyse der Genexpression mit vollständig langen
cDNAs, wie unten definiert, verlängerten
cDNAs, 5'-ESTs oder
Fragmenten davon in einem Mikroarray mit komplementärer DNA
wie von Schena et al (Science 270:467-470, 15; Proc. Natl. Acad.
Sci. USA 93:10614-10619, 1996) durchgeführt werden. Vollständig lange
cDNAs, verlängerte
cDNAs, 5'-ESTs oder
Fragmente davon werden mit Hilfe einer PCR amplifiziert und aus
96 Well-Mikrotiterplatten auf silylierte Mikroskopobjektträger unter
Verwendung von Hochgeschwindigkeitsrobotern angeordnet. Gedruckte
Arrays werden in einer feuchten Kammer inkubiert, um die Rehydrierung
der Arrayelemente zu ermöglichen
und einmal in 0,2% SDS für
1 Minute, zweimal in Wasser für
1 Minute und einmal für
5 Minuten in Natriumborhydridlösung
gespült.
Die Arrays werden für 2
Minuten bei 95°C
in Wasser getaucht, in 0,2% SDS für eine Minute transferiert,
zweimal mit Wasser gespült, an
der Luft getrocknet und im Dunklen bei 25°C gelagert.
-
mRNA
aus Zellenoder Gewebe wird isoliert oder kommerziell erhalten, und
Sonden werden durch eine einzige Runde reverser Transkription hergestellt.
Die Sonden werden mit 1 cm2 Mikroarrays
unter 14 × 14
mm Glasdeckgläschen
für 6-12
Stunden bei 60°C
hybridisiert. Die Arrays werden für 5 Minuten bei 25°C in einem Waschpuffer
mit geringer Stringenz (1 × SSC/0,2%
SDS) gewaschen, anschließend
für 10
Minuten bei Raumtemperatur in Waschpuffer mit hoher Stringenz (0,1 × SSC/0,2%
SDS). Die Arrays werden in 0,1 × SSC
unter Verwendung eines Fluoreszenzlaser-Scanninggerätes, das
mit einem gewöhnlichen
Filterset ausgerüstet
ist, gescannt. Akkurate Messungen der differenziellen Expression
werden erhalten, indem der Durchschnitt der Verhältnisse von zwei unabhängigen Hybridisierungen
genommen wird.
-
Die
quantitative Analyse der Expression von Genen kann ebenfalls mit
vollständig
langen cDNAs, verlängerten
cDNAs, 5'-ESTs oder
Fragmenten davon in Arrays mit komplementärer DNA wie von Pietu et al.
(Genome Research 6:492-503, 1996) beschrieben durchgeführt werden.
Die vollständig
langen cDNAs, verlängerten
cDNAs, 5'-ESTs oder
Fragmente davon werden mittels PCR amplifiziert und auf Membranen
gespottet. Anschließend
werden die aus den verschiedenen Geweben stammenden mRNAs mit radioaktiven
Nukleotiden markiert. Nach der Hybridisierung und dem Waschen unter
kontrollierten Bedingungen werden die hybridisierten mRNAs mittels
Phospho-Imaging oder Autoradiografie detektiert. Doppelte Experimente
werden durchgeführt
und eine quantitative Analyse der differenziell exprimierten mRNAs
wird anschließend
durchgeführt.
-
Alternativ
kann die Expressionsanalyse der 5'-ESTs oder verlängerten cDNAs durch High Density-Nukleotidarrays
wie von Lockhart et al. (Nature Biotechnology 14:1675-1680, 1996) und Sosnowsky
et al. (Proc. Natl. Acad. Sci. 94:1119-1123, 1997) beschrieben durchgeführt werden.
Oligonukleotide mit 15-50 Nukleotiden, die den Sequenzen der 5'-ESTs oder verlängerten
cDNAs entsprechen, werden direkt auf dem Chip synthetisiert (Lockhart
et al, s.o.) oder synthetisiert und anschließend auf den Chip gegeben (Sonowsky
et al., s.o.). Vorzugsweise haben die Oligonukleotide eine Länge von
etwa 20 Nukleotiden.
-
cDNA-Sonden,
die mit einer geeigneten Verbindung markiert sind, wie z.B. Biotin,
Digoxigenin oder Fluoreszenzfarbstoff, werden aus der geeigneten
mRNA-Population synthetisiert und anschließend in zufällige Fragmente mit einer durchschnittlichen
Größe von 50-100
Nukleotiden zerstückelt.
Die genannten Sonden werden dann mit dem Chip hybridisiert. Nach
dem Waschen wie in Lockhart et al., s.o., beschrieben und nach der
Anwendung verschiedener elektrischer Felder (Sonowsky et al., s.o.)
werden die Farbstoffen oder markierenden Verbindungen detektiert
und quantifiziert. Doppelte Hybridisierungen werden durchgeführt. Eine
vergleichende Analyse der Intensität der Signale, die von den
cDNA-Sonden auf dem selben Zieloligonukleotid in verschiedenen cDNA-Proben stammen, zeigt
eine differenzielle Expression der mRNA an, die dem 5'-EST oder der verlängerten
cDNA entspricht, von dem/der die Oligonukleotidsequenz abgeleitet
wurde.
-
III. Verwendung der 5'-ESTs, um verlängerte cDNAs zu klonieren und
um die korrespondierenden genomischen DNAs zu klonieren
-
Sobald
die 5'-ESTs, welche
das 5'-Ende der
korrespondieren mRNAs enthalten, unter Verwendung der oben beschriebenen
Verfahren selektiert wurden, können
sie verwendet werden, um verlängerte
cDNAs zu isolieren, die Sequenzen enthalten, die den 5'-ESTs benachbart sind. Die verlängerten
cDNAs können
die gesamte kodierende Sequenz des Proteins, das durch die korrespondierende
mRNA kodiert wird, enthalten, einschließlich der authentischen Translationsstartstelle,
der Signalsequenz und der Sequenzen, die für das reife Protein kodieren,
das nach der Abspaltung des Signalpeptids übrig bleibt. Derartige verlängerte cDNAs
werden hierin als "vollständig lange
cDNAs" beschrieben.
Alternativ können
die verlängerten
cDNAs nur die Sequenz enthalten, die für das reife Protein kodiert,
das nach dem Abspalten des Signalpeptids übrig bleibt oder nur die Sequenz,
die für
das Signalpeptid kodiert.
-
Beispiel
27 unten beschreibt ein allgemeines Verfahren zum Erhalt verlängerter
cDNAs unter Verwendung von 5'-ESTs.
Beispiel 28 unten stellt experimentelle Ergebnisse zur Verfügung, wobei
das in Beispiel 27 erläuterte
Verfahren verwendet wird, und beschreibt mehrere verlängerte cDNAs,
die die gesamte kodierende Sequenz und das authentische 5'-Ende der korrespondierenden
mRNA für
mehrere sezernierte Proteine enthalten.
-
Die
Verfahren gemäß der Beispiele
27, 28 und 29 können
außerdem
verwendet werden, um verlängerte
cDNAs zu erhalten, die für
weniger als die gesamte kodierende Sequenz der sezernierten Proteine
kodieren, die durch die Gene kodiert werden, die den 5'-ESTs entsprechen.
In einigen Ausführungsformen
kodieren die verlängerten
cDNAs, die mit Hilfe dieser Verfahren isoliert wurden, wenigstens
10 Aminosäuren
des Proteins, das durch die Sequenz der SEQ ID NR: 149 kodiert wird.
In weiteren Ausführungsformen
kodieren die verlängerten
cDNAs wenigstens 20 Aminosäuren
des Proteins, das durch die Sequenz der SEQ ID NR: 149 kodiert wird.
In anderen Ausführungsformen
kodieren die verlängerten
cDNAs für
wenigstens 30 Aminosäuren
der Sequenz der SEQ ID NR: 149. In einer bevorzugten Ausführungsform
kodieren die verlängerten cDNAs
eine vollständig
lange Proteinsequenz, die die kodierende Sequenz des Proteins der
SEQ ID NR: 149 enthält.
-
BEISPIEL 27
-
Allgemeines Verfahren zur Verwendung der
5'-ESTs, um cDNAs
zu klonieren und zu sequenzieren, welche die gesamte kodierende
Region und das authentische 5'-Ende
der korrespondierenden mRNA enthalten.
-
Das
folgende allgemeine Verfahren wurde verwendet, um verlängerte cDNAs,
welche die authentischen 5'-Enden
ihrer korrespondierenden mRNAs ebenso wie die kodierende Sequenz
für das
vollständige Protein
enthalten und Sequenzen enthalten, die benachbart zu den Sequenzen
der 5'-ESTs sind,
die verwendet wurden, um sie zu erhalten, rasch und effizient zu
isolieren. Dieses Verfahren kann angewendet werden, um verlängerte cDNAs
für jeden
5'-EST in der NetGeneTM-Datenbank, einschließlich solcher 5'-ESTs, die für Polypeptide
kodieren, die zu sezernierten Proteinen gehören, zu erhalten. Das Verfahren
ist in 3 zusammengefasst.
-
1. Erhalt der verlängerten cDNAs
-
a) Synthese des ersten Strangs
-
Das
Verfahren macht sich bekannte 5'-Sequenz
der mRNA zunutze. Eine reverse Transkriptionsreaktion wird mit der
gereinigten mRNA mit Hilfe eine Poly-14dT-Primers durchgeführt, der
eine 49 Nukleotid lange Sequenz an dessen 5'-Ende enthält, welcher die Addition einer
bekannten Sequenz an das Ende der cDNA erlaubt, die dem 3'-Ende der mRNA entspricht.
Zum Beispiel kann der Primer die folgende Sequenz haben: 5'-ATC GTT GAG ACT CGT ACC AGC AGA GTC
ACG AGA GAG ACT ACA CGG TAC TGG TTT TTT TTT TTT TTVN-3' (SEQ ID NR: 14).
Die Fachleute auf dem Gebiet werden verstehen, dass auch andere
Sequenzen an die Poly-dT-Sequenz angefügt werden können und verwendet werden können, um
die Synthese des ersten Strangs zu primen. Unter Verwendung dieses
Primers und einer reversen Transkriptase, wie z.B. des Superscript
II-Enzyms (Gibco BRL) oder des RNase H Minus-MLV-Enzyms (Promega),
wird ein reverses Transkript erzeugt, das an der 3'-PolyA-Stelle verankert
ist.
-
Nach
dem Entfernen der mit dem ersten Strang der cDNA hybridisierten
mRNA mit Hilfe der alkalischen Hydrolyse werden die Produkte der
alkalischen Hydrolyse und die restlichen Poly-dT-Primer mit Hilfe einer
Ausschlusssäule,
wie z.B. einer AcA34-Matrix (Biosepra), wie in Beispiel 11 erklärt, eliminiert.
-
b) Synthese des zweiten Strangs
-
Ein
Paar nested Primer an jedem Ende wird auf Grundlage der bekannten
5'-Sequenz des 5'-ESTs und dem bekannten
3'-Ende, das durch
den Poly-dT-Primer angefügt
wurde, der bei der Synthese des ersten Strangs verwendet wurde,
entworfen. Software, die zum Entwurf von Primern verwendet wird,
basiert entweder auf dem GC-Gehalt und den Schmelztemperaturen von
Oligonukleotiden, wie z.B. OSP (Illier und Green, PCR Meth. Appl.
1:124-128, 1991), oder basiert auf der Octamer Frequency Disparity
Method (Griffcis et al., Nucleic Acids Res. 19:3887-3891, 1991),
wie z.B. PC-Rare (http://bioinformatics.weizmann.ac.il/software/PC-Rare/doc/manuel.html).
-
Vorzugsweise
werden die nested Primer an dem 5'-Ende voneinander durch vier oder neun
Basen getrennt. Die Sequenzen der 5'-Primer können so ausgewählt werden,
dass sie Schmelztemperaturen und Spezifitäten aufweisen, die für die Verwendung
in der PCR geeignet sind. Vorzugsweise sind die nested Primer an dem
3'-Ende voneinander
durch vier oder neun Basen getrennt. Zum Beispiel können die
nested 3'-Primer
die folgenden Sequenzen haben: (5'-CCA GCA GAG TCA CGA GAG AGA CTA CAC
GG-3' (SEQ ID NR:
15) und 5'-CAC GAG
AGA GAC TAC ACG GTA CTG G-3' (SEQ
ID NR: 16). Diese Primer wurden ausgewählt, da sie Schmelztemperaturen
und Spezifitäten
aufweisen, die mit ihrer Verwendung in der PCR kompatibel sind.
Jedoch werden die Fachleute auf dem Gebiet verstehen, dass andere
Sequenzen ebenfalls als Primer verwendet werden können.
-
Der
erste PCR-Lauf mit 25 Zyklen wird unter Verwendung des Advantage-Tth-Polymerasemix (Clontech)
und dem äußeren Primer
eines jeden nested Primerpaares durchgeführt. Eine zweite PCR mit 20
Zyklen unter Verwendung desselben Enzyms und des inneren Primers
eines jeden nested Paares wird anschließend mit 1/2500 des ersten
PCR-Produktes durchgeführt.
Anschließend
werden die Primernukleotide entfernt.
-
2. Sequenzieren der vollständig langen
verlängerten
cDNAs oder Fragmente davon
-
Aufgrund
des Fehlens von Positionsbeschränkungen
bei dem Entwurf der 5' nested
Primer, die passend sind für
die Verwendung in der PCR, unter Verwendung der OSP-Software, werden
zwei Arten von Amplicons erhalten. Vorzugsweise ist der zweite 5'-Primer stromaufwärts des Translations-Initiations-Kodons
lokalisiert, was ein nested PCR-Produkt erzeugt, das die gesamte
kodierende Sequenz enthält.
Eine solche vollständig
lange verlängerte
cDNA wird einem direkten Klonierungsverfahren wie in Abschnitt a
beschrieben unterzogen. Jedoch ist der zweite 5'-Primer in einigen Fällen stromabwärts des
Translations-Initiations-Kodons lokalisiert, wodurch ein PCR-Produkt
erzeugt wird, das nur einen Teil des ORFs enthält. Derartige unvollständige PCR-Produkte werden einem
modifizierten Verfahren unterzogen, das in Abschnitt b beschrieben
ist.
-
a) Nested PCR-Produkte, die vollständige ORFs
enthalten
-
Enthält das resultierende
PCR-Produkt die vollständige
kodierende Sequenz, wie sie von der 5'-EST-Sequenz vorhergesagt wird, wird
es in einen geeigneten Vektor wie z.B. pED6dpc2 kloniert, wie in
Abschnitt 3 beschrieben.
-
b) Nested PCR-Produkte, die unvollständige ORFs
enthalten
-
Enthält das Amplicon
keine vollständige
kodierende Sequenz, sind Zwischenschritte notwendig, um sowohl die
vollständige
kodierende Sequenz als auch ein PCR-Produkt, das die vollständige kodierende
Sequenz enthält,
zu erhalten. Die vollständige
kodierende Sequenz kann aus mehreren Teilsequenzen zusammengesetzt
werden, wie sie direkt aus den verschiedenen PCR-Produkten wie unten
in dem folgenden Abschnitt beschrieben bestimmt wurden.
-
Sobald
die vollständige
kodierende Sequenz vollständig
bestimmt wurde, werden neue Primer entworfen, die für die Verwendung
in der PCR kompatibel sind, um Amplicons zu erhalten, welche die
gesamte kodierende Region enthalten. Jedoch sind in solchen Fällen, die
für die
PCR-Verwendung geeigneten 3'-Primer innerhalb
der 3'-UTR der korrespondierenden
mRNA lokalisiert, was Amplicons erzeugt, denen ein Teil dieser Region
fehlt, d. h. der PolyA-Teil und manchmal das Polyadenylierungssignal,
wie in 3 dargestellt. Solche vollständig langen
verlängerten
cDNAs werden anschließend
in einen geeigneten Vektor wie in Abschnitt 3 beschrieben kloniert.
-
c) Sequenzieren der verlängerten
cDNAs
-
Das
Sequenzieren der verlängerten
cDNAs wird unter Verwendung eines Die Terminator-Ansatzes mit dem
AmpliTaq DNA Polymerase FS-Kit, das von Perkin-Elmer erhältlich ist,
durchgeführt.
-
Um
die PCR-Fragmente zu sequenzieren, wird ein Primer Walking unter
Verwendung einer Software, wie z.B. OSP, durchgeführt, um
Primer auszuwählen
sowie unter Verwendung einer automatisierten Computersoftware wie
z.B. ASMG (Sutton et al., Genome Science Technol. 1:9-19, 1995),
um Contigs der Walking-Sequenzen zu konstruieren, die den ursprünglichen
5'-Tag und unter
Verwendung einer minimalen Überlappung
von 32 Nukleotiden enthalten. Vorzugsweise wird das Primer Walking
durchgeführt,
bis die Sequenzen der vollständig
langen cDNAs erhalten wurden.
-
Die
Vervollständigung
der Sequenzierung eines bestimmten verlängerten cDNA-Fragmentes wird wie folgt
bestimmt. Da Sequenzen, die nach dem PolyA-Teil lokalisiert sind,
im Falle von nichtklonierten Produkten schwierig genau zu bestimmen
sind, werden die Verfahren der Sequenzierung und des Primer Walkings
für PCR-Produkte
unterbrochen, wenn ein PolyA-Teil in den verlängerten cDNAs identifiziert
wurde, die wie im Fall b beschrieben erhalten wurden. Die Sequenzlänge wird
mit der Größe des nested
PCR-Produktes verglichen, das
wie oben beschrieben erhalten wurde. Aufgrund der limitierten Genauigkeit
bei der Bestimmung der Größe des PCR-Produktes
mittels Gelelektrophorese, wird eine Sequenz als vollständig erachtet,
wenn die Größe der erhaltenen
Sequenz wenigstens 70% der Größe des ersten
nested PCR-Produktes ist. Ist die Länge der durch die Computeranalyse
bestimmten Sequenz nicht wenigstens 70% der Länge des nested PCR-Produktes,
werden diese PCR-Produkte kloniert, und die Sequenz der Insertion
wird bestimmt. Sind Northern Blot-Daten verfügbar, wird die Größe der mRNA,
die für
ein bestimmtes PCR-Produkt nachgewiesen wurde, verwendet, um endgültig festzustellen,
dass die Sequenz vollständig
ist. Sequenzen, welche die oben genannten Kriterien nicht erfüllen, werden
verworfen und einem neuen Isolationsverfahren unterzogen.
-
Die
Sequenzdaten sämtlicher
verlängerter
cDNA werden anschließend
in eine geschützte
Datenbank übertragen,
in der die Qualitätskontrollen
und Auswertungsschritte wie in Beispiel 15 beschrieben durchgeführt werden.
-
3. Klonieren von vollständig langen
verlängerten
cDNAs
-
Das
PCR-Produkt, das die vollständige
kodierende Sequenz enthält,
wird anschließend
in einen geeigneten Vektor kloniert. Zum Beispiel können die
verlängerten
cDNAs in den Expressionsvektor pED6dpc2 (DiscoverEase, Genetics
Institute, Cambridge, MA) wie folgt kloniert werden. PED6dpc2-Vektor-DNA
wird mit stumpfen Enden hergestellt, indem ein EcoRI-Verdau gefolgt
von einer Auffüllreaktion
durchgeführt.
Der Vektor mit stumpfen Enden wird dephosphoryliert. Nach dem Entfernen
der PCR-Primer und einer Ethanolpräzipitation wird das PCR-Produkt,
das die vollständige
kodierende Sequenz oder die verlängerte
cDNA enthält,
das wie oben beschrieben erhalten wurde, mit einer Kinase phosphoryliert,
anschließend
durch Phenol-Sevag-Extraktion entfernt und präzipitiert. Die doppelsträngige verlängerte cDNA
wird anschließend
mit dem Vektor ligiert, und das resultierende Expressionsplasmid
wird in geeignete Wirtszellen eingeführt.
-
Da
die wie oben beschriebenen PCR-Produkte Moleküle mit stumpfen Enden sind,
die in jeder Richtung kloniert werden können, wird die Orientierung
der verschiedenen Klone für
jedes PCR-Produkt bestimmt. Anschließend werden 4 bis 10 Klone
in Mikrotiterplatten angeordnet und einer PCR-Reaktion unter Verwendung
eines ersten Primers, der in dem Vektor nahe der Klonierungsstelle
lokalisiert ist, und eines zweiten Primers, der in dem Teil der
verlängerten
cDNA lokalisiert ist, der dem 3'-Ende
der mRNA entspricht, unterzogen. Dieser zweite Primer kann der Antisense-Primer
sein, der in der Verankerungs-PCR im Falle der direkten Klonierung
(Fall a) verwendet wurde, oder der Antisense-Primer, der innerhalb
der 3'-UTR lokalisiert
ist, im Falle der indirekten Klonierung (Fall b). Klone, in denen
das Startkodon der verlängerten
cDNA funktionell mit dem Promotor in dem Vektor verbunden ist, so
dass die Expression des durch die verlängerte cDNA kodierten Proteins
möglich
ist, werden konserviert und sequenziert. Zusätzlich zu den Enden der cDNA-Inserts
werden außerdem
etwa 50 Basenpaare der Vektor-DNA an jeder Seite des cDNA-Inserts
sequenziert.
-
Die
klonierten PCR-Produkte werden anschließend vollständig in Übereinstimmung mit dem zuvor
erwähnten
Verfahren sequenziert. In diesem Fall wird anschließend die
Kontigierung langer Fragmente auf Walking Sequenzen durchgeführt, die
bereits während
des Primer Walkings für
unklonierte PCR-Produkte kontigiert wurden. Das Sequenzieren der
geklonten Amplicons ist vollständig,
wenn die resultierenden Contigs die gesamte kodierende Region ebenso
wie überlappende
Sequenzen mit der Vektor-DNA an beiden Enden enthalten.
-
4. Computeranalyse der vollständig langen
verlängerten
cDNA
-
Die
Sequenzen sämtlicher
vollständig
langer verlängerter
cDNAs werden anschließend
für die
weitere Analyse wie unten beschrieben zugelassen. Vor dem Durchsuchen
der vollständig
langen verlängerten
cDNAs nach Sequenzen von Interesse werden verlängerte cDNAs, die nicht von
Interesse sind (Vektor-RNAs, Transfer-RNAs, ribosomale RNAs, mitochondriale
RNAs, prokaryontische RNAs und Pilz-RNAs), unter Verwendung von
Verfahren, die den für
die 5'-ESTs in Beispiel
18 beschriebenen im Wesentlichen ähnlich sind, verworfen.
-
a) Identifikation von strukturellen Merkmalen
-
Strukturelle
Merkmale, z.B. ein PolyA-Schwanz und ein Polyadenylierungssignal,
der Sequenzen der vollständig
langen verlängerten
cDNAs werden anschließend
wie folgt bestimmt.
-
Ein
PolyA-Schwanz ist definiert als ein homopolymerer Abschnitt von
wenigstens 11 A mit wenigstens einer alternativen Base darin. Die
Recherche nach dem PolyA-Schwanz ist auf die letzten 100 nt der
Sequenz beschränkt
und auf Abschnitte von 11 konsekutiven As beschränkt, das die Sequenzierungsreaktionen
häufig nach
einem solchen PolyA-Abschnitt nicht lesbar sind. Abschnitte, die
mehr als 90% Homologie über
8 Nukleotide aufweisen, werden unter Verwendung von BLAST2N als
PolyA-Schwänze
identifiziert.
-
Um
nach einem Polyadenylierungssignal zu suchen, wird der PolyA-Schwanz
von der vollständig
langen Sequenz abgeschnitten. Die 50 Basenpaare, die vor dem PolyA-Schwanz liegen, werden
zuerst auf das vorschriftsmäßige Polyadenylierungssignal
A-AUAAA untersucht
und wenn das vorschriftsmäßige Signal
nicht detektiert werden kann, nach dem alternativen Signal AUUAAA
(Sheets et al., Nuc. Acids Res. 18:5799-5805, 1990). Wenn keines
dieser Konsensus-Polyadenylierungssignale gefunden wird, wird das
vorschriftsmäßige Motiv
erneut gesucht, wobei ein Mismatch zugelassen wird, um mögliche Sequenzierungsfehler
zu berücksichtigen.
Mehr als 85% der identifizierten Polyadenylierungssignale von jedem
Typ enden tatsächlich
10 bis 30 Basenpaare von dem PolyA-Schwanz entfernt. Alternative
AUUAAA-Signale repräsentieren
etwa 15% der gesamten Zahl identifizierter Polyadenylierungssignale.
-
b) Identifikation funktioneller Merkmale
-
Funktionelle
Merkmale, wie z.B. ORFs und Signalsequenzen, der Sequenzen der vollständig langen verlängerten
cDNAs wurden anschließend
wie folgt bestimmt.
-
Die
drei Rahmen des oberen Strangs der verlängerten cDNAs werden nach ORFs
untersucht, die definiert sind als Fragmente mit maximaler Länge, die
mit einem Translations-Initiations-Kodon beginnen und mit einem
Stoppkodon enden. ORFs, die wenigstens für 20 Aminosäuren kodieren, sind bevorzugt.
-
Jeder
gefundene ORF wird anschließend
auf die Gegenwart eines Signalpeptids in den ersten 50 Aminosäuren oder,
wenn dies angemessen ist, innerhalb kürzerer Regionen bis zu 20 Aminosäuren oder
weniger in dem ORF abgesucht, wobei das Matrixverfahren von von
Heijne verwendet wird (Nuc. Acids Res. 14:4683-4690, 1986), wie
in Beispiel 22 beschrieben.
-
c) Homologie entweder mit nukleotidischen
oder proteinischen Sequenzen
-
Die
Kategorisierung der vollständig
langen Sequenzen kann unter Verwendung von Verfahren erreicht werden,
die den für
5'-ESTs in Beispiel
24 beschriebenen im Wesentlichen ähnlich sind.
-
Wie
oben beschrieben hergestellte verlängerte cDNAs können anschließend manipuliert
werden, um Nukleinsäuren
zu erhalten, welche die gewünschten
Teile der verlängerten
cDNA enthalten, unter Verwendung herkömmlicher Verfahren, wie z.B.
der Subklonierung, PCR oder in vitro-Oligonukleotidsynthese. Zum
Beispiel können
Nukleinsäuren,
welche nur die vollständigen
kodierenden Sequenzen enthalten (d. h. die Sequenzen, die für das Signalpeptid
und das reife Protein kodieren, das übrig bleibt, nachdem das Signalpeptid
abgespalten wurde), unter Verwendung von Methoden, die den Fachleuten
auf dem Gebiet bekannt sind, erhalten werden. Alternativ können konventionelle
Verfahren angewendet werden, um Nukleinsäuren zu erhalten, die nur die
kodierenden Sequenzen für
das reife Protein enthalten, das übrig bleibt, nachdem das Signalpeptid
abgespalten wurde, oder Nukleinsäuren,
die nur die kodierenden Sequenzen für die Signalpeptide enthalten.
-
In ähnlicher
Weise können
Nukleinsäuren
erhalten werden, die irgendeinen gewünschten Teil der kodierenden
Sequenzen für
das sezernierte Protein enthalten. Zum Beispiel kann die Nukleinsäure wenigstens 10
konsekutive Basen einer verlängerten
cDNA enthalten, wie z.B. einer der verlängerten cDNAs, die unten beschrieben
sind. In einer weiteren Ausführungsform
kann die Nukleinsäure
wenigstens etwa 15 konsekutive Basen einer verlängerten cDNA enthalten, wie
eine der verlängerten
cDNAs, die unten beschrieben werden. Alternativ kann die Nukleinsäure wenigstens
20 konsekutive Basen einer verlängerten
cDNA, wie z.B. einer der unten beschriebenen verlängerten
cDNAs enthalten. In einer weiteren Ausführungsform kann die Nukleinsäure wenigstens
25 konsekutive Basen einer verlängerten
cDNA, wie z.B. einer der unten beschriebenen verlängerten
cDNAs enthalten. In noch einer weiteren Ausführungsform kann die Nukleinsäure wenigstens
40 konsekutive Basen einer verlängerten
cDNA, wie z.B. einer der unten beschriebenen verlängerten
cDNAs enthalten.
-
Sobald
eine verlängerte
cDNA erhalten worden ist, kann sie sequenziert werden, um die Aminosäuresequenz,
für die
sie kodiert, zu bestimmen. Sobald die kodierte Aminosäuresequenz
bestimmt wurde, kann man irgendeine der vielen denkbaren cDNAs erzeugen
und identifizieren, die für
das Protein kodieren wird, indem man einfach die Degeneration des
genetischen Codes verwendet. Zum Beispiel können allele Varianten oder
andere homologe Nukleinsäuren
wie unten beschrieben identifiziert werden. Alternativ können Nukleinsäuren, die
für die
gewünschte
Aminosäuresequenz
kodieren, in vitro synthetisiert werden.
-
In
einer bevorzugten Ausführungsform
kann die kodierende Sequenz ausgewählt werden unter Verwendung
der bekannten Kodon- oder Kodonpaar-Präferenzen für den Wirtsorganismus, in welchem
die cDNA exprimiert werden soll.
-
Die
von den hierin beschriebenen 5'-ESTs
abgeleiteten verlängerten
cDNAs wurden wie in Beispiel 28 unten beschrieben erhalten.
-
BEISPIEL 28
-
Charakterisierung der klonierten verlängerten
cDNAs, die unter Verwendung von 5'-ESTs erhalten wurden
-
Das
in Beispiel 27 oben beschriebene Verfahren wurde verwendet, um die
von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleiteten cDNAs in einer Vielzahl von Geweben zu erhalten.
Die folgende Liste stellt einige wenige Beispiele der so erhaltenen
verlängerten
cDNAs zur Verfügung.
-
Unter
Verwendung dieser Methode wurde die vollständig lange cDNA der SEQ ID
NR: 17 (interne Identifizierungsnummer 48-19-3-G1-FL1) erhalten.
Diese cDNAs fällt
in die Kategorie "EST-ext", die oben beschrieben
wurde, und kodiert für
das Signalpeptid MKKVLLLITAILAVAVG (SEQ ID NR: 18), das einen von
Heijne-Wert von 8,2 aufweist.
-
Die
vollständig
lange cDNA der SEQ ID NR: 19 (interne Identifizierungsnummer 58-34-2-E7-FL2) wurde ebenfalls
unter Verwendung dieser Methode erhalten. Diese cDNA fällt in die
Kategorie "EST-ext", die oben beschrieben
wurde, und kodiert für
das Signalpeptid MWWFQQGLSFLPSALVIWTSA (SEQ ID NR: 20), das einen
von Heijne-Wert von 5,5 hat.
-
Eine
weitere vollständig
lange cDNA, die unter Verwendung des oben beschriebenen Verfahrens
erhalten wurde, hat die Sequenz der SEQ ID NR: 21 (interne Identifizierungsnummer
51-27-1-E8-FL1). Diese cDNA fällt
in die Kategorie "EST-ext", die oben beschrieben
wurde, und kodiert für
das Signalpeptid MVLTTLPSANSANSPVNMPTTGPNSLSYASSALSPCLT (SEQ ID
NR: 22), die einen von Heijne-Wert von 5,9 hat.
-
Das
obige Verfahren wurde außerdem
verwendet, um eine vollständig
lange cDNA zu erhalten, welche die Sequenz der SEQ ID NR: 23 aufweist
(interne Identifizierungsnummer 76-4-1-E5-FL1). Diese cDNA fällt in die
Kategorie "EST-ext", die oben beschrieben
wurde, und kodiert für
das Signalpeptid ILSTVTALTFAXA (SEQ ID NR: 24), das einen von Heijne-Wert
von 5,5 hat.
-
Die
vollständig
lange cDNA der SEQ ID NR: 25 (interne Identifizierungsnummer 51-3-3-B10-FL3) wurde ebenfalls
unter Verwendung dieses Verfahrens erhalten. Diese cDNA fällt in die
Kategorie "neu", die oben beschrieben
wurde, und kodiert für
ein Signalpeptid LVLTLCTLPLAVA (SEQ ID NR: 26), das einen von Heijne-Wert
von 10,1 hat.
-
Die
vollständig
lange cDNA der SEQ ID NR: 27 (interne Identifizierungsnummer 58-35-2-F10-FL2) wurde ebenfalls
unter Verwendung dieses Verfahrens erhalten. Diese cDNA fällt in die
Kategorie "neu", die oben beschrieben
wurde, und kodiert für
ein Signalpeptid LWLLFFLVTAIHA (SEQ ID NR: 28), das einen von Heijne-Wert
von 10,7 hat.
-
Bakterienklone,
welche Plasmide enthalten, die die oben beschriebenen vollständig langen
cDNAs enthalten, werden zur Zeit in den Laboratorien des Erfinders
unter den oben zur Verfügung
gestellten internen Identifizierungsnummern gelagert. Die Inserts
können
aus dem gelagerten Material gewonnen werden, indem ein Aliquot des
entsprechenden Bakterienklons in dem geeigneten Medium wachsen gelassen
wird. Die Plasmid-DNA kann anschließend unter Verwendung von Plasmid-Isolierungsverfahren,
die den Fachleuten auf dem Gebiet bekannt sind, wie z.B. alkalische
Lyse-Minipreps oder Plasmid-Isolierungsverfahren
der alkalischen Lyse im Großmaßstab, isoliert
werden. Wenn gewünscht,
kann die Plasmid-DNA weiterhin durch Zentrifugation auf einen Cäsiumchloridgradienten
durch Größenausschlusschromatographie
oder Anionenaustauschchromatographie angereichert werden. Die unter
Verwendung dieser Verfahren erhaltene Plasmid-DNA kann dann unter
Verwendung von Standard-Klonierungsmethoden, die mit denen die Fachleute
auf dem Gebiet vertraut sind, manipuliert werden. Alternativ kann
eine PCR durchgeführt
werden mit Primern, die an beiden Enden des cDNA-Inserts entworfen
wurden. Das PCR-Produkt, das der cDNA entspricht, kann anschließend un ter
Verwendung von Standard-Klonierungsverfahren, mit denen die Fachleute
auf dem Gebiet vertraut sind, manipuliert werden.
-
Die
durch die verlängerten
cDNAs kodierten Polypeptide können
auf die Gegenwart von bekannten strukturellen oder funktionellen
Motiven oder das Vorhandensein von identifizierenden Merkmalen (signatures),
kurzen Aminosäurensequenzen
untersucht werden, die bei den Mitgliedern einer Proteinfamilie
gut konserviert werden. Die konservierten Regionen wurden verwendet,
um Konsensusmuster oder Matrizes abzuleiten, die in der PROSITE-Datenbank,
insbesondere in der Datei Prosite.dat (Ausgabe 13.0 von November 1995,
zu finden unter http://expasy.hcuge.ch/sprot/prosite.html) abzuleiten.
Prosite_convert und Prosite_scan-Programme (http://ulrec3.unil.ch/ftpserveur/prosite_scan)
können
verwendet werden, um identifizierende Merkmale (signatures) auf
den verlängerten
cDNAs zu finden.
-
Für jedes
mit dem Prosite_convert-Programm aus der Prosite.dat-Datei erhaltenen
Muster kann die Genauigkeit des Nachweises auf einer neuen Proteinsequenz
durch Auswerten der Frequenz irrelevanter Treffer auf der Population
humaner sezernierter Proteine, die in der Datenbank SWISSPROT enthalten
sind, bewertet werden. Das Verhältnis
zwischen der Anzahl von Treffern auf shuffled Proteinen (mit einer
Fenstergröße von 20
Aminosäuren)
und der Anzahl von Treffern auf Nativen (unshuffled) Proteinen,
kann als Index verwendet werden. Jedes Muster, für welches das Verhältnis größer als
20% ist (ein Treffer auf shuffled Proteinen auf 5 Treffern auf nativen
Proteinen) kann während
der Recherche mit Prosite_scan übersprungen
werden. Das zum Durchmischen von Proteinsequenzen verwendete Programm
(db-shuffled) und das zum Bestimmen der Statistiken für jedes
Muster in den Proteindatenbanken verwendete Programm (Prosite_statistics)
sind auf der ftp-Seite http://ulrec3.unil.ch/ftpserveur/prosite_scan
erhältlich.
-
Zusätzlich zu
PCR-basierten Verfahren zum Erhalt verlängerter cDNAs können auch
traditionell Hybridisierungs-basierte Verfahren verwendet werden.
Diese Verfahren können
auch verwenden werden, um die genomischen DNAs zu erhalten, die
für die
mRNAs kodieren, von denen die 5'-ESTs
abgeleitet wurden, für mRNAs,
die den verlängerten
cDNAs entsprechen, oder für
Nukleinsäuren,
die homolog zu den verlängerten cDNAs
oder 5'-ESTs sind.
Beispiel 29 unten stellt Beispiele für derartige Verfahren zur Verfügung.
-
BEISPIEL 29
-
Verfahren zum Erhalt von cDNAs, welche
die gesamte kodierende Region und das authentische 5'-Ende der korrespondierenden
mRNA enthalten
-
Eine
vollständig
lange cDNA-Bibliothek kann hergestellt werden unter Verwendung der
in den Beispielen 13, 14, 15 und 16 oben beschriebenen Strategien,
indem das Zufallsnonamer, das in Beispiel 14 verwendet wird, durch
einen Oligo-dT-Primer ersetzt wird. Zum Beispiel kann das Oligonukleotid
der SEQ ID NR: 14 verwendet werden.
-
Alternativ
kann einen cDNA-Bibliothek oder genomische DNA-Bibliothek von einer
kommerziellen Quelle erhalten werden oder unter Verwendung von Methoden,
die den Fachleuten auf dem Gebiet vertraut sind, hergestellt werden.
Derartige cDNA- oder genomische DNA-Bibliotheken können verwendet
werden, um verlängerte
cDNAs zu isolieren, die von 5'-ESTs
oder Nukleinsäuren
erhalten wurden, die homolog zu den verlängerten cDNAs oder den 5'-ESTs sind, wie folgt.
Die cDNA-Bibliothek oder genomische DNA-Bibliothek wird mit einer nachweisbaren
Sonde hybridisiert, die wenigstens 10 konsekutive Nukleotide aus
dem 5'-EST oder der
verlängerten
cDNA umfasst, unter Verwendung herkömmlicher Verfahren hybridisiert.
Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 konsekutive
Nukleotide des 5'-EST
oder der verlängerten
cDNA. Bevorzugter umfasst die Sonde wenigstens 20 bis 30 konsekutive
Nukleotide aus dem 5'-EST
oder der verlängerten
cDNA. In einigen Ausführungsformen
umfasst die Sonde mehr als 30 Nukleotide aus dem 5'-EST oder der verlängerten
cDNA.
-
Methoden
zum Identifizieren von cDNA-Klonen in einer cDNA-Bibliothek, die
mit einer bestimmten Sondensequenz hybridisieren, sind in Sambrook
et al., Molecular Cloning: A Laboratory Manual, 2d Ed., Cold Springs
Harbor Laboratory Press, 1989, offenbart. Dieselben Methoden können verwendet
werden, um genomische DNAs zu isolieren.
-
Kurz
beschrieben werden cDNA-Klone oder Klone genomischer DNA, die mit
der nachweisbaren Sonde hybridisieren, wie folgt identifiziert und
für die
weitere Manipulation isoliert. Eine Sonde, die wenigstens 10 konsekutive
Nukleotide aus dem 5'-EST
oder der verlängerten
cDNA umfasst, wird mit einer detektierbaren Markierung, wie z.B.
einem Radioisotop oder einem fluoreszenten Molekül markiert. Vorzugsweise umfasst
die Sonde wenigstens 12, 15 oder 17 konsekutive Nukleotide aus dem
5'-EST oder der
verlängerten
cDNA. Bevorzugter umfasst die Sonde 20 bis 30 konsekutive Nukleotide
von dem 5'-EST oder
der verlängerten
cDNA. In einigen Ausführungsformen
umfasst die Sonde mehr als 30 Nukleotide von dem 5'-EST oder der verlängerten
cDNA.
-
Methoden
zum Markieren der Sonde sind wohlbekannt und schließen die
Phosphorylierung mit Polynukleotidkinase, die Nick Translation,
die in vitro-Transkription und nicht-radioaktive Methoden ein. Die cDNAs oder
genomischen DNAs in der Bibliothek werden auf einen Nitrocellulosefilter
oder Nylonfilter transferiert und denaturiert. Nach dem Blockieren
von nicht-spezifischen Stellen wird der Filter mit der markierten
Sonde inkubiert, in einer Menge und für eine Zeit, die ausreichend
ist für
die Sonde, um an die cDNAs oder genomischen DNAs zu binden, die
eine Sequenz enthalten, die fähig
zur Hybridisierung daran ist.
-
Durch
Variieren der Stringenz der Hybridisierungsbedingungen, die zur
Identifizierung verlängerter
cDNAs und genomischer DNAs, die mit der nachweisbaren Sonde hybridisieren,
verwendet werden, können
die verlängerten
cDNAs, die verschiedene Homologiegrade zu der Sonde aufweisen, wie
unten beschrieben identifiziert und isoliert werden.
-
1. Identifikation von verlängerten
cDNA-Sequenzen oder Sequenzen genomischer DNA, die einen hohen Grad an
Homologie mit der markierten Sonde aufweisen
-
Um
verlängerte
cDNAs oder genomische DNAs zu identifizieren, die einen hohen Grad
an Homologie mit der Sequenz der Sonde aufweisen, kann die Schmelztemperatur
der Sonde unter Verwendung der folgenden Formeln berechnet werden.
-
Für Sonden
mit einer Länge
zwischen 14 und 70 Nukleotiden wird die Schmelztemperatur (Tm) unter Verwendung
der Formel: Tm=81,5+16,6(log [Na+])+0,41(Anteil G+C)-(600/N) berechnet
werden, wobei N die Länge
der Sonde angibt.
-
Wenn
die Hybridisierung in einer Lösung
durchgeführt
wird, die Formamid enthält,
kann die Schmelztemperatur unter Verwendung der Gleichung Tm=81,5+16,6(log
[Na+])+0,41(Anteil G+C)-(0,63% Formamid)-(600/N) berechnet werden,
wobei N die Länge
der Probe ist.
-
Eine
Prähybridisierung
kann in 6 X SSC, % X Denhardt's
Reagens, 0,5% SDS, 100 μg
denaturierte, fragmentierte Lachssperma-DNA oder 6 X SSC, 5 X Denhardt's Reagens, 0,5% SDS,
100 μg denaturierte, fragmentierte
Lachssperma-DNA, 50% Formamid, durchgeführt werden. Die Formeln für SSC und
Denhardt's Lösungen sind
in Sambrook et al., s.o., angegeben.
-
Die
Hybridisierung wird durchgeführt,
indem die nachweisbare Sonde zu den oben angegebenen Prähybridisierungslösungen dazugegeben
wird. Wenn die Sonde doppelsträngige
DNA umfasst, wird sie vor der Zugabe zu der Hybridisierungslösung denaturiert.
Der Filter wird mit der Hybridisierungslösung für einen ausreichenden Zeitraum
in Kontakt gebracht, so dass die Sonde an die verlängerten
cDNAs oder genomische DNAs enthaltende Sequenzen, die dazu komplementär oder damit
homolog sind, hybridisieren kann. Für Sonden mit mehr als 200 Nukleotiden
Länge kann
die Hybridisierung bei 15-25°C
unter der Tm ausgeführt
werden. Für
kürzere
Sonden, wie z.B. Oligonukleotidsonden, kann die Hybridisierung bei
15-25°C
unter der Tm durchgeführt
werden. Vorzugsweise wird die Hybridisierung bei Hybridisierungen
in 6 X SSC bei etwa 68°C
durchgeführt.
Vorzugsweise wird die Hybridisierung bei Hybridisierungen in 50%
Formamid-enthaltenden Lösungen bei
etwa 42°C
durchgeführt.
-
Sämtliche
der vorangehend beschriebenen Hybridisierungen würden als unter "stringenten" Bedingungen betrachtet
werden.
-
Nach
der Hybridisierung wird der Filter in 2 X SSC, 0,1% SDS bei Raumtemperatur
für 15
Minuten gewaschen. Der Filter wird anschließend mit 0,1 X SSC, 0,5% SDS
bei Raumtemperatur für
30 Minuten bis 1 Stunde gewaschen. Danach wird die Lösung bei
der Hybridisierungstemperatur in 0,1 X SSC, 0,5% SDS gewaschen.
Ein letzter Waschschritt wird in 0,1 X SSC bei Raumtemperatur durchgeführt.
-
Verlängerte cDNAs,
Nukleinsäuren,
die homolog zu den verlängerten
cDNAs oder 5'-ESTs sind, oder genomische
DNAs, die mit der Sonde hybridisiert haben, werden mittels Autoradiografie
oder anderer herkömmlicher
Verfahren identifiziert.
-
2. Erhalt von verlängerten cDNA-Sequenzen oder
genomischen cDNA-Sequenzen, die einen geringeren Grad an Homologie
zu der markierten Sonde aufweisen
-
Das
obige Verfahren kann modifiziert werden, um verlängerte cDNAs, Nukleinsäuren, die
homolog zu verlängerten
cDNAs sind, oder genomische DNAs zu identifizieren, die niedrigere
Homologiegrade zu der Sondensequenz aufweisen. Zum Beispiel können, um
verlängerte
cDNAs, Nukleinsäuren,
die homolog zu den verlängerten
cDNAs sind, oder genomische DNAs mit verringerter Homologie zu der
nachweisbaren Sonde zu erhalten, weniger stringente Bedingungen
verwendet werden. Zum Beispiel kann die Hybridisierungstemperatur
in Schrittgrößen von
5°C von
68 auf 42°C
verringert werden, in einem Hybridisierungspuffer, der eine Natriumkonzentration
von etwa 1 M hat. Nach der Hybri disierung kann der Filter mit 2
X SSC, 0,5% SDS bei der Hybridisierungstemperatur gewaschen werden.
Diese Bedingungen werden als "moderate" Bedingungen bei über 50°C und als "schwache" Bedingungen bei
unter 50°C
betrachtet.
-
Alternativ
kann die Hybridisierung in Puffern, wie z.B. 6 X SSC, der Formamid
enthält,
bei einer Temperatur von 42°C
durchgeführt
werden. In diesem Fall kann die Konzentration des Formamids in dem
Hybridisierungspuffer in 5%-Schritten von 50% auf 0% reduziert werden,
um Klone zu identifizieren, die verringerte Homologiegrade mit der
Sonde aufweisen. Nach der Hybridisierung kann der Filter mit 6 X
SSC, 0,5% SDS bei 50°C
gewaschen werden. Diese Bedingungen werden als "moderate" Bedingungen bei über 25% Formamid und als "schwache" Bedingungen bei
unter 25% Formamid betrachtet.
-
Verlängerte cDNAs,
Nukleinsäuren,
die homolog zu den verlängerten
cDNAs sind, oder genomische DNAs, die mit der Sonde hybridisiert
haben, werden mittels Autoradiografie identifiziert.
-
3. Bestimmen des Homologiegrades
zwischen den erhaltenen verlängerten
cDNAs und der markierten Sonde
-
Wenn
es gewünscht
wird, Nukleinsäuren
zu erhalten, die homolog zu den verlängerten cDNAs sind, wie z.B.
allele Varianten davon, oder Nukleinsäuren, die für Proteine kodieren, die mit
den durch die verlängerten
cDNAs kodierten Proteinen verwandt sind, kann der Homologiegrad
zwischen der hybridisierten Nukleinsäure und der verlängerten
cDNA oder dem 5'-EST,
die als Sonde verwendet wurden, weiterhin unter Verwendung von BLAST2N
bestimmt werden; die Parameter können
abhängig
von der Länge
der Sequenz und dem untersuchten Homologiegrad angepasst werden.
Um den Grad der Homologie zwischen der hybridisierten Nukleinsäure und
der verlängerten
cDNA oder dem 5'-EST,
von der/dem die Sonde abgeleitet wurde, zu bestimmen, werden die
Nukleotidsequenzen der hybridisierten Nukleinsäure und der verlängerten
cDNA und des 5'-ESTs,
von der/dem die Sonde abgeleitet wurde, verglichen. Zum Beispiel
können
unter Verwendung der oben genannten Verfahren Nukleinsäuren, die
wenigstens 95% Nukleinsäurehomologie
zu der verlängerten cDNA
oder dem 5'-EST,
von der/dem die Sonde abgeleitet wurde, erhalten und identifiziert
werden. In ähnlicher
Weise kann man durch Verwenden von zunehmend weniger stringenten
Hybridisierungsbedingungen Nukleinsäuren erhalten und identifizieren,
die wenigstens 90%, wenigstens 85%, wenigstens 80% oder wenigstens
75% Homologie zu der verlängerten
cDNA oder dem 5'-EST, von der/dem
die Sonde abgeleitet wurde, erhalten und identifizieren.
-
Um
zu bestimmen, ob ein Klon für
ein Protein kodiert, das einen bestimmten Grad an Homologie mit dem
durch die verlängerte
cDNA oder den 5'-EST
kodierten Protein aufweist, wird die Aminosäuresequenz, die durch die verlängerte cDNA
oder den 5'-EST
kodiert wird, mit der Aminosäuresequenz
verglichen, die durch die hybridisierende Nukleinsäure kodiert
wird. Es wird festgestellt, dass eine Homologie existiert, wenn eine
Aminosäuresequenz
in der verlängerten
cDNA oder dem 5'-EST
mit einer Aminosäuresequenz
in der hybridisierenden Nukleinsäure
nahe verwandt ist. Eine Sequenz ist nahe verwandt, wenn sie identisch
mit der der verlängerten
cDNA oder des 5'-EST
ist oder wenn sie eine oder mehrere Aminosäuresubstitutionen enthält, in denen
die füreinander
substituierten Aminosäuren ähnliche
Eigenschaften aufweisen. Unter Verwendung der oben genannten Verfahren
und Algorithmen, wie z.B. FASTA mit Parametern, die abhängig von
der Sequenz und dem untersuchten Grad der Homologie sind, kann man
Nukleinsäuren
erhalten, die für
Proteine kodieren, die wenigstens 95%, wenigstens 90%, wenigstens
85%, wenigstens 50% oder wenigstens 75% Homologie zu den Proteinen
aufweisen, die durch die verlängerte
cDNA oder den 5'-EST
kodiert werden, von der/dem die Sonde abgeleitet wurde.
-
Zusätzlich zu
den oben beschriebenen Verfahren sind andere Protokolle vorhanden,
um verlängerte cDNAs
unter Verwendung von 5'-ESTs
zu erhalten, wie in den folgenden Abschnitten dargelegt.
-
Verlängerte cDNAs
können
hergestellt werden, indem mRNA aus dem Gewebe, der Zelle oder dem Organismus
von Interesse unter Verwendung von mRNA-Präparationsmethoden
erhalten werden, die PolyA-Selektionsverfahren oder andere Methoden
verwenden, die den Fachleuten auf dem Gebiet bekannt sind. Ein erster
Primer, der fähig
ist, mit dem PolyA-Schwanz der mRNA zu hybridisieren, wird mit der
mRNA hybridisiert, und eine reverse Transkriptionsreaktion wird
durchgeführt,
um einen ersten cDNA-Strang zu erzeugen.
-
Der
erste cDNA-Strang wird mit einem zweiten Primer hybridisiert, der
wenigstens 10 konsekutive Nukleotide der Sequenz der SEQ ID NR:
149 enthält.
Vorzugsweise umfasst der Primer wenigstens 12, 15 oder 17 konsekutive
Nukleotide aus der Sequenz der SEQ ID NR: 149. Bevorzugter umfasst
der Primer 20 bis 30 konsekutive Nukleotide aus der Sequenz der
SEQ ID NR: 149. In einigen Ausführungsformen
umfasst der Primer mehr als 30 Nukleotide aus der Sequenz der SEQ
ID NR: 149. Wenn es gewünscht
ist, verlängerte
cDNAs zu erhalten, welche die kodierende Sequenz für das vollständige Protein
enthalten, einschließlich
der authentischen Translations-Initiationsstelle, enthält der zweite
verwendete Primer Sequenzen, die stromaufwärts der Translations-Initiationsstelle
liegen. Der zweite Primer wird verlängert, um einen zweiten cDNA-Strang zu erzeugen,
der zu dem ersten cDNA-Strang komplementär ist. Alternativ kann eine
RT-PCR durchgeführt
werden, wie oben beschrieben, unter Verwendung von Primern von beiden
Enden der zu erhaltenden cDNA.
-
Verlängerte cDNAs,
die 5'-Fragmente
der mRNA enthalten, können
durch Hybridisieren einer mRNA hergestellt werden, welche die Sequenz
des 5'-EST umfasst,
für den
eine verlängerte
cDNA gewünscht
wird, mit einem Primer, der wenigstens 10 konsekutive Nukleotide
der zu der 5'-EST
komplementären
Sequenzen umfasst, und durch reverse Transkription des hybridisierten
Primers, um einen ersten cDNA-Strang von den mRNAs herzustellen.
Vorzugsweise umfasst der Primer wenigstens 12, 15 oder 17 konsekutive
Nukleotide aus dem 5'-EST.
Bevorzugter umfassen die Primer 20 bis 30 Nukleotide von dem 5'-EST.
-
Anschließend wird
ein zweiter cDNA-Strang synthetisiert, der komplementär zu dem
ersten cDNA-Strang ist. Der zweite cDNA-Strang kann hergestellt
werden, indem ein Primer, der komplementär ist zu Sequenzen in dem ersten
cDNA-Strang, mit dem ersten cDNA-Strang hybridisiert wird und der
Primer verlängert
wird, um den zweiten cDNA-Strang
zu erzeugen.
-
Die
unter Verwendung der oben beschriebenen Verfahren hergestellten
doppelsträngigen
cDNAs werden isoliert und kloniert. Die verlängerten cDNAs können in
Vektoren, wie z.B. Plasmiden oder viralen Vektoren kloniert werden,
die fähig
sind in einer geeigneten Wirtszelle zu replizieren. Zum Beispiel
kann die Wirtszelle eine Bakterienzelle, Säugerzelle, Vogelzelle oder
Insektenzelle sein.
-
Methoden
zum Isolieren von mRNA, zur reversen Transkription eines Primers,
der mit mRNA hybridisiert ist, um einen ersten cDNA-Strang zu erzeugen,
zum Verlängern
eines Primers, um einen zweiten cDNA-Strang herzustellen, der komplementär zu dem
ersten cDNA-Strang ist, zum Isolieren der doppelsträngigen cDNA
und zum Klonieren der doppelsträngigen
cDNA sind dem Fachleuten auf dem Gebiet wohlbekannt und in Current
Protocols in Molecular Biology, John Wiley and Sons, Inc. 1997 und
Sambrook et al., Molecular Cloning: A Laboratory Manual, zweite
Ausgabe, Cold Springs Harbor Laboratory, 1989 beschrieben.
-
Alternativ
können
Verfahren wie das in Beispiel 29 beschriebene verwendet werden,
um vollständig lange
cDNAs oder verlängerte
cDNAs zu erhalten. In diesem Ansatz werden vollständig lange
oder verlängerte cDNAs
von mRNA hergestellt und in doppelsträngige Phagemide wie folgt kloniert.
Die cDNA-Bibliothek in den doppelsträngigen Phagemiden wird anschließend durch
Behandlung mit Endonuklease, wie z.B. dem Gen II-Produkt oder dem
Phagen F1, sowie einer Exonuklease einzelsträngig gemacht (Chang et al.,
Gene 127:95-8, 1993). Ein biotinyliertes Oligonukleotid, das die
Sequenz eines 5'-EST
umfasst oder ein Fragment, das wenigstens 10 Nukleotide davon enthält, wird
mit den einzelsträngigen
Phagemiden hybridisiert. Vorzugsweise umfasst das Fragment wenigstens
12, 15 oder 17 konsekutive Nukleotide aus dem 5'-EST. Bevorzugter umfasst das Fragment
20 bis 30 konsekutive Nukleotide aus dem 5'-EST. In einigen Verfahren kann das
Fragment mehr als 30 konsekutive Nukleotide von dem 5'-EST umfassen.
-
Hybride
zwischen dem biotinylierten Oligonukleotid und den Phagemiden, die
Inserts haben, welche die 5'-EST-Sequenz
enthalten, werden durch Inkubieren der Hybride mit paramagnetischen
Beads, die mit Streptavidin beschichtet sind und durch Zurückgewinnen
der Beads mit einem Magneten isoliert (Fry et al., Biotechniques,
13:124-131, 1992). Anschließend
werden die resultierenden Phagemide, die die 5'-EST-Sequenz enthalten, von den Beads
freigesetzt und unter Verwendung eines Primers, der spezifisch für die 5'-EST-Sequenz ist,
in doppelsträngige
DNA konvertiert. Alternativ können
Protokolle wie z.B. das Gene Trapper-Kit (Gibco BRL) verwendet werden.
Die resultierende doppelsträngige
DNA wird in Bakterien transformiert. Verlängerte cDNAs, welche de 5'-EST-Sequenz enthalten,
werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
-
Unter
Verwendung irgendeiner der oben beschriebenen Verfahren in Abschnitt
III, kann eine Vielzahl von verlängerten
cDNAs, welche die kodierenden Sequenzen für das vollständige lange
Protein oder Sequenzen, die nur für das reife Protein kodieren,
das nach ... spalten des Signalpeptids übrig bleibt, als cDNA-Bibliotheken
für die
anschließende
Auswertung der kodierten Proteine oder die Verwendung in diagnostischen
Assays wie unten beschrieben bereitgestellt werden.
-
IV. Expression von Proteinen, die durch
die verlängerten
cDNAs kodiert werden, die unter Verwendung von 5'-ESTs isoliert wurden
-
Verlängerte cDNAs,
welche die kodierenden Sequenzen ihrer korrespondierenden mRNAs
für das vollständige Protein
oder Teile davon enthalten, wie z.B. cDNAs, die für das reife
Protein kodieren, können
verwendet werden, um die kodierten sezernierten Proteine oder Teile
davon wie in Beispiel 30 unten beschrieben zu exprimieren. Wenn
gewünscht,
können
die verlängerten
cDNAs die Sequenzen enthalten, die für das Signalpeptid kodieren,
um die Sekretion des exprimierten Proteins zu erleichtern. Es wird
verstanden werden, dass eine Vielzahl von verlängerten cDNAs, die die kodierenden
Sequenzen für
das vollständige
Protein oder Teile davon enthalten, gleichzeitig in Expressionsvektoren
kloniert werden können,
um eine Expressionsbibliothek für
die Analyse der kodierten Proteine zu erzeugen, wie unten beschrieben.
-
BEISPIEL 30
-
Expression der Proteine, die durch die
Gene kodiert werden, die den 5'-ESTs
oder Teilen davon entsprechen
-
Um
die Proteine zu exprimieren, die durch die Gene kodiert werden,
die den 5'-ESTs
entsprechen (oder Teilen davon), werden vollständig lange cDNAs wie in den
Beispielen 27-29 beschrieben erhalten, die die kodierende Region
für das
gesamte Protein enthalten oder verlängerte cDNAs, die Sequenzen
enthalten, die benachbart zu den 5'-ESTs sind (oder Teilen davon), und
in geeignete Expressionsvektoren kloniert. Wenn gewünscht, können die
Nukleinsäuren
die Sequenzen enthalten, die für
das Signalpeptid kodieren, um die Sekretion des exprimierten Proteins
zu erleichtern. Die in die Expressionsvektoren Nukleinsäuren können außerdem Sequenzen
stromaufwärts
der für
das Signalpeptid kodierenden Sequenzen enthalten, wie z.B. Sequenzen,
die die Expressionslevel regulieren, oder Sequenzen, die eine gewebsspezifische
Expression verleihen.
-
Die
Nukleinsäure,
die für
das zu exprimierende Protein oder Polypeptid kodiert, wird unter
Verwendung herkömmlicher
Klonierungsmethoden funktionell mit einem Promotor in einem Expressionsvektor
verbunden. Der Expressionsvektor kann irgendeines der Säuger-, Hefe-,
Insekten- oder Bakterien-Expressionssysteme sein, die auf dem Gebiet
bekannt sind. Kommerziell erhältliche
Vektoren und Expressionssysteme sind von einer Vielzahl von Anbietern,
einschließlich
dem Genetics Institut (Cambridge, MA), Strategene (La Jolla, Kalifornien),
Promega (Madison, Wisconsin) und Invitrogen (San Diego, Kalifornien)
erhältlich.
Wenn gewünscht,
kann der Kodonkontext und die Kodonpaarung der Sequenz für einen
bestimmten Expressionsorganismus, in den der Expressionsvektor eingeführt wird,
wie von Hatfield et al.,
US-Patent
Nr. 5,082,767 erklärt, optimiert
werden, um die Expression zu verstärken und die richtige Proteinfaltung
zu erleichtern.
-
Die
in den Expressionsvektor klonierte cDNA kann für das gesamte Protein (d. h.
das Signalpeptid und das reife Protein), für das reife Protein (d. h.
das Protein, das durch Abspalten des Signalpeptids erzeugt wird), nur
für das
Signalpeptid oder für
jeden anderen Teil davon kodieren.
-
Das
Folgende wird nur als beispielhaftes Verfahren zur Verfügung gestellt,
um die Proteine zu exprimieren, die durch die mit den 5'-ESTs korrespondierenden
verlängerten
cDNAs oder die oben beschriebenen Nukleinsäuren kodierten Proteine zu
exprimieren. Zuerst werden das Methionin-Initiationskodon für das Gen und
das PolyA-Signal des Gens identifiziert. Wenn der für das zu
exprimierende Polypeptid kodierenden Nukleinsäure ein Methionin fehlt, das
als die Initiationsstelle dienen soll, kann ein Anfangsmethionin
neben das erste Kodon der Nukleinsäure unter Verwendung von herkömmlichen
Verfahren eingeführt
werden. In ähnlicher
Weise kann diese Sequenz, wenn der verlängerten cDNA ein PolyA-Signal
fehlt, an das Konstrukt angefügt
werden, z.B. durch Ausschneiden des PolyA-Signals aus pSG5 (Strategene)
unter Verwendung von BglII und SalI-Restriktionsendonukleaseenzymen
und durch dessen Einfügung
in den Säuger-Expressionsvektor pXT1
(Stratagene). PXT1 enthält
die LTRs und einen Teil des Gag-Gens des Moloney Murinen-Leukämievirus. Die
Position der LTRs in dem Konstrukt erlaubt eine effiziente stabile
Transfektion. Der Vektor enthält
einen Promotor der Thymidinkinase des Herpes Simplex und das selektierbare
Neomycingen. Die verlängerte
cDNA oder ein Teil davon, die/der für das zu exprimierende Polypeptid
kodiert, wird durch PCR von dem bakteriellen Vektor erhalten, in
dem Oligonukleotidprimer verwendet werden, die komplementär zu der
verlängerten
cDNA oder dem Teil davon sind, und die Restriktionsendonukleasesequenzen
für PstI
in dem 5'-Primer
und für
BglII an dem 5'-Ende
des korrespondierenden cDNA 3'-Primers
enthalten, wobei Acht gegeben wird, dass die verlängerte cDNA
mit dem PolyA-Signal positioniert wird. Das gereinigte Fragment,
das aus der resultierenden PCR-Reaktion erhalten wurde, wird mit
PstI verdaut, mit einer Exonuklease werden stumpfe Enden hergestellt, es
wird mit BglII verdaut, gereinigt und mit pXT1 ligiert, der ein
PolyA-Signal enthält,
und für
diese Ligation vorbereitet wurde (stumpfe Ende/BglII).
-
Das
ligierte Produkt wird in Maus NIH 3T3-Zellen unter Verwendung von
Lipofectin (Life Technologies, Inc., Grand Island, New York) unter
Bedingungen transfiziert, die in der Produktbeschreibung angegeben
sind. Positive Transfektanden werden nach dem Wachstum der transfizierten
Zellen in 600 μg/ml
G418 (Sigma, St. Louis, Missouri) se tektiert. Vorzugsweise wird
das exprimierte Protein in das Kulturmedium freigesetzt, wodurch
die Reinigung erleichtert wird.
-
Alternativ
können
die verlängerten
cDNAs in pED6dpc2 wie oben beschrieben kloniert werden. Die resultierenden
pED6dpc2-Konstrukte können
in eine geeignete Wirtszelle, wie z.B. COS 1-Zellen transfiziert werden.
Methotrexat-resistente Zellen werden selektiert und expandiert.
Vorzugsweise wird das von den verlängerten cDNAs exprimierte Protein
in das Kulturmedium freigesetzt, wodurch die Reinigung erleichtert
wird.
-
Proteine
in dem Kulturmedium werden mittels Gelelektrophorese separiert.
Wenn dies gewünscht wird,
können
die Proteine vor der Elektrophorese mit Ammoniumsulfat präzipitiert
oder auf Grundlage der Größe oder
Ladung separiert werden.
-
Als
eine Kontrolle wird der Expressionsvektor, dem ein cDNA-Insert fehlt,
in die Wirtszellen oder in den Organismus eingeführt, und die Proteine in dem
Medium werden gewonnen. Die sezernierten Proteine, die in dem Medium
vorhanden sind, werden unter Verwendung von Methoden, die den Fachleuten
auf dem Gebiet bekannt sind, wie z.B. der Färbung mit Coomassie-Blau oder
der Silberfärbung
oder der Verwendung von Antikörpern
gegen das durch die verlängerte
cDNA kodierte Protein nachgewiesen.
-
Antikörper, die
in der Lage sind, das Protein von Interesse spezifisch zu erkennen,
können
unter Verwendung von synthetischen 15-mer-Peptiden, die eine Sequenz
haben, die durch den geeigneten 5'-EST, die verlängerte cDNA oder den Teil davon
kodiert werden, erzeugt werden. Die synthetischen Peptide werden
in Mäuse
injiziert, um Antikörper
gegen das 5'-EST,
die verlängerte
cDNA oder einen Teil davon kodierte Polypeptid zu erzeugen.
-
Sezernierte
Proteine aus den Wirtszellen oder den Organismen, die einen Expressionsvektor
enthalten, der die von einem 5'-EST
abgeleitete verlängerte
cDNA oder einen Teil davon enthält,
werden mit denen aus Kontrollzellen oder Organismen verglichen.
Das Vorhandensein in einer Bande in dem Medium aus Zellen, die den
Expressionsvektor enthalten, die in dem Medium der Kontrollzellen
nicht vorhanden ist, zeigt an, dass die verlängerte cDNA für ein sezerniertes
Protein kodiert. Im Allgemeinen wird die Bande, die dem durch die verlängerte cDNA
kodierten Protein entspricht, eine Mobilität haben, die nahe der auf Grundlage
der Anzahl von Aminosäuren
in dem offenen Leserahmen der verlängerten cDNA erwarteten Mobilität liegt.
Jedoch kann die Bande eine Mobilität haben, die sich von der erwarteten
unterscheidet, als Folge von Modifikationen wie z.B. Glycosylierung,
Ubiquitinierung oder enzymatischer Spaltung.
-
Alternativ
können
die Proteine, wenn das Protein, das von dem oben genannten Expressionsvektor exprimiert
wird, keine Sequenzen enthält,
die dessen Sekretion steuern, können
die Proteine, die von den Wirtszellen exprimiert werden, die einen
Expressionsvektor mit einem für
ein sezerniertes Protein oder einen Teil davon kodierendes Insert
enthalten, mit den Proteinen verglichen werden, die in Kontrollwirtszellen
exprimiert werden, die den Expressionsvektor ohne ein Insert enthalten.
Das Vorhandensein einer Bande in Proben von Zellen, die den Expressionsvektor
mit einem Insert enthalten, die in Proben aus Zellen, die den Expressionsvektor
ohne ein Insert enthalten, nicht vorhanden ist, zeigt an, dass das
gewünschte
Protein oder ein Teil davon exprimiert wird. Im Allgemeinen wird
die Bande die für
das sezernierte Protein oder den Teil davon erwartete Mobilität aufweisen.
Jedoch kann die Bande eine Mobilität haben, die sich von der erwarteten
als Ergebnis von Modifikationen, wie z.B. Glycosylierung, Ubiquitinierung
oder enzymatischer Spaltung unterscheidet.
-
Das
durch die verlängerte
cDNA kodierte Protein kann unter Verwendung von immunchromatographischen
Standardmethoden gereinigt werden. In solchen Verfahren wird eine
Lösung,
die das sezernierte Protein enthält,
wie z.B. das Kulturmedium oder ein Zellextrakt, auf eine Säule gegeben,
die Antikörper
gegen das sezernierte Protein an die Chromatographiematrix aufweist.
Das sezernierte Protein wird an die Immunchromatographiesäule binden
gelassen. Anschließend
wird die Säule
gewaschen, um nicht-spezifisch
gebundene Proteine zu entfernen. Das spezifisch gebundene sezernierte
Protein wird anschließend
von der Säule
freigesetzt und unter Verwendung von Standardmethoden gewonnen.
-
Wenn
eine Antikörperproduktion
nicht möglich
ist, kann die verlängerte
cDNA-Sequenz oder der Teil davon in Expressionsvektoren eingefügt werden,
die für
die Verwendung in Reinigungsschemata entwickelt wurden, welche chimere
Polypeptide verwenden. In solchen Strategien wird die kodierende
Sequenz der verlängerten
cDNA oder des Teils davon im Leserahmen mit dem Gen, das für die andere
Hälfte
des Chimeres kodiert, insertiert. Die andere Hälfte der Chimere kann β-Globin oder
ein Nickelbindendes Polypeptid sein. Eine Chromatographiematrix,
die einen Antikörper
gegen β-Globin
oder Nickel daran angefügt
aufweist, wird anschließend
verwendet, um das chimere Protein zu reinigen. Proteasespaltstellen
können
zwischen das β-Globin
gehen oder dem Nickel-bindenden Polypeptid oder der verlängerten
cDNA oder Teil davon eingefügt
werden. Folglich können
die beiden Polypeptide der Chimere voneinander durch Proteaseverdau
getrennt werden.
-
Ein
nützlicher
Expressionsvektor zur Erzeugung von β-Globin-Chimeren ist pSG5 (Stratagene),
der für β-Globin des
Kaninchens kodiert. Das Intron II des β-Gens des Kaninchens erleichtert
das Splicen des exprimierten Transkriptes und das Polyadenylierungssignal,
das in das Konstrukt eingefügt
ist, erhöht
die Expressionsmenge. Diese Methoden, wie sie beschrieben wurden,
sind den Fachleuten auf dem Gebiet der Molekularbiologie wohlbekannt.
Standardverfahren sind in Verfahrenstexten, wie z.B. Davis et al.,
(Basic Methods in Molecular Biology, Davis, Dibner und Battey, ed.,
Elsevier Press, NY, 1986) veröffentlicht,
und viele der Verfahren sind von Strategene, Life Technologies,
Inc. oder Promega erhältlich.
Polypeptide können
zusätzlich
von dem Konstrukt hergestellt werden unter Verwendung von in vitro-Translationssystemen,
wie z.B. dem in vitro ExpressTM-Translation-Kit
(Stratagene).
-
Nach
der Expression und Reinigung der sezernierten Proteine, die durch
die 5'-ESTs, verlängerten
cDNAs oder Fragmente davon kodiert werden, können die gereinigten Proteine
auf ihre Fähigkeit
untersucht werden, an die Oberfläche
verschiedener Zelltypen zu binden, wie in Beispiel 31 unten beschrieben.
Man wird verstehen, dass eine Vielzahl von Proteinen, die von diesen
cDNAs exprimiert werden, in eine Anordnung von Proteinen eingeschlossen
werden kann, die gleichzeitig auf die unten spezifisch beschriebenen
Aktivitäten
hinuntersucht werden, ebenso wie auf andere biologische Rollen,
für die
Assays zur Bestimmung der Aktivität vorhanden sind.
-
BEISPIEL 31
-
Analyse der sezernierten Proteine, um
zu bestimmen, ob sie an die Zelloberfläche binden
-
Die
von den 5'-ESTs,
verlängerten
cDNAs oder Fragmenten davon kodierten Proteine werden in Expressionsvektoren
wie die in Beispiel 30 beschriebenen kloniert. Die Proteine werden
mittels Größe, Ladung, Immunchromatographie
oder anderen Methoden, die den Fachleuten auf dem Gebiet vertraut
sind, gereinigt. Nach der Reinigung werden die Proteine unter Verwendung
von Methoden, die den Fachleuten auf dem Gebiet bekannt sind, markiert.
Die markierten Proteine werden mit Zellen oder Zelllinien inkubiert,
die von einer Vielzahl von Organen oder Geweben stammen, um die
Proteine mit jedem auf der Zelloberfläche vorhandenen Rezeptor binden
zu lassen. Nach der Inkubation werden die Zellen gewaschen, um nicht-spezifisch
gebundenes Protein zu entfernen. Die markierten Proteine werden
durch Autoradiografie nachgewiesen. Alternativ können unmarkierte Proteine mit
den Zellen inkubiert werden und mit Antikörpern nachgewiesen werden,
die eine nachweisbare Markierung daran angefügt haben, wie z.B. ein fluoreszentes
Molekül.
-
Die
Spezifität
der Zelloberflächenbindung
kann analysiert werden, indem eine Kompetitionsanalyse durchgeführt wird,
in der verschiedene Mengen an unmarkiertem Protein zusammen mit
dem markierten Protein inkubiert werden. Die Menge an markiertem
Protein, das an die Zelloberfläche
gebunden ist, nimmt mit zunehmender Menge an kompetitiv unmarkiertem
Protein ab. Als Kontrolle werden verschiedene Mengen an unmarkiertem
Protein, das mit dem markierten Protein in keiner Beziehung steht,
in einigen Bindungsreaktionen eingeschlossen. Die Menge an markiertem
Protein, das an die Zelloberfläche
gebunden ist, verringert sich in Bindungsreaktionen, die zunehmende
Mengen an verschiedenem unmarkiertem Protein enthalten, ab, was zeigt,
dass das durch die cDNA kodierte Protein spezifisch an die Zelloberfläche bindet.
-
Wie
oben erläutert
wurde gezeigt, dass sezernierte Proteine eine Vielzahl wichtiger
physiologischer Wirkungen ausüben
und folglich eine wertvolle therapeutische Quelle darstellen. Die
sezernierten Proteine, die durch die verlängerten cDNAs oder Teile davon
kodiert werden, die in Übereinstimmung
mit den Beispielen 27-29 hergestellt wurden, können untersucht werden, um
deren physiologische Aktivitäten
wie unten beschrieben festzustellen.
-
BEISPIEL 32
-
Untersuchen der Proteine, die von den
verlängerten
cDNAs oder Teilen davon exprimiert werden, auf ihre Aktivität als Cytokin,
ihre Zellteilungsaktivität
oder Zelldifferenzierungsaktivität
-
Wie
oben erläutert
können
sezernierte Proteine als Cytokine wirken oder können die zelluläre Proliferation
oder Differenzierung beeinträchtigen.
Viele bisher entdeckte Proteinfaktoren, einschließlich sämtlicher bekannter
Cytokine, zeigten eine Aktivität
in einem oder mehreren Faktor-abhängigen Zellproliferations-Assays,
und folglich dienen die Assays als praktische Bestätigung der
Cytokinaktivität.
Die Aktivität
eines durch die verlängerten
cDNAs kodierten Proteins wird durch irgendeines der vielen Routine-Assays
der Faktor-abhängigen
Zellproliferation für
Zelllinien nachgewiesen, einschließlich, jedoch ohne Beschränkung, von:
32D, DA2, DA1G, T10, B9, B9/11, BaF3, MC9/G, M+ (preB
M+), 2E8, RB5, DA1, 123, T1165, HT2, CTLL2,
TF-1, Mo7c und CMK. Die durch die oben genannten verlängerten
cDNAs oder Teile davon kodierten Proteine können auf ihre Fähigkeit,
die T-Zell- oder Thymocyten-Proliferation zu regulieren, in Assays
wie z.B. den oben beschriebenen oder in den folgenden Referenzen
beschriebenen, untersucht werden: Current Protocols in Immunology,
herausgegeben durch Coligan et al., Greene Publishing Associates
and Wiley-Interscience; Takai et al. J. Immunol. 137:3494-3500,
1986; Bertagnolli et al., J. Immunol. 145:1706-1712, 1990; Bertagnolli
et al., Cell. Immunol. 133:327-341, 1991; Bertagnolli et al., J.
Immunol. 149:3778-3783, 1992; Bowman et al., J. Immunol. 152:1756-1761,
1994.
-
Darüber hinaus
sind zahlreiche Assays für
die Cytokinproduktion und/oder die Proliferation von Milzzellen,
Zellen der Lymphknoten und Thymocyten bekannt. Diese schließen die
in Current Protocols in Immunology, s.o., 1:3.12.1-3.12.14 ein;
sowie Schreiber in Current Protocols in Immunology, s.o., 1:6.8.1-6.8.8.
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihre Fähigkeit
hin untersucht werden, die Proliferation und Differenzierung von
hematopoetischen oder lymphopoetischen Zellen zu regulieren. Viele Assays
für eine
derartige Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich den
in den folgenden Referenzen eingeschlossenen Assays: Bottomly et
al., in Current Protocols in Immunology, s.o., 1:6.3.1-6.3.12; deVries et
al., J. Exp. Med. 173:1205-1211, 1991; Moreau et al., Nature 36:690-692, 1988; Greenberger
et al., Proc. Natl. Acad. Sci. USA 80:2931-2938, 1983; Nordan, R.,
in Current Protocols in Immunology, s.o., 1:6.6.1-6.6.5; Smith et
al., Proc. Natl. Acad. Sci. USA 83:1857-1861, 1986, Gennett et al.,
in Current Protocols in Immunology, s.o., 1:6.15.1; Ciarletta et
al., in Current Protocols in Immunology, s.o., 1:6.13.1.
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihre Fähigkeit
hin untersucht werden, die T-Zell-Antworten auf Antigene zu regulieren.
Viele Assays für
eine derartige Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich den
in den folgenden Referenzen beschriebenen Assays: Kapitel 3 (In Vitro
Assays for Mouse Lymphocyte Function), Kapitel 6 (Cytokines and
Their Cellular Receptors) und Kapitel 7 (Immunologic Studies in
Humans) in Current Protocols in Immunology, s.o.; Weinberger et
al., Proc. Natl. Acad. Sci. USA 77:6091-6095, 1980, Weinberger et
al., Eur. J. Immun. 11:405-411, 1981; Takei et al., J. Immunol.
137:3494-3500, 1986; Takei et al., J. Immunol. 140:508-512, 1988.
-
Die
Proteine, die eine Cytokin-, Zellproliferations- oder Zelldifferenzierungsaktivität zeigen,
können
anschließend
als Pharmazeutika formuliert werden und verwendet werden, um klinische
Zustände
zu behandeln, in denen die Induktion der Zellproliferation oder
der Zelldifferenzierung von Nutzen ist. Alternativ können die Gene,
wie unten detaillierter beschrieben wird, die für diese Proteine kodieren oder
Nukleinsäuren,
welche die Expression dieser Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu steigern oder zu verringern.
-
BEISPIEL 33
-
Untersuchen der Proteine, die von den
verlängerten
cDNAs oder Teilen davon exprimiert werden, auf ihre Aktivität als Regulatoren
des Immunsystems
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihre Wirkungen als
Immunregulatoren hin untersucht werden. Zum Beispiel können die
Proteine auf ihre Aktivität
untersucht werden, die Zytotoxizität der Thymocyten oder Splenocyten
zu beeinflussen. Zahlreiche Assays für derartige Aktivität sind den
Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden
Referenzen beschriebenen: Kapitel 3 (In Vitro Assays for Mouse Lymphocyte
Function 3.1-3.19) und Kapitel 7 (Immunologic Studies in Humans)
in Current Protocols in Immunology, Coligan et al., Hrsg., Greene
Publishing Associates and Wiley-Interscience; Hermann et al., Proc.
Natl. Acad. Sci. USA 78:2488-2492,
1981; Herrmann et al., J. Immunol. 128:1968-1974, 1982; Handa et
al., J. Immunol. 135:1564-1572, 1985; Takei et al., J. Immunol.
137:3494-3500, 1986; Takei et al., J. Immunol. 140:508-512, 1988;
Bowman et al., J. Virology 61:1992-1998; Bertagnolli et al., Cell.
Immunol. 133:327-341, 1991, Brown et al., J. Immunol. 153:3079-3092,
1994.
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihre Wirkungen auf
T-Zell-abhängige Immunglobulinantworten
und Isotypenwechsel untersucht. Verschiene Assays für derartige
Aktivitäten
sind den Fachleuten auf dem Gebiet vertraut, einschließlich der
in den folgenden Referenzen offenbarten Assays: Maliszewski, J.
Immunol. 144:3028-3033, 1990; Mond et al., in Current Protocols
in Immunology, 1:3.8.1-3.8.16, s.o.,
-
Die
durch cDNAs kodierten Proteine können
außerdem
auf ihre Wirkung auf Immuneffektorzellen, einschließlich ihres
Effektes auf Th1-Zellen und auf zytotoxische Lymphozyten, untersucht
werden. Zahlreiche Assays für
eine derartige Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich der
in den folgenden Referenzen offenbarten Assays: Kapitel 3 (In Vitro
Assays for Mouse Lymphocyte Function 3.1-3.19) und Kapitel 7 (Immunologic
Studies in Humans) in Current Protocols in Immunology, s.o., Takei
et al., J. Immunol. 137:3494-3500, 1986; Takei et al., J. Immunol.
140:508-512, 1988; Bertagnolli et al., J. Immunol. 149:3778-3783,
1992.
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihre Wirkung auf
die durch dendritische Zellen vermittelte Aktivierung von naiven
T-Zellen untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den
Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden
Referenzen offenbarten Assays: Guery et al., J. Immunol. 134:536-544,
1995; Inaba et al., J. Exp. Med. 173:549-559, 1991; Macatonia et
al., J. Immunol. 154:5071-5079, 1995; Porgador et al., J. Exp. Med.
182:255-260, 1995; Nair et al., J. Virol. 67:4062-4069, 1993; Huang
et al., Science 264:961-965, 1994; Macatonia et al., J. Exp. Med.
169:1255-1264, 1989; Bhardwaj et al., Journal of Clinical Investigation
94:797-807, 1994; und Inaba et al., J. Exp. Med. 172:631-640, 1990.
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihren Einfluss auf
die Lebenszeit von Lymphozyten untersucht werden. Zahlreiche Assays
für eine
derartige Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich den
in den folgenden Referenzen offenbarten Assays: Darzynkiewicz et
al., Cytometry 13:795-808, 1992; Gorczyca et al., Leukemia 7:659-670,
1993; Gorczyca et al., Cancer Res. 53:1945-1951, 1993; Itoh et al.,
Cell 66:233-243, 1991; Zacharchuk, J. Immunol. 145:4037-3045, 1990;
Zamai et al., Cytometry 14:891-897, 1993; Gorczyca et al., Int.
J. Oncol. 1:639-648, 1992.
-
Die
durch die cDNAs kodierten Proteine können außerdem auf ihren Einfluss auf
die frühen
Schritten der T-Zell-Festlegung und der T-Zell-Entwicklung untersucht
werden. Zahlreiche Assays für
eine derartige Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich und
ohne Beschränkung
der Assays, die in den folgenden Referenzen offenbart sind: Antica
et al., Blood 84:111-117, 1994; Fine et al., Cell. Immunol. 155:111-122,
1994; Galy et al., Blood 85:2770-2778, 1995; Toki et al., Proc.
Natl. Acad. Sci. USA 88:7748-7751, 1991.
-
Die
Proteine, die eine Aktivität
als Regulatoren des Immunsystems zeigen, können anschließend als Pharmazeutika
formuliert werden und verwendet werden, um klinische Zustände zu behandeln,
in denen die Regulation der Immunaktivität nützlich ist. Zum Beispiel können die
Proteine nützlich
sein bei der Behandlung von verschiedenen Immundefizienzen und Immunerkrankungen
(einschließlich
der schweren kombinierten Immundefekte), z.B. bei der Regulierung
(herauf und herunter) des Wachstums und der Proliferation von T- und/oder
B-Lymphozyten sind, ebenso wie bei der Bewirkung der zytolytischen
Aktivität
von NK-Zellen und anderen Zellpopulationen. Diese Immundefizienzen
können
genetisch sein oder durch virale (z.B. HIV) ebenso bakterielle oder
Pilzinfektionen verursacht sein, oder aus einer Autoimmunerkrankung
resultieren. Spezifischer kann eine infektiöse Erkrankung, die durch eine
virale Infektion, bakterielle Infektion, Pilzinfektion oder andere Infektionen
verursacht wurde, behandelbar sein, indem ein Protein verwendet
wird, das durch die verlängerten cDNAs
kodiert wird, die von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleitet sind, einschließlich von Infektionen durch
HIV, Hepatitisviren, Herpesviren, Mycobakterien, Leishmania spp,
Plasmodium und verschiedenen Pilz-Infektionen, wie z.B. Candidiase.
Natürlich
kann in diesem Zusammenhang ein Protein, das durch die von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiertes Protein außerdem
nützlich
sein, wenn ein Boost des Immunsystems allgemein gewünscht sein
kann, d. h. bei der Behandlung von Krebs.
-
Alternativ
können
die Proteine, die durch die von den 5'-ESTs gemäß der vorliegenden Erfindung
abgeleiteten verlängerten
cDNAs kodiert werden, bei der Behandlung von Autoimmunerkrankungen
nützlich sein,
einschließlich
z.B. der Bindegewebserkrankung, Multiple Sklerose, systemischen
Lupus erythematosus, rheumatoider Arthritis, autoimmuner pulmonaren
Entzündung,
Guillain-Barre-Syndrom, autoimmuner Thyroiditis, Insulin-abhängiger Diabetes
mellitus, Myasthenia gravis, Graft-versus-Host-Erkrankung und autoimmunentzündlicher
Augenerkrankung. Ein solches Protein, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung
abgeleiteten verlängerten
cDNAs kodiert wird, kann außerdem
nützlich
bei der Behandlung allergischer Reaktionen und Zustände sein,
wie z.B. Asthma (insbesondere allergischem Asthma) oder anderen
respiratorischen Problemen. Andere Zustände, in denen die Immunsuppression
gewünscht
wird (einschließlich, z.B.,
der Organtransplantation), können
ebenfalls behandelbar sein, indem ein Protein verwendet wird, das durch
die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiert wird.
-
Durch
Verwendung der Proteine gemäß der Erfindung
kann es außerdem
möglich
sein, entweder hoch oder herunterzuregulieren.
-
Eine
Herabregulierung kann die Inhibierung oder Blockierung einer Immunantwort
umfassen, die bereits imgange ist, oder kann das Verhindern der
Induktion einer Immunantwort umfassen. Die Funktionen aktivierter
T-Zellen können
durch Unterdrücken
der T-Zell-Antworten
oder durch Induzieren einer spezifischen Toleranz in T-Zellen oder
durch beides inhibiert werden. Eine Immunsuppression von T-Zell-Antworten
ist im Allgemeinen ein aktiver, nicht-antigenspezifischer Prozess,
der eine kontinuierlich Exposition der T-Zellen gegenüber dem
suppressiven Agens erfordert. Toleranz, die das Induzieren einer
Nicht-Ansprechempfindlichkeit oder Anergie in T-Zellen umfasst,
ist von der Immunsuppression dadurch unterscheidbar, da sie im Allgemeinen
Antigen-spezifisch ist und nach dem Ende der Exposition gegenüber dem
tolerisierenden Agens fortdauert. Funktionell kann Toleranz nachgewiesen
werden durch das Fehlen einer T-Zell-Antwort bei erneuter Exposition
gegenüber
einem spezifischen Antigen in Abwesenheit des tolerisierenden Agens.
-
Die
Herabregulation oder die Vermeidung einer oder mehrerer Antigenfunktionen
(einschließlich,
ohne Beschränkung,
von B-Lymphozyten-Antigenfunktionen, wie z.B. der B7-Kostimulation),
z.B. die Vermeidung der Synthese von hohen Konzentrationen von Lymphokinen
durch aktivierte T-Zellen, wird in Situationen der Gewebs-, Haut-
und Organtransplantation und bei der Graft-versus-Host-Erkrankung
(graft-versus-host disease, GVHD) nützlich sein. Zum Beispiel sollte
das Blockieren der T-Zell-Funktion zu einer verringerten Gewebszerstörung bei
der Gewebstransplantation führen.
Typischerweise wird die Abstoßung
des Transplantats bei Gewebetransplantaten durch dessen Erkennung
als fremd durch T-Zellen initiiert, gefolgt von einer Immunreaktion,
welche das Transplantat zerstört.
Das Verabreichen eines Moleküls,
das die Interaktion eines B7-Lymphozytenantigens
mit dessen natürlichen
Ligand(en) auf Immunzellen inhibiert oder blockiert (wie z.B. eine
lösliche,
monomere Form eines Peptids, das allein oder zusammen mit einer
monomeren Form eines Peptids, das eine Aktivität eines anderen B-Lymphozytenantigens
aufweist (z.B. B7-1, B7-3) oder in Verbindung mit einem blockierenden
Antikörper),
vor der Transplantation, kann zu der Bindung des Moleküls an den natürlichen
Ligand(en) auf den Immunzellen ohne die Übermittlung des entsprechenden
kostimulatorischen Signals führen.
Ein Blockieren der B-Lymphozyten-Antigenfunktion in dieser Angelegenheit
verhindert die Cytokinsynthese durch Immunzellen, wie z.B. T-Zellen, und wirkt
dadurch als ein Immunsuppressor. Darüber hinaus kann das Fehlen einer
Kostimulation auch ausreichend sein, um die T-Zelle zu anergisieren,
wodurch eine Toleranz in einem Individuum induziert wird. Die Induktion
einer Langzeittoleranz durch B-Lymphozytenantigen-blockierende Reagenzien
kann die Notwendigkeit von wiederholter Verabreichung dieser blockierenden Reagenzien
vermeiden. Um eine ausreichende Immunsuppression oder Toleranz in
einem Individuum zu erreichen, kann es außerdem notwendig sein, die
Funktion einer Kombination von B-Lymphozytenantigenen
zu blockieren.
-
Die
Effizienz von bestimmten blockierenden Reagenzien bei der Vermeidung
von Organtransplantatsabstoßungen
oder GVHD kann untersucht werden, indem Tiermodelle verwendet werden,
die für
die Effizienz im Menschen Vorhersagekraft haben. Beispiele für geeignete
Systeme, die verwendet werden können,
schließen
allogene Herztransplantate in Ratten und xenogene Transplantate
der Lange Hans'schen
Inselzellen in Mäusen
ein, die beide verwendet wurden, um die immunsuppressiven Wirkungen
von CTLA4Ig-Fusionsproteinen
in vivo zu untersuchen, wie in Lenschow et al., Science 257:789-792,
1992 und Turka et al., Proc. Natl. Acad. Sci. USA 89:11102-11105,
1992 beschrieben. Darüber
hinaus können
Maus-Modelle für
GVHD (siehe Paul ed., Fundamental Immunology, Raven Press, New York,
1989, Seiten 846-847) verwendet werden, um die Wirkung der Blockierung
der B-Lymphozytenantigenfunktion in vivo auf die Entwicklung dieser
Krankheit zu untersuchen.
-
Eine
Blockierung der Antigenfunktion kann außerdem therapeutisch nützlich sein
für die
Behandlung von Autoimmunkrankheiten. Viele Autoimmunerkrankungen
sind das Ergebnis einer ungeeigneten Aktivierung von T-Zellen, die
gegen Eigengewebe reaktiv sind und die die Produktion von Cytokinen
und von Autoantikörpern,
die an der Pathologie der Erkrankung beteiligt sind, begünstigen.
Ein Verhindern der Aktivierung von autoreaktiven T-Zellen kann die
Erkrankungssymptome reduzieren oder eliminieren. Ein Verabreichen
von Reagenzien, welche die Kostimulation von T-Zellen blockieren,
indem sie die Rezeptor/Liganden-Interaktionen von B-Lymphozytenantigenen
zerstören,
kann verwendet werden, um die T-Zell-Aktivierung zu inhibieren und
die Produktion von Autoantikörpern
oder von T-Zell-abgeleiteten Cytokinen, welche potenziell an dem
Fortschreiten der Erkrankung beteiligt sind, zu verhindern. Darüber hinaus
können
blockierende Reagenzien eine Antigen-spezifische Toleranz autoreaktiver
T-Zellen induzieren, die zu einer längerfristigen Linderung der
Krankheit führen
könnte.
Die Effizienz von blockierenden Reagenzien bei der Vermeidung oder
der Linderung von Autoimmunerkrankungen kann bestimmt werden, indem
eine Zahl gut charakterisierter Tiermodelle für humane Autoimmunkrankheiten
verwendet wird. Beispiele schließen die experimentelle Autoimmunencephalitis
der Maus, systemischer Lupus erythematosus in MRL/pr/pr-Mäusen oder
NZB-Hybrid-Mäusen,
die autoimmune Kollagenarthritis in Mäusen, Diabetes mellitus in
OD-Mäusen
und BB-Ratten und die experimentellen Myasthenia gravis der Maus
ein (siehe Paul Ed., s.o., Seiten 840-856) ein.
-
Eine
Hochregulation einer Antigenfunktion (vorzugsweise eine B-Lymphozytenantigenfunktion)
als Mittel zur Hochregulation von Immunantworten kann ebenfalls
in der Therapie nützliche
sein. Eine Hochregulation von Immunantworten kann entweder das Verstärken einer
vorhandenen Immunantwort umfassen oder das Hervorrufen einer ersten
Immunantwort, wie durch die folgenden Beispiele gezeigt wird. Zum
Beispiel kann die Verstärkung
einer Immunantwort durch Stimulieren der B-Lymphozytenantigenfunktion in Fällen der
viralen Infektion nützlich
sein. Darüber
hinaus eine systemische virale Erkrankung, wie z.B. Influenza, der
gemeinen Erkältung
sowie Encephalitis durch die systemische Verabreichung einer stimulatorischen
Form B-Lymphozytenantigenen
gelindert werden.
-
Alternativ
können
antivirale Immunantworten in einem infizierten Patienten durch Entfernen
der T-Zellen aus dem Patienten, durch Kostimulieren der T-Zellen
in vitro mit APCs, die mit viralem Antigen gepulst wurden, die entweder
ein durch die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten cDNAs
kodierten Peptid exprimieren oder zusammen mit einer stimulatorischen
Form eines löslichen
Peptids, das durch die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiert wird, und durch Wiedereinführen der in vitro geprimten
T-Zellen in den Patienten verstärkt
werden.
-
Die
infizierten Zellen wären
jetzt fähig,
ein kostimulatorisches Signal an T-Zellen in vivo zu liefern, wodurch
die T-Zellen aktiviert werden.
-
In
einer anderen Anwendung kann die Hochregulation oder das Verstärken der
Antigenfunktion (vorzugsweise der B-Lymphozytenantigenfunktion)
bei der Induktion einer Tumorimmunität nützlich sein. Tumorzellen (z.B.
Sarkom, Melanom, Lymphom, Leukämie,
Neuroblastom, Karzinom), die mit einer Nukleinsäure transfiziert sind, die
wenigstens für
ein Peptid kodieren, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung
abgeleiteten verlängerten
cDNAs kodiert wird, können
einem Individuum verabreicht werden, um die tumorspezifische Toleranz
in dem Individuum zu überwinden.
Wenn dies gewünscht
wird, kann die Tumorzelle transfiziert werden, so dass sie eine
Kombination von Peptiden exprimiert. Zum Beispiel können die von
einem Patienten erhaltenen Tumorzellen ex vivo mit einem Expressionsvektor
transfiziert werden, der die Expression eines Peptids mit B7-2-ähnlicher
Aktivität
steuert, allein oder zusammen mit einem Peptid, das eine B7-1-ähnliche
Aktivität
und/oder B7-3-ähnliche
Aktivität
aufweist. Die transfizierten Tumorzellen werden dem Patienten zurückgeführt, was
zu einer Expression der Peptide auf der Oberfläche der transfizierten Zellen führt. Alternativ
können
Gentherapieverfahren verwenden werden, um eine Tumorzelle für die in
vivo-Transfektion gezielt zu erreichen.
-
Die
Gegenwart des Peptids, das durch die von den 5'-ESTs gemäß der Erfindung abgeleiteten
cDNAs kodiert wird, das die Aktivität eines oder mehrerer B-Lymphozytenantigene
auf der Oberfläche
der Tumorzelle aufweist, stellt T-Zellen das notwendige kostimulatorische
Signal zur Verfügung,
um eine T-Zell-vermittelte Immunantwort gegen die transfizierten
Tumorzellen zu erzeugen. Zusätzlich
können
Tumorzellen, denen ausreichende Mengen der MHC Klasse 1- oder MHC
Klasse 2-Moleküle
fehlen, oder die es nicht schaffen, ausreichende Mengen an MHC Klasse
1- oder MHC Klasse 2-Molekülen
zu reexprimieren, mit Nukleinsäure
transfiziert werden, die für
die ganze oder einen Teil (z.B. einen Teil, bei dem die zytoplasmatische
Domäne
trunkiert ist) einer MHC Klasse 1-α-Kette und eines β 2-Mikroglobulins
oder einer MHC Klasse 2-α-Kette und
einer MHC Klasse 2-β-Kette
transfiziert werden, um dadurch MHC Klasse 1-bzw. MHC Klasse 2-Proteine auf der Zelloberfläche zu exprimieren.
Die Expression der entsprechenden MHC Klasse 1-Moleküle oder
MHC Klasse 2-Moleküle
zusammen mit einem Peptid, das die Aktivität eines B-Lymphozytenantigens
hat (z.B. B7-1, B7-2, B7-3) induziert eine T-Zell-vermittelte Immunantwort
gegen die transfizierte Tumorzelle. Optional kann auch ein Gen,
das für
ein Antisensekonstrukt kodiert, das der Expression eines MHC Klasse
2-assoziierten Proteins, wie z.B. die invariante Kette, blockiert,
ebenso mit einer DNA kotransfiziert werden, die für ein Peptid
kodiert, das die Aktivität
eines B-Lymphozytenantigens
hat, um die Präsentation
von tumorassoziierten Antigenen zu fördern und eine tumorspezifische
Immunität
zu induzieren. Folglich kann die Induktion einer T-Zell-vermittelten
Immunantwort in einem menschlichen Individuum ausreichen, um die
tumorspezifische Toleranz in dem Individuum zu überwinden. Wie detaillierter
unten beschrieben, können
alternativ Gene, die für
diese Regulatorproteine des Immunsystems kodieren, oder Nukleinsäuren, die
die Expression solcher Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu
verringern.
-
BEISPIEL 34
-
Untersuchen der von den verlängerten
cDNAs oder Teilen davon exprimierten Proteine auf eine die Hematopoese
regulierende Aktivität
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre die Hematopoese
regulierende Aktivität
untersucht werden. Zum Beispiel kann die Wirkung der Proteine auf
die Differenzierung von embryonalen Stammzellen untersucht werden.
Zahlreiche Assays für
eine derartige Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich der
in den folgenden Referenzen offenbarten Assays: Johansson et al.,
Cell. Biol. 15:141-151, 1995; Keller et al., Mol. Cell. Biol. 13:473-478,
1993; McClanahan et al., Blood 81:2903-2915, 1993.
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können außerdem auf ihren Einfluss auf
die Lebensdauer von Stammzellen und auf die Stammzelldifferenzierung
untersucht werden. Zahlreihe Assays für eine derartige Aktivität sind den
Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden
Referenzen offenbarten Assays: Freshney, Methylcellulose Colony
Forming Assays, in Culture of Hematopoietic Cells, Freshney et al.,
Eds. Seiten 265-268, Wiley-Liss, Inc., New York, NY, 1994; Hirayama
et al., Proc. Natl. Acad. Sci. USA 89:5907-5911, 1992; McNiece und
Briddell, in Culture of Hematopoietic Cells, s.o., Neben et al.,
Exp. Hematol. 22:353-359, 1994; Ploemacher und Cobblestone in Culture
of Hematopoietic Cells, s.o., 21, Spooncer et al., in Culture of
Hematopoietic Cells, s.o., 163-179 und Sutherland in Culture of Hematopoietic
Cells, s.o., 139-162.
-
Die
Proteine, die eine die Hematopoese regulierende Aktivität zeigen,
können
anschließend
als Pharmazeutika formuliert werden und verwendet werden, um klinische
Zustände
zu behandeln, in denen die Regulation der Hematopoese vorteilhaft
ist, wie z.B. bei der Behandlung von Defizienzen myeloider Zellen
oder lymphoider Zellen. Eine Beteiligung an der Regulierung der
Hematopoese wird bereits durch maginale biologische Aktivität zur Unterstützung von
koloniebildenden Zellen oder Faktor-abhängigen Zelllinien angezeigt.
Zum Beispiel zeigen Proteine, welche das Wachstum und die Proliferation
von erythroiden Vorläuferzellen
allein oder im Kombination mit anderen Cytokinen unterstützen, Nützlichkeit
an, z.B. bei der Behandlung verschiedener Anämien oder zur Verwendung zusammen
mit Bestrahlung/Chemotherapie, um die Produktion erythroider Vorläufer und/oder
erythroider Zellen zu stimulieren. Proteine, welche das Wachstum
und die Proliferation myeloider Zellen unterstützen, wie z.B. Granulozyten
und Monozy ten/Makrophagen (d. h. die traditionelle CSF-Aktivität) können nützlich sein,
z.B. zusammen mit Chemotherapie, um eine konsequente Myelosuppression
zu verhindern oder zu behandeln. Proteine, welche das Wachstum und
die Proliferation von Megakaryocyten unterstützen und folglich von Blutplättchen,
erlauben die Vermeidung oder Behandlung verschiedener Erkrankungen
der Blutplättchen,
einschließlich
der Thrombocytopenie und können
im Allgemeinen anstelle von Transfusionen mit Blutplättchen oder
ergänzend
zu Transfusionen mit Blutplättchen
verwendet werden. Proteine, welche das Wachstum und die Proliferation
hematopoetischer Stammzellen unterstützen, die in der Lage sind,
in sämtliche
der oben genannten hematopoetischen Zellen zu reifen, können daher
therapeutischen Nutzen bei verschiedenen Stammzellerkrankungen finden
(einschließlich
solcher, die gewöhnlicherweise
mit Transplantation behandelt werden, einschließlich, jedoch ohne Beschränkung, der
aplastischen Anämie
und der paroxysmalen nokturnen Hämoglobinurie),
ebenso wie bei der Erneuerung des Stammzellbestandes nach der Bestrahlung/Chemotherapie,
entweder in vivo oder ex vivo (d. h. zusammen mit einer Knochenmarkstransplantation
oder mit einer Transplantation peripherer Vorläuferzellen (homolog oder heterolog)),
als normale Zellen oder genetisch manipuliert für die Gentherapie. Wie detaillierter
unten beschrieben, können
alternativ Gene, die für
Proteine mit die Hematopoese regulierender Aktivität kodieren
oder Nukleinsäuren,
die die Expression solcher Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder
zu verringern.
-
BEISPIEL 35
-
Untersuchen der Proteine, die von den
verlängerten
cDNAs oder Teilen davon exprimiert werden, auf eine Regulation des
Gewebewachstums
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre Wirkung auf
das Gewebewachstum untersucht werden. Zahlreiche Assays für eine derartige
Aktivität
sind den Fachleuten auf dem Gebiet bekannt, einschließlich der
in der
internationalen Patentveröffentlichung
Nr. WO 95/16035 ,
internationalen
Patentveröffentlichung
Nr. WO 95/05846 und
internationalen
Patentveröffentlichung Nr.
WO 91/07491 offenbarten Assays.
-
Assays
für die
Wundheilungsaktivität
schließen
ohne Beschränkung
die in Winter, Epidermal Wound Healing, Seiten 71-112, Maibach und
Rovee, Editoren, Jahrbuch Medical Publishers, Inc., Chicago, wie
von Eaglstein und Mertz, J. Invest. Dermatol. 71:382-84, 1978 modifiziert,
ein.
-
Die
Proteine, die an der Regulation des Gewebewachstums beteiligt sind,
können
anschließend
als Pharmazeutika formuliert werden und verwendet werden, um klinische
Zustände
zu behandeln, in denen die Regulation des Gewebewachstums vorteilhaft
ist. Zum Beispiel kann ein Protein, das durch die von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiert wird, auch einen Nutzen in Zusammensetzungen haben,
die für
das Gewebewachstum oder die Regeneration von Knochen, Knorpel, Sehnen,
Bändern
und/oder Nerven verwendet werden, ebenso wie für die Wundheilung und die Wiederherstellung
oder den Ersatz von Gewebe, sowie bei der Behandlung von Verbrennungen,
Schnitten und Ulzera.
-
Ein
durch die von den 5'-ESTs
gemäß der Erfindung
verlängerten
cDNAs kodiertes Protein, das das Wachstum von Knorpel und/oder Knochen
induziert, in Fällen,
in denen der Knochen nicht normal ausgebildet ist, findet Anwendung
bei der Heilung von Knochenfrakturen und Knorpelschäden oder
Knorpeldefekten in Menschen und anderen Tieren. Eine derartige Herstellung,
die ein Protein gemäß der Erfindung
verwendet, kann eine prophylaktische Verwendung bei der Reduktion
sowohl von geschlossenen als auch von offenen Brüchen und auch bei der verbesserten
Fixierung künstlicher
Gelenke haben. Die de novo-Knochensynthese, die durch ein osteogenisches
Agens induziert wird, trägt
zu der Wiederherstellung von craniofacialen Defekten bei, die erblich
bedingt sind, durch ein Trauma induziert wurden oder durch die onkologische
Resektion induziert wurden und ist außerdem nützlich in der kosmetisch plastischen
Chirurgie.
-
Ein
Protein gemäß dieser
Erfindung kann außerdem
bei der Behandlung von Periodontalerkrankungen und bei anderen Zahnwiederherstellungsverfahren
verwendet werden. Derartige Agenzien können eine Umgebung bereitstellen,
um knochenbildende Zellen anzuziehen, das Wachstum von knochenbildenden
Zellen zu stimulieren oder eine Differenzierung knochenbildender
Vorläuferzellen
zu induzieren. Ein Protein gemäß der Erfindung
kann außerdem
nützlich
bei der Behandlung von Osteoporose oder Osteoarthritis sein, wie z.B.
durch Stimulation der Wiederherstellung des Knochens und/oder des
Knorpels oder durch Blockieren der Entzündung oder von Gewebszerstörungsprozessen
(Kollagenaseaktivität,
Osteoklastenaktivität,
usw.), die durch inflammatorische Vorgänge vermittelt wird.
-
Eine
weitere Kategorie der Gewebsregenerationsaktivität, die den durch die von 5'-ESTs gemäß der Erfindung
abgeleiteten verlängerten
cDNAs kodierten Proteinen zugerechnet werden könnte, ist die Bildung von Sehnen/Bändern. Ein
durch die von den 5'-ESTs
ge mäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiertes Protein, das Bänder/Sehnen-ähnliches
Gewebe induziert oder andere Gewebsbildung in Fällen, in denen ein solches
Gewebe normalerweise nicht gebildet wird, findet Anwendung bei der
Heilung von Sehnenrissen oder Bänderrissen,
Deformationen und anderen Störungen
der Sehnen oder Bänder
in Menschen oder anderen Tieren. Eine solche Herstellung verwendet
ein Protein, das Sehnen/Bänder-ähnliches Gewebe
induziert, das eine prophylaktische Verwendung bei der Verhinderung
von Schäden
an Sehne- oder Bändergewebe
haben, ebenso wie Verwendung bei der verbesserten Fixierung von
Sehnen oder Bändern
an Knochen oder anderen Geweben und bei der Wiederherstellung von
Sehnen- oder Bändergewebe.
Die de novo-Bildung von Sehnen/Bänder-ähnlichem
Gewebe, die durch eine Zusammensetzung induziert wird, die durch
von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten cDNAs kodiert wird, trägt zu der Wiederherstellung
von Sehnen oder Bänderdefekten
bei, die angeborenen, traumatischen oder anderen Ursprungs sind,
und ist außerdem
nützlich
in der kosmetisch plastischen Chirurgie zur Anheftung oder zur Wiederherstellung
von Sehnen oder Bändern.
Die durch die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodierten Zusammensetzungen können eine Umgebung zur Verfügung stellen,
um Sehnen- oder Bänder-bildende
Zellen anzulocken, das Wachstum von Sehnen- oder Bänder-bildenden
Zellen zu stimulieren, die Differenzierung von Vorläufern von
Sehnen- oder Bänder-bildenden
Zellen zu induzieren oder das Wachstum von Sehnen/Bänderzellen
oder Vorläufern
ex vivo zu induzieren, um sie in vivo wieder einzubringen, um eine
Wiederherstellung des Gewebes zu bewirken. Die Zusammensetzungen
gemäß der Erfindung
können
außerdem
nützlich
sein bei der Behandlung von Tendinitis, des Carpal-Tunnel-Syndroms und
anderen Sehnen- oder Bänderfehlern.
Die Zusammensetzungen können
außerdem
eine geeignete Matrix und/oder ein sequestrierendes Mittel als Träger umfassen,
wie auf dem Gebiet wohlbekannt ist.
-
Das
durch die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodierte Protein kann außerdem
nützlich
für die
Proliferation neuronaler Zellen und die Regeneration von Nerven-
und Hirngewebe sein, d. h. für
die Behandlung von Erkrankungen des zentralen und peripheren Nervensystems
sowie von Neuropathien, ebenso wie für mechanische und traumatische
Erkrankungen, welche die Degeneration, den Tod oder ein Trauma der
neuralen Zellen oder des Nervengewebes umfassen. Spezifischer kann
ein Protein verwendet werden bei der Behandlung von Erkrankungen
des peripheren Nervensystems, wie z.B. Verletzungen der peripheren
Nerven, peripherer Neuropathie und lokalisierter Neuropathien sowie
Erkrankungen des zentralen Nervensystems, wie z.B. Alzheimer'sche Erkrankung,
Parkinson'sche Erkrankung, Chores
Huntington, amyotrophe Lateralsklerose und Shy-Drager-Syndrom. Weitere
Zustände,
die in Übereinstimmung
mit der vorliegenden Erfindung behandelt werden können, schließen mechanische
und traumatische Erkrankungen ein, wie z.B. Erkrankungen des Rückenmarks,
Schädeltraumata
und zerebrovaskuläre
Erkrankungen, wie z.B. Schlaganfall. Periphere Neuropathien, die
aus der Chemotherapie oder anderen medizinischen Therapien resultieren,
können
ebenfalls unter Verwendung eines Proteins gemäß der Erfindung behandelbar
sein.
-
Proteine
gemäß der Erfindung
können
außerdem
nützlich
sein, um eine bessere und schnellere Schließung von nicht heilenden Wunden
zu fördern,
einschließlich,
jedoch ohne Beschränkung,
von Druckulzera, Ulzera, die mit einer vaskulären Insuffizienz assoziiert
sind, chirurgischen und traumatischen Wunden und dergleichen.
-
Es
ist zu erwarten, dass ein Protein, das durch die von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiert wird, außerdem
eine Aktivität
zur Generation und Regeneration anderer Gewebe zeigen kann, wie
z.B. von Organen (einschließlich,
z.B., Pankreas, Leber, Darm, Niere, Haut, Endothel), Muskel (glatt,
skelettal oder kardial) und vaskulärem Gewebe (einschließlich vaskulärem Endothel) oder
zur Förderung
des Wachstums von Zellen, die solche Gewebe umfassen. Ein Teil der
gewünschten
Wirkungen könnte
durch die Inhibition oder Modulation der fibrotischen Narbenbildung
erfolgen, um normales Gewebe zu erzeugen. Ein Protein gemäß der Erfindung
kann außerdem
eine aniogene Aktivität
zeigen.
-
Ein
durch die von den 5'-ESTs
gemäß der Erfindung
abgeleiteten verlängerten
cDNAs kodiertes Protein kann außerdem
nützlich
sein für
den Schutz oder die Regeneration des Darms sowie für die Behandlung von
einer Fibrose der Lunge oder Leber, von Reperfusionsverletzungen
in verschiedenen Geweben sowie Zuständen, die aus einem systemischen
Cytokinschaden resultieren.
-
Ein
durch die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiertes Protein kann außerdem
nützlich
sein für
die Förderung
oder die Inhibition der Differenzierung von Geweben, wie oben beschrieben,
von Vorläufergeweben
oder Vorläuferzellen;
oder für
die Inhibition des Wachstums von Geweben, wie oben beschrieben.
-
Wie
unten detaillierter beschrieben wird, können die Gene, die für Proteine
mit Gewebswachstum regulierender Aktivität kodieren oder die Nukleinsäuren, welche
die Expression solcher Proteine regulieren, alternativ in geeignete
Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder
zu verringern.
-
BEISPIEL 36
-
Untersuchen der Proteine, die von den
verlängerten
cDNAs oder Teilen davon exprimiert werden, auf Regulation von Reproduktionshormonen
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre Fähigkeit
untersucht werden, Reproduktionshormone zu regulieren, einschließlich des
Follikel-stimulierenden Hormons. Zahlreiche Assays für eine derartige
Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich den
in den folgenden Referenzen offenbarten Assays: Vale et al., Endocrinol.
91:562-572, 1972; Ling et al., Nature 321:779-782, 1986; Vale et
al., Nature 321:776-779, 1986; Mason et al., Nature 318:659-663,
1985; Forage et al., Proc. Natl. Acad. Sci. USA 83:3091-3095, 1986;
Kapitel 6.12 in Current Protocols in Immunology, Coligan et al.,
Eds. Greene Publishing Associates and Wiley-Interscience; Taub et
al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:149-146,
1995; Muller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al.,
J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol. 153:1762-1768, 1994.
-
Proteine,
die eine Aktivität
als Reproduktionshormone oder Regulatoren der Zellbewegung zeigen, können anschließend als
Pharmazeutika formuliert werden und verwendet werden, um klinische
Zustände
zu behandeln, in denen die Regulation der Reproduktionshormone nützlich ist.
Zum Beispiel kann ein durch die von den 5'-ESTs gemäß der vorliegenden Erfindung
abgeleitete verlängerten
cDNAs kodiertes Protein außerdem
Acitivin- oder Inhibin-spezifische Aktivitäten zeigen. Inhibine sind gekennzeichnet
durch ihre Fähigkeit,
die Freisetzung des Follikel-stimulierenden Hormons (FSH) zu inhibieren,
während
Activine gekennzeichnet sind durch ihre Fähigkeit, die Freisetzung von
FSH zu stimulieren. Folglich kann ein durch die von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiertes Protein nützlich
sein als Kontrazeptivum auf Grundlage der Fähigkeit von Inhibinen, die
Fruchtbarkeit in weiblichen Säugetieren
zu verringern und die Spermatogenese in männlichen Säugetieren zu verringern. Die
Verabreichung ausreichender Mengen anderer Inhibine kann die Unfruchtbarkeit
in diesen Säugetieren
induzieren. Alternativ kann das Protein gemäß der Erfindung als Homodimer
oder als Heterodimer mit anderen Proteinuntereinheiten der Inhibin
B-Gruppe nützlich sein
als Fruchtbarkeit-induzierendes Therapeutikum, basierend auf der
Fähigkeit
der Acitivinmoleküle, die
FSH-Freisetzung von Zellen des Hypophysenvorderlappens zu stimulieren.
Siehe, z.B.,
US-Patent 4,798,885 .
Ein Protein kann außerdem
nützlich
sein für
das Vorziehen des Beginns der Fruchtbarkeit in sexuell unreifen
Säugetieren,
um so die Lebenszeit der Reproduktionsleistung von Haustieren wie
z.B. Kühen,
Schafen und Schweinen zu erhöhen.
-
Wie
unten detaillierter beschrieben, können die Gene, die für Proteine
mit einer die Reproduktionshormone regulierenden Aktivität kodieren,
oder Nukleinsäuren,
welche die Expression solcher Proteine regulieren, alternativ in
geeignete Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu verringern.
-
BEISPIEL 37
-
Untersuchen der Proteine, die von verlängerten
cDNAs oder Teilen davon exprimiert werden, auf chemotaktische/chemokinetische
Aktivität
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können außerdem auf chemotaktische/chemokinetische
Aktivität
untersucht werden. Zum Beispiel kann ein durch die von den 5'-ESTs gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodiertes Protein eine chemotaktische oder chemokinetische
Aktivität
(z.B. als ein Chemokin wirken) für
Säugerzellen
haben, einschließlich
z.B. Monozyten, Fibroblasten, Neutrophilen, T-Zellen, Mastzellen,
Eosinophilen, Epithelzellen und/oder Endothelzellen. Chemotaktische
und chemokinetische Proteine können
verwendet werden, um eine gewünschte
Zellpopulation zu einer gewünschten
Wirkungsstätte
zu mobilisieren oder anzulocken. Chemotaktische oder chemokinetische
Proteine stellen bestimmte Vorteile bei der Behandlung von Wunden
und anderen Gewebstraumata, ebenso wie bei Behandlung lokalisierter
Infektionen zur Verfügung.
Zum Beispiel kann das Anlocken von Lymphozyten, Monozyten oder Neutrophilen
zu Tumoren oder Infektionsorten zu verbesserten Immunantworten gegen
den Tumor oder das infizierende Agens führen.
-
Ein
Protein oder Peptid hat eine chemotaktische Aktivität für eine bestimmte
Zellpopulation, wenn es die Orientierung oder die Bewegung einer
solchen Zellpopulation direkt oder indirekt stimulieren kann. Vorzugsweise
hat das Protein oder Peptid die gerichtete Bewegung von Zellen direkt
zu stimulieren. Ob ein bestimmtes Protein eine chemotakti sche Aktivität für eine Zellpopulation
aufweist, kann leicht durch Verwenden eines solchen Proteins oder
Peptids in irgendeinem bekannten Assay für die Zellchemotaxis bestimmt
werden.
-
Die
Aktivität
eines Proteins gemäß der Erfindung
kann, u. a., durch die folgenden Verfahren gemessen werden:
Assays
zur chemotaktischen Aktivität
(die Proteine identifizieren werden, welche die Chemotaxis induzieren oder
verhindern) bestehen aus Untersuchungen, welche die Fähigkeit
eines Proteins messen, die Migration von Zellen über eine Membran zu induzieren,
ebenso wie die Fähigkeit
eines Proteins, die Adhäsion
einer Zellpopulation an eine andere Zellpopulation zu induzieren.
Geeignete Assays für
die Bewegung und die Adhäsion schließen die
in den folgenden Referenzen beschriebenen ein, sind jedoch nicht
darauf limitiert: Current Protocols in Immunology, herausgegeben
durch Coligan, Kruisbeek, Margulies, Shevach und Strober, , Pub.
Greene Publishing Associates and Wiley-Interscience, Kapitel 6.12: 6.12.1-6.12.28;
Taub et al. J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS
103:140-146, 1995; Mueller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al.,
J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol. 153:1762-1768,
1994.
-
BEISPIEL 38
-
Untersuchung der Proteine, die von den
verlängerten
cDNAs oder Teilen davon exprimiert werden, auf die Regulation der
Blutgerinnung
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können ferner auf ihre Wirkungen
auf die Blutgerinnung untersucht werden. Zahlreiche Assays für eine derartige
Aktivität
sind den Fachleuten auf dem Gebiet vertraut, einschließlich der
in den folgenden Referenzen offenbarten Assays: Linet et al., J.
Clin. Pharmacol. 26:131-140, 1986; Burdick et al., Thrombosis Res.
45:413-419, 1987; Humphrey et al., Fibrinolysis 5:71-79, 1991; Schaub,
Prostaglandins 35:467-474, 1988.
-
Die
Proteine, die an der Regulation der Blutgerinnung beteiligt sind,
können
anschließend
als Pharmazeutika formuliert werden und verwendet werden, um klinische
Zustände
zu behandeln, in denen die Regulation der Blutgerinnung vorteilhaft
ist. Zum Beispiel ein Protein gemäß der Erfindung ebenfalls eine
hemostatische oder thrombolytische Aktivität zeigen. Als ein Ergebnis
wird von einem solchen Protein erwartet, dass es nützlich bei
der Behandlung verschiedener Störungen
der Koagulation ist (einschließlich
erblicher Störungen, wie
z.B. die Hämophilie)
oder um die Koagulation und andere hemostatische Ereignisse bei
der Behandlung von Wunden, die von Traumata, der Chirurgie oder
anderen Ursachen resultieren, zu verstärken. Ein Protein gemäß der Erfindung
kann außerdem
nützlich
sein zum Auflösen
von Thrombosen oder zur Inhibition der Bildung von Thrombosen sowie
zur Behandlung und Verhinderung von Zuständen, die daraus resultieren
(wie z.B. dem Infarkt von Herzgefäßen und Gefäßen des zentralen Nervensystems
(z.B. Schlaganfall)). Wie unten detaillierter beschrieben wird,
können
die Gene, die für
Proteine mit Blutgerinnungsaktivität kodieren, oder Nukleinsäuren, welche
die Expression solcher Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu erhöhen oder
zu verringern.
-
BEISPIEL 39
-
Überprüfen der
von den verlängerten
cDNAs oder Teilen davon exprimierten Proteine auf ihre Beteilung
an Rezeptor/Liganden-Interaktionen
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre Beteiligung
an Rezeptor/Liganden-Interaktionen untersucht werden. Zahlreiche
Assays für
eine derartige Beteilung sind den Fachleuten auf dem Gebiet vertraut,
einschließlich
der in den folgenden Referenzen offenbarten Assays: Kapitel 7.7.28.1-7.28.22 in Current
Protocols in Immunology, Coligan et al., Editoren Green Publishing Associates
und Wiley-Interscience; Takai et al., Proc. Natl. Acad. Sci. USA
84:6864-6868, 1987;
Bierer et al., J. Exp. Med. 168:1145-1156, 1988; Rosenstein et al.,
J. Exp. Med. 169:149-160, 1989; Stoltenborg et al., J. Immunol.
Methods 175:59-68, 1994; Stitt et al., Cell 80:661-670, 1995; Gyuris
et al., Cell 75:791-803, 1993.
-
Zum
Beispiel können
die durch die von den 5'-ESTs
gemäß der vorliegenden
Erfindung abgeleiteten verlängerten
cDNAs kodierten Proteine außerdem
eine Aktivität
als Rezeptoren, Rezeptorliganden oder Inhibitoren oder Agonisten
von Rezeptor/Liganden-Interaktionen
zeigen. Beispiele für
derartige Rezeptoren und Liganden schließen ohne Beschränkung Cytokinrezeptoren
und ihre Liganden, Rezeptorkinasen und ihre Liganden, Rezeptorphosphatasen
und ihre Liganden, Rezeptoren, die an Zell-Zell-Interaktionen beteiligt sind sowie ihre
Liganden (einschließlich,
jedoch ohne Beschränkung,
von zellulären
Adhäsionsmolekülen (wie
z.B. Selektinen, Integrinen und deren Liganden) und Rezeptor/Liganden-Paaren,
die an der Antigenpräsentation beteiligt
sind, der Antigenerkennung und der Entwicklung von zellulären und
humoralen Immunantwor ten). Rezeptoren und Liganden sind außerdem nützlich zum
Screenen von potenziellen Peptidinhibitoren oder kleinmolekularen
Inhibitoren der relevanten Rezeptor/Liganden-Interaktion. Ein durch die von den beschriebenen 5'-ESTs abgeleiteten
verlängerten
cDNAs kodiertes Protein (einschließlich, jedoch ohne Beschränkung, von Fragmenten
von Rezeptoren und Liganden) kann selbst nützlich als Inhibitor von Rezeptor/Liganden-Interaktionen sein.
Wie unten detaillierter beschrieben wird, können Gene, die für Proteine
kodieren, die an Rezeptor/Liganden-Interaktionen beteiligt sind,
oder Nukleinsäuren,
welche die Expression solcher Proteine regulieren, in geeignete
Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder
zu verringern.
-
BEISPIEL 40
-
Untersuchen der von den verlängerten
cDNAs oder Teilen davon exprimierten Proteine auf antiinflammatorische
Aktivität
-
Die
durch die verlängerten
cDNAs und einen Teil davon kodierten Proteine können außerdem auf antiinflammatorische
Aktivität
untersucht werden. Die antiinflammatorische Aktivität kann erreicht
werden, indem ein Stimulus einer Zelle zur Verfügung gestellt wird, die an
der inflammatorischen Antwort beteiligt ist, in den Zell-Zell-Interaktionen
inhibiert oder gefördert
werden (wie z.B. die Zelladhäsion),
indem die Chemotaxis von Zellen, die an dem inflammatorischen Prozess
beteiligt sind, inhibiert oder gefördert wird, die Zellextravasation inhibiert
oder gefördert
wird oder indem die Produktion anderer Faktoren, die auf direktere
Weise eine inflammatorische Antwort inhibieren oder fördern, stimuliert
oder unterdrückt
wird. Proteine, die derartige Aktivitäten zeigen, können verwendet
werden, um inflammatorische Zustände
zu behandeln, einschließlich
chronische oder akute Zustände,
einschließlich
und ohne Beschränkung
von einer Inflammation, die mit einer Infektion assoziiert ist (wie
z.B. ein septischer Schock Sepsis oder ein systemisches inflammatorisches
Antwortsyndrom), Ischämie-Reperfusioninurie,
Endotoxinlethalität,
Arthritis, Komplement-vermittelte hyperakute Abstoßung, Nephritis,
Cytokin- oder Chemokin-induzierte Lungenschädigung, inflammatorische Darmerkrankung,
Morbus Crohn oder zur Behandlung von Inflammation, die aus einer Überproduktion
von Cytokinen, wie z.B. TNF oder IL-1 resultiert. Die Proteine gemäß der Erfindung
können
außerdem
nützlich
sein, um Anaphylaxe und Hypersensitivität gegenüber einer antigenen Substanz
oder einem Material zu behandeln. Wie unten detaillierter beschrieben
wird, können
die Gene, die für
Proteine mit antiinflammatorischer Aktivität kodieren oder Nuk leinsäuren, welche
die Expression derartiger Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder
zu verringern.
-
BEISPIEL 41
-
Untersuchung der von den verlängerten
cDNAs oder Teilen davon exprimierten Proteine auf eine Tumorinhibitionsaktivität
-
Die
durch die verlängerten
cDNAs oder Teile davon kodierten Proteinen können außerdem auf ihre Tumorinhibitionsaktivität untersucht
werden. Zusätzlich
zu den oben für
die immunologische Behandlung oder die Verhinderung von Tumoren
beschriebenen Aktivität,
kann ein Protein gemäß der Erfindung
weitere Antitumoraktivitäten
aufweisen. Ein Protein kann das Tumorwachstum direkt oder indirekt
inhibieren (wie z.B. über
ADCC). Ein Protein kann seine tumorinhibitorische Aktivität zeigen,
indem es auf ein Tumorgewebe oder Tumorvorläufergewebe wirkt, indem die
Bildung von Geweben, die notwendig sind, um das Tumorwachstum zu
unterstützen,
inhibiert (wie z.B. durch Inhibieren der Angiogenese), indem es
die Produktion weiterer Faktoren, Agenzien oder Zelltypen verursacht,
die das Tumorwachstum inhibieren, oder indem es Faktoren, Agenzien oder
Zelltypen, die das Tumorwachstum fördern, supprimieren, eliminieren
oder inhibieren. Wie unten detaillierter beschrieben wird, können die
Gene, die für
Proteine mit Tumorinhibitionsaktivität kodieren, oder Nukleinsäuren, welche
die Expression derartiger Proteine regulieren, in geeignete Wirtszellen
eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder
zu verringern.
-
Ein
Protein gemäß der Erfindung
kann außerdem
ein oder mehrere der folgenden zusätzlichen Aktivitäten oder
Wirkungen zeigen: Inhibieren des Wachstums, der Infektion oder der
Funktion von infektiösen
Agenzien, oder das Zerstören
der infektiösen
Agenzien, einschließlich,
jedoch ohne darauf beschränkt
zu sein, von Bakterien, Viren, Pilzen und anderen Parasiten; Hervorrufen
(Unterdrücken
oder Verstärken)
körperlicher
Eigenschaften, einschließlich,
jedoch ohne darauf beschränkt
zu sein, der Größe, des
Gewichtes, Haarfarbe, Augenfarbe, Haut, Fat to lean-Verhältnis oder
Pigmentierung eines anderen Gewebes, oder Größe oder Form eines Organs oder
Körperteils
(wie z.B. einer Brustvergrößerung oder
-verkleinerung, einer Veränderung
der Knochenform oder Gestalt); Hervorrufen von Biorhythmen oder
circadierten Zyklen oder Rhythmen; Hervorrufen der Fruchtbarkeit
von männlichen
oder weiblichen Individuen; Bewirken des Metabolismus, Catabolismus, Anabolismus,
der Prozessierung, Verwendung, Speicherung oder Eliminierung von
diätetischem
Fett, Lipid, Protein, Kohlenhydraten, Vitaminen, Mineralien, Kofaktoren
oder anderen Ernährungsfaktoren
oder Bestandteilen; Hervorrufen von Verhaltenseigenschaften, einschließlich, jedoch
ohne darauf beschränkt
zu sein, des Appetits, der Libido, Stress, Kognition (einschließlich kognitiver
Störungen),
Depression (einschließlich
depressiver Störungen)
und gewalttätigen
Verhaltensweisen; Bereitstellen von schmerzstillenden Wirkungen
oder anderen schmerzreduzierenden Wirkungen; Förderung der Differenzierung
und des Wachstums von embryonalen Stammzellen in Linien, die nicht
hematopoetische Linien sind; hormonelle oder endokrine Aktivität; in dem
Fall von Enzymen, die Korrektur von Defizienzen des Enzyms und die
Behandlung von Defizienz-vermittelten Erkrankungen; die Behandlung
von hyperproliferativen Störungen
(wie z.B. Psoriasis); Immunglobulin-ähnliche Aktivität (wie z.B.
die Fähigkeit,
Antigene oder Komplement zu binden; sowie die Fähigkeit, als ein Antigen in
einer Vaccinzusammensetzung zu wirken, um eine Immunantwort gegen
ein derartiges Protein oder ein anderes Material oder eine andere
Einheit, die mit einem solchen Protein kreuzreagiert, hervorzurufen.
Wie unten detaillierter beschrieben wird, können Gene, die für Proteine
kodieren, die an irgendeiner der oben genannten Aktivität beteiligt
sind, oder Nukleinsäuren,
welche die Expression derartiger Proteine regulieren, alternativ
in geeignete Wirtszellen eingeführt
werden, um die Expression der Proteine wie gewünscht zu verstärken oder
zu verringern.
-
BEISPIEL 42
-
Identifikation von Proteinen, die mit
Polypeptiden interagieren, die durch die verlängerten cDNAs kodiert werden
-
Proteine,
die mit den Polypeptiden interagieren, die durch die von den 5'-ESTs oder Fragmenten
davon abgeleiteten cDNAs kodiert werden, wie z.B. Rezeptorproteine,
können
unter Verwendung von Two Hybrid-Systemen, wie z.B. dem Matchmaker
Two Hybrid-System 2 (Katalog Nr. K1604-1, Clontech) identifiziert werden.
Wie in dem Handbuch beschrieben wird, das dem Kit beiliegt, und
das hierin als Referenz eingeschlossen wird, werden die cDNAs, die
von den 5'-ESTs
abgeleitet sind, oder Fragmente davon in einen Expressionsvektor
insertiert, so dass sie sich im Leserahmen mit der DNA befinden,
die für
die DNA bindende Domäne
des Hefetranskriptionsaktivators GAL4 kodiert. cDNAs in einer cDNA-Bibliothek,
die für
Proteine kodiert, die mit den durch die verlängerten cDNAs oder Teile davon
kodierten Polypeptide interagieren, werden in einen zweiten Expressionsvektor
insertiert, so dass sie sich im Leserahmen mit einer DNA befinden, die
für die
Aktivierungsdomäne
von GAL4 kodiert. Die beiden Expressionsplasmide werden in Hefe
transformiert, und die Hefe wird auf Selektionsmedium ausplattiert,
das auf die Expression eines nachweisbaren Markers auf jedem der
Expressionsvektoren, ebenso auf eine GAL4-abhängige Expression des HIS3-Gens
selektiert. Transformanten, die fähig sind, auf dem Medium ohne
Histidin zu wachsen, werden auf GAL4-abhängige lacZ-Expression untersucht.
Die Zellen, die sowohl in der Histidinselektion als auch in dem
lacZ-Assay positiv sind, enthalten Plasmide, die für Proteine
kodieren, die mit durch die verlängerten
cDNAs oder Teile davon kodierten Polypeptid interagieren.
-
Alternativ
kann das in Lustig et al., Methods in Enzymology 283:83-99, 1997,
und in
US-Patent Nr. 5,654,150 beschriebene
System zum Identifizieren von Molekülen, die mit dem durch die
verlängerten
cDNAs kodierten Polypeptiden interagieren, zu identifizieren. In
derartigen Systemen werden in vitro-Transkriptionsreaktionen mit
einem Pool von Vektoren durchgeführt,
die verlängerte
cDNA-Inserts enthalten, die stromabwärts eines Promotors kloniert
wurden, der die in vitro-Transkription steuert. Die resultierenden
Pools von mRNAs werden in Oocyten von Xenopus laevis eingeführt. Die
Oocyten werden anschließend
auf eine gewünschte
Aktivität
untersucht.
-
Alternativ
können
die gepoolten in vitro-Transkriptionsprodukte, die wie oben beschrieben
erzeugt wurden, in vitro translatiert werden. Die gepoolten in vitro-Translationsprodukte
können
auf eine gewünschte Aktivität oder auf
eine Interaktion mit einem bekannten Polypeptid untersucht werden.
-
Proteine
oder andere Moleküle,
die mit den durch die verlängerten
cDNAs kodierten Polypeptiden interagieren, können durch eine Vielzahl zusätzlicher
Methoden aufgefunden werden. In einem Verfahren können Affinitätssäulen hergestellt
werden, die das Polypeptid enthalten, das durch die verlängerten
cDNAs oder einen Teil davon kodiert wird. In einigen Versionen dieses
Verfahrens enthält
die Affinitätssäule chimere
Proteine, in denen das durch die verlängerte cDNA oder einen Teil
davon kodierte Protein mit einer Glutathion S-Transferase fusioniert
ist. Eine Mischung zellulärer
Proteine oder eine Vereinigung exprimierter Proteine wie oben beschrieben
wird auf die Affinitätssäule aufgebracht.
Proteine, die mit dem an die Säule
angehefteten Polypeptid interagieren, können anschließend isoliert
und auf einem 2D-Elektrophoresegel wie in Ramunsen et al., Electrophoresis
18:588-598, 1997 beschrieben analysiert werden. Alternativ können die
auf der Affinitätssäule zurückgehaltenen
Proteine durch Elektrophorese-basierte Verfahren gereinigt werden
und sequenziert werden. Dasselbe Verfahren kann verwendet werden, um
Antikörper
zu isolieren, Phagendisplay-Produkte zu untersuchen oder Phagendisplay-humane
Antikörper
zu untersuchen.
-
Proteine,
die mit dem durch die verlängerten
cDNAs oder Teile davon kodierten Polypeptiden interagieren, können außerdem unter
Verwendung eines Optical Biosensor, wie in Edwards und Leatherbarrow, Analytical
Biochemistry 246:1-6, 1997, beschrieben, untersucht werden. Der
Hauptvorteil dieses Verfahrens ist, dass es die Bestimmung der Assoziationsrate
zwischen dem Protein und anderen interagierenden Molekülen erlaubt.
Folglich ist es möglich,
interagierende Moleküle
mit einer hohen oder niedrigen Assoziationsrate spezifisch zu selektieren. Üblicherweise
ist ein Zielmolekül
an die Sensoroberfläche
(über eine
Carboxylmethyldextranmatrix) gebunden, und einer Auswahl von Testmolekülen wird
mit den Zielmolekülen
in Kontakt gebracht. Das binden eines Testmoleküls an das Zielmolekül verursacht
eine Veränderung
des Brechungsindex und/oder der Dicke. Diese Veränderung wird durch den Biosensor
detektiert, vorausgesetzt, dass es in dem evaneszenten Feld auftritt
(das sich einige wenige Hundert Nanometer von der Sensoroberfläche befindet).
In diesem Screening-Assay kann das Zielmolekül eines der Polypeptide sein,
das durch die verlängerten
cDNAs oder einen Teil davon kodiert wird, und die Testprobe kann
eine Sammlung von Proteinen sein, die aus Geweben oder Zellen extrahiert
wurden, ein Pool exprimierter Proteine, kombinatorische Peptid und/oder
chemische Bibliotheken oder Phagendisplay-Peptide. Die Gewebe oder
Zellen, aus denen die Testproteine gewonnen werden, können aus
irgendeiner Spezies stammen.
-
In
anderen Verfahren wird ein Zielmolekül immobilisiert und die Testpopulation
ist eine Sammlung einzigartiger Polypeptide, die durch die verlängerten
cDNAs oder Teile davon kodiert werden.
-
Um
die Interaktion der durch die verlängerten cDNAs oder Teile davon
kodierten Proteine mit Arzneimitteln zu untersuchen, kann die Mikrodialyse,
die an ein HPLC-Verfahren gekoppelt ist und von Wang et al., Chromatographia
44:205-208, 1997 beschrieben wird, oder die Affinitäts-Kapillar-Elektrophorese-Methode, die
von Bush et al., J. Chromatogr. 777:311-328, 1997 beschrieben wird,
verwendet werden.
-
Die
Fachleute auf dem Gebiet werden verstehen, dass die von den verlängerten
cDNAs oder Teilen exprimierten Proteine auf zahlreiche Aktivitäten zusätzlich zu
den spezifisch oben aufgezählten
untersucht werden können.
Zum Beispiel können
die exprimierten Proteine auf Anwendungen untersucht werden, welche die
Kontrolle und die Regulation von Entzündung, Tumorproliferation oder
Metastase, Infektion oder anderen klinischen Zuständen umfasst.
Zusätzlich
können
die von den verlängerten
cDNAs oder Teilen davon exprimierten Proteine nützlich als Ernährungsmittel
oder kosmetische Mittel sein.
-
Die
von den cDNAs oder Teilen davon exprimierten Proteine können verwendet
werden, um Antikörper zu
erzeugen, die fähig
sind, an die exprimierten Proteine oder Fragmente davon spezifisch
zu binden, wie in Beispiel 40 unten beschrieben. Die Antikörper können fähig sein,
an ein vollständig
langes Protein zu binden, dass durch eine cDNA kodiert wird, die
von einem 5'-EST
stammt, an ein reifes Protein (d. h. das Protein, das durch Abspalten
des Signalpeptids erzeugt wird), das durch eine von einer 5'-EST stammende cDNA
kodiert wird, oder an ein Signalpeptid, das durch eine von einer
5'-EST stammende
cDNA kodiert wird. Alternativ können
die Antikörper
fähig sein,
Fragmente von wenigstens 10 Aminosäuren der Proteine zu binden,
die durch die oben genannten cDNAs kodiert werden. In einigen Ausführungsformen
können
die Antikörper
fähig sein, Fragmente
von wenigstens 15 Aminosäuren
der durch die oben genannten cDNAs kodierten Proteine zu binden.
In anderen Ausführungsformen
können
die Antikörper
fähig sein,
Fragmente von wenigstens 25 Aminosäuren der durch die verlängerten
cDNAs exprimierten Proteine zu binden, die wenigstens 25 Aminosäuren der
durch die oben genannten cDNAs kodierten Proteine umfassen. In weiteren
Ausführungsformen
können die
Antikörper
fähig sein,
Fragmente von wenigstens 40 Aminosäuren der durch die oben genannten
cDNAs kodierten Proteine zu binden.
-
BEISPIEL 43
-
Herstellung eines Antikörpers gegen
ein humanes Protein
-
Im
Wesentlichen reines Protein oder Polypeptid wird aus den transfizierten
oder transformierten Zellen wie in Beispiel 30 oben beschrieben
isoliert. Die Konzentrierung eines Proteins in der Endherstellung
wird angepasst, z.B. durch Konzentrierung auf einer Amiconfiltereinheit
auf eine Konzentration von wenigen Mikrogramm/Milliliter. Ein monoklonaler
oder polyklonaler Antikörper
gegen das Protein kann anschließend
wie folgt hergestellt werden.
-
1. Herstellung eines monoklonalen
Antikörpers
mittels Hybridomfusion
-
Ein
monoklonaler Antikörper
gegen Epitope eines jeden der identifizierten und wie beschrieben
isolierten Peptide kann aus murinen Hybridomen gemäß dem klassischen Verfahren
von Kohler und Milstein, Nature 256:459, 1995, oder davon abgeleiteten
Verfahren hergestellt werden. Kurz beschrieben wird eine Maus wiederholt
mit einigen wenigen Mikrogramm des ausgewählten Proteins oder der ausgewählten Peptide,
die davon abgeleitet sind, über
einen Zeitraum von einigen Wochen inokuliert. Die Maus wird anschließend geopfert, und
die Antikörperproduzierenden
Zellen der Milz werden isoliert. Die Milzzellen werden mittels Polyethylenglycol
mit Myelomzellen der Maus fusioniert, und der Überschuss an nicht-fusionierten
Zellen wird durch Wachstum des Systems auf selektiven Medien, die
Aminopterin enthalten (HAT-Medien) beseitigt. Die erfolgreich fusionierten
Zellen werden verdünnt
und Aliquots der Verdünnung
werden in Vertiefungen einer Mikrotiterplatte gegeben, wo das Wachstum
der Kultur fortgesetzt wird. Antikörper produzierende Klone werden
durch Nachweis von Antikörpern
in dem Überstand
der Vertiefungen mittels Immunassaymethoden, wie z.B. ELISA, wie
ursprünglich
von Engvall, Meth. Enzymol. 70:419, 1980 beschrieben sowie davon
abgeleiteten Verfahren identifiziert. Ausgewählte positive Klone können expandiert
werden, und ihr Produkt, der monoklonale Antikörper, kann für die weitere
Verwendung gewonnen werden. Detaillierte Methoden zur Herstellung
von monoklonalem Antikörper
werden in Davis et al. in Basic Methods in Molecular Biology Elsevier,
New York, Abschnitt 21-2 beschrieben.
-
2. Herstellung eines polyklonalen
Antikörpers
durch Immunisierung
-
Polyklonales
Antiserum, das Antikörper
gegen heterogene Epitope eines einzigen Proteins enthält, kann
hergestellt werden, indem geeignete Tiere mit dem exprimierten Protein
oder den davon abgeleiteten Peptiden immunisiert wird, wobei das
Protein unmodifiziert sein kann oder modifiziert, um die Immunogenizität zu verstärken. Eine
effektive Herstellung von monoklonalem Antikörper wird durch zahlreiche
Faktoren beeinträchtigt,
die sowohl mit dem Antigen als auch den Wirtsspezies zusammenhängen. Zum
Beispiel neigen kleine Moleküle
dazu, weniger immunogen als andere zu sein und können die Verwendung von Trägern und
einem Adjuvans erfordern. Außerdem
variiert die Antwort des Wirtstieres abhängig von dem Ort der Inokulationen
und den Dosen, wobei sowohl unzureichende als auch überhöhte Dosen
des Antigens zu einem geringen Titerantiserum führen. Geringe Dosen (ng-Konzentration)
des Antigens, die an verschiedenen intradermalen Orten verabreicht
werden, scheinen die verlässlichsten
zu sein. Ein wirksames Immunisierungsprotokoll für Kaninchen ist in Vaitukaitis
et al., J. Clin. Endocrinol. Metab. 33:988-991 (1971) zu finden.
-
Booster-Injektionen
können
in regelmäßigen Intervallen
verabreicht werden, und Antiserum wird gewonnen, wenn der Antikörpertiter
davon zu fallen beginnt, wie semi-quantitativ bestimmt wird, z.B. durch
doppelte Immundiffusion in Agar gegen bekannte Konzentrationen des
Antigens. Siehe, z.B., Ouchterlony et al., Kap. 19 in: Handbook
of Experimental Immunology D. Wier (Ed.) Blackwell (1973). Die Plateaukonzentration des
Antikörpers
bewegt sich im Allgemeinen in dem Bereich von 0,1 bis 0,2 mg/ml
Serum (etwa 12 μM).
Die Affinität
der Antisera für
das Antigen wird durch Anfertigen kompetitiver Bindungskurven, wie
z.B. von Fisher D., Kap. 42 in: Manual of Clinical Immunology, 2.
Ed. (Rose und Friedman, Hrsg.) Amer. Soc. For Microbiol., Washington,
D.C. (1980) beschrieben, bestimmt.
-
Die
in Übereinstimmung
mit einem der Protokolle hergestellten Antikörperpräparationen sind nützlich in
quantitativen Immunassays, die die Konzentrationen von Antigentragenden
Substanzen in biologischen Proben bestimmen; sie werden außerdem semi-quantitativ oder
qualitativ verwendet, um das Vorhandensein des Antigens in einer
biologischen Probe zu bestimmen. Die Antikörper können außerdem in therapeutischen Zusammensetzungen
verwendet werden, um Zellen zu töten,
die das Protein exprimieren oder die Konzentrationen des Proteins
im Körper
zu reduzieren.
-
V. Verwendung der 5'-ESTs oder davon erhältlichen Sequenzen oder Teilen
davon als Reagenzien
-
Die
5'-ESTs der vorliegenden
Erfindung (oder cDNAs oder genomischen DNAs, die davon erhältlich sind)
können
als Reagenzien in Isolierungsverfahren, diagnostischen Assays und
forensischen Verfahren verwendet werden. Zum Beispiel können die
Sequenzen von den 5'-ESTs
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) nachweisbar markiert
werden und als Sonden verwendet werden, um andere Sequenzen zu isolieren,
die fähig
sind, an sie zu hybridisieren. Darüber hinaus können die
Sequenzen von den 5'-ESTs
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) verwendet werden,
um PCR-Primer zu entwerfen, die in Isolations-, diagnostischen oder
forensischen Verfahren verwendet werden sollen.
-
1. Verwendung von 5'-ESTs oder Sequenzen, die davon erhältlich sind
oder Teilen davon in Isolations-, diagnostischen und forensischen
Verfahren
-
BEISPIEL 44
-
Herstellung von PCR-Primern und Amplifikation
von DNA
-
Die
5'-EST-Sequenzen
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) können verwendet
werden, um PCR-Primer für
eine Vielzahl von Anwendungen herzustellen, einschließlich Isolationsverfahren
zum Klonieren von Nukleinsäuren,
die in der Lage sind, an solche Sequenzen zu hybridisieren, diagnostische
Verfahren und forensische Verfahren. Die PCR-Primer sind wenigstens
10 Basen lang und vorzugsweise wenigstens 12, 15 oder 17 Basen.
Bevorzugter sind die PCR-Primer 20 bis 30 Basen lang. In einigen Ausführungsformen
können
die PCR-Primer mehr als 30 Basen lang sein. Es ist bevorzugt, dass
die Primerpaare etwa dasselbe G/C-Verhältnis aufweisen, so dass die
Schmelztemperaturen in etwa dieselben sind. Eine Vielzahl von PCR-Methoden
sind den Fachleuten auf dem Gebiet vertraut. Für ein Review von PCR-Methoden,
siehe Molecular Cloning to Genetic Engineering, White Ed. In Methods
in Molecular Biology 67: Humana Press, Totowa 1997. In jedem dieser
PCR-Verfahren werden PCR-Primer auf beiden Seiten der zu amplifizierenden
Nukleinsäuresequenzen
zu einer auf geeignete Weise hergestellten Nukleinsäureprobe
zusammen mit dNTPs und einer thermostabilen Polymerase, wie z.B.
Taq-Polymerase, Pfu-Polymerase oder Vent-Polymerase, dazugegeben.
Die Nukleinsäure
in der Probe wird denaturiert, und die PCR-Primer werden spezifisch
an komplementäre
Nukleinsäuresequenzen
in der Probe hybridisiert. Die hybridisierten Primer werden verlängert. Danach
wird ein weiterer Zyklus aus Denaturierung, Hybridisierung und Verlängerung
gestartet. Die Zyklen werden mehrere Male wiederholt, um ein amplifiziertes
Fragment herzustellen, das die Nukleinsäuresequenz zwischen den Primerorten
enthält.
-
BEISPIEL 45
-
Verwendung von 5'-ESTs als Sonden
-
Sonden,
die von 5'-ESTs
abgeleitet sind (oder cDNAs oder genomischen DNAs, die davon erhältlich sind),
einschließlich
vollständig
langer cDNAs oder genomischer Sequenzen, können detektierbaren Markierungen
markiert werden, die den Fachleuten auf dem Gebiet vertraut sind,
einschließlich
Radioisotopen und nichtradioaktiven Markierungen, um eine detektierbare
Sonde zur Verfügung
zu stellen. Die detektierbare Sonde kann einzelsträngig oder
doppelsträngig
sein und kann unter Verwendung von Methoden hergestellt werden,
die auf dem Gebiet bekannt sind, einschließlich der in vitro-Transkript,
Nick-Translation oder Kinase-Reaktionen. Eine Nukleinsäureprobe,
welche eine Sequenz enthält,
die fähig
ist, an die markierte Sonde zu hybridisieren, wird mit der mar kierten
Sonde in Kontakt gebracht. Wenn die Nukleinsäure in der Probe doppelsträngig ist,
kann sie vor dem in Kontaktbringen mit der Sonde denaturiert werden.
In einigen Anwendungen kann die Nukleinsäureprobe auf einer Oberfläche, wie
z.B. einer Nitrocellulosemembran oder eine Nylonmembran, immobilisiert
werden. Die Nukleinsäureprobe
kann Nukleinsäuren
enthalten, die aus einer Vielzahl von Quellen stammen, einschließlich die
genomischer DNA, cDNA-Bibliotheken, RNA oder Gewebeproben.
-
Methoden,
die für
den Nachweis des Vorhandenseins von Nukleinsäuren, die fähig sind, mit der nachweisbaren
Sonde zu hybridisieren, verwendet werden, schließen wohlbekannte Methoden wie
z.B. Southern Blotting, Northern Blotting, Dot Blotting, Kolonienhybridisierung
und Plaquehybridisierung ein. In einigen Anwendungen kann die Nukleinsäure, die
fähig ist,
mit der markierten Sonde zu hybridisieren, in Vektoren wie z.B.
Expressionsvektoren, Sequenzierungsvektoren oder in vitro-Transkriptionsvektoren
kloniert werden, um die Charakterisierung und die Expression der
hybridisierenden Nukleinsäuren
in der Probe zu erleichtern. Zum Beispiel können derartige Methoden verwendet
werden, um Sequenzen in einer genomischen Bibliothek oder cDNA-Bibliothek
zu isolieren und zu klonieren, die in der Lage sind, mit der nachweisbaren
Sonde zu hybridisieren, wie in Beispiel 30 oben beschrieben.
-
PCR-Primer,
die wie in Beispiel 44 oben beschrieben hergestellt wurden, können in
forensischen Analysen, wie z.B. dem DNA-Fingerprinting, verwendet
werden, wie in den Beispielen 46 bis 50 unten beschrieben wird.
Derartige Analysen können
nachweisbare Sonden oder Primer verwenden, die auf den Sequenzen
der 5'-ESTs oder
cDNAs oder genomischen DNAs, die unter Verwendung der 5'-ESTs isoliert wurden,
basieren.
-
BEISPIEL 46
-
Forensischer Abgleich mittels DNA-Sequenzierung
-
In
einem beispielhaften Verfahren werden DNA-Proben aus forensischen
Proben z.B. des Haars, des Spermas, der Blutes oder der Hautzellen
mittels konventioneller Verfahren isoliert. Eine Reihe von PCR-Primern,
die auf einer Anzahl von 5'-ESTs
aus Beispiel 25 basieren, oder cDNAs oder genomischen DNAs, die daraus
wie oben isoliert wurden, wird anschließend in Übereinstimmung mit Beispiel
44 verwendet, um DNA mit einer Länge
von 100 bis 200 Basen aus den forensischen Proben zu amplifizieren.
Die korrespondierenden Sequenzen werden von einem Testindividuum
erhalten. Jede dieser Identifikations-DNAs wird anschließend unter
Verwendung von Standardverfahren se quenziert und ein einfacher Datenbankvergleich
bestimmt die Unterschiede, sofern vorhanden, zwischen den Sequenzen
aus dem Individuum und denen aus der Probe. Statistisch signifikante
Unterschiede zwischen den DNA-Sequenzen des Verdächtigen und denen aus der Probe beweisen
schlüssig
das Fehlen von Identität.
Dieses Fehlen von Identität
kann z.B. mit oder ohne eine Sequenz bewiesen werden. Identität sollte
andererseits mit einer großen
Anzahl von Sequenzen, die alle passen, nachgewiesen werden. Vorzugsweise
wird ein Minimum von 50 statistisch identischen Sequenzen mit einer Länge von
100 Basen verwendet, um Identität
zwischen dem Verdächtigen
und der Probe zu beweisen.
-
BEISPIEL 47
-
Positive Identifizierung mittels DNA-Sequenzierung
-
Die
in dem vorherigen Beispiel kurz dargestellte Methode kann auch in
größerem Maßstab verwendet werden,
um eine einzigartige Fingerprint-ähnliche Identifizierung irgendeines
Individuums zur Verfügung
zu stellen. In diesem Verfahren werden Primer von einer großen Zahl
von 5'-EST-Sequenzen
aus Beispiel 25 oder cDNA-Sequenzen oder genomischen Sequenzen,
die davon ableitbar sind, hergestellt. Vorzugsweise 20 bis 50 verschiedene
Primer werden verwendet. Diese Primer werden verwendet, um eine
entsprechende Anzahl von PCR-erzeugten DNA-Segmenten von dem Individuum
in Frage in Übereinstimmung
mit Beispiel 44 zu erhalten. Jedes dieser DNA-Segmente wird sequenziert
unter Verwendung des in Beispiel 46 dargestellten Verfahrens. Die
Datenbank der durch dieses Verfahren erzeugten Sequenzen identifiziert
auf einzigartige Weise das Individuum, aus dem die Sequenzen erhalten
wurden. Dieselbe Reihe von Primern kann anschließend verwendet werden zu irgendeinem
späteren
Zeitpunkt, um Gewebeproben oder andere biologische Proben mit diesem
Individuum absolut zueinander in Beziehung zu setzen.
-
BEISPIEL 48
-
Southern Blot forensische Identifizierung
-
Die
Methode gemäß Beispiel
47 wird wiederholt, um eine Reihe von wenigstens 10 amplifizierten
Sequenzen aus einem Individuum und einer Probe zu amplifizieren.
Vorzugsweise enthält
diese Reihe wenigstens 50 amplifizierte Sequenzen. Bevorzugter enthält die Reihe
100 amplifizierte Sequenzen. In einigen Ausführungsformen enthält die Reihe
200 amplifizierte Sequenzen. Diese PCR-erzeugte DNA wird anschließend mit
einer Kombination aus vorzugsweise 4 Basen-spezifischen Restriktionsenzymen
verdaut. Derartige Enzyme sind kommerziell erhältlich und den Fachleuten auf
dem Gebiet bekannt. Nach dem Verdau werden die resultierenden Genfragmente über ihre
Größe in mehreren
Duplikats-Vertiefungen auf einem Agarosegel aufgetrennt und unter
Verwendung von Southern Blot-Methoden, die den Fachleuten auf dem
Gebiet wohlbekannt sind, auf Nitrocellulose transferiert. Für ein Review über das
Southern Blotting siehe Davis et al. (Basic Methods in Molecular
Biology, 1986, Elsevier Press, Seiten 62-65).
-
Eine
Reihe von Sonden, die auf den Sequenzen der 5'-ESTs basieren (oder cDNAs oder genomischen DNAs,
die davon erhältlich
sind) oder Fragmente davon mit wenigstens 10 Basen, werden radioaktiv
oder colorimetrisch unter Verwendung von auf dem Gebiet bekannten
Verfahren markiert, wie z.B. der Nick-Translation, oder dem Endlabeling
und unter Verwendung von auf dem Gebiet bekannten Methoden mit dem
Southern Blot hybridisiert (Davis et al., s.o.). Vorzugsweise umfasst
die Sonde wenigstens 12, 15 oder 17 konsekutive Nukleotide von dem
5'-EST (oder cDNAs
oder genomischen DNAs, die davon erhältlich sind). Bevorzugter umfasst
die Sonde wenigstens 20-30 konsekutive Nukleotide von dem 5'-EST (oder cDNAs
oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen
umfasst die Sonde mehr als 30 Nukleotide von dem 5'-EST (oder cDNAs
oder genomischen DNAs, die davon erhältlich sind).
-
Vorzugsweise
werden wenigstens 5 bis 10 dieser markierten Sonden verwendet und
bevorzugter werden wenigstens 20 oder 30 verwendet, um ein einzigartiges
Muster bereitzustellen. Die resultierenden Banden, die sich aus
der Hybridisierung einer großen
Probe des 5'-ESTs
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) ergibt, wird ein
einzigartiges Identifizierungsmittel sein. Da die Spaltung durch
Restriktionsenzyme für
jedes Individuum anders sein wird, wird auch das Bandenmuster auf
dem Southern Blot einzigartig sein. Eine Erhöhung der Anzahl von Sonden
der 5'-ESTs (oder
cDNAs oder genomischen DNAs, die davon erhältlich sind) wird einen statistisch
höheren
Grad an Vertrauen zu der Identifizierung bereitstellen, da es eine
größere Anzahl
von Bandensets gegen wird, die für
die Identifizierung verwendet werden.
-
BEISPIEL 49
-
Methode zur Dot Blot-Identifizierung
-
Eine
andere Methode zum Identifizieren von Individuen unter Verwendung
der 5'-EST-Sequenzen, die hierin
offenbart sind, verwendet ein Dot Blot-Hybridisierungsverfahren.
Genomische DNA wird aus zu identifizierenden Nuklei isoliert. Oligonukleotidsonden
mit etwa 30 Basenpaaren Länge
werden synthetisiert, die wenigstens 10, vorzugsweise 50 Sequenzen
von den 5'-ESTs
oder cDNAs oder genomischen DNAs, die davon erhältlich sind, entsprechen. Die
Sonden werden verwendet, um sie mit der genomischen DNA mittels
Bedingungen, die den Fachleuten auf dem Gebiet bekannt sind, zu
hybridisieren. Die Oligonukleotide werden mit 32P
unter Verwendung von Polynukleotidkinase (Pharmacia) am Ende markiert.
Dot Blots werden durch Aufbringen der genomischen DNA auf Nitrocellulose
oder dergleichen unter Verwendung eines Vakuum Dot Blot-Gerätes (Bio-Rad, Richmond Kalifornien)
erzeugt. Der Nitrocellulosefilter, der die genomischen Sequenzen
enthält,
wird gebacken oder mit dem Filter durch UV verbunden, prähybridisiert
und mit der markierten Sonde unter Verwendung von auf dem Gebiet
bekannten Methoden hybridisiert (Davis et al., s.o.). Die mit 32P markierten DNA-Fragmente werden der Reihe
nach mit zunehmenden stringenten Bedingungen hybridisiert, um minimale
Unterschiede zwischen der 30 bp-Sequenz und der DNA zu detektieren.
Tetramethylammoniumchlorid ist nützlich
zum Identifizieren von Klonen, die eine geringe Anzahl an Nukleotid-Fehlpaarungen
enthalten (Wood et al., Proc. Natl. Acad. Sci. USA 82(6):1585-1588,
1985). Ein einzigartiges Muster an Dots unterscheidet ein Individuum
von einem anderen Individuum.
-
5'-EST-Sequenzen (oder
cDNAs oder genomischen DNAs, die davon erhältlich sind) oder Oligonukleotide,
die wenigstens 10 konsekutive Basen aus diesen Sequenzen aufweisen,
können
als Sonden in der folgenden alternativen Fingerprinting-Methode
verwendet werden. Vorzugsweise umfasst die Sonde wenigstens 12,
15 oder 17 konsekutive Nukleotide aus den 5'-EST-Sequenzen (oder cDNAs oder genomischen
DNAs, die davon erhältlich
sind). Bevorzugter umfasst die Sonde wenigstens 20 bis 30 konsekutive
Nukleotide von den 5'-EST-Sequenzen
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen
umfasst die Sonde mehr als 30 Nukleotide aus den 5'-EST-Sequenzen (oder
cDNAs oder genomischen DNAs, die davon erhältlich sind).
-
Vorzugsweise
wird eine Mehrzahl von Sonden, die Sequenzen von verschiedenen Genen
haben, in dem alternativen Fingerprinting-Verfahren verwendet. Beispiel
50 unten stellt ein repräsentatives
alternatives Fingerprinting-Verfahren zur Verfügung, in dem die Sonden von
dem 5'-EST abgeleitet
sind.
-
BEISPIEL 50
-
Alternative "Fingerprint"-Identifizierungsmethode
-
20-mer
Oligonukleotide werden von einer großen Anzahl, z.B. 50, 100 oder
200 5'-ESTs unter
Verwendung von kommerziell erhältlichen
Oligonukleotid-Serviceeinrichtungen, wie z.B. Genset, Paris, Frankreich, hergestellt.
Zellproben aus dem Testindividuum werden für die DNA aufbereitet, unter
Verwendung von Verfahren, die den Fachleuten auf dem Gebiet wohlbekannt
sind. Die Nukleinsäure
wird mit Restriktionsenzymen, wie z.B. EcoRI und XbaI verdaut. Nach
dem Verdau werden die Proben für
die Elektrophorese in Vertiefungen gegeben. Das Verfahren, das auf
dem Gebiet bekannt ist, kann modifiziert werden, um es mit der Polyacrylamid-Elektrophorese
in Einklang zu bringen. In diesem Beispiel jedoch werden Proben,
die 5 μg
DNA enthalten, in Vertiefungen gegeben und auf ein 0,8% Agarosegel
aufgetrennt. Die Gele werden auf Nitrocellulose übertragen unter Verwendung
von Southern Blotting Standardmethoden.
-
10 μg eines jeden
Oligonukleotids werden gepoolt und mit 32P
endmarkiert. Die Nitrocellulose wird mit Blockierungslösung prähybridisiert
und mit den markierten Sonden hybridisiert.
-
Nach
der Hybridisierung und dem Waschen wird der Nitrocellulosefilter
mit einem X-Omat
AR Röntgenfilm
exponiert. Das resultierende Hybridisierungsmuster wird für jedes
Individuum einzigartig sein.
-
Es
wird außerdem
in diesem Beispiel in Erwägung
gezogen, dass die Anzahl von verwendeten Sondensequenzen für eine zusätzliche
Akkuratesse oder Klarheit variiert werden kann.
-
Die
durch die verlängerten
cDNAs kodierten Proteine können
außerdem
verwendet werden, um Antikörper
zu erzeugen, wie in den Beispielen 30 und 43 erläutert wurde, um die Gewebeart
oder die Zellarten zu identifizieren, aus denen eine Probe stammt,
wie in Beispiel 51 beschrieben.
-
BEISPIEL 51
-
Identifizierung von Gewebsarten oder Zellarten
mittels markierter, gewebsspezifischer Antikörper
-
Die
Identifizierung eines spezifischen Gewebes wird durch die Visualisierung
gewebsspezifischer Antigene mit Hilfe von Antikörperherstellungen in Übereinstimmung
mit den Beispielen 30 und 43, die direkt oder indirekt mit einem
nachweisbaren Marker konjugiert sind, erreicht. Ausgewählte markierte
Antikörperspezies binden
an ihren spezifischen Antigen-Bindungspartner in Gewebeschnitten,
Zellsuspensionen oder in Extrakten löslicher Proteine aus einer
Gewebeprobe, um ein Muster für
die qualitative oder semiqualitative Interpretation zur Verfügung zu
stellen.
-
Antisera
für diese
Verfahren müssen
eine Potenz aufweisen, die über
der der nativen Präparation
liegt, und aus diesem Grund werden Antikörper auf eine Milligramm/ml-Konzentration durch
Isolation der Gammaglobulinfraktion, z.B. mittels Ionenaustauschchromatographie
oder mittels Ammoniumsulfaffraktionierung konzentriert. Außerdem müssen, um
die spezifischsten Antiseren herzustellen, ungewollte Antikörper, z.B.
gegen gewöhnliche
Proteine, aus der Gammaglobulinfraktion entfernt werden, z.B. mittels
unlöslicher
Immunabsorptionsmittel, bevor die Antikörper mit dem Marker markiert
werden. Sowohl monoklonales als auch heterologes Antiserum ist für beide
Verfahren geeignet.
-
A. Immunhistochemische Methoden
-
Gereinigte
Antikörper
mit hohem Titer, die wie oben beschrieben hergestellt wurden, werden
mit einem detektierbaren Marker wie beschrieben, z.B. von Fudenberg,
Kap. 26 in: Basic and Clinical Immunology, 3. Ed. Lange, Los Altos,
Kalifornien, 1980 oder Rose et al., Kap. 12 in: Methods in Immunodiagnosis,
2 Ed. John Wiley and Sons, New York (1980), konjugiert.
-
Ein
fluoreszenter Marker, entweder Fluorescein oder Rhodamin, wird bevorzugt,
jedoch können
die Antikörper
auch mit einem Enzym markiert werden, das eine farbproduzierende
Reaktion mit einem Substrat unterstützt, wie z.B. Meerrettich-Peroxidase.
Marker können
in einem zweiten Schritt an den Gewebegebundenen Antikörper angefügt werden,
wie unten beschrieben wird. Alternativ können die spezifischen Antigewebe-Antikörper mit
Ferritin oder anderen elektronendichten Partikeln markiert werden,
und die Lokalisierung des an Ferritin gekoppelten Antigen-Antikörper-Komplexes
wird mittels eines Elektronenmikroskops erreicht. In noch einem
anderen Ansatz werden die Antikörper
radioaktiv markiert, z.B. mit 1251, und durch Überlagern der mit dem Antikörper behandelten
Herstellung mit fotografischer Emulsion.
-
Herstellungen
zur Ausführung
der Verfahren können
monoklonale oder polyklonale Antikörper gegen ein einziges Protein
oder Peptid umfassen, das als spezifisch für einen Gewebetyp identifiziert
wurde, z.B. Hirngewebe, oder Antikörperherstellung gegen mehrere
antigenisch unterschiedliche gewebsspezifische Antigene können in
Reihen verwendet werden, unabhängig
oder in Mischungen, wie dies benötigt
wird.
-
Gewebsschnitte
und Zellsuspensionen werden für
die immunhistochemische Untersuchung in Übereinstimmung mit üblichen
histologischen Methoden hergestellt. Mehrfache Cryostatschnitte
(etwa 4 μm,
nicht fixiert) des unbekannten Gewebes und einer bekannten Kontrolle
werden auf Objektträger
aufgebracht, und jeder Objektträger
wird mit verschiedenen Lösungen
der Antikörperherstellung
beschichtet. Schnitte bekannter und unbekannter Gewebe sollten ebenfalls
mit den Herstellungen behandelt werden, um eine positive Kontrolle
zur Verfügung
zu stellen, eine negative Kontrolle, z.B. Präimmunsera und eine Kontrolle
für nichtspezifische Färbung, z.B.
Puffer.
-
Behandelte
Schnitte werden in einer feuchten Kammer für 30 Minuten bei Raumtemperatur
inkubiert, gespült,
anschließend
in Puffer für
30-45 Minuten gewaschen. Überschüssige Flüssigkeit
wird aufgesogen und der Marker entwickelt.
-
Wenn
der gewebsspezifische Antikörper
in der ersten Inkubation nicht markiert war, kann es in einer zweiten
Antikörper-Antikörper-Reaktion
markiert werden, z.B. durch Zugabe von Fluorescein- oder Enzym-konjugiertem
Antikörper
gegen die Immunglobulinklasse der Antiserum-produzierenden Spezies,
z.B. ein mit Fluorescein markierter Antikörper gegen Maus IgG. Derartig
markierte Seren sind kommerziell erhältlich.
-
Das
in den Geweben durch das obige Verfahren nachgewiesene Antigen kann
quantifiziert werden, indem die Intensität der Farbe oder der Fluoreszenz
auf dem Gewebeschnitt gemessen wird und das Signal unter Verwendung
von geeigneten Standards kalibriert wird.
-
B. Identifizierung von gewebsspezifischen
löslichen
Proteinen
-
Die
Visualisierung von gewebsspezifischen Proteinen und die Identifizierung
von unbekannten Geweben aus diesem Verfahren wird ausgeführt, indem
die Reagenzien mit markiertem Antikörper und einer Nachweisstrategie
wie für
die Immunhistochemie beschrieben verwendet werden; jedoch wird die
Probe in Übereinstimmung
mit einer E lektrophoresetechnik hergestellt, um die aus dem Gewebe
extrahierten Proteine in einer geordneten Anordnung auf Basis des
Molekulargewichtes für
die Detektion zu verteilen.
-
Eine
Gewebeprobe wird unter Verwendung eines Virtis-Apparates homogenisiert;
Zellsuspensionen werden durch Dounce-Homogenisierung oder osmotische
Lyse aufgeschlossen, unter Verwendung von Detergenzien im jeweiligen
Fall, wie sie benötigt
werden, um die Zellmembranen zu zerstören, wie es auf dem Gebiet
Praxis ist.
-
Unlösliche Zellkomponenten
wie z.B. Nuklei, Mikrosomen und Membranfragmente werden durch Ultrazentrifugation
entfernt und die das lösliche
Protein enthaltende Fraktion wird, falls erforderlich, konzentriert und
für die
Analyse aufbewahrt.
-
Eine
Probe der Lösung
mit dem löslichen
Protein wird mittels konventioneller SDS-Polyacrylamid-Elektrophorese, wie z.B.
von Davis et al., Abschnitt 19-2 in: Basic Methods in Molecular
Biology, Leder Ed., Elsevier, New York, 1986 beschrieben, in einzelne
Proteinspezies aufgetrennt, unter Verwendung einer Auswahl von Polyacrylamidmengen
in einem Set von Gelen, um den gesamten Bereich des Molekulargewichtes
der Proteine, die in der Probe nachgewiesen werden sollen, aufzutrennen.
Ein Größenmarker
wird parallel laufen gelassen, zum Zwecke der Abschätzung der
Molekulargewichte der einzelnen Proteine. Eine praktische Probengröße für die Analyse
ist ein Volumen zwischen 5 und 55 μl und einem Gehalt von etwa
1 bis 100 μg Protein.
Ein Aliquot eines jeden der aufgetrennten Proteine wird durch Blotten
auf ein Nitrocellulosefilterpapier transferiert, ein Prozess, der
das Muster der Auftrennung beibehält. Mehrere Kopien werden hergestellt.
Das Verfahren, das als Western Blot-Analyse ist gut in Davis L.
et al., s.o., Abschnitt 19-3, beschrieben. Ein Set Nitrocelluloseblots
wird mit Coomassieblau-Farbstoff gefärbt, um das gesamte Set an
Proteinen zum Vergleich mit den Antikörpergebundenen Proteinen zu
visualisieren. Die verbleibenden Nitrocellulosefilter werden anschließend mit
einer Lösung
aus einem oder mehreren spezifischen Antiseren gegen gewebsspezifische
Proteine, die wie in den Beispielen 30 und 43 hergestellt wurden,
inkubiert. In diesem Verfahren werden, wie in dem Verfahren A oben,
geeignete positive und negative Proben und Kontrollreagenzien laufengelassen.
-
In
jedem der Verfahren A oder B kann ein nachweisbarer Marker an den
primären
Gewebeantigen-primären
Antikörper-Komplex
in Übereinstimmung
mit verschiedenen Strategien und Abwandlungen davon angefügt werden.
In einem direkten Ansatz kann der primäre spezifische Antikörper markiert
werden; alternativ kann der unmarkierte Komplex durch einen markierten
sekundären
Anti-IgG-Antikörper
gebunden werden. In ande ren Ansätzen
wird entweder der primäre
oder sekundäre
Antikörper
mit einem Biotinmolekül
konjugiert, das in einem anschließenden Schritt Avidin-konjugierten
Marker bindet. In Übereinstimmung
mit noch einer anderen Strategie wird ein markiertes Enzym oder
radioaktives Protein A, das die Eigenschaft hat, an irgendein IgG
zu binden, in einem letzten Schritt entweder an den primären oder
sekundären
Antikörper
gebunden.
-
Die
Visualisierung der gewebsspezifischen Antigenbindung in Konzentrationen,
die über
den in den Kontrollgeweben beobachteten liegen, haben ein oder mehrere
gewebsspezifische Antikörper,
die aus den Gensequenzen hergestellt wurde, die in den verlängerten
cDNA-Sequenzen identifizierten wurden, kann Gewebe mit unbekannter
Herkunft identifizieren, z.B. forensische Proben oder differenziertes
Tumorgewebe, das an andere Körperstellen
metastasiert ist.
-
Zusätzlich zu
ihren Anwendungen in der Forensik und zur Identifizierung können die
5'-ESTs (oder cDNAs
oder genomischen DNAs, die davon erhältlich sind) chromosomal kartiert
werden. Beispiel 52 unten beschreibt eine Radiation Hybrid (RH)-Kartierung
von humanen chromosomalen Regionen unter Verwendung von 5'-ESTs. Beispiel 53
unten beschreibt ein repräsentatives
Verfahren zur Kartierung eines 5'-ESTs
an dessen Lokalisierung auf einem humanen Chromosom. Beispiel 54
unten beschreibt die Kartierung 5'-ESTs auf Metaphasechromosomen durch
Fluoreszenz-In Situ-Hybridisierung (FISH). Die Fachleute auf dem
Gebiet werden verstehen, dass das Verfahren gemäß der Beispiele 52 bis 54 außerdem verwendet
werden kann, um cDNAs oder genomische DNAs, die von den 5'-ESTs erhältlich sind,
an deren chromosomalen Orten zu kartieren.
-
2. Verwendung von 5'-ESTs oder Sequenzen, die davon erhältlich sind
oder Teilen davon bei der Chromosomenkartierung
-
BEISPIEL 52
-
Radiation Hybrid-Kartierung von 5'-ESTs in humanem
Genom
-
Radiation
Hybrid (RH)-Kartierung ist ein somatischer zellgenetischer Ansatz,
der verwendet werden kann zur hoch auflösenden Kartierung des humanen
Genoms. In dieser Methode werden Zelllinien, die ein oder mehrere
humane Chromosomen enthalten, letal bestrahlt, wodurch jedes Chromosom
in Fragmente zerbrochen wird, dessen Größe von der Bestrahlungsdosis
abhängig
ist. Diese Fragmente werden durch Fusion mit kultivierten Nagerzellen
geborgen, was Subklone erzeugt, die verschiedene Teile des humanen Genoms enthalten.
Diese Methode ist durch Benham et al., Genomics 4:509-517, 1989;
und Cox et al., Science 250:245-250, 1990, beschrieben worden. Die
zufällige
und unabhängige
Eigenschaft der Subklone erlaubt eine effiziente Kartierung von
jedem Marker des humanen Genoms. Humane DNA, die aus einer Reihe
von 80 bis 100 Zelllinien isoliert wurde, stellt ein Kartierungsreagenz
zum Ordnen von 5'-ESTs
zur Verfügung.
In diesem Ansatz wird die Frequenz der Brüche zwischen den Markern verwendet,
um die Distanz zu messen, was die Aufstellung von hoch auflösenden Karten
erlaubt, wie sie unter Verwendung herkömmlicher ESTs durchgeführt wurde
(Schuler et al., Science 274:540-546, 1996).
-
RH-Kartierung
wurde verwendet, um eine hoch auflösende Radiation Hybrid-Kartierung
des gesamten Genoms für
das humane Chromosom 17q22-q25.3 über die Gene für das Wachstumshormon
(Growth hormone, GH) und die Thymidinkinase (TK) hinaus zu erzeugen
(Foster et al., Genomics 33:185-192, 1996), für die Region, die das Gen für das Gorlinsyndrom
umgibt (Obermayr et al., Eur. J. Hum. Genet. 4:242-245, 1996) für 60 Loci,
die den gesamten kurzen Arm von Chromosom 12 bedecken (Raeymaekers
et al., Genomics 29:170-178, 1995), für die Region des humanen Chromosoms
22, die den Locus für
Neurofibromatosis Typ 2 enthält
(Frazer et al., Genomics 14:574-584, 1992) und für 13 Loci auf dem langen Arm
für Chromosom
5 (Warrington et al., Genomics 11:701-708, 1991).
-
BEISPIEL 53
-
Kartierung der 5'-ESTs auf humane Chromosomen unter Verwendung
von PCR-Methoden
-
5'-ESTs (oder cDNAs
oder genomischen DNAs, die davon erhältlich sind) können unter
Verwendung von PCR-basierten Methoden den humanen Chromosomen zugeordnet
werden. In derartigen Methoden werden Oligonukleotid-Primerpaare
von den 5'-ESTs
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) konstruiert, um
die Wahrscheinlichkeit, durch ein Intron zu amplifizieren, zu minimieren.
Vorzugsweise haben die Oligonukleotidprimer eine Länge von
18-23 Basenpaaren und sind für
die PCR-Amplifikation
entworfen. Die Erzeugung von PCR-Primern aus bekannten Sequenzen
ist den Fachleuten auf dem Gebiet wohlbekannt. Für ein Review über PCR-Methoden
siehe Erlich in PCR Technology, Principles and Applications for DNA
Amplification, Freeman and Co., New York, 1992.
-
Die
Primer werden in Polymerasekettenreaktion (PCR) verwendet, um Templates
aus der gesamten genomischen DNA zu amplifizieren. Die PCR-Bedingungen
sind die Folgenden: 60 ng genomische DNA wird als Template für die PCR
verwendet, mit 80 ng von jedem Oligonukleotidprimer, 0,6 Einheiten
der Taq-Polymerase und 1 μCu
eines mit 32P Deoxycytidintriphosphates.
Die PCR wird in einem Mikroplatten-Thermocycler (rechne) unter den folgenden
Bedingungen durchgeführt:
30 Zyklen mit 94°C,
1,4 Minuten; 55°C,
2 Minuten; und 72°C,
2 Minuten; mit einer Endverlängerung
bei 72°C
für 10
Minuten. Die amplifizierten Produkte werden auf einem 6% Polyacrylamid-Sequenzierungsgel
und durch Autoradiografie visualisiert. Wenn die Länge des PCR-Produktes
mit der Entfernung zwischen den Enden der Primersequenzen in der
verlängerten
cDNA, von der die Primer abgeleitet wurden, übereinstimmt, wird die PCR-Reaktion mit DNA-Templates
aus zwei Reihen von Human-Nager-somatischen Zellhybriden, BIOS PCRable
DNA (BIOS Corporation) und NIGMS Human Rodent Somatic Cell Hybrid
Mapping Panel Number 1 (NIGMS, Camden, NJ) wiederholt.
-
Die
PCR wird verwendet, um eine Reihe somatischer Zellhybridzelllinien
zu untersuchen, die definierte Sets von humanen Chromosomen enthalten,
auf das Vorhandensein eines bestimmten 5'-EST (oder cDNAs oder genomischen DNAs,
die davon erhältlich
sind). Die DNA wird aus den somatischen Hybriden isoliert und als
Start-Templates für
PCR-Reaktionen unter Verwendung der Primerpaare von dem 5'-EST (oder der cDNA oder
genomischen DNA, die davon erhältlich
sind), verwendet. Nur solche somatischen Zellhybride mit Chromosomen,
die das humane Gen enthalten, das den 5'-EST (oder der cDNA oder genomischen
DNA, die davon erhältlich
ist) entspricht, werden ein amplifiziertes Fragment ergeben. Der
5'-EST (oder die
cDNA oder genomische DNA, die davon erhältlich sind) wird einem Chromosom
zugeordnet durch Analyse des Segregationsmusters der PCR-Produkte
aus den DNA-Templates der somatischen Hybride. Das einzige humane
Chromosom, das in sämtlichen
Zellhybriden vorhanden ist, die ein amplifiziertes Fragment ergeben,
ist das Chromosom, das den 5'-EST
(oder die cDNA oder genomische DNA, die davon erhältlich sind)
enthält.
Für ein
Review über
Methoden und die Analyse von Ergebnissen aus somatischen Zellgen-Kartierungsexperimenten,
siehe Ledbetter et al., Genomics 6:475-481, 1990.
-
BEISPIEL 54
-
Kartierung von verlängerten 5'-ESTs auf Chromosomen unter Verwendung
der Fluoreszenz-In Situ-Hybridisierung
-
Fluoreszenz-In
Situ-Hybridisierung erlaubt es, den 5'-EST (oder die cDNA oder genomischen
DNA, die davon erhältlich
ist) auf einen bestimmten Bereich auf einem bestimmten Chromosom
zu kartieren. Die für
die Fluoreszenz-In Situ Hybridisierungsmethoden zu verwendenden
Chromosomen können
aus einer Vielzahl von Quellen verwendet werden, einschließlich Zellkulturen,
Gewebe oder Gesamtblut.
-
In
einer bevorzugten Ausführungsform
wird die chromosomale Lokalisierung eines 5'-EST
(oder einer cDNA oder genomischen DNA, die davon erhältlich sind)
mittels FISH wie von Cherif et al., (Proc. Natl. Acad. Sci. USA,
87:6639-6643, 1990) erhalten. Metaphasechromosomen werden von mit
Phytohemagglutinin (PHA) stimulierten Blutzellspendern hergestellt.
PHA-stimulierte Lymphozyten von gesunden männlichen Spendern werden 72
Stunden in RPMI-1640-Medium kultiviert. Für die Synchronisierung wird
Methotrexat (10 μM)
für 17 Stunden
dazugegeben, gefolgt von einer Zugabe von 5-Bromodexoyuridin (5-BrdU, 0,1 mM) für 6 Stunden. Colcemid
(1 μg/ml)
wird für
die letzten 15 Minuten dazugegeben, bevor die Zellen geerntet werden.
Die Zellen werden gesammelt, in RPMI gewaschen, mit einer hypotonen
Lösung
aus KCl (75 mM) bei 37°C
für 15
Minuten inkubiert und in drei Wechseln von Methanol:Essigsäure (3:1)
fixiert. Die Zellsuspension wird auf einen Glasobjektträger aufgeträufelt und
an der Luft getrocknet. Der 5'-EST
(oder die cDNA oder genomischen DNA, die davon erhältlich ist)
wird mit Biotin-16 dUTP mittels Nick-Translation in Übereinstimmung
mit den Angaben des Herstellers (Bethesda Research Laborstories,
Bethesda, MD) markiert, unter Verwendung einer Sephadex G-50-Säule (Pharmacia,
Uppsala, Schweden) gereinigt und präzipitiert. Kurz vor der Hybridisierung
wird das DNA-Pellet in Hybridisierungspuffer (50% Formamid, 2 X
SSC, 10% Dextransulfat, 1 mg/ml beschallte Lachssperma DNA, pH 7)
aufgelöst,
und die Probe wird bei 70°C
für 5-10
Minuten denaturiert.
-
Objektträger, die
bei –20°C gelagert
wurden, werden für
1 Stunde bei 37°C
mit RNase A (100 μg/ml) behandelt,
dreimal in 2 X SSC gespült
und in Ethanolreihen dehydriert. Chromosomenherstellungen werden in
70% Formamid, 2 X SSC für
2 Minuten bei 70°C
denaturiert, anschließend
bei 4°C
dehydriert. Die Objektträger
werden mit Proteinase K (1 μg/100
ml in 20 mM Tris-HCl, 2 mM CaCl2) bei 37°C für 8 Minuten
behandelt und dehydriert. Die Hybridisierungsmischung, welche die
Sonde enthält,
wird auf den Objektträger
gegeben, mit einem der Gläschen
bedeckt, mit Gummiklebstoff versiegelt und über Nacht in einer feuchten
Kammer bei 37°C
inkubiert. Nach der Hybridisierung und nach den anschließenden Waschschritten
wird die biotinylierte Sonde durch Avidin-FITC detektiert und mit
zusätzlichen
Schichten von biotinyliertem Ziege Anti-Avidin und Avidin- FITC amplifiziert.
Für die
chromosomale Lokalisierung werden fluoreszente R-Banden wie zuvor
beschrieben (Cherif et al., s.o.) erhalten. Die Objektträger werden
unter einem LEICA Fluoreszenzmikroskop (DMRXA) betrachtet. Die Chromosomen
werden mit Propidiumiodid gegengefärbt, und das Fluoreszenzsignal der
Sonde erscheint als zwei symmetrische gelbgrüne Punkte auf beiden Chromatiden
des fluoreszenten R-Banden-Chromosoms
(rot). Folglich kann ein bestimmter 5'-EST (oder eine cDNA oder genomische
DNA, die davon erhältlich
ist) auf einer bestimmten zytogenen R-Bande auf einem bestimmten
Chromosom lokalisiert werden.
-
Sobald
die 5'-ESTs (oder
die cDNA oder genomische DNA, die davon erhältlich sind) bestimmten Chromosomen
unter Verwendung der in den Beispielen 52-54 oben beschriebenen
Methoden zugeordnet wurden, können
sie verwendet werden, um eine hoch auflösende Karte der Chromosomen,
auf denen sie lokalisiert sind, herzustellen, oder um die Chromosomen
in einer Probe zu identifizieren.
-
BEISPIEL 55
-
Verwendung des 5'-EST, um Chromosomenkarten zu erstellen
oder zu erweitern
-
Die
Chromosomenkartierung beinhaltet das Zuordnen einer bestimmten einzigartigen
Sequenz zu einem bestimmten Chromosom wie oben beschrieben. Sobald
die einzigartige Sequenz einem bestimmten Chromosom zugeordnet wurde,
wird es relativ zu anderen einzigartigen Sequenzen auf demselben
Chromosom geordnet. Ein Ansatz zur Chromosomenkartierung verwendet
eine Reihe von künstlichen
Hefechromosomen (yeast artificial chromosomes, YACs), die mehrere
Tausend lange Inserts enthalten, die von den Chromosomen der Organismen
abgeleitet sind, von dem die verlängerten cDNAs (oder genomischen
DNAs, die davon erhältlich
sind) erhalten wurden. Diese Methode wird in Nagaraja et al., Genome
Research 7:210-222, 1997, beschrieben. Kurz beschrieben wird in
dieser Methode jedes Chromosom in überlappende Stücke zerbrochen, die
in den YAC-Vektor insertiert werden. Die YAC-Inserts werden unter
Verwendung von PCR oder anderen Verfahren untersucht, um zu bestimmen,
ob sie den 5'-EST
(oder die cDNA oder genomische DNA, die davon erhältlich ist),
dessen Position bestimmt werden soll, enthalten. Sobald ein Insert
gefunden wurde, das den 5'-EST
(oder die cDNA oder genomische DNA, die davon erhältlich ist)
enthält,
kann das Insert durch PCR oder andere Verfahren analysiert werden,
um zu bestimmen, ob das Insert auch andere Sequenzen enthält, von denen
bekannt ist, dass sie sich auf dem Chromosom oder in der Region
befinden, von der der 5'-EST
(oder die cDNA oder genomische DNA, die davon erhältlich ist)
stammte. Dieses Verfahren kann für
jedes Insert in der YAC-Bibliothek
wiederholt werden, um die Lokalisierung von jeder der verlängerten
cDNAs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind)
relativ zueinander und zu den anderen bekannten chromosomalen Markern
zu bestimmen. Auf diese Weise kann eine hoch auflösende Karte
der Verteilung zahlreicher einzigartiger Marker in jedem der Chromosomen
der Organismen erhalten werden.
-
Wie
in Beispiel 56 unten beschrieben wird, können verlängerte cDNAs (oder cDNAs oder
genomischen DNAs, die davon erhältlich
sind) auch verwendet werden, um Gene zu identifizieren, die mit
einem bestimmten Phenotyp in Zusammenhang stehen, wie z.B. einer
Erbkrankheit oder einer Arzneimittelantwort.
-
3. Verwendung von 5'-ESTs oder davon erhaltenen Sequenzen
oder Fragmenten davon bei der Genidentifizierung
-
BEISPIEL 56
-
Identifizierung von Genen, die mit Erbkrankheiten
oder Arzneimittelantwort in Zusammenhang stehen
-
Dieses
Beispiel veranschaulicht eine Methode, die nützlich ist für die Assoziation
von 5'-ESTs (oder cDNA oder
genomischer DNA, die davon erhältlich
ist) mit bestimmten phenotypischen Eigenschaften. In diesem Beispiel
wird ein bestimmter 5'-EST
(oder eine cDNA oder genomische DNA, die davon erhältlich ist)
als eine Testprobe verwendet, um diesen 5'-EST (oder die cDNA oder genomische
DNA, die davon erhältlich
ist) mit einer bestimmten phenotypischen Eigenschaft.
-
5'-ESTs (oder davon
erhältliche
cDNAs oder genomischen DNAs) werden auf eine bestimmte Lokalisierung
auf einem humanen Chromosom unter Verwendung von Methoden wie den
in Beispiel 52 und 53 beschriebenen oder anderen auf dem Gebiet
bekannten Methoden kartiert. Eine Recherche des Mendelian Inheritance
in Man (McKusick in Mendelian Inheritance in Man (erhältlich online über die
Johns Hopkins University Welch Medical Library) lässt erkennen,
dass die Region auf dem humanen Chromosom, die den 5'-EST enthält (oder
die cDNA oder genomische DNA, die davon erhältlich ist) eine sehr genreiche
Region ist, die mehrere bekannte Gene und mehrere Krankheiten oder
Phenotypen, für
die Gene noch nicht identifiziert wurden, enthält. Das zu diesem 5'-EST (oder der cDNA
oder genomischen DNA, die davon erhältlich ist) korrespondierende Gen
wird folglich zu einem unmittelbaren Kandidaten für jede dieser
genetischen Erkrankungen.
-
Zellen
aus Patienten mit diesen Erkrankungen oder Phenotypen werden isoliert
und in Kultur expandiert. PCR-Primern von dem 5'-EST (oder der cDNA oder genomischen
DNA, die davon erhältlich
ist) werden verwendet, um genomische DNA, mRNA oder cDNA zu untersuchen,
die von den Patienten erhalten wurde. 5'-ESTs (oder cDNA oder genomische DNA,
die davon erhältlich
ist), die in dem Patienten nicht amplifiziert sind, können positiv
mit einer bestimmten Krankheit assoziiert werden, indem eine weitere
Analyse durchgeführt
wird. Alternativ kann die PCR-Analyse Fragmente verschiedener Längen erzeugen,
wenn die Proben von einem Individuum stammen, das den mit der Krankheit
assoziierten Phenotyp aufweist, im Vergleich zu einer Probe, die
von einem gesunden Individuum stammt, was anzeigt, dass das den
5'-EST enthaltende
Gen für die
genetische Erkrankung verantwortlich sein kann.
-
VI. Verwendung des 5'-EST (oder der cDNA oder genomischen
DNA, die davon erhältlich
ist), um Vektoren zu konstruieren
-
Die
vorliegenden 5'-ESTs
(oder cDNA oder genomische DNA, die davon erhältlich ist) kann außerdem verwendet
werden, um Sekretionsvektoren zu konstruieren, die in der Lage sind,
die Sekretion der durch die darin kodierten Proteine zu steuern.
Derartige Sekretionsvektoren können
die Reinigung oder die Anreicherung der durch die daran insertierten
Gene kodierten Proteine erleichtern, indem die Anzahl der Hintergrundproteine,
aus denen das gewünschte
Protein gereinigt werden oder angereichert werden muss, reduziert
wird. Beispielhafte Sekretionsvektoren sind in Beispiel 57 unten
beschrieben.
-
1. Konstruktion von Sekretionsvektoren
-
BEISPIEL 57
-
Konstruktion von Sekretionsvektoren
-
Die
Sekretionsvektoren enthalten eine Promotor, der in der Lage ist,
die Genexpression in der Wirtszelle, dem Gewebe oder dem Organismus
von Interesse zu steuern. Derartige Promotoren schließen den Rous
Sarkom Virus-Promotor ein, den SV 40-Promotor, den humanen Cytomegalovirus-Promotor
sowie andere Promotoren, die den Fachleuten auf dem Gebiet vertraut
sind.
-
Eine
Signalsequenz von einem 5'-EST
(oder cDNAs oder genomischen DNAs, die davon erhältlich sind) wird funktionell
mit dem Promotor verbunden, so dass die von dem Promotor transkribierte
mRNA die Translation des Signalpeptids steuern wird. Die Wirtszelle,
das Gewebe oder der Organismus kann irgendeine Zelle, ein Gewebe
oder Organismus sein, der das Signalpeptid, das durch die Signalsequenz
in dem 5'-EST (oder
der cDNA oder genomischen DNA, die davon erhältlich ist) kodiert, erkennt.
Geeignete Wirte schließen Säugerzellen,
-gewebe oder -organismen, Zellen, Gewebe oder Organismen von Vögeln, Insektenzellen,
-gewebe oder -organismen oder Hefe ein.
-
Darüber hinaus
enthält
der Sekretionsvektor Klonierungsstellen, um Gene zu insertieren,
die für
die zu sezernierenden Proteine kodieren. Die Klonierungsstellen
erleichtern das Klonieren des insertierten Gens im Leserahmen mit
der Signalsequenz, so dass ein Fusionsprotein von der von dem Promotor
transkribierten mRNA exprimiert wird, in dem das Signalpeptid mit
dem durch das insertierte Gen kodierten Protein fusioniert ist.
-
Der
Sekretionsvektor kann DNA oder RNA sein und kann in das Chromosom
des Wirtes integrieren, stabil als extrachromosolames Replicon in
dem Wirt aufrechterhalten werden, ein künstliches Chromosom sein oder
transient in dem Wirt vorhanden sein. Viele Nukleinsäure-Backbones,
die für
die Verwendung als Sekretionsvektoren geeignet sind, sind den Fachleuten
auf dem Gebiet bekannt, einschließlich retroviraler Vektoren, SV
40-Vektoren, bovines Papillomvirus-Vektoren, Hefe-integrierende
Plasmide, Hefe-episomale
Plasmide, Hefe-künstliche
Chromosomen, humane künstliche
Chromosomen, P-Element-Vektoren, Baculovirus-Vektoren oder bakterielle
Plasmide, die fähig
sind, transient in den Wirt eingeführt zu werden.
-
Der
Sekretionsvektor kann außerdem
ein PolyA-Signal enthalten, so dass das PolyA-Signal stromabwärts von dem insertierten Gen
in dem Sekretionsvektor lokalisiert ist.
-
Nachdem
das Gen, das für
das Protein kodiert, für
das eine Sekretion erwünscht
wird, in den Sekretionsvektor insertiert wurde, wird der Sekretionsvektor
in die Wirtszelle, das Gewebe oder den Organismus unter Verwendung
der Calciumphosphatpräzipitation,
DEAE-Dextran, Elektroporation, Liposomen-vermittelten Transfektion,
viralen Partikeln oder als nackte DNA eingeführt. Das durch das insertierte
Gen kodierte Protein wird anschließend gereinigt oder von dem Überstand
angereichert, unter Verwendung herkömmlicher Methoden, wie z.B.
Ammoniumsulfatpräzipitation,
Immunpräzipitation,
Immunchromatographie, Größenausschlusschromatographie,
Ionenaustauschchromatographie und HPLC. Alternativ kann das sezernierte
Protein in einem ausreichend an gereicherten oder reinen Zustand
in dem Überstand
oder Wachstumsmedium des Wirtes vorhanden sein, um die Verwendung
für dessen
beabsichtigen Zweck ohne weitere Anreicherung zu erlauben.
-
Die
Signalsequenzen können
außerdem
in Vektoren insertiert werden, die für die Gentherapie entworfen
wurden. In derartigen Vektoren ist die Signalsequenz funktionell
mit einem Promotor verbunden, so dass die von dem Promotor transkribierte
mRNA für
das Signalpeptid kodiert. Eine Klonierungsstelle ist stromabwärts von
der Signalsequenz lokalisiert, so dass ein Gen, das für ein Protein
kodiert, dessen Sekretion gewünscht
ist, einfach in den Vektor insertiert und an die Signalsequenz fusioniert
wird. Der Vektor wird in eine geeignete Wirtszelle eingeführt. Das
von dem Promotor exprimierte Protein wird extrazellulär sezerniert,
wodurch ein therapeutischer Effekt produziert wird.
-
Die
5'-ESTs können außerdem verwendet
werden, um Sequenzen zu klonieren, die stromaufwärts von den 5'-ESTs lokalisiert
sind, die in der Lage sind, die Genexpression zu regulieren, einschließlich Promotorsequenzen,
Enhancersequenzen und andere stromaufwärts gelegener Sequenzen, welche
die Transkriptions- oder Translationslevel beeinflussen. Sobald
sie identifiziert und kloniert wurden, können diese stromaufwärts gelegenen
regulatorischen Sequenzen in Expressionsvektoren verwendet werden,
die zur Steuerung der Expression eines insertierten Genes auf eine
gewünschte
räumliche,
zeitliche, entwicklungsgemäße oder
quantitative Weise zu steuern. Beispiel 58 beschreibt ein Verfahren
zum klonieren von Sequenzen, die stromaufwärts der verlängerten
cDNAs oder 5'-ESTs
liegen.
-
2. Identifizierung von stromaufwärts gelegenen
Sequenzen mit fördernden
oder regulatorischen Aktivitäten
-
BEISPIEL 58
-
Verwendung von verlängerten cDNAs oder 5'-ESTs, um stromaufwärts gelegene
Sequenzen der genomischen DNA zu klonieren
-
Sequenzen,
die von den verlängerten
cDNAs oder 5'-ESTs
abgeleitet sind, können
verwendet werden, um die Promotoren der dazugehörigen Gene unter Verwendung
von Chromosome Walking-Methoden zu isolieren. In einer Chromosome
Walking-Methode, die den GenomeWalkerTM-Kit
verwendet, der von Clontech erhältlich
ist, werden fünf
vollständige
genomische DNA-Proben jeweils mit einem anderen Restriktionsenzym verdaut,
das eine 6 Basen lange Erkennungsstelle hat und ein stumpfes Ende
hinterlässt.
Nach dem Verdau werden die Oligonukleotidadaptoren an jedes Ende
der resultierenden Fragmente genomischer DNA ligiert.
-
Für jede der
fünf genomischen
DNA-Bibliotheken wird eine erste PCR-Reaktion in Übereinstimmung mit
den Angaben des Herstellers unter Verwendung eines äußeren Adaptorprimers,
der in dem Kit vorhanden ist, und eines äußeren genspezifischen Primers
durchgeführt.
Der genspezifische Primer sollte so ausgewählt sein, dass er spezifisch
für die
verlängerte
cDNA oder den 5'-EST
von Interesse ist, und er sollte eine Schmelztemperatur, Länge und
Lokalisierung in der verlängerten
cDNA oder dem 5'-EST
haben, die mit dessen Verwendung in den PCR-Reaktionen vereinbar
ist. Jede erste PCR-Reaktion enthält 5 ng genomische DNA, 5 μl 10X Tth-Reaktionspuffer,
0,2 mM von jedem dNTP, 0,2 μM
von jedem äußeren Adapterprimer
und äußeren genspezifischen
Primer, 1,1 mM Mg(OAc)2 und 1 μl der Tth-Polymerase
50X Mischung, in einem gesamten Volumen von 50 μl. Der Reaktionszyklus der ersten
PCR-Reaktion ist wie folgt: 1 min-94°C/2 s-94°C,
3 min-72°C
(7 Zyklen)/2 s-94°C,
3 min-68°C
(32 Zyklen)/5 min-67°C.
-
Das
Produkt der ersten PCR-Reaktion wird verdünnt und als Template für eine zweite
PCR-Reaktion in Übereinstimmung
mit den Angaben des Herstellers unter Verwendung eines Paares von
nested Primern verwendet, die intern auf dem Amplicon lokalisiert
sind, das aus der ersten PCR-Reaktion resultiert. Zum Beispiel können 5 μl des Reaktionsproduktes
der ersten PCR-Mischung 180fach verdünnt werden. Rektionen werden in
einem 50 μl-Volumen
durchgeführt
und haben eine Zusammensetzung, die der der ersten PCR-Reaktion entspricht,
außer
dass nested Primer verwendet werden. Der erste nested Primer ist
spezifisch für
den Adaptor und wird mit dem GenomeWalkerTM-Kit
zur Verfügung
gestellt. Der zweite nested Primer ist spezifisch für die jeweilige
verlängerte
cDNA oder den 5'-EST,
für den
der Promotor kloniert werden soll und sollte eine Schmelztemperatur,
Länge und
Lokalisierung in der verlängerten
cDNA oder dem 5'-EST haben, die mit
dessen Verwendung in den PCR-Reaktionen vereinbar ist. Die Reaktionsparameter
der zweiten PCR-Reaktion sind wie folgt: 1 min-94°C/2 s-94°C, 3 min-72°C (6 Zyklen)/2
s-94°C,
3 min-67°C
(25 Zyklen)/5 min-67°C.
Das Produkt der zweiten PCR-Reaktion wird gereinigt, kloniert und
unter Verwendung von Standardmethoden sequenziert.
-
Alternativ
können
zwei oder mehr Bibliotheken humaner genomischer DNA konstruiert
werden, indem zwei oder mehrere Restriktionsenzyme verwendet werden.
Die verdaute genomische DNA wird in Vektoren kloniert, die in einzelsträngige, zirkuläre oder
lineare DNA umgewandelt werden können.
Ein biotinyliertes Oligonukleotid, das wenigstens 15 Nukleotide
der verlängerten
cDNA oder der 5'-EST-Sequenz
umfasst, wird mit der einzelsträngigen
DNA hybridisiert. Hybride zwischen dem biotinylierten Oligonukleotid
und der einzelsträngigen
DNA, die die verlängerte
cDNA oder EST-Sequenz enthalten, werden wie in Beispiel 29 oben
beschrieben isoliert. Anschließend
wird die einzelsträngige
DNA, die die verlängerte
cDNA oder die EST-Sequenz enthält,
von den Beads freigesetzt und unter Verwendung eines Primers, der
spezifisch für
die verlängerte
cDNA oder die 5'-EST-Sequenz
ist, oder eines Primers, der einer Sequenz entspricht, die in dem
Klonierungsvektor enthalten ist, in doppelsträngige DNA umgewandelt. Die
resultierende doppelsträngige
DNA wird in Bakterien transformiert. DNAs, die die 5'-EST oder verlängerte cDNA-Sequenzen
enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
-
Sobald
die stromaufwärts
gelegenen genomischen Sequenzen wie oben beschrieben kloniert und
sequenziert worden sind, können
potenzielle Promotoren und Transkriptionsstartstellen innerhalb
der stromaufwärts
gelegenen Sequenzen durch Vergleich der Sequenzen, die stromaufwärts der
verlängerten
cDNAs oder 5'-ESTs
liegen, mit Datenbanken, die bekannte Transkriptionsstartstellen,
Transkriptionsfaktor-Bindungsstellen oder Promotorsequenzen enthalten,
identifiziert werden.
-
Darüber hinaus
können
Promotoren in den stromaufwärts
gelegenen Sequenzen unter Verwendung von Promotor-Reportervektoren
wie im Beispiel beschrieben identifiziert werden.
-
BEISPIEL 59
-
Identifizierung von Promotoren in den
klonierten stromaufwärts
liegenden Sequenzen
-
Die
genomischen Sequenzen, die stromaufwärts von den verlängerten
cDNAs oder 5'-ESTs liegen, werden
in einen geeigneten Promotor-Reportervektor kloniert, wie z.B. den
von Clontech erhältlichen
Promotor-Reportervektor (pSEAP-Basic, pSEAP-Enhancer, pβgal-Basic,
pβgal-Enhancer
oder pEGFP-1. Kurz beschrieben enthält jeder dieser Promotor-Reportervektoren
multiple Klonierungsstellen, die sich stromaufwärts eines Reportergens befinden,
das das für
ein leicht zu untersuchendes Protein, wie z.B. sezernierte alkalische Phosphatase, β-Galactosidase
oder grün
fluoreszierendes Protein kodiert. Die Sequenzen stromaufwärts der verlängerten
cDNAs oder 5'-ESTs
werden in die Klonierungsstellen stromaufwärts des Reportergens in beiden Orientierungen
insertiert und in eine geeignete Wirtszelle eingeführt. Die
Konzentration an Reporterprotein wird untersucht und mit der Konzentration
verglichen, die von einem Vektor erhalten wird, dem ein Insert in
der Klonierungsstelle fehlt. Das Vorhandensein einer erhöhten Expressionskonzentration
in dem das Insert enthaltenden Vektor in Bezug auf den Kontrollvektor
zeigt das Vorhandensein eines Promotors in dem Insert an. Wenn notwendig,
können
die stromaufwärts
gelegenen Sequenzen in Vektoren kloniert werden, die einen Enhancer
für die
Verstärkung
der Transkriptionskonzentrationen von schwachen Promotorsequenzen
enthalten. Eine signifikante Expressionsmenge über der, die mit dem Vektor
beobachtet wird, dem ein Insert fehlt, zeigt, dass eine Promotorsequenz
in der insertierten stromaufwärts
gelegenen Sequenz vorhanden ist.
-
Geeignete
Wirtszellen für
die Promotor-Reportervektoren können
auf Grundlage der Ergebnisse der oben beschriebenen Bestimmung der
Expressionsmuster der verlängerten
cDNAs und ESTs ausgewählt
werden. Zum Beispiel kann, wenn die Analyse des Expressionsmusters
andeutet, dass die einer bestimmten verlängerten cDNA oder einem 5'-EST entsprechenden
mRNA in Fibroblasten exprimiert wird, der Promotor-Reportervektor in
eine humane Fibroblastenzelllinie eingeführt werden.
-
Promotorsequenzen
innerhalb der stromaufwärts
genomischen DNA können
außerdem
durch Konstruktion von nested Deletionen in der stromaufwärts gelegenen
DNA unter Verwendung herkömmlicher
Methoden, wie z.B. dem Verdau mit Exonuklease III, definiert werden.
Die resultierenden Deletionsfragmente können in den Promotor-Reportervektor insertiert
werden, um zu bestimmen, ob die Deletion die Promotoraktitivität reduziert
oder ausgelöscht
hat. Auf diese Weise können
die Grenzen der Promotoren definiert werden. Wenn dies gewünscht ist,
können
potenzielle individuell regulatorische Stellen innerhalb des Promotors
unter Verwendung der ortsspezifischen Mutagenese oder des Linker-Scannings,
um potenzielle Transkriptorfaktor-Bindungsstellen innerhalb des
Promotors einzeln oder in Kombination zu zerstören, identifiziert werden. Die
Wirkungen dieser Mutationen auf die Transkriptionslevel können bestimmt
werden, indem die Mutationen in die Klonierungsstellen in den Promotor-Reportervektoren
insertiert werden.
-
BEISPIEL 60
-
Klonierung und Identifizierung von Promotoren
-
Unter
Verwendung des in Beispiel 58 oben mit 5'-ESTs beschriebenen Verfahrens werden
Sequenzen stromaufwärts
verschiedener Gene erhalten. Unter Verwendung der Primerpaare GGG
AAG ATG GAG ATA GTA TTG CCT G (SEQ ID NR: 29) und CTG CCA TGT ACA
TGA TAG AGA GAT TC (SEQ ID NR: 30) wurde der Promotor mit der internen
Bezeichnung P13H2 (SEQ ID NR: 31) erhalten.
-
Unter
Verwendung der Primerpaare GTA CCA GGGG ACT GTG ACC ATT GC (SEQ
ID NR: 32) und CTG TGA CCA TTG CTC CCA AGA GAG (SEQ ID NR: 33) wurde
der Promotor mit der internen Bezeichnung P15B4 (SEQ ID NR: 34)
erhalten.
-
Unter
Verwendung der Primerpaare CTG GGA TGG AAG GCA CGG TA (SEQ ID NR:
35) und GAG ACC ACA CAG CTA GAC AA (SEQ ID NR: 36) wurde der Promotor
mit der internen Bezeichnung P29B6 (SEQ ID NR: 37) erhalten.
-
4 stellt
eine schematische Beschreibung der isolierten Promotoren sowie die
Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengefügt wurden, zur Verfügung. Die
stromaufwärts
gelegenen Sequenzen wurden auf das Vorhandensein von Motiven, die
Transkriptionsfaktor-Bindungsstellen oder bekannten Transkriptionsstartstellen ähneln, unter
Verwendung des Computerprogramms MatInspector, Ausgabe 2.0, August
1996, untersucht.
-
Tabelle
VII beschreibt die Transkriptionsfaktor-Bindungsstellen, die in
jedem dieser Promotoren vorhanden sind. Die Spalten, die mit Matrix
bezeichnet sind, geben den Namen der verwendeten MatInspector-Matrix
an. Die Spalte, die mit Position bezeichnet ist, gibt die 5'-Position der Promotorstelle
an. Die Nummerierung der Sequenz beginnt bei der Transkriptionsstelle,
wie sie durch Abgleich der genomischen Sequenz mit der 5'-EST-Sequenz bestimmt
wurde. Die Spalte, die mit "Orientierung" bezeichnet ist,
gibt den DNA-Strang an, in dem sich die Stelle befindet, wobei der
+-Strang der kodierende Strang ist, wie er durch Abgleich der genomischen
Sequenz mit der Sequenz der 5'-EST
bestimmt wurde. Die Spalte, die mit "Wert" bezeichnet
ist, gibt den MatInspector-Wert an, der für diese Stelle gefunden wurde.
Die Spalte, die mit "Länge" bezeichnet wird,
gibt die Länge
der Stelle in Nukleotiden an. Die Spalte, die mit "Sequenz" bezeichnet ist,
gibt die Sequenz der gefundenen Stelle an.
-
Bakterienklone,
die Plasmide enthalten, die die oben beschriebenen Promotorsequenzen
enthalten, werden derzeit in den Laboratorien der Erfindung unter
den internen oben angegebenen Identifizierungsnummern gelagert.
Die Inserts können
aus den hinterleg ten Materialien, gewonnen werden, indem ein Aliquot
des entsprechenden Bakterienklons in dem geeigneten Medium wachsen
gelassen wird. Die Plasmid-DNA kann anschließend unter Verwendung von Plasmidisolierungsverfahren,
die Fachleuten auf dem Gebiet bekannt sind, wie z.B. von alkalische
Lyse-MiniPreps oder Plasmidisolationsverfahren der alkalischen Lyse
im Großmaßstab, isoliert
werden. Wenn dies gewünscht
ist, kann die Plasmid-DNA weiter durch Zentrifugation auf einen
Cäsiumchloridgradienten,
durch Größenausschlusschromatographie
oder Anionenaustauschchromatographie angereichert werden. Die unter
Verwendung dieser Methoden erhaltene Plasmid-DNA kann anschließend unter
Verwendung von Standard-Klonierungsmethoden, die den Fachleuten
auf dem Gebiet vertraut sind, manipuliert werden. Alternativ kann
eine PCR durchgeführt
werden mit Primern, die an beiden Enden der EST-Insertion entworfen
werden. Das PCR-Produkt, das dem EST entspricht, kann anschließend unter
Verwendung von Standard-Klonierungsmethoden, die den Fachleuten
auf dem Gebiet vertraut sind, manipuliert werden.
-
Die
Promotoren und anderen regulatorischen Sequenzen, die stromaufwärts der
verlängerten
cDNAs oder 5'-ESTs
liegen, können
verwendet werden, um Expressionsvektoren zu konstruieren, die in
der Lage sind, die Expression eines insertierten Gens in einer gewünschten
räumlichen,
zeitlichen entwicklungsgemäßen oder
quantitativen Weise zu steuern. Ein Promotor, der fähig ist,
die gewünschten
räumlichen,
entwicklungsgemäßen und
quantitativen Muster zu steuern, kann ausgewählt werden unter Verwendung
der Ergebnisse der Expressionsanalyse, die in Beispiel 26 oben beschrieben
wird. Zum Beispiel kann, wenn ein Promotor, der einen hohen Expressionslevel
im Muskel verleiht, gewünscht
wird, die Promotorsequenz stromaufwärts einer verlängerten
cDNA oder eines 5'-ESTs,
der von einer mRNA abgeleitet ist, die im Muskel in hohen Konzentrationen
exprimiert wird, wie durch das Verfahren gemäß Beispiel 26 bestimmt wird,
in dem Expressionsvektor verwendet werden.
-
Vorzugsweise
wird der gewünschte
Promotor nahe der multiplen Restriktionsstellen angeordnet, um die
Klonierung des gewünschten
Inserts stromabwärts
des Promotors zu erleichtern, so dass der Promotor in der Lage ist,
die Expression des insertierten Genes zu steuern. Der Promotor kann
in konventionellen Nukleinsäure-Backbones
insertiert werden, die für
die extrachromosomale Replikation, die Integration in die Wirtschromosomen
oder die transiente Expression entworfen wurden. Geeignete Backbones
für die
vorliegenden Expressionsvektoren schließen retrovirale Backbones,
Backbones aus eu karyontischen Episomen, wie z.B. SV 40 oder dem
bovinen Papillomvirus, Backbones aus bakteriellen Episomen oder
künstliche
Chromosomen ein.
-
Vorzugsweise
enthalten die Expressionsvektoren auch ein PolyA-Signal stromabwärts der
multiplen Restriktionsstellen, um die Polyadenylierung der von dem
in den Expressionsvektor insertierten Gen-transkribierten mRNA zu
steuern.
-
Nach
der Identifikation von Promotorsequenzen unter Verwendung der Verfahren
gemäß den Beispielen
58-60, können
Proteine, die mit dem Promotor interagieren, wie in Beispiel 61
unten identifiziert werden.
-
BEISPIEL 61
-
Identifikation von Proteinen, die mit
Promotorsequenzen, stromaufwärts
gelegenen regulatorischen Sequenzen oder mRNA interagieren
-
Sequenzen
innerhalb der Promotorregion, die wahrscheinlich Transkriptionsfaktoren
binden, können durch
Homologie mit bekannten Transkriptionsfaktor-Bindungsstellen oder
durch herkömmliche
Mutagenese oder Deletionsanalysen von Reporterplasmiden, die die
Promotorsequenz enthalten, identifiziert werden. Zum Beispiel können Deletionen
in einem Reporterplasmid hergestellt werden, dass die Promotorsequenz
von Interesse, funktionell verbunden mit einem untersuchbaren Reportergen,
enthält.
Die Reporterplasmide, die verschiedene Deletionen innerhalb der
Promotorregion aufweisen, werden in eine geeignete Wirtszelle transfiziert,
und die Auswirkungen der Deletionen auf die Expressionslevel werden
untersucht. Transkriptionsfaktor-Bindungsstellen innerhalb der Regionen,
in denen Deletionen die Expressionslevel reduzieren, können weiterhin
unter Verwendung der ortsgerichteten Mutagenese, der Linker-Scanninganalyse
oder anderen den Fachleuten auf dem Gebiet vertrauten Methoden lokalisiert
werden.
-
Nukleinsäuren, die
für Proteine
kodieren, die mit Sequenzen in dem Promotor interagieren, können unter
Verwendung von One-Hybrid-Systemen, wie den in dem Handbuch, das
dem Matchmaker One-Hybrid-Systemkit beigefügt ist, das von Clontech erhältlich ist
(Katalog Nr. K1603-1) beschriebenen, identifiziert werden. Kurz
beschrieben wird das Matchmaker One-Hybrid-System wie folgt verwendet.
Die Zielsequenz, für die
es gewünscht
wird, bindende Proteine zu identifizieren, wird stromaufwärts eines
selektierbaren Reportergens kloniert und in das Hefegenom integriert.
Vorzugsweise werden mehrere Kopien der Zielsequenzen in das Reporterplasmid
in Tandem insertiert. Eine Biblio thek, die aus Fusionen zusammengesetzt
ist, zwischen cDNAs, die auf ihre Fähigkeit, an den Promotor zu
binden, untersucht werden sollen und der Aktivierungsdomäne eines
Transkriptionsfaktors der Hefe, wie z.B. GAL4, wird in den Hefestamm
transformiert, der die integrierte Reportersequenz enthält. Die
Hefen werden auf Selektionsmedium ausplattiert, um Zellen zu selektieren,
die den selektierbaren Marker, verbunden mit der Promotorsequenz
exprimieren. Die Kolonien, die auf dem Selektionsmedium wachsen,
enthalten Gene, die für
Proteine kodieren, die an die Zielsequenz binden. Die Inserts der
für die
Fusionsproteine kodierenden Gene werden weiter charakterisiert durch
Sequenzierung. Zusätzlich
können
die Inserts in Expressionsvektoren oder in in vitro-Transkriptionsvektoren
insertiert werden. Die Bindung der durch die Inserts kodierten Polypeptide
an die Promotor-DNA kann durch Methoden bestätigt werden, die den Fachleuten
auf dem Gebiet vertraut sind, wie z.B. der Gel-Shift-Analyse oder
der DNase-Protection-Analyse.
-
VII. Verwendung von 5'-ESTs (oder cDNAs oder genomischen DNAs,
die davon erhältlich
sind) in der Gentherapie
-
Ebenfalls
hierin beschrieben wird die Verwendung von 5'-ESTs (oder cDNA oder genomischen DNA, die
davon erhältlich
ist) in Gentherapieansätzen,
einschließlich
der Antisense- und Triele Helix-Strategien, wie in den Beispielen
62 und 63 unten beschrieben. In Antisense-Methoden werden Nukleinsäuresequenzen,
die komplementär
zu einer mRNA sind, intrazellulär
mit der mRNA hybridisiert, wodurch die Expression des durch die
mRNA kodierten Proteins blockiert wird. Die Antisensesequenzen können die
Genexpression durch verschiedenste Mechanismen verhindern. Zum Beispiel
können
die Antisensesequenzen die Fähigkeit
der Ribosomen, die mRNA zu translatieren, inhibieren. Alternativ
können
die Antisensesequenzen den Transport der mRNA aus dem Nukleus in
das Cytoplasma blockieren, wodurch die Menge an mRNA, die für die Translation zur
Verfügung
steht, limitiert wird. Ein anderer Mechanismus, durch den Antisensesequenzen
die Genexpression inhibieren können,
ist durch Interferieren mit dem mRNA-Splicing. In noch einem anderen Ansatz
kann Antisense-Nukleinsäure
in ein Ribozym eingeschlossen werden, das fähig ist, die Ziel-mRNA spezifisch
zu spalten.
-
BEISPIEL 62
-
Herstellung und Verwendung von Antisense-Oligonukleotiden
-
Die
in der Gentherapie zu verwendenden Antisense-Nukleinsäuremoleküle können entweder
DNA- oder RNA-Sequenzen sein. Sie können eine Sequenz umfassen,
die komplementär
zu der Sequenz des 5'-EST
(oder der cDNA oder genomischen DNA, die davon erhältlich sind)
ist. Die Antisense-Nukleinsäuren sollten
eine Länge
und Schmelztemperatur aufweisen, die ausreichen, um die Bildung
einer intrazellulären
Duplex mit ausreichender Stabilität, um die Expression der mRNA
in der Duplex zu inhibieren, zu erlauben. Strategien zum Entwurf
von Antisense-Nukleinsäuren,
die für
die Verwendung in der Gentherapie geeignet sind, sind in Green et
al., Ann. Rev. Biochem. 55:569-597, 1986; und Izant und Weintraub,
Cell 36:1007-1015, 1984, offenbart.
-
In
einigen Ansätzen
werden Antisensemoleküle
von einer Nukleotidsequenz erhalten, die für ein Protein kodiert, in dem
die Orientierung der kodierenden Region im Hinblick auf einen Promotor
umgekehrt wird, so dass der gegenüberliegende Strang von dem,
der normalerweise in der Zelle transkribiert wird, transkribiert wird.
Die Antisensemoleküle
können
unter Verwendung von in vitro-Transkriptionssystemen, wie z.B. solchen, die
T7 oder SP6-Polymerase verwenden, um das Transkript zu erzeugen,
transkribiert werden. Ein anderer Ansatz umfasst die Transkription
der Antisense-Nukleinsäuren
in vivo, indem eine DNA, welche die Antisensesequenz enthält, funktionell
mit einem Promotor in einem Expressionsvektor verbunden wird.
-
Alternativ
können
Oligonukleotide, die komplementär
zu dem normalerweise in der Zelle transkribierten Strang sind, in
vitro synthetisiert werden. Folglich sind die Antisense-Nukleinsäuren komplementär zu der korrespondierenden
mRNA und in der Lage, mit der mRNA zu hybridisieren, um eine Duplex
zu erzeugen. In einigen Ausführungsformen
können
die Antisensesequenzen modifizierte Zucker-Phosphat-Backbones enthalten,
um die Stabilität
zu erhöhen
und sie weniger sensitiv gegenüber
der RNase-Aktivität
zu machen. Beispiele für
geeignete Modifikationen zur Verwendung in Antisensestrategien werden
von Rossi et al., Pharmacol. Ther. 50(20):245-254, 1991, beschrieben.
-
Verschiedene
Arten von Antisense-Oligonukleotiden, die komplementär zu der
Sequenz des 5'-ESTs (oder
der cDNA oder genomischen DNA, die davon erhältlich sind), sind, können verwendet
werden. In einer bevorzugten Ausführungsform werden stabile und
semi-stabile Antisense-Oligonukleotide verwendet, die in der
internationalen Anmeldung Nr. PCT
WO 94/23026 beschrieben werden. In diesen Molekülen sind
das 3'-Ende oder
sowohl das 3'-Ende
und das 5'-Ende
an der intramolekularen Wasserstoffbrückenbindung zwischen komplementären Basenpaaren
beteiligt. Diese Moleküle
sind deshalb in der Lage, den Attacken durch Exonuklease zu widerstehen,
und zeigen eine erhöhte
Stabilität
im Vergleich zu herkömmlichen
Antisense-Oligonukleotiden.
-
In
einer weiteren bevorzugten Ausführungsform
werden Antisense-Oligodeoxynukleotide gegen den Herpes Simplex-Virus
Typ 1 und 2, die in der
internationalen
Anmeldung Nr. WO 95/04141 beschrieben werden, verwendet.
-
In
noch einer weiteren bevorzugten Ausführungsform werden die kovalent
kreuzvernetzten Antisense-Oligonukleotide, die in der
internationalen Anmeldung Nr. WO 96/31523 beschrieben
werden, verwendet. Diese doppel- oder einzelsträngigen Oligonukleotide umfassen
ein bzw. mehrere inter- oder intra-Oligonukleotid-kovalente Kreuzvernetzungen,
wodurch die Verknüpfung
aus einer Amidbindung zwischen einer primären Amingruppe in einem Strang
und einer Carboxylgruppe in dem anderen Strang bzw. in demselben
Strang, einer primären
Amingruppe, die direkt in der 2'-Position
des Strangs des Nukleotidmonosaccharidrings substituiert ist und
der Carboxylgruppe, die in einer aliphatischen Spacergruppe enthalten
ist, die in einem Nukleotid substituiert ist, oder einem Nukleotid
des anderen Strangs bzw. desselben Strangs besteht.
-
Die
in der
internationalen Anmeldung
Nr. WO 92/18522 offenbarten Antisense-Oligodeoxynukleotide und Oligonukleotide
können
ebenfalls verwendet werden. Diese Moleküle sind stabil gegenüber einer
Degradation und enthalten wenigstens eine Transkriptionskontroll-Erkennungssequenz,
die bindet, um Proteine zu kontrollieren, und sind wirksam als Köder dafür. Diese
Moleküle
können "Hairpin"-Strukturen, "Dumbbell"-Strukturen, "modifizierte Dumbbell"-Strukturen, "kreuzvernetzte" Köderstrukturen
und "Loop"-Strukturen enthalten.
-
In
einer weiteren bevorzugten Ausführungsform
werden zyklische doppelsträngige
Oligonukleotide verwendet, die in der
europäischen
Patentanmeldung Nr. 0 572 287 A2 beschrieben werden. Diese
ligierten Oligonukleotid-"Dumbbells" enthalten die Bindungsstelle
für einen
Transkriptionsfaktor und inhibieren die Expression des Genes, das
unter Kontrolle des Transkriptionsfaktors steht, indem der Faktor
sequestriert wird.
-
Die
Verwendung geschlossener Antisense-Oligonukleotide, die in der
internationalen Anmeldung Nr. WO
92/19732 offenbart werden, ist ebenfalls in Erwägung gezogen.
Da diese Moleküle
keine freien Enden haben, sind sie resistenter gegenüber der
Degradation durch Exonukleasen als es herkömmlichen Oligonukleotide sind.
Diese Oligonukleo tide können
multifunktionell sein, mit mehreren Regionen interagieren, die auf
der ZielmRNA nicht benachbart sind.
-
Die
geeignete Menge an Antisense-Nukleinsäuren, die zum Inhibieren der
Genexpression benötigt wird,
kann unter Verwendung der in vitro-Expressionsanalyse bestimmt werden.
Das Antisensemolekül
kann in die Zellen mittels Diffusion, Injektion, Infektion, Transfektion
oder H-Region-vermitteltem Import unter Verwendung von auf dem Gebiet
bekannten Verfahren eingeführt
werden. Zum Beispiel können
die Antisense-Nukleinsäuren in
den Körper
als lose oder nackte Oligonukleotide, in Lipid eingekapselte Oligonukleotide,
durch virale Proteine eingekapselte Oligonukleotidsequenzen oder
als Oligonukleotid, das funktionell mit einem in einem Expressionsvektor
enthaltenen Promotor verbunden ist, in den Körper eingeführt werden. Der Expressionsvektor
kann irgendeiner aus einer Vielzahl von auf dem Gebiet bekannten
Expressionsvektoren sein, einschließlich retroviraler oder viraler
Vektoren, Vektoren, die zur extrachromosomalen Replikation fähig sind
oder Integrationsvektoren. Die Vektoren können DNA oder RNA sein.
-
Die
Antisensemoleküle
werden in Zellproben in einer Anzahl verschiedener Konzentrationen,
vorzugsweise zwischen 1 × 10–10 M
bis 1 × 10–4 M
eingeführt.
Sobald die Minimumkonzentration, die in geeigneter Weise die Genexpression
kontrollieren kann, identifiziert wurde, wird die optimierte Dosis
in eine für
die in vivo-Verwendung geeignete Dosierung umgerechnet. Zum Beispiel
rechnet sich eine inhibierende Konzentration in Kultur von 1 × 10–7 in
einer Dosis von etwa 0,6 mg/kg Körpergewicht
um. Konzentrationen des Nukleotids nahe 100 mg/kg Körpergewicht
oder höher
können
möglich
sein, nachdem die Toxizität
des Oligonukleotids in Labortieren getestet wurde. Es wird außerdem in
Erwägung
gezogen, dass Zellen aus dem Wirbeltier entfernt werden, mit dem
Antisense-Oligonukleotid
behandelt werden und in das Wirbeltier wiedereingeführt werden.
-
Es
wird ferner in Betracht gezogen, dass die Antisense-Oligonukleotidsequenz
in eine Ribozymsequenz eingefügt
wird, um der Antisensesequenz zu ermöglichen, spezifisch zu binden
und dessen Ziel-mRNA zu spalten. Für technische Anwendungen von
Ribozym und Antisense-Oligonukleotiden siehe Rossi et al., s.o.
-
In
einer bevorzugten Anwendung dieser Erfindung wird das durch das
Gen kodierte Polypeptid zuerst identifiziert, so dass die Wirksamkeit
der Antisenseinhibition auf die Translation unter Verwendung von
Methoden beobachtet werden kann, die Antikörper vermittelte Tests, wie
z.B. RIAs und ELISA, funktionelle Assays oder radioaktive Markierung
einschließen,
jedoch nicht auf diese beschränkt
sind.
-
Die
5'-ESTs gemäß der vorliegenden
Erfindung (oder cDNAs oder genomischen DNAs, die davon erhältlich sind)
können
außerdem
in Gentherapieansätzen
verwendet werden, die auf der Bildung einer intrazellulären Triele
Helix basieren. Triele Helix-Oligonukleotide
werden verwendet, um die Transkription von einem Genom zu inhibieren.
Sie sind besonders nützlich
zur Untersuchung der Veränderungen
der Zellaktivität,
das mit einem bestimmten Gen assoziiert ist. Die 5'-EST-Sequenzen (oder
die cDNAs oder genomischen DNAs, die davon erhältlich sind) gemäß der vorliegenden
Erfindung, oder, bevorzugter, ein Teil dieser Sequenzen, können verwendet
werden, um die Genexpression in Individuen zu inhibieren, die Erkrankungen
aufweisen, die mit der Expression eines bestimmten Genes assoziiert
sind. In ähnlicher
Weise kann ein Teil der 5'-EST-Sequenzen
(oder der cDNAs oder genomischen DNAs, die davon erhältlich sind)
verwendet werden, um die Wirkung der Inhibition der Transkription
eines bestimmten Genes innerhalb einer Zelle zu untersuchen. Traditionell wurden
Homopurinsequenzen als die nützlichsten
für Triele
Helix-Ansätze
betrachtet. Jedoch können
Homopyrimidinsequenzen ebenfalls die Genexpression inhibieren. Derartige
Homopyrimidin-Oligonukleotide
binden an die größere Furche
in Homopurin:Homopyrimidin-Sequenzen. Folglich werden beide Arten
von Sequenzen des 5'-EST
oder von dem Gen, das dem 5'-EST entspricht, innerhalb
des Umfangs dieser Erfindung in Betracht gezogen.
-
BEISPIEL 63
-
Herstellung und Verwendung von Triple
Helix-Sonden
-
Die
Sequenzen der 5'-ESTs
(oder der cDNAs oder genomischen DNAs, die davon erhältlich sind)
werden untersucht, um 10-mer oder 20-mer Homopyrimidin- oder Homopurin-Abschnitte
zu identifizieren, die in Triele Helix-basierten Ansätzen zur
Inhibition der Genexpression verwendet werden könnten. Nach der Identifikation
von möglichen
Homopyrimidin- oder Homopurin-Abschnitten, wird deren Wirksamkeit
bei dem Inhibieren der Genexpression durch Einführen verschiedener Mengen an
Oligonukleotiden, die die Kandidatensequenzen enthalten, in Gewebskulturzellen,
die normalerweise das Zielgen exprimieren, untersucht. Die Oligonukleotide
können
auf einem Oligonukleotid-Synthetisierer
hergestellt werden, oder sie können
kommerziell von einer Firma erworben werden, die auf die kundenspezifische
Oligonukleotidsynthese spezialisiert ist, wie z.B. GENSET, Paris,
Frankreich.
-
Die
Oligonukleotide können
in die Zellen unter Verwendung einer Vielzahl von den Fachleuten
auf dem Gebiet bekannten Verfahren eingeführt werden, einschließlich der
Calciumphosphatpräzipitation,
DEAE-Dextran, Elektroporation, Liposom-vermittelter Transfektion
oder nativer Aufnahme, ohne darauf beschränkt zu sein.
-
Behandelte
Zellen werden unter Verwendung von Methoden, wie z.B. dem Northern
Blotting, RNase Protection Assays, PCR-basierten Ansätzen, um
die Transkriptionslevel des Zielgens in Zellen, die mit dem Oligonukleotid
behandelt wurden, zu beobachten, auf eine veränderte Zellfunktion oder reduzierte
Genexpression untersucht. Die zu beobachtenden Zellfunktionen werden
auf Grundlage der Homologien des Zielgens, das der verlängerten
cDNA entspricht, von dem das Oligonukleotid abgeleitet wurde, mit
bekannten Gensequenzen, die mit einer bestimmten Funktion in Verbindung
gebracht wurden, vorhergesagt. Die Zellfunktionen können außerdem auf
Grundlage des Vorhandenseins anomaler Physiologien in den von Individuen
mit einer bestimmten Erbkrankheit abgeleiteten Zellen vorhergesagt
werden, insbesondere, wenn die verlängerte cDNA mit der Krankheit
assoziiert ist, unter Verwendung der in Beispiel 56 beschriebenen
Methoden.
-
Die
Oligonukleotide, die wirksam bei dem Inhibieren der Genexpression
in Gewebskulturzellen sind, können
anschließend
unter Verwendung der oben und in Beispiel 62 beschriebenen Methoden
in vivo eingeführt
werden, mit einer Dosierung, die auf Grundlage der in vitro-Ergebnisse
berechnet wird, wie in Beispiel 62 beschrieben.
-
In
einigen Ausführungsformen
können
natürliche
(beta) Anomere der Oligonukleotideinheiten durch alpha-Anomere ersetzt
werden, um das Oligonukleotid gegenüber Nukleasen resistenter zu
machen. Darüber hinaus
kann ein interkalierendes Mittel, wie z.B. Ethidiumbromid oder dergleichen
an das 3'-Ende des
alpha-Oligonukleotides angefügt
werden, um die Triele Helix zu stabilisieren. Für Informationen zur Erzeugung von
Oligonukleotiden, die für
die Triele Helix-Bildung geeignet sind, siehe Griffin et al., Science
245:967-971, 1989.
-
BEISPIEL 64
-
Verwendung der unter Verwendung der 5'-ESTs erhaltenen
cDNAs, um ein kodiertes Protein in einem Wirtsorganismus zu exprimieren
-
Die
wie oben beschrieben unter Verwendung der 5'-ESTs gemäß der vorliegenden Erfindung
erhaltenen cDNAs können
außerdem
verwendet werden, um ein kodiertes Protein in einem Wirtsorganismus
zu exprimieren, um eine vorteilhafte Wirkung zu erzeugen. In derartigen
Verfahren kann das kodierte Protein transient in dem Wirtsorganismus
exprimiert werden oder stabil in dem Wirtsorganismus exprimiert
werden. Das kodierte Protein kann irgendeine der oben beschriebenen
Aktivitäten
haben. Das kodierte Protein kann ein Protein sein, das dem Wirtsorganismus
fehlt oder alternativ, kann das kodierte Protein die vorhandenen
Mengen des Proteins in dem Wirtsorganismus erhöhen. Eine vollständig lange
verlängerte
cDNA, die für
das Signalpeptid und das reife Protein kodiert, oder eine verlängerte cDNA,
die nur für
das reife Protein kodiert, wird in den Wirtsorganismus eingeführt. Die
verlängerte
cDNA kann in den Wirtsorganismus unter Verwendung einer Vielzahl
von den Fachleuten auf dem Gebiet bekannten Methoden eingeführt werden.
Zum Beispiel kann die verlängerte
cDNA in dem Wirtsorganismus als nackte DNA injiziert werden, so
dass das kodierte Protein in dem Wirtsorganismus exprimiert wird,
wodurch eine vorteilhafte Wirkung erzeugt wird.
-
Alternativ
kann die verlängerte
cDNA in einen Expressionsvektor stromabwärts von einem Promotor kloniert
werden, der in dem Wirtsorganismus aktiv ist. Der Expressionsvektor
kann irgendeiner der für
die Verwendung in der Gentherapie entworfenen Expressionsvektoren
sein, einschließlich
viraler oder retroviraler Vektoren. Der Expressionsvektor kann direkt
in den Wirtsorganismus eingeführt
werden, so dass das kodierte Protein in dem Wirtsorganismus exprimiert
wird, um eine vorteilhafte Wirkung zu erzeugen. In einem anderen Ansatz
kann der Expressionsvektor in vitro in Zellen eingeführt werden.
Zellen, die den Expressionsvektor enthalten, werden danach selektiert
und in den Wirtsorganismus eingeführt, wo sie das kodierte Protein
exprimieren, um eine vorteilhafte Wirkung zu erzeugen.
-
BEISPIEL 65
-
Verwendung von durch die 5'-ESTs oder davon
erhaltene Sequenzen kodierten Signalpeptiden, um Proteine in Zellen
zu importieren
-
Die
kurze hydrophobe Kernregion (h) von Signalpeptiden, die durch die
5'-ESTs oder verlängerten
cDNAs kodiert werden, die von SEQ ID NR: 149 abgeleitet sind, kann
ebenfalls als Träger
verwendet werden, um ein Peptid oder ein Protein von Interesse,
so genannte Fracht, in Gewebskulturzellen zu importieren (Lin et
al., J. Biol. Chem. 270:14225-14258, 1995; Du et al., J. Peptide
Res. 51:235-243, 1998; Rojas et al., Nature Biotech., 16:370-375,
1998).
-
Wenn
zellpermeable Peptide von begrenzter Größe (etwa bis zu 25 Aminosäuren) über die
Zellmembran translokalisiert werden sollen, kann die chemische Synthese
verwendet werden, um die h-Region entweder an den C-Terminus oder
den N-Terminus an das Frachtpeptid von Interesse anzufügen. Alternativ
können, wenn
längere
Peptide oder Proteine in Zellen importiert werden sollen, Nukleinsäuren genetisch
modifiziert werden, um die verlängerte
cDNA-Sequenz, die für
die h-Region kodiert, an das 5'-
oder 3'-Ende einer DNA-Sequenz
anzufügen,
die für
ein Frachtpolypeptid kodiert, unter Verwendung von Methoden, die
den Fachleuten auf dem Gebiet vertraut sind. Derartig genetisch
manipulierte Nukleinsäuren
werden anschließend entweder
in vitro oder in vivo nach der Transfektion in geeignete Zellen
translatiert, unter Verwendung herkömmlicher Methoden, um das resultierende
zellpermeable Polypeptid herzustellen. Geeignete Wirtszellen werden
anschließend
einfach mit dem zellpermeablen Polypeptid inkubiert, das dann über die
Membran translokalisiert wird.
-
Dieses
Verfahren kann angewendet werden, um die verschiedenen intrazellulären Funktionen
und zellulären
Prozesse zu untersuchen. Zum Beispiel wurde es verwendet, um funktionell
relevante Domänen
intrazellulärer
Proteine zu erforschen und Protein-Protein-Interaktionen, die an den Signalübertragungswegen
beteiligt sind, zu untersuchen (Lin et al., s.o.; Lin et al., J.
Biol. Chem., 271:5305-5308, 1996; Rojas et al., J. Biol. Chem.,
271:27456-27461, 1996; Liu et al., Proc. Natl. Acad. Sci. USA 93:11819-11824,
196; Rojas et al., Bioch. Biophys. Res. Commun., 234:675-680, 1997).
-
Derartige
Techniken können
in der zellulären
Therapie verwendet werden, um Proteine zu importieren, die therapeutische
Wirkungen ausüben.
Zum Beispiel können
Zellen, die von einem Patienten isoliert wurden, mit wichtigen therapeutischen
Proteinen behandelt werden und anschließend in den Wirtsorganismus
wiedereingeführt
werden.
-
Alternativ
könnte
die h-Region von Signalpeptiden gemäß der vorliegenden Erfindung
in Verbindung mit einem nukleären
Lokalisierungssignal verwendet werden, um Nukleinsäuren in
den Zellnukleus einzuführen.
Derartige Oligonukleotide können
Antisense-Oligonukleotide
oder Oligonukleotide sein, die entworfen wurden, damit sie Triele
Helizes bilden, wie in den Beispielen 62 bzw. 63 beschrieben, um
die Prozessierung und/oder Reifung einer zellulären Ziel-RNA zu inhibieren.
-
Wie
oben erläutert,
können
die cDNAs oder Teile davon, die unter Verwendung der 5'-ESTs gemäß der vorliegenden Erfindung
erhalten wurden, für
verschiedene Zwecke verwendet werden. Die Polynukleotide können verwendet
werden, um ein rekombinantes Protein zur Analyse, Charakterisierung
oder für
therapeutische Verwendungen zu exprimieren; als Marker für Gewebe,
in denen das entsprechende Protein vorzugsweise exprimiert wird
(entweder konstitutiv oder zu einem bestimmten Stadium der Gewebedifferenzierung
oder der Entwicklung oder in einem Krankheitszustand); als Molekulargewichtsmarker
auf Southern Gelen; als Chromosomenmarker oder Tags (sofern markiert),
um Chromosomen zu identifizieren oder Genpositionen zu kartieren;
um Vergleiche mit endogenen DNA-Sequenzen in Patienten herzustellen,
um mögliche
genetische Erkrankungen zu identifizieren; als Sonde zum Hybridisieren
und folglich zum Entdecken neuer, verwandter DNA-Sequenzen; als
Informationsquelle, um PCR-Primer für das genetische Fingerprinting
abzuleiten, zum Selektieren und Herstellen von Oligomeren zum Anfügen an einen "Gen Chip" oder einen anderen
Träger,
einschließlich
der Untersuchung von Expressionsmustern; um Anti-Proteinantikörper zu
erzeugen, unter Verwendung von DNA-Immunisierungsmethoden; und als
ein Antigen, um Anti-DNA-Antikörper
hervorzurufen, oder eine andere Immunantwort herzurufen. Soweit
das Polypeptid für
ein Protein kodiert, das an ein anderes Protein bindet oder möglicherweise
bindet (wie z.B. in einer Rezeptor-Ligand-Interaktion), kann das
Polynukleotid auch in Interaction Trap Assays (wie z.B. dem in Gyuris
et al., Cell 75:791-803, 1993, beschriebenen) verwendet werden,
um Polynukleotide zu identifizieren, die das andere Protein kodieren,
mit dem die Bindung auftritt oder um Inhibitoren der Bindungsinteraktion
zu identifizieren.
-
Die
Proteine und Polypeptide, die durch die vorliegende Erfindung zur
Verfügung
gestellt werden, können
in ähnlicher
Weise in Assays verwendet werden, um die biologische Aktivität zu bestimmen,
einschließlich der
Verwendung in einer Anordnung mehrerer Proteine für das High
Throughput Screening; um Antikörper
hervorzurufen oder eine andere Immunantwort hervorzurufen; als ein
Reagenz (einschließlich
des markierten Reagenz) in Assays, die zur quantitativen Bestimmung
der Proteinmenge (oder dessen Rezeptors) in biologischen Flüssigkeiten
entworfen wurden; als Marker für
Gewebe, in denen das dazugehörige
Protein vorzugsweise exprimiert wird (entweder konstitutiv oder
zu einem bestimmten Stadium der Gewebsdifferenzierung oder der Entwicklung
oder in einem Krankheitszustand); und, selbstverständlich,
um entsprechende Rezeptoren oder Liganden zu isolieren. Soweit das
Protein an ein anderes Protein bindet oder möglicher weise bindet (wie z.B.
einer Rezeptor-Ligand-Interaktion), kann das Protein verwendet werden,
um das andere Protein, mit dem die Bindung auftritt, zu identifizieren
oder Inhibitoren der Bindungsinteraktion zu identifizieren. Proteine, die
an diesen Bindungsinteraktionen beteiligt sind, können außerdem verwendet
werden, um nach Peptidinhibitoren oder kleine Moleküle-Inhibitoren
oder Agonisten der Bindungsinteraktion zu suchen.
-
Einzeln
oder insgesamt sind diese Forschungshilfsmittel geeignet, zu einem
Reinheitsgrad oder einer Kitausführung
für die
Kommerzialisierung als Forschungsprodukte entwickelt zu werden.
-
Verfahren
zur Durchführung
der oben aufgelisteten Verwendungen sind den Fachleuten auf dem
Gebiet wohlbekannt. Referenzen, die derartige Verfahren offenbaren,
schließen
ohne Beschränkung
ein: Molecular Cloning: A Laborstory Manual, 2. Ed., Cold Spring
Harbor Laborstory Press, Sambrook, Fritsch und Maniatis Hrsg., 1989,
und Methods in Enzymology: Guide to Molecular Cloning Techniques,
Academic Press, Berger und Kimmer Hrsg., 1987.
-
Polynukleotide
und Proteine gemäß der vorliegenden
Erfindung können
außerdem
als Nahrungsquellen oder Nahrungsergänzungen verwendet werden. Derartige
Verwendungen schließen,
ohne Beschränkung, die
Verwendung als Protein oder Aminosäurepräparat, die Verwendung als Kohlenstoffquelle,
die Verwendung als Stickstoffquelle und die Verwendung als Kohlenhydratquelle
ein. In derartigen Fällen
kann das Protein oder Polypeptid gemäß der Erfindung dazugegeben
werden, um einen bestimmten Organismus zu füttern oder es kann als getrennte
feste oder flüssige
Herstellung verabreicht werden, z.B. in Form von Puder, Pillen,
Lösungen,
Suspensionen oder Kapseln. In dem Fall von Mikroorganismen kann
das Protein oder Polypeptid gemäß der Erfindung
zu dem Medium dazugegeben werden, auf dem der Mikroorganismus kultiviert
wird.
Minimum-Signalpeptid-Wert | Rate
Falsch-positiver | Rate
Falsch-negativer | Proba (0,1) | Proba (0,2) |
3,5 | 0,121 | 0,036 | 0,467 | 0,664 |
4 | 0,096 | 0,06 | 0,519 | 0,708 |
4,5 | 0,078 | 0,079 | 0,565 | 0,745 |
5 | 0,062 | 0,098 | 0,615 | 0,782 |
5,5 | 0,05 | 0,127 | 0,659 | 0,813 |
6 | 0,04 | 0,163 | 0,694 | 0,836 |
6,5 | 0,033 | 0,202 | 0,725 | 0,855 |
7 | 0,025 | 0,248 | 0,763 | 0,878 |
7,5 | 0,021 | 0,304 | 0,78 | 0,889 |
8 | 0,015 | 0,368 | 0,816 | 0,909 |
8,5 | 0,012 | 0,418 | 0,836 | 0,92 |
9 | 0,009 | 0,512 | 0,856 | 0,93 |
9,5 | 0,007 | 0,581 | 0,863 | 0,934 |
10 | 0,006 | 0,679 | 0,835 | 0,919 |
TABELLE
IV
Minimum-Signalpeptid-Wert | Sämtliche ESTs | Neue
ESTs | ESTs,
die mit allgemein bekanntem EST übereinstimmen,
näher als 40
bp vom Anfang | ESTs,
die bekannte mRNA verlängern, mehr
als 40 bp | ESTs,
die öffentlich
bekannten EST verlängern, mehr
als 40 bp |
3,5 | 2674 | 947 | 599 | 23 | 150 |
4 | 2278 | 784 | 499 | 23 | 126 |
4,5 | 1943 | 647 | 425 | 22 | 112 |
5 | 1657 | 523 | 353 | 21 | 96 |
5,5 | 1417 | 419 | 307 | 19 | 80 |
6 | 1190 | 340 | 238 | 18 | 68 |
6,5 | 1035 | 280 | 186 | 18 | 80 |
7 | 893 | 219 | 161 | 15 | 48 |
7,5 | 753 | 173 | 132 | 12 | 36 |
8 | 636 | 133 | 101 | 11 | 29 |
8,5 | 543 | 104 | 83 | 8 | 26 |
9 | 456 | 81 | 63 | 6 | 24 |
9,5 | 364 | 57 | 48 | 6 | 18 |
10 | 303 | 47 | 35 | 6 | 15 |
TABELLE
V
Gewebe | Sämtliche
ESts | Neue
ESTs | ESTs,
die mit allgemein bekanntet EST übereinstimmen,
näher als 40
bp vom Anfang | ESTs,
die bekannte mRNA verlängern, mehr
als 40 bp | ESTs,
die öffentlich
bekannten EST verlängern, mehr
als 40 bp |
Hirn | 329 | 131 | 75 | 3 | 24 |
Kanzeröse Prostata | 134 | 40 | 37 | 1 | 6 |
Cerebellum | 17 | 9 | 1 | 0 | 6 |
Kolon | 21 | 11 | 4 | 0 | 0 |
Dystropher Muskel | 41 | 18 | 8 | 0 | 1 |
Fötales Hirn | 70 | 37 | 16 | 0 | 1 |
Fötale Niere | 227 | 116 | 46 | 1 | 19 |
Fötale Leber | 13 | 7 | 2 | 0 | 0 |
Herz | 30 | 15 | 7 | 0 | 1 |
Hypertrophe Prostata | 86 | 23 | 22 | 2 | 2 |
Niere | 10 | 7 | 3 | 0 | 0 |
Dickdarm | 21 | 8 | 4 | 0 | 1 |
Leber | 23 | 9 | 6 | 0 | 0 |
Lunge | 24 | 12 | 4 | 0 | 1 |
Lunge
(Zellen) | 57 | 38 | 6 | 0 | 4 |
Lymphganglien | 163 | 60 | 23 | 2 | 12 |
Lymphozyten | 23 | 6 | 4 | 0 | 2 |
Muskel | 33 | 16 | 6 | 0 | 4 |
Normale
Prostata | 181 | 61 | 45 | 7 | 11 |
Ovar | 90 | 57 | 12 | 1 | 2 |
Pankreas | 48 | 11 | 6 | 0 | 1 |
Plazenta | 24 | 5 | 1 | 0 | 0 |
Prostata | 34 | 16 | 4 | 0 | 2 |
Milz | 56 | 28 | 10 | 0 | 1 |
Substantia
nigra | 108 | 47 | 27 | 1 | 6 |
Surrenals | 15 | 3 | 3 | 1 | 0 |
Hoden | 131 | 68 | 25 | 1 | 8 |
Schilddrüse | 17 | 8 | 2 | 0 | 2 |
Nabelschnur | 55 | 17 | 12 | 1 | 3 |
Uterus | 28 | 15 | 3 | 0 | 2 |
Nicht
gewebespezifisch | 568 | 48 | 177 | 2 | 28 |
Gesamt | 2677 | 947 | 601 | 23 | 150 |
TABELLE
VI
-
Beschreibung
der Transkriptionsfaktor-Bindungsstellen, die in Promotoren vorhanden
sind, die aus SignalTag-Sequenzen isoliert wurden
Promotorsequenz
P13H2 (646 bp): | | |
Matrix | Position | Orientierung | Wert | Länge | Sequenz |
CMYB_01 | -502 | + | 0.983 | 9 | TGTCAGTTG |
MYOD_06 | -501 | – | 0.981 | 10 | CCCAACTGAC |
S8_01 | -444 | – | 0.960 | 11 | AATAGAATTAG |
S8_01 | -425 | – | 0.968 | 11 | AACTAAATTAG |
DELTAEF1_01 | -390 | – | 0.960 | 11 | GCACACCTCAG |
GATA_C | -384 | – | 0.964 | 11 | AGATAAATCCA |
CMYB_01 | -349 | + | 0.958 | 9 | CTTCAGTTG |
GATA1_02 | -343 | + | 0.959 | 14 | TTGTAGATAGGACA |
GATA_C | -339 | + | 0.953 | 11 | AGATAGGACAT |
TAL1ALPHAE47_01 | -235 | + | 0.973 | 18 | CATAACAGATGGTAAG |
TAL1BETAE47_01 | -235 | + | 0.983 | 18 | CATAACAGATGGTAAG |
TAL1BETAITF2_01 | -235 | + | 0.978 | 16 | CATAACAGATGGTAAG |
MYOD_06 | -232 | – | 0.954 | 10 | ACCATCTGTT |
GATA1_04 | -217 | – | 0.953 | 13 | TCAAGATAAAGTA |
IK1_01 | -128 | + | 0.963 | 13 | AGTTGGGAATTCC |
IK2_01 | -126 | + | 0.985 | 12 | AGTTGGGAATTC |
CREL_01 | -123 | + | 0.962 | 10 | TGGGAATTCC |
GATA1_02 | -96 | + | 0.950 | 14 | TCAGTGATATGGCA |
SRY_02 | -41 | – | 0.951 | 12 | TAAAACAAAACA |
E2F_02 | -33 | + | 0.957 | 8 | TTTAGCGC |
MZF1_01 | -5 | – | 0.975 | 8 | TGAGGGGA |
| |
Promotorsequenz
P16B4 (861 bp): | |
Matrix | Position | Orientierung | Wert | Länge | Sequenz |
NFY_Q6 | -748 | – | 0.958 | 11 | GGACCAATCAT |
MZF1_01 | -738 | + | 0.962 | 8 | CCTGGGGA |
CMYB_01 | -684 | + | 0.994 | 9 | TGACCGTTG |
VMYB_02 | -682 | – | 0.985 | 9 | TCCAACGGT |
STAT_01 | -673 | + | 0.968 | 9 | TTCCTGGAA |
STAT_01 | -673 | – | 0.951 | 9 | TTCCAGGAA |
MZF1_01 | -556 | – | 0.956 | 8 | TTGGGGGA |
IK2_01 | -451 | + | 0.965 | 12 | GAATGGGATTTC |
MZF1_01 | -424 | + | 0.986 | 8 | AGAGGGGA |
SRY_02 | -398 | – | 0.955 | 12 | GAAAACAAAACA |
MZE1_01 | -216 | + | 0.960 | 8 | GAAGGGGA |
MYOD_Q6 | -190 | + | 0.981 | 10 | AGCATCTGCC |
DELTAEF1_01 | -176 | + | 0.958 | 11 | TCCCACCTTCC |
S8_01 | 5 | – | 0.992 | 11 | GAGGCAATTAT |
MZF1_01 | 16 | – | 0.986 | 8 | AGAGGGGA |
| |
Promotorsequenz
P29B6 (555 bp): | |
Matrix | Position | Orientierung | Wert | Länge | Sequenz |
ARNT_01 | -311 | + | 0.964 | 16 | GGACTCACGTGCTGCT |
NMYC_01 | -309 | + | 0.965 | 12 | ACTCACGTGCTG |
USF_01 | -309 | + | 0.985 | 12 | ACTCACGTGCTG |
USF_01 | -309 | – | 0.985 | 12 | CAGCACGTGAGT |
NMYC_01 | -309 | – | 0.956 | 12 | CAGCACGTGAGT |
MYCMAX_02 | -309 | – | 0.972 | 12 | CAGCACGTGAGT |
USF_C | -307 | + | 0.997 | 8 | TCACGTGC |
USF_C | -307 | – | 0.991 | 8 | GCACGTGA |
MZF1_01 | -292 | – | 0.968 | 8 | CATGGGGA |
ELKI_02 | -105 | + | 0.963 | 14 | CTCTCCGGAAGCCT |
CETS1P54_01 | -102 | + | 0.974 | 10 | TCCGGAAGCC |
AP1_Q4 | -42 | – | 0.963 | 11 | AGTGACTGAAC |
AP1FJ_Q2 | -42 | – | 0.961 | 11 | AGTGACTGAAC |
PADS_C | 45 | + | 1.000 | 9 | TGTGGTCTC |
TABELLE
VII
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-