DE69837761T2

DE69837761T2 - 5' ests für sekretierte proteine aus gehirngeweben

Info

Publication number: DE69837761T2
Application number: DE69837761T
Authority: DE
Inventors: Jean-Baptiste Dumas Milne Edwards; Aymeric Duclert; Bruno Lacroix
Original assignee: Serono Genetics Institute SA
Current assignee: Merck Biodevelopment SAS
Priority date: 1997-08-01
Filing date: 1998-07-31
Publication date: 2008-01-17
Anticipated expiration: 2018-08-01
Also published as: AU8555498A; DE69837761D1; PT1000149E; ATE361933T1; WO1999006551A2; DK1000149T3; CA2296809A1; EP1000149A2; WO1999006551A3; JP2001512014A; WO1999006551B1; EP1000149B1; ES2287979T3

Description

Hintergrund der Erfindung
Die geschätzten 50000 bis 100000 Gene, die auf den humanen Chromosomen verteilt sind, bieten ein großes Versprechen für das Verständnis, die Diagnose und die Behandlung humaner Krankheiten. Darüber hinaus finden Sonden, die in der Lage sind, spezifische an Loci zu hybridisieren, die in dem humanen Genom verteilt sind, Anwendungen bei der Konstruktion hoch aufgelöster Chromosomenkarten und bei der Identifikation von Individuen.
In der Vergangenheit war die Charakterisierung selbst eines einzigen humanen Gens ein mühsames Verfahren, das Jahre des Bemühens erforderten. Kürzliche Entwicklungen auf dem Gebiet der Klonierungsvektoren, der DNA-Sequenzierung und der Computertechnik haben zusammen dazu geführt, die Rate mit der humane Gene isoliert, sequenziert, kartiert und charakterisiert werden können, stark zu beschleunigen. Klonierungsvektoren wie z.B. künstliche Hefechromosomen (yeast artificial chromosomes, YACs) und künstliche bakterielle Chromosomen (bacterial artificial chromosomes, BACs) sind in der Lage, DNA-Inserts mit einer Länge im Bereich von 300 bis 1000 Kilobasen (kb) bzw. 100 bis 400 kb aufzunehmen, wodurch die Manipulierung und das Ordnen von DNA-Sequenzen, die über große Distanzen auf den humanen Chromosomen verteilt sind, erleichtert wird. Automatisierte DNA-Sequenzierungsmaschinen erlauben die rasche Sequenzierung humaner Gene. Bioinformatik-Software ermöglicht den Vergleich von Nukleinsäure- und Proteinsequenzen, wodurch sie bei der Charakterisierung humaner Genprodukte behilflich ist.
Derzeit werden zwei verschiedene Ansätze verfolgt, die im humanen Genom verteilt sind, zu charakterisieren. In einem Ansatz werden große Fragmente genomischer DNA isoliert, kloniert und sequenziert. Mögliche offene Leserahmen in diesen genomischen Sequenzen werden unter Verwendung von Bioinformatik-Software identifiziert. Jedoch macht es dieser Ansatz erforderlich, große Abschnitte humaner DNA zu sequenzieren, die nicht für Proteine kodiert, um Proteinkodierende Sequenzen zu finden, die in dem Genom verteilt sind. Neben dem Erfordernis der umfangreichen Sequenzierung kann die Bioinformatik-Software die erhaltenen genomischen Sequenzen falsch charakterisieren. Folglich kann die Software Falschpositive produzieren, in denen nicht-kodierende DNA fälschlich als kodierende DNA charakterisiert wird oder Falschnegative, in denen kodierende DNA als nicht-kodierende DNA falsch bezeichnet wird.
Ein alternativer Ansatz geht einen direkteren Weg zur Identifizierung und Charakterisierung humaner Gene. In diesem Ansatz werden komplementäre DNAs (cDNAs) von den isolierten Messenger-RNAs (mRNAs) synthetisiert, die für humane Proteine kodieren. Bei der Verwendung dieses Ansatzes wird eine Sequenzierung nur mit DNA durchgeführt, die von Proteinkodierenden Teilen des Genoms stammt. Häufig werden nur kurze Abschnitte der DNA sequenziert, um Sequenzen zu erhalten, die exprimierte sequenzmarkierte Stellen (expressed sequence tags, ESTs) genannt werden. Die ESTs können anschließend verwendet werden, um verlängerte cDNAs zu isolieren oder zu reinigen, die Sequenzen enthalten, die benachbart zu den EST-Sequenzen sind. Die verlängerten cDNAs können die gesamte Sequenz der EST enthalten, die verwendet wurde, um sie zu erhalten, oder nur einen Teil der Sequenz der EST, die verwendet wurde, um sie zu erhalten. Darüber hinaus können die verlängerten cDNAs die vollständige kodierende Sequenz des Gens enthalten, von dem die EST abgeleitet war, oder alternativ können die verlängerten cDNAs Teile der kodierenden Sequenz des Gens enthalten, von dem die EST stammt. Es wird einem bewusst sein, dass es mehrere verlängerte cDNAs geben kann, welche die EST-Sequenz als Resultat eines alternativen Splicings oder der Aktivität verschiedener Promotoren enthalten.
In der Vergangenheit wurden diese kurzen EST-Sequenzen häufig aus Oligo-dT-geprimten cDNA-Bibliotheken erhalten. Folglich entsprechen sie hauptsächlich dem 3' untranslatierten Bereich der mRNA. Teilweise ist das Vorherrschen von EST-Sequenzen, die von den 3'-Enden der mRNA stammen, ein Ergebnis der Tatsache, dass übliche Verfahren zum Erhalten von cDNAs zur Isolierung von cDNA-Sequenzen, die von den 5'-Enden der mRNAs abgeleitet sind, nicht gut geeignet sind (Adams et al., Nature 377:3-174, 1996; Hillier et al., Genome Res. 6:807-828, 1996).
Darüber hinaus entsprechen in Fällen, in denen berichtet wurde, dass längere cDNA-Sequenzen erhalten wurden, die bezeichneten Sequenzen üblicherweise kodierenden Sequenzen und enthalten den nicht den vollständigen 5' untranslatierten Bereich der mRNA, von der die cDNA abgeleitet ist. Derartige unvollständige Sequenzen können das erste Exon der mRNA nicht enthalten, insbesondere in Situationen, in denen das erste Exon kurz ist. Darüber hinaus können sie einige Exons nicht enthalten, häufig kür zere, die stromaufwärts der Splicingstellen lokalisiert sind. Folglich gibt es einen Bedarf, Sequenzen zu erhalten, die von den 5'-Enden der mRNAs stammen.
Während zahlreiche Sequenzen, die von humanen Chromosomen stammen, praktische Anwendungen haben, sind Ansätze, die auf der Identifizierung und Charakterisierung solcher chromosomaler Sequenzen basieren, die für ein Proteinprodukt kodieren, für diagnostische und therapeutische Verwendungen besonders relevant. Von den 50000 bis 100000 Protein-kodierenden Genen sind diejenigen Gene, die für Proteine kodieren, die von den Zellen sezerniert werden, in denen sie synthetisiert werden, ebenso wie die sezernierten Proteine selbst, besonders wertvoll als mögliche therapeutische Wirkstoffe. Derartige Proteine sind häufig an der Zell-Zell-Kommunikation beteiligt und können für die Produktion einer klinisch relevanten Antwort in ihren Zielzellen verantwortlich sein.
Tatsächlich werden derzeit mehrere sekretorische Proteine, einschließlich dem Gewebe-Plasminogen-Aktivator (tissue plasminogen activator) G-CSF, GM-CSF, Erythropoetin, dem humanen Wachstumshormon, Insulin, Interferon-α, Interferon-β, Interferon-γ und Interleukin-2 klinisch verwendet. Diese Proteine werden verwendet, um einen weiten Bereich von Krankheitszuständen, einschließlich dem akuten myokardialen Infarkt, dem akuten ischämischen Schlaganfall, der Anämie, der Diabetes, der Wachstumshormondefizienz, Hepatitis, Nierenkarzinom, Chemotherapie-induzierter Neutropenie und multipler Sklerose, zu behandeln. Aus diesen Gründen stellen verlängerte cDNAs, die für sezernierte Proteine oder Teile davon kodieren, eine besonders wertvolle Quelle für therapeutische Wirkstoffe dar. Folglich gibt es einen Bedarf zur Identifizierung und Charakterisierung sezernierter Proteine sowie der Nukleinsäuren, die für sie kodieren.
Sekretorische Proteine sind nicht nur selbst therapeutisch nützlich, sondern umfassen außerdem kurze Peptide, die Signalpeptide genannt werden, an ihren Aminotermini, die ihre Sekretion steuern. Diese Signalpeptide werden von den Signalsequenzen kodiert, die an 5'-Enden der kodierenden Sequenzen der für die sezernierten Proteine kodierenden Gene lokalisiert sind. Da diese Signaipeptide die extrazelluläre Sekretion eines jeden Proteins vermitteln, an das sie funktionell geknüpft sind, können die Signalsequenzen genutzt werden, um die effiziente Sekretion irgendeines Proteins zu steuern, indem die Signalsequenzen funktionell mit einem Gen verbunden werden, das für das Protein kodiert, dessen Sekretion gewünscht ist. Darüber hinaus können auch Teile der Signalsequenzen verwendet werden, um den intrazellulären Import eines Peptids oder Proteins von Interesse zu steuern. Dies könnte sich nützlich bei Gentherapie-Strategien er weisen, in denen es gewünscht wird, ein bestimmtes Genprodukt an andere Zellen zu liefern als die Zelle, in der es produziert wird. Signalsequenzen, die für Signalpeptide kodieren, werden außerdem bei der Vereinfachung von Protein-Reinigungsmethoden angewendet. Bei solchen Verwendungen erleichtert die extrazelluläre Sekretion des gewünschten Proteins die Reinigung deutlich, indem die Anzahl ungewünschter Proteine, aus denen das gewünschte Protein selektiert werden muss, reduziert wird. Folglich gibt es einen Bedarf zur Identifizierung und Charakterisierung der 5'-Bereiche der Gene für sekretorische Proteine, die für Signalpeptide kodieren.
Öffentliche Informationen über die Anzahl humaner Gene, für die die Promotoren und stromaufwärts gelegenen regulatorischen Regionen identifiziert und charakterisiert worden sind, sind ziemlich limitiert. Teilweise könnte dies zurückzuführen sein auf die Schwierigkeit, derartige regulatorische Sequenzen zu isolieren. Stromaufwärts gelegene regulatorische Sequenzen, wie z.B. Bindungsstellen für Transkriptionsfaktoren, sind üblicherweise zu kurz, um als Sonden zur Isolierung von Promotoren aus humanen Genombibliotheken verwendet zu werden. Kürzlich wurden einige Ansätze entwickelt, um humane Promotoren zu isolieren. Einer dieser Ansätze besteht aus der Herstellung einer CpG-Insel-Bibliothek (Cross et al., Nature Genetics 6:236-244, 1994). Der zweite besteht aus der Isolierung humaner genomischer DNA-Sequenzen, die Spel-Bindungsstellen enthalten, durch die Verwendung von Spel-bindenden Proteinen (Mortlock et al., Genome Res. 6:327-335, 1996). Beide Ansätze weisen Limitationen aufgrund eines Fehlens von Spezifität oder Umfassenheit auf.
Die vorliegenden 5'-ESTs können verwendet werden, um stromaufwärts gelegene regulatorische Bereiche effizient zu identifizieren und zu isolieren, welche die Lokalisierung, das Entwicklungsstadium, die Geschwindigkeit und Menge der Proteinsynthese, ebenso wie die Stabilität der mRNA kontrollieren (Theil, BioFactors 4:87-93, 1993). Sobald diese regulatorischen Bereiche identifiziert und charakterisiert wurden, können sie bei der Gentherapie oder bei der Proteinreinigung verwendet werden, um die gewünschte Menge oder Lokalisierung der Proteinsynthese zu erhalten oder die Synthese ungewünschter Genprodukte zu inhibieren, zu reduzieren oder zu verhindern.
Darüber hinaus können die ESTs, die die 5'-Enden sekretorischer Proteingene enthalten, Sequenzen umfassen, die als Sonden zur Chromosomenkartierung oder zur Identifizierung von Individuen nützlich sind. Folglich gibt es einen Bedarf zur Identifizierung und Charakterisierung der Sequenzen, die stromaufwärts der 5' kodierenden Sequenzen von Genen liegen, die für sekretorische Proteine kodieren.
Zusammenfassung der Erfindung
Die vorliegende Erfindung bezieht sich auf ein Signalpeptid, das die Sequenz der Aminosäuren -22 bis -1 der SEQ ID NR: 307 hat. Außerdem werden gereinigte, isolierte oder rekombinante ESTs beschrieben, die Sequenzen enthalten, die von den authentischen 5'-Enden oder ihren korrespondierenden mRNAs stammen. Der Begriff "korrespondierende mRNA" bezieht sich die mRNA, die das Template für die cDNA-Synthese war, die die 5'-EST hervorbrachte. Diese Sequenzen werden hierin im Folgenden als "5'-ESTs" bezeichnet. Wie hierin verwendet, erfordert der Begriff "gereinigt" keinen absolute Reinheit; vielmehr ist er als relative Definition gedacht. Individuelle 5'-EST-Klone, die aus einer cDNA-Bibliothek isoliert wurden, wurden konventionell gereinigt bis zur elektrophoretischen Homogenität. Die aus diesen Klonen erhaltenen Sequenzen konnten nicht direkt aus der Bibliothek oder aus gesamter humaner DNA erhalten werden. Die cDNA-Klone kommen als solche nicht natürlich vor, sondern werden durch Manipulation einer teilweise gereinigten natürlich vorkommenden Substanz (Messenger-RNA) erhalten. Die Konversion von mRNA in eine cDNA-Bibliothek umfasst die Erzeugung einer synthetischen Substanz (cDNA), und reine individuelle cDNA-Klone können durch klonale Selektion aus der synthetischen Bibliothek erhalten werden. Folglich führt die Erzeugung einer cDNA-Bibliothek aus Messenger-RNA und die anschließende Isolierung individueller Klone aus dieser Bibliothek zu einer etwa 10⁴- bis 10⁶-fachen Reinigung der nativen Message. Die Reinigung des Ausgangsmaterials oder natürlichen Materials auf wenigstens eine Größenordnung, vorzugsweise zwei oder drei Größenordnungen, oder noch bevorzugter vier oder fünf Größenordnungen, ist ausdrücklich vorgesehen.
Wie hierin verwendet, erfordert die Bezeichnung "isoliert", dass das Material aus dessen ursprünglichen Umgebung entnommen wird (z.B. der natürlichen Umgebung, wenn es natürlich vorkommt). Zum Beispiel ist ein natürlich vorkommendes Polynukleotid, das in einem lebenden Tier vorhanden ist, nicht isoliert, jedoch dasselbe Polynukleotid, das von einigen oder dem gesamten koexistierenden Material in dem natürlichen System abgetrennt ist, ist isoliert.
Wie hierin verwendet, bedeutet der Begriff "rekombinant", dass die 5'-EST neben einer "Backbone"-Nukleinsäure liegt, neben der sie in ihrer natürlichen Umgebung nicht liegt. Zusätzlich werden die 5'-ESTs, um "angereichert" zu sein, 5% oder mehr der Anzahl von Nukleinsäureinserts in einer Population von Nukleinsäure-Backbone-Molekülen repräsentieren. Backbone-Moleküle gemäß der vorliegenden Erfindung schließen Nukleinsäuren, wie z.B. Expressionsvektoren, selbstreplizierende Nukleinsäuren, Viren, integrierende Nukleinsäuren und andere Vektoren oder Nukleinsäure, die verwendet werden, um ein Nukleinsäureinsert von Interesse aufrechtzuerhalten oder zu manipulieren ein. Vorzugsweise repräsentieren die angereicherten 5'-ESTs 15% oder mehr der Anzahl von Nukleinsäureinserts in der Population rekombinanter Backbone-Moleküle. Bevorzugter repräsentieren die angereicherten 5'-ESTs 50% oder mehr der Anzahl von Nukleinsäureinserts in der Population rekombinanter Backbone-Moleküle. In einer höchstbevorzugten Ausführungsform repräsentieren die angereicherten 5'-ESTs 90% oder mehr der Anzahl von Nukleinsäureinserts in der Population rekombinanter Backbone-Moleküle.
"Stringente", "moderate" und "schwache" Hybridisierungsbedingungen sind wie in Beispiel 29 definiert.
Soweit nicht anders angegeben, ist eine "komplementäre" Sequenz vollständig komplementär. Folglich sind 5'-ESTs in cDNA-Bibliotheken, in den eine oder mehrere 5'-ESTs 5% oder mehr der Anzahl von Nukleinsäureinserts in den Backbone-Molekülen ausmachen, "angereicherte rekombinante 5'-ESTs", wie hierin definiert. Ähnlich sind 5'-ESTs in einer Population von Plasmiden, in denen eine oder mehrere 5'-ESTs gemäß der vorliegenden Erfindung insertiert wurden, so dass sie 5% oder mehr der Anzahl von Inserts in den Plasmid-Backbones ausmachen, "angereicherte rekombinante 5'-ESTs", wie hierin definiert. Jedoch sind 5'-ESTs in cDNA-Bibliotheken, in denen 5'-ESTs weniger als 5% der Anzahl von Nukleinsäureinserts in der Population von Backbone-Molekülen ausmachen, wie z.B. Bibliotheken, in denen Backbone-Molekülen, die ein 5'-EST-Insert aufweisen, sehr rar sind, keine "angereicherten rekombinanten 5'-ESTs".
Insbesondere werden 5'-ESTs beschrieben, die von Genen stammen, die für sezernierte Proteine kodieren. Wie hierin verwendet, ist ein "sezerniertes" Protein eines, um das, wenn es in einer geeigneten Wirtszelle exprimiert wird, über oder durch eine Membran transportiert wird, einschließlich einem Transport als Ergebnis von Signalpeptiden in dessen Aminsosäuresequenz. "Sezernierte" Proteine schließen ohne Einschränkung Proteine ein, die vollständig sezerniert werden (z.B. Flüssigproteine) oder teilweise sezerniert werden (z.B. Rezeptoren) von den Zellen, in denen sie exprimiert werden. "Sezernierte" Proteine schließen außerdem ohne Einschränkung Proteine ein, die über die Membran des endoplasmatischen Reticulums transportiert werden.
Solche 5'-ESTs schließen Nukleinsäuresequenzen ein, die Signalsequenzen genannt werden, die für Signalpeptide kodieren, die die extrazelluläre Sekretion der Proteine steuern, die durch die Gene kodiert werden, von denen die 5'-ESTs abgeleitet sind. Im Allgemeinen sind die Signalpeptide an dem Aminoterminus der sezernierten Proteine lokalisiert.
Sezernierte Proteine werden von Ribosomen translatiert, die mit dem "rauen" endoplasmatischen Reticulum assoziiert sind. Im Allgemeinen werden sezernierte Proteine kotranslationell zu der Membran des endoplasmatischen Reticulums transferiert. Die Assoziation des Ribosoms mit dem endoplasmatischen Reticulum während der Translation sezernierter Proteine wird durch das Signalpeptid vermittelt. Das Signalpeptid wird typischerweise nach dessen kotranslationellen Eintritt in das endoplasmatische Reticulum abgespalten. Nach der Lieferung an das endoplasmatische Reticulum können die sezernierten Proteine durch den Golgi-Apparat weitergehen. In dem Golgi-Apparat können die Proteine einer posttranslationellen Modifikation unterzogen werden, bevor sie in sekretorische Vesikel eintreten, welche sie über die Zellmembran transportieren.
Die hierin beschriebenen 5'-ESTs haben mehrere wichtige Anwendungen. Zum Beispiel können sie verwendet werden, um cDNA-Klone zu erhalten und zu exprimieren, welche die kodierenden Sequenzen des vollständigen Proteins der korrespondierenden Genprodukte enthalten, einschließlich den authentischen Translationsstartstellen, die von den 5'-Enden der kodierenden Sequenzen der mRNAs stammen, von denen die 5'-ESTs abgeleitet sind. Diese cDNAs werden hierin im Folgenden als "vollständig lange cDNAs" bezeichnet. Diese cDNAs können außerdem DNA enthalten, die von mRNA-Sequenzen stromaufwärts der Translationsstartstellen stammen. Die vollständig langen cDNA-Sequenzen können verwendet werden, um die Proteine zu exprimieren, die den 5'-ESTs entsprechen. Wie oben erläutert, sind sezernierte Proteine therapeutisch wichtig. Folglich können die von den cDNAs exprimierten Proteine verwendet werden bei der Behandlung oder dem Beherrschen einer Vielzahl humaner Zustände. Die 5'-ESTs können außerdem verwendet werden, um die korrespondierende/entsprechende genomische DNA zu erhalten. Der Begriff "korrespondierende/entsprechende genomische DNA" bezeichnet die genomische DNA, die die mRNA kodiert, von welcher der 5'-EST abgeleitet wurde.
Alternativ können die 5'-ESTs verwendet werden, um verlängerte cDNAs zu erhalten und zu exprimieren, die für Teile der sezernierten Proteine kodieren. Die Teile können die Signalpeptide der sezernierten Proteine oder die reifen Proteine umfassen, die erzeugt werden, wenn das Signalpeptid abgespalten wird. Die Teile können außerdem Polypeptide umfassen, die wenigstens 10 konsekutive Aminosäuren aufweisen, die durch die verlängerten cDNAs oder vollständig langen cDNAs kodiert werden. Alternativ können die Teile wenigstens 15 konsekutive Aminsäuren umfassen, die von den verlängerten cDNAs oder den vollständig langen cDNAs kodiert werden. In einigen Ausführungsformen können die Teile wenigstens 25 konsekutive Aminosäuren umfassen, die von den verlängerten cDNAs oder vollständig langen cDNAs kodiert werden. In anderen Ausführungsformen können die Teile wenigstens 40 Aminosäuren umfassen, die durch die verlängerten cDNAs oder vollständig langen cDNAs kodiert werden.
Antikörper, die die gesamten sezernierten Proteine spezifisch erkennen, welche von den verlängerten cDNAs, vollständig langen cDNAs oder Fragmenten davon mit wenigstens 10 konsekutiven Aminosäuren, wenigstens 25 konsekutiven Aminosäuren oder wenigstens 40 konsekutiven Aminosäuren, können ebenfalls wie unten beschrieben erhalten werden. Antikörper, die das reife Protein spezifisch erkennen, das erzeugt wird, wenn das Signalpeptid abgespalten wird, können ebenfalls wie unten beschrieben erhalten werden. In ähnlicher Weise können Antikörper, die die Signalpeptide, die durch die verlängerten cDNAs oder vollständig langen cDNAs kodiert werden, erkennen, ebenfalls erhalten werden.
Die verlängerten cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, können die Signalsequenz umfassen. Alternativ können die verlängerten cDNA-Sequenzen, die unter Verwendung der 5'-ESTs erhalten wurden, die vollständigen kodierenden Sequenzen für das reife Protein enthalten (d. h. das Protein, das erzeugt wird, wenn das Signalpeptid abgespalten wird). Zusätzlich können die unter Verwendung der 5'-ESTs erhaltenen cDNAs regulatorische Regionen stromaufwärts der Translationsstartstelle oder stromabwärts des Stoppkodons enthalten, welche die Menge, die Lokalisierung oder das Entwicklungsstadium der Genexpression steuern.
Wie oben erläutert, sind sezernierte Proteine therapeutisch wichtig. Folglich können die Proteine, die von den verlängerten cDNAs oder vollständig langen cDNAs, die unter Verwendung der 5'-ESTs erhalten wurden, exprimiert werden, bei der Behandlung oder dem Beherrschen einer Vielzahl von humanen Zuständen nützlich sein.
Die 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhalten wurden), können verwendet werden bei forensischen Verfahren, um Individuen zu identifizieren oder in diagnostischen Verfahren, um Individuen zu identifizieren, die genetische Krankheiten haben, die aus einer anomalen Expression der Gene resultieren, die den 5'-ESTs entsprechen. Zusätzlich ist die vorliegende Erfindung nützlich zur Konstruktion einer hoch auflösenden Kartierung der humanen Chromosomen.
Die vorliegende Erfindung bezieht sich außerdem auf Sekretionsvektoren, die fähig sind, die Sekretion eines Proteins von Interesse zu steuern. Derartige Vektoren können bei Gentherapiestrategien verwendet werden, in denen es gewünscht ist, ein Genprodukt in einer Zelle zu produzieren, die zu einer anderen Stelle im Körper geliefert werden soll. Sekretionsvektoren können außerdem die Reinigung von gewünschten Proteinen erleichtern.
Die vorliegende Erfindung bezieht sich außerdem auf Expressionsvektoren, die fähig sind, die Expression eines insertierten Gens auf gewünschte räumliche oder zeitliche Art und Weise oder mit einer gewünschten Konzentration zu steuern. Derartige Vektoren können Sequenzen stromaufwärts der 5'-ESTs enthalten, wie z.B. Promotoren oder upstream-regulatorische Sequenzen.
Signalpeptide können an heterologe Proteine fusioniert werden, um deren extrazelluläre Sekretion zu steuern.
Bakterielle Klone, die Bluescript-Plasmide enthalten, die Inserts haben, welche die 5'-EST (SEQ ID NR: 149) enthalten, werden zur Zeit bei 80°C n 4% (v/v) Glycerin in Laboratorien des Erfinders unter den neben der SEQ ID NR: in II aufgeführten Bezeichnungen gelagert. Die Inserts können aus dem hinterlegten Material durch Wachsenlassen der geeigneten Klone in einem geeigneten Medium gewonnen werden. Die Bluescript-DNA kann anschließend unter Verwendung von Plasmid-Isolationsverfahren isoliert werden, welche den Fachleuten auf dem Gebiet bekannt sind, wie z.B. die alkalische Lyse Minipreps- oder alkalische Lyse Plasmid-Isolationsverfahren in großem Maßstab. Wenn dies gewünscht wird, kann die Plasmid-DNA weiter durch Zentrifugation auf einem Cäsiumfluoridgradienten, durch Größen-Ausschlusschromatographie oder Anionenaustauschchromatographie angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann anschließend unter Verwendung von Standard-Klonierungstechniken, die den Fachleuten auf dem Gebiet bekannt sind, manipuliert werden. Alternativ kann eine PCR durchgeführt werden mit Primern, die an beiden Enden der EST-Insertion entworfen werden. Das PCR-Produkt, das dem 5'-EST entspricht, kann dann unter Verwendung von Standard-Klonierungstechniken, die den Fachleuten auf dem Gebiet bekannt sind, manipuliert werden.
Beschrieben wird eine gereinigte oder isolierte Nukleinsäure, die die Sequenz der SEQ ID NR: 149 aufweist oder eine Sequenz, die komplementär dazu ist. In einer Ausführungsform ist die Nukleinsäure rekombinant.
Beschrieben wird eine gereinigte oder isolierte Nukleinsäure, die wenigstens 10 konsekutive Basen der Sequenz der SEQ ID NR: 149 oder eine dazu komplementäre Sequenz umfasst.
Beschrieben wird eine gereinigte oder isolierte Nukleinsäure, die wenigstens 15 konsekutive Basen der Sequenz der SEQ ID NR: 149 oder eine dazu komplementäre Sequenz umfasst. In einer Ausführungsform ist die Nukleinsäure rekombinant.
Weiterhin beschrieben wird eine gereinigte oder isolierte Nukleinsäure mit wenigstens 15 Basen, die in der Lage ist, unter stringenten Bedingungen mit der Sequenz der SEQ ID NR: 149 oder einer Sequenz, die komplementär zu der SEQ ID NR: 149 ist, zu hybridisieren. In einer Ausführungsform ist die Nukleinsäure rekombinant.
Ebenfalls beschrieben wird eine gereinigte oder isolierte Nukleinsäure, die für ein humanes Genprodukt kodiert, wobei das genannte humane Genprodukt eine Sequenz hat, die teilweise durch die Sequenz der SEQ ID NR: 149 kodiert wird.
Ebenfalls beschrieben wird ein Verfahren zur Herstellung eine cDNA, die für ein humanes sekretorisches Protein kodiert, wobei das genannte humane sekretorische Protein teilweise durch die SEQ ID NR: 149 kodiert wird, und das Verfahren die Schritte des Inkontaktbringens einer Sammlung von mRNA-Molekülen aus humanen Zellen mit einem Primer, den wenigstens 15 konsekutive Nukleotide einer Sequenz umfasst, die komplementär zur SEQ ID NR: 149 ist; das Hybridisieren des genannten Primers mit einer mRNA in der genannten Sammlung, die für das genannte Protein kodiert; die reverse Transkription des genannten hybridisierten Primers, um einen ersten cDNA-Strang von der genannten mRNA herzustellen; das Herstellen eines zweiten cDNA-Strangs, der komplementär zu dem ersten cDNA-Strang ist; und das Isolieren der resultierenden cDNA, die für das genannte Protein kodiert, und den genannten ersten cDNA-Strang und den genannten zweiten cDNA-Strang umfasst, umfasst.
Ebenfalls beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes sekretorisches Protein kodiert, wobei das genannte humane sekretorische Protein das Protein umfasst, das durch die SEQ ID NR: 149 oder ein Fragment davon von wenigstens 10 Aminosäuren kodiert wird, wobei die genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA die für das vollständige Protein kodierende Sequenz des genannten Proteins, wobei die Sequenz teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
Ebenfalls beschrieben wird ein Verfahren zur Herstellung einer cDNA, die für ein humanes sekretorisches Protein kodiert, das teilweise durch die SEQ ID NR: 149 kodiert wird, umfassend die Schritte des Erhaltens einer cDNA, umfassend die Sequenz der SEQ ID NR: 149; das Inkontaktbringen der genannten cDNA mit einer detektierbaren Sonde, die wenigstens 15 konsekutive Nukleotide der genannten Sequenz der SEQ ID NR: 149 umfasst oder mit einer Sequenz, die dazu komplementär ist, unter Bedingungen, welche der genannten Sonde erlauben, mit der genannten cDNA zu hybridisieren. Das Identifizieren einer cDNA, die mit der genannten detektierbaren Sonde hybridisiert; und das Isolieren der genannten cDNA, die mit der genannten Sonde hybridisiert.
Ebenfalls beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes sekretorisches Protein kodiert, wobei das genannte humane sekretorische Protein das Protein umfasst, das durch die SEQ ID NR: 149 oder ein Fragment davon mit wenigstens 10 Aminosäuren kodiert wird; wobei die genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA die für das vollständige Protein kodierende Sequenz, die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
Ebenfalls beschrieben wird ein Verfahren zur Herstellung einer cDNA, die die Sequenz der SEQ ID NR: 149 umfasst, umfassend die Schritte des Inkontaktbringens einer Sammlung von mRNA-Molekülen aus humanen Zellen mit einem ersten Primer, der fähig ist, mit dem PolyA-Schwanz der genannten mRNA zu hybridisieren; Hybridisieren des genannten ersten Primers mit dem genannten PolyA-Schwanz; reverse Transkription der genannten mRNA, um einen ersten cDNA-Strang herzustellen; Herstellen eines zweiten cDNA-Strangs, der komplementär zu dem genannten ersten cDNA-Strang ist, unter Verwendung von wenigstens einem Primer, der wenigstens 15 Nukleotide der Se quenz der SEQ ID NR: 149 umfasst; und Isolieren der resultierenden cDNA, die den genannten ersten cDNA-Strang und den genannten zweiten cDNA-Strang umfasst.
Ebenfalls beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes sekretorisches Protein kodiert, wobei das genannte humane sekretorische Protein das Protein umfasst, das durch die SEQ ID NR: 149 oder ein Fragment davon mit wenigstens 10 Aminosäuren kodiert wird, wobei die genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA die kodierende Sequenz für das vollständige Protein, die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
In einer Ausführungsform des Verfahrens, das in den beiden Abschnitten oben beschrieben wird, wird der zweite cDNA-Strang durch Inkontaktbringen des genannten ersten cDNA-Strangs mit einem ersten Primerpaar hergestellt, wobei das genannte erste Primerpaar einen zweiten Primer umfasst, der wenigstens 15 konsekutive Nukleotide der Sequenz der SEQ ID NR: 149 umfasst, sowie einen dritten Primer, der eine Sequenz darin aufweist, die innerhalb der Sequenz des genannten ersten Primers enthalten ist; durch Durchführen einer ersten Polymerasekettenreaktion mit dem genannten ersten Paar der nested Primer, um ein erstes PCR-Produkt zu erzeugen; durch Inkontaktbringen des genannten ersten PCR-Produktes mit einem zweiten Primerpaar, wobei das genannte zweite Primerpaar einen vierten Primer umfasst, und der genannte vierte Primer wenigstens 15 konsekutive Nukleotide der genannten Sequenz der SEQ ID NR: 149 umfasst, sowie einen fünften Primer, wobei die genannten vierten und fünften Primer in der Lage sind, mit Sequenzen innerhalb des genannten ersten PCR-Produktes; und durch Durchführen einer zweiten Polymerasekettenreaktion, wodurch ein zweites PCR-Produkt erzeugt wird.
Ebenfalls beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes sekretorisches Protein kodiert, wobei das genannte sekretorische Protein umfasst, das durch die SEQ ID NR: 149 kodiert wird, oder ein Fragment davon mit wenigstens 10 Aminosäuren, wobei die genannte cDNA mit Hilfe der in dem vorangehenden Abschnitt beschriebenen Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA die kodierende Sequenz für das vollständige Protein, die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
Ebenfalls beschrieben wird das in den vier Abschnitten oben beschriebene Verfahren, in dem der zweite cDNA-Strang mittels dem Kontaktring des genannten ersten cDNA- Strangs mit einem zweiten Primer hergestellt wird, der wenigstens 15 konsekutive Nukleotide der Sequenz der SEQ ID NR: 149 umfasst, durch Hybridisieren des genannten zweiten Primers mit dem genannten ersten cDNA-Strang; und durch Verlängern des genannten hybridisierten zweiten Primers, um den genannten zweiten cDNA-Strang zu erzeugen.
Ebenfalls beschrieben wird eine isolierte oder gereinigte cDNA, die für ein humanes sekretorisches Protein kodiert, wobei das genannte humane sekretorische Protein das Protein umfasst, das teilweise durch die SEQ ID NR: 149 kodiert wird, oder ein Fragment davon mit wenigstens 10 Aminosäuren umfasst, wobei die genannte cDNA mit Hilfe des in dem vorangehenden Abschnitt beschriebenen Verfahrens zu erhalten ist. In einer Ausführungsform umfasst die cDNA die kodierende Sequenz des vollständigen Proteins, die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist.
Ebenfalls beschrieben wird ein Verfahren zur Herstellung eines Proteins, das die Sequenz der SEQ ID NR: 307 umfasst, welches die Schritte des Erhaltens einer cDNA, die für die vollständige Proteinsequenz kodiert, die teilweise in der Sequenz der SEQ ID NR: 149 enthalten ist; das Insertieren der genannten cDNA in einen Expressionsvektor, so dass die genannte cDNA funktionell mit einem Promotor verbunden wird; das Einführen des genannten Expressionsvektors in eine Wirtszelle, wodurch die genannte Wirtszelle das durch die genannte cDNA kodierte Protein produziert; und das Isolieren des genannten Proteins umfasst.
Ebenfalls beschrieben wird ein isoliertes Protein, das mit Hilfe des in dem vorangehenden Abschnitt beschriebenen Verfahrens erhältlich ist.
Ebenfalls beschrieben wird ein Verfahren zum Erhalt einer Promotor-DNA, das die Schritt des Gewinnens von cDNAs, die stromaufwärts der Nukleinsäure der SEQ ID NR: 149 oder von dazu komplementären Sequenzen; das Screenen der genannten Upstream-DNAs, um einen Promotor zu identifizieren, der fähig zur Steuerung der Transkriptionsinitiation ist; und das Isolieren der genannten DNA, die den genannten identifizierten Promotor umfasst, umfasst. In einer Ausführungsform umfasst der Schritt des Erhaltens ein Chromosomen-Walking von der genannten Nukleinsäure der SEQ ID NR: 149 oder einer dazu komplementären Sequenz. In einer weiteren Ausführungsform umfasst der Schritt des Screenens das Insertieren der genannten Upstream-Sequenzen in einen Promotor-Reportervektor. In einer weiteren Ausführungsform umfasst der Schritt des Screenens die Identifizierung von Motiven in den genannten Upstream-DNAs, bei denen es sich um Bindungsstellen für Transkriptionsfaktoren oder Transkriptionsstartstellen handelt.
Ebenfalls beschrieben wird ein isoliertes oder gereinigtes Protein, das die Sequenz der SEQ ID NR: 307 umfasst.
Ebenfalls beschrieben wird die Aufnahme der Sequenz der SEQ ID NR: 149 oder der zu der Sequenz der SEQ ID NR: 149 komplementären Sequenz oder eines Fragmentes davon mit wenigstens 15 konsekutiven Nukleotiden in ein Array einzelner ESTs oder Fragmente davon mit wenigstens 15 Nukleotiden Länge.
Ebenfalls beschrieben wird ein Promotor, der eine Sequenz hat, die ausgewählt ist aus der Gruppe bestehend aus den SEQ ID NRn: 31; 34 UND 37.
Kurze Beschreibung der Abbildungen
1 ist eine Zusammenfassung der Methode zum Erhalt von cDNAs, die so ausgewählt wurden, dass sie die 5'-Enden der mRNAs enthalten, von denen sie abgeleitet sind.
2 zeigt die Verteilung der von Heijne-Auswertung für 5'-ESTs in jeder der hierin beschriebenen Kategorien und die Wahrscheinlichkeit, dass diese 5'-ESTs für ein Signalpeptid kodieren.
3 fasst ein allgemeines Verfahren zusammen, das zum Klonieren und Sequenzieren verlängerter cDNAs verwendet wurde, die an 5'-ESTs angrenzende Sequenzen enthalten.
4 (Beschreibung von Promotorenstrukturen, die von SignalTag 5'-ESTs isoliert wurden) stellt eine schematische Beschreibung isolierten Promotoren zur Verfügung und die Art und Weise wie sie mit den korrespondierenden 5'-Tags zusammengesetzt sind.
Detaillierte Beschreibung der bevorzugten Ausführungsformen
Tabelle IV zeigt eine Analyse der 43 Aminosäuren, die sich an dem N-Terminus sämtlicher humaner SwissProt-Proteine befinden, um die Frequenz von Falschpositiven und Falschnegativen zu bestimmen, unter Verwendung der für die Identifikation von Signalpeptiden hierin beschriebenen Methoden.
Tabelle V zeigt die Verteilung der 5'-ESTs in jeder Kategorie, die hierin beschrieben wird, sowie die Anzahl von 5'-ESTs in jeder Kategorie, die ein bestimmtes Minimum der von Heijne-Punktzahl erreichen.
Tabelle VI zeigt die Verteilung von 5'-ESTs in jeder Kategorie, die hierin beschrieben wird, im Hinblick auf die Gewebe, aus denen die 5'-ESTs der korrespondierenden mRNA erhalten wurden.
Tabelle VII zeigt die Bindungsstellen für Transkriptionsfaktoren, die in jedem dieser Promotoren vorhanden sind.
I. Allgemeine Verfahren zum Erhalt von 5'-ESTs, die von mRNAs mit intakten 5'-Enden abgeleitet sind
Um die hierin beschriebenen 5'-ESTs zu erhalten, müssen mRNAs mit intakten 5'-Enden erhalten werden. Zur Zeit gibt es zwei Ansätze zum Erhalt solcher mRNAs mit intakten 5'-Enden, wie unten beschrieben: entweder chemisch (1) oder enzymatisch (2).
1. Chemische Verfahren zum Erhalt von mRNAs mit intakten 5'-Enden
Einer dieser Ansätze ist ein chemisches Modifikationsverfahren, das die Derivatisierung der 5'-Enden der mRNAs und die Auswahl der derivatisierten mRNAs umfasst. Die 5'-Enden von eukaryontischen mRNAs besitzen eine Struktur, die als "Cap" bezeichnet wird, die eine methyliertes Guanosin an der Position 7 umfassen. Die Cap-Struktur ist an die erste transkribierte Phase der mRNA durch eine 5',5'-Triphosphatbindung angefügt. In einigen Fällen ist das 5'-Guanosin sowohl an den Positionen 2 als auch 7 methyliert. Selten ist das 5'-Guanosin dreifach methyliert an den Positionen 2, 7 und 7. In dem chemischen Verfahren zum Erhalt von mRNAs mit intakten 5'-Enden, wird die 5'-Cap-Struktur spezifisch derivatisiert und an eine reaktive Gruppe auf einem immobilisierenden Substrat gebunden. Diese spezifische Derivatisierung basiert auf der Tatsache, dass nur die Ribose, die mit dem methylierten Guanosin an dem 5'-Ende der mRNA verbunden ist und die Ribose, die mit der Base an dem 3'-Terminus der mRNA verbunden ist, 2',3'-Cis-Diole besitzen.
Optional kann das 2',3'-Cis-Diol der 3'-terminalen Ribose chemisch modifiziert, substituiert, konvertiert oder eliminiert werden, was dazu führt, dass nur die mit dem methylierten Guanosin an dem 5'-Ende der mRNA verbundene Ribose mit einem 2',3'-Cis-Diol verbunden ist. Eine Vielzahl von Methoden sind verfügbar, um das 2',3'-Cis-Diol in der 3'-terminalen Ribose zu eliminieren. Zum Beispiel kann die kontrollierte alkalische Hydrolyse verwendet werden, um mRNA-Fragmente zu erzeugen, in denen die 3'-terminale Ribose ein 3'-Phosphat, 2'-Phosphat oder 2',3'-Cyclophosphat ist. Danach kann das Fragment, das die ursprüngliche 3'-Ribose enthält, aus der Mischung über eine Chromatographie auf eine Oligo-dT-Säule entfernt werden. Alternativ kann eine Base, der das 2',3'-Cis-Diol fehlt, an das 3'-Ende der mRNA unter Verwendung einer RNA-Ligase, wie z.B. der T4 RNA-Ligase angefügt werden. Beispiel 1 unten beschreibt ein Verfahren zum Legieren eines Nukleosiddiphosphates an das 3'-Ende einer Messenger-RNA.
BEISPIEL 1
Ligation des Nukleosiddiphosphates pCp an das 3'-Ende von mRNA
1 μg RNA wurde in einem Endreaktionsmedium von 10 μl in der Gegenwart von 5 U T₄ Phagen-RNA-Ligase in dem von dem Hersteller zur Verfügung gestellten Puffer (Gibco – BRL) inkubiert, 40 U des RNase-Inhibitors Rnasin (Promega) und 2 μl ³²pCp (Amersham #PB 10208). Die Inkubation wurde bei 37°C für 2 Stunden oder über Nacht bei 7-8°C durchgeführt.
Nach der Modifikation oder Elimination des 2',3'-Cis-Diols an der 3'-Ribose kann das 2',3'-Cis-Diol, das an dem 5'-Ende der mRNA vorhanden ist, unter Verwendung von Reagenzien, wie z.B. NaBH₄, NaBH₃CN oder Natriumperiodat oxidiert werden, wodurch das 2',3'-Cis-Diol zu einem Dialdehyd umgewandelt wird. Beispiel 2 beschreibt die Oxidation des 2',3'-Cis-Diols an dem 5'-Ende der mRNA mit Natriumperiodat.
BEISPIEL 2
Oxidation des 2',3'-Cis-Diols an dem 5'-Ende der mRNA mit Natriumperiodat
0,1 OD-Einheit entweder eines Oligoribonukleotids mit Cap-Struktur mit 47 Nukleotiden (einschließlich der Cap oder eines Oligoribonukleotids ohne Cap-Struktur mit 46 Nukleotiden wurden wie folgt behandelt. Die Oligoribonukleotide wurden mittels in vitro-Transkription unter Verwendung des Transkriptionskits "AmpliScribe T7" (Epicentre Technologies) hergestellt. Wie unten angegeben enthielt das DNA-Template für das RNA-Transkript ein einziges Cytosin. Um die RNA ohne Cap zu synthetisieren, wurden vier NTPs in die in vitro-Transkriptionsreaktion eingeschlossen. Um die RNA mit Cap zu erhalten, wurde GTP durch ein Analog der Cap-Struktur, m7G(5')ppp(5')G ersetzt. Diese Verbindung, die von der Polymerase erkannt wird, wurde in das 5'-Ende des im Entste hen begriffenen Transkripts während der Einleitung der Transkription eingebaut, wurde jedoch nicht während des Verlängerungsschrittes eingebaut. Folglich enthielt die resultierende RNA eine Cap-Struktur an deren 5'-Ende. Die Sequenzen der Oligoribonukleotide, die mittels der in vitro-Transkriptionsreaktion hergestellt wurden, waren:
+Cap:

5'm7GpppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NR: 1)

–Cap:

5'-pppGCAUCCUACUCCCAUCCAAUUCCACCCUAACUCCUCCCAUCUCCAC-3' (SEQ ID NR: 2)

Die Oligoribonukleotide wurden in 9 μl Acetatpuffer (0,1 M Natriumacetat, pH 5,2) und 3 μl frisch hergestellter 0,1 M Natriumperiodatlösung gelöst. Die Mischung wurde 1 Stunde lang im Dunkeln oder bei 4°C oder Raumtemperatur inkubiert. Anschließend wurde die Reaktion durch Hinzugeben von 4 μl eines 10%igen Ethylenglycols gestoppt. Das Produkt wurde mit Ethanol präzipitiert, in wenigstens 10 μl Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser dialysiert.
Die resultierenden Aldehydgruppen können anschließend mit Molekülen gekoppelt werden, die eine reaktive Aminogruppe aufweisen, wie z.B. Hydrazin, Carbazid, Thiocarbazid oder Semicarbazidgruppen, um die Anreicherung der 5'-Enden der mRNAs zu erleichtern. Moleküle, die reaktive Aminogruppen aufweisen, die geeignet sind zur Verwendung bei dem Selektieren von mRNAs, die intakte 5'-Enden aufweisen, schließen Avidin, Proteine, Antikörper, Liganden, die fähig sind, spezifisch an Rezeptormoleküle zu binden, oder Oligonukleotide ein. Beispiel 3 unten beschreibt die Kopplung des resultierenden Dialdehyds an Biotin.
BEISPIEL 3
Kopplung des Dialdehyds an das 5'-Ende von Transkripten mit Biotin
Das in Beispiel 2 erhaltene Oxidationsprodukt wurde in 50 μl Natriumacetat bei einem pH zwischen 5 und 5,2 sowie 50 μl frisch hergestellter 0,02 M Lösung von Biotinhydrazid in einer Methoxy/Ethanol-Wassermischung (1:1) mit der Formel
gelöst.
In der in diesen Beispielen verwendeten Verbindung ist n=5. Jedoch wird man erkennen, dass andere, kommerziell erhältliche Hydrazide ebenfalls verwendet werden können, wie z.B. Moleküle der oben genannten Formel, in denen n zwischen 0 und 5 schwankt. Die Mischung wurde anschließend für 2 Stunden bei 37°C inkubiert, mit Ethanol präzipitiert und gegen destilliertes Wasser dialysiert. Beispiel 4 zeigt die Spezifität der Biotinylierungsreaktion.
BEISPIEL 4
Spezifität der Biotinylierung von Transkripten mit Cap
Die Spezifität der Biotinylierung für mRNAs mit Cap wurde mittels Gelelektrophorese der folgenden Proben bestimmt.
Probe 1. Das in Beispiel 2 hergestellte in vitro-Transkript ohne Cap mit 46 Nukleotiden, das wie in Beispiel 1 mit ³²pCp markiert wurde.
Probe 2. Das in Beispiel 2 hergestellte in vitro-Transkript ohne Cap mit 46 Nukleotiden, das wie in Beispiel 1 markiert wurde, mit der Oxidationsreaktion gemäß Beispiel 2 behandelt wurde und den Biotinylierungsbedingungen gemäß Beispiel 3 unterzogen wurde.
Probe 3. Das in Beispiel 2 hergestellte in vitro-Transkript mit Cap mit 47 Nukleotiden, das wie in Beispiel 1 beschrieben mit ³²pCp markiert wurde.
Probe 4. Das in Beispiel 2 hergestellte in vitro-Transkript mit Cap mit 47 Nukleotiden, das wie in Beispiel 1 beschrieben mit ³²pCp markiert wurde, mit der Oxidationsreaktion gemäß Beispiel 2 behandelt wurde und den Biotinylierungsbedingungen gemäß Beispiel 3 unterzogen wurde.
Proben 1 und 2 hatten identische Migrationsraten, was zeigte, dass die RNAs ohne Cap nicht oxidiert oder biotinyliert waren. Probe 3 migrierte langsamer als Proben 1 und 2, während Probe 4 die langsamste Migration zeigte. Die Unterschiede in der Migration der RNA in den Proben 3 und 4 zeigt, dass die RNAs mit Cap spezifisch biotinyliert waren.
In einigen Fällen können RNAs mit intakten 5'-Enden durch Bindung des Moleküls, das eine reaktive Aminogruppe enthält, an ein geeignetes feste Phase-Substrat angereichert werden, wie z.B. das Innere der die mRNAs enthaltenden Gefäßes, magnetische Beads, Chromatographiematrizes oder Nylon- oder Nitrocellulose-Membrane. Zum Beispiel kann, wenn das Molekül mit der reaktiven Aminogruppe ein Biotin ist, das feste Phase-Substrat an Avidin oder Streptavidin gekoppelt werden. Alternativ kann, wenn das Molekül mit der reaktiven Aminogruppe ein Antikörper oder Rezeptorligand ist, das feste Phase-Substrat an das verwandte Antigen oder Rezeptor binden. Schließlich kann, wenn das Molekül mit der reaktiven Aminogruppe ein Oligonukleotid umfasst, das feste Phase-Substrat ein komplementäres Oligonukleotid umfassen.
Die mRNAs mit den intakten 5'-Enden können nach dem Anreicherungsverfahren von der festen Phase freigesetzt werden. Zum Beispiel können die mRNAs, wenn das Dialdehyd an Biotinhydrazid gekoppelt ist und die feste Phase Streptavidin umfasst, von der festen Phase einfach durch Erhitzen auf 95°C in 2% SDS freigesetzt werden. In einigen Verfahren kann das Molekül, das eine reaktive Aminogruppe hat, auch von der mRNA mit intakten 5'-Enden nach der Anreicherung abgespalten werden. Beispiel 5 beschreibt das Abfangen biotinylierter mRNAs mit Beads, die mit Streptavidin beschichtet sind sowie die Freisetzung der biotinylierten mRNAs von den Beads nach der Anreicherung.
BEISPIEL 5
Abfangen und Freisetzen der biotinylierten mRNAs unter Verwendung von mit Streptavidin beschichteten Beads
Die mit Streptavidin beschichteten Beads wurden in Übereinstimmung mit den Angaben des Herstellers (CPG Inc., USA) hergestellt. Die biotinylierten mRNAs wurden zu einem Hybridisierungspuffer (1,5 M NaCl, pH 5-6) gegeben. Nach der Inkubation für 30 Minuten wurde das ungebundene und nicht biotinylierte Material entfernt. Die Beads wurden anschließend mehrere Male in Wasser mit 1% SDS gewaschen. Die so erhaltenen Beads wurden für 15 Minuten bei 95°C in Wasser mit 2% SDS inkubiert.
Beispiel 6 zeigt die Effizienz, mit der biotinylierte mRNAs von mit Streptavidin beschichteten Beads gewonnen wurden.
BEISPIEL 6
Effizienz der Gewinnung biotinylierter mRNAs
Die Effizienz des Gewinnungsverfahrens wurde wie folgt bestimmt. mRNAs mit Cap wurden mit ³²pCp markiert, oxidiert, biotinyliert und an mit Streptavidin beschichtete Beads wie oben beschrieben gebunden. Anschließend wurden die gebundenen RNAs 5, 15 oder 30 Minuten bei 95°C in der Gegenwart von 2% SDS inkubiert.
Die Reaktionsprodukte wurden mittels Elektrophorese auf 12% Polyacrylamidgelen unter denaturierenden Bedingungen (7 M Harnstoff) analysiert. Die Gele wurden einer Autoradiografie unterzogen. Während dieser Manipulation wurden die Hydrazonbindungen nicht reduziert.
Zunehmende Mengen an Nukleinsäuren wurden mit zunehmenden Inkubationszeiten in 2% SDS gewonnen, was zeigt, dass die biotinylierten mRNAs effizient gewonnen wurden.
In einem alternativen Verfahren zum Erhalt von mRNAs mit intakten 5'-Enden wird ein Oligonukleotid, das derivatisiert wurde, so dass es eine reaktive Aminogruppe enthält, spezifisch an mRNAs mit intakten Cap-Strukturen gekoppelt. Vorzugsweise wird das 3'-Ende der mRNA vor dem Schritt, in dem die Aldehydgruppen mit dem derivatisierten Oligonukleotid zusammengebracht werden, wie oben beschrieben blockiert, um zu verhindern, dass das derivatisierte Oligonukleotid mit dem 3'-Ende der mRNA zusammengefügt wird. Zum Beispiel kann pCp an das 3'-Ende der mRNA unter Verwendung der T4 RNA-Ligase wie in Beispiel 1 beschrieben angefügt werden. Jedoch ist das Blockierendes 3'-Endes der mRNA ein optionaler Schritt. Derivatisierte Oligonukleotide können wie in Beispiel 7 beschrieben hergestellt werden.
BEISPIEL 7
Derivatisierung von Oligonukleotiden
Ein Oligonukleotid, das an seinem 3'-Ende phosphoryliert ist, wurde zu einem 3'-Hydrazid in 3' mittels Behandlung mit einer wässrigen Lösung von Hydrazin oder von Hydrazid der Formel H₂N(R1)NH₂ bei etwa 1 bis 3 M und bei einem pH von 4,5 bei einer Temperatur von 8°C über Nacht umgewandelt. Diese Inkubation wurde in der Gegen wart eines Carbodiimid-artigen Agens, das in Wasser löslich ist, wie z.B. 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid mit einer Endkonzentration von 0,3 M durchgeführt.
Das derivatisierte Oligonukleotid wurde anschließend von den anderen Agenzien und Produkten unter Verwendung einer Standardmethode zur Isolierung von Oligonukleotiden getrennt.
Wie oben beschrieben können die mRNAs, die angereichert werden sollen, behandelt werden, um die 3'-OH-Gruppen zu eliminieren, die auf ihnen vorhanden sein können. Dies kann durch enzymatische Ligation, in der Sequenzen erreicht werden, denen ein 31 OH fehlt, wie z.B. pCp, wie in Beispiel 1 beschrieben. Alternativ können die 3'-OH-Gruppen durch alkalische Hydrolyse wie in Beispiel 8 unten beschrieben eliminiert werden.
BEISPIEL 8
Eliminierung der 3'-OH-Gruppen von mRNA unter Verwendung der alkalischen Hydrolyse
In einem Gesamtvolumen von 100 μl 0,1 N Natriumhydroxid werden 1,5 μg für 40 bis 60 Minuten bei 4°C inkubiert. Die Lösung wird mit Essigsäure neutralisiert und mit Ethanol präzipitiert.
Nach der optionalen Eliminierung 3'-OH-Gruppen werden die Diolgruppen an den 5'-Enden der mRNAs wie unten in Beispiel 9 beschrieben oxidiert.
BEISPIEL 9
Oxidation der Diole der mRNA
Bis zu 1 OD-Einheit RNA wurde in 9 μl Puffer (0,1 M Natriumacetat, pH 6-7) oder Wasser sowie 3 μl frisch hergestellter 0,1 M Natriumperiodatlösung gelöst. Die Reaktion wurde 1 Stunde im Dunkeln bei 4°C oder Raumtemperatur inkubiert. Nach der Inkubation wurde die Reaktion durch Hinzufügen von 4 μl 10% Ethylenglycol gestoppt. Anschließend wurde die Mischung bei Raumtemperatur 15 Minuten lang inkubiert. Nach der Ethanolpräzipitation wurde das Produkt in wenigstens 10 μl Wasser oder einem geeigneten Puffer resuspendiert und gegen Wasser dialysiert.
Nach der Oxidation der Diolgruppen an den 5'-Enden der mRNAs wurde das derivatisierte Oligonukleotid mit den resultierenden Aldehyden wie in Beispiel 10 beschrieben verbunden.
BEISPIEL 10
Ligation der Aldehyde der mRNA mit derivatisierten Oligonukleotiden
Die oxidierte mRNA wurde in einem acidischen Medium wie z.B. 50 μl Natriumacetat pH 4-6 gelöst. 50 μl einer Lösung des derivatisierten Oligonukleotids wurden dazugegeben, um ein mRNA:derivatisiertes Oligonukleotid-Verhältnis von 1:20 zu erhalten. Die Mischung wurde mit einem Borhydrid reduziert und für 2 Stunden bei 37°C oder über Nacht (14 Stunden) bei 10°C inkubiert. Die Mischung wurde anschließend mit Ethanol präzipitiert, in 10 μl oder mehr Wasser oder einem geeigneten Puffer resuspendiert und gegen destilliertes Wasser dialysiert. Wenn gewünscht kann das resultierende Produkt unter Verwendung der Acrylamid-Gelelektrophorese, HPLC-Analyse, oder anderen konventionellen Methoden analysiert werden.
Nach dem Anfügen des derivatisierten Oligonukleotids an die mRNAs kann eine reverse Transkriptionsreaktion wie unten in Beispiel 11 beschrieben durchgeführt werden.
BEISPIEL 11
Reverse Transkription der mRNAs, die mit einem derivatisierten Oligonukleotid ligiert sind
Ein Oligodeoxyribonukieotid wurde wie folgt derivatisiert. Drei OD-Einheiten eines Oligodeoxyribonukleotids mit der Sequenz 5'ATCAAGAATTCGCACGAGACCATTA3' (SEQ ID NR: 3), das 5'-OH und 3'-P-Enden hat, wurden in 70 μl einer 1,5 M Hydroxybenzotriazollösung, pH 5,3, hergestellt in Dimethylformamid/Wasser (75:25), enthaltend 2 μg 1-Ethyl-3-(3-dimethylaminopropyl)carbodiimid, gelöst. Die Mischung wurde für 2 Stunden 30 Minuten bei 22°C inkubiert und anschließend zweimal in LiClO₄/Aceton präzipitiert. Das Pellet wurde in 200 μl 0,25 M Hydrazin resuspendiert und bei 8°C zwischen 3 bis 14 Stunden inkubiert. Im Anschluss an die Hydrazinreaktion wurde die Mischung zweimal in LiClO₄/Aceton präzipitiert.
Die Messenger-RNAs, die revers transkribiert werden sollten, wurden aus Blöcken von Plazenta mit Seitenlängen von 2 cm, die bei –80°C gelagert wurden, extrahiert. Gesamt- RNA wurde unter Verwendung herkömmlicher saurer Phenoltechniken extrahiert. Eine Oligo-dT-Chromatographie wurde verwendet, um die mRNAs zu reinigen. Die Intaktheit der mRNAs wurde mittels Northern Blotting überprüft.
Die Diolgruppen auf 7 μg der plazentalen mRNAs wurden oxidiert wie oben in Beispiel 9 beschrieben. Das derivatisierte Oligonukleotid wurde mit den mRNAs wie in Beispiel 10 oben verbunden, außer dass der Präzipitationsschritt durch einen Austausch-Chromatographieschritt ersetzt wurde, um die derivatisierten Oligodeoxyribonukleotide, die nicht an die mRNAs angefügt wurden, zu entfernen. Die Ausschlusschromatographie wurde wie folgt durchgeführt:
10 ml Ultrogel AcA34 (BioSepra #230151)-Gel, eine Mischung aus Agarose und Acrylamid, wurden in 50 ml einer Lösung aus 10 mM Tris pH 8,0, 300 mM NaCl, 1 mM EDTA und 0,05% SDS äquilibriert. Der Mischung wurde erlaubt, zu sedimentieren. Der Überstand wurde entfernt und das Gel wurde in 50 ml Puffer resuspendiert. Dieses Verfahren wurde zwei- oder dreimal wiederholt.
Eine Glaskugel (Durchmesser 3 mm) wurde in eine 2 ml Einwegpipette (Länge 25 cm) eingeführt. Die Pipette wurde mit der Gelsuspension gefüllt, bis sich die Höhe des Gels 1 cm von dem oberen Ende der Pipette stabilisierte. Die Säule wurde anschließend mit 20 ml Äquilibrierungspuffer (10 mM Tris HCl pH 7,4, 20 mM NaCl) äquilibriert.
10 μl der mRNA, die mit dem derivatisierten Oligonukleotid reagiert hatte, wurden in 39 μl von 10 mM Harnstoff und 2 μl Blue-Glycerinpuffer gemischt, der durch Auflösen von 5 mg Bromphenolblau in 60% Glycerin (v/v) und Gabe der Mischung durch einen Filter mit 0,45 μm Durchmesser hergestellt wurde.
Die Säule wurde anschließend mit der an das Oligonukleotid gekoppelten mRNAs beladen. Sobald die Probe durchgedrungen war, wurde Äquilibrierungspuffer dazugegeben. Fraktionen mit 100 μl wurden anschließend gesammelt. Das derivatisierte Oligonukleotid, das nicht an die mRNA angefügt worden war, erschien in Fraktion 16 und späteren Fraktionen. Folglich wurden die Fraktionen 3 bis 15 zusammengegeben und mit Ethanol präzipitiert.
Um festzustellen, ob das derivatisierte Oligonukleotid tatsächlich mit mRNA verbunden war, wurde ein Zehntel der zusammengegebenen Fraktionen zweimal auf einer Nylonmembran gespottet und mit einer radioaktiven Sonde unter Verwendung herkömmlicher Methoden hybridisiert. Die mit ³²P markierte Sonde, die in diesen Hybridisierungen verwendet wurde, war ein Oligodeoxyribonukleotid mit der Sequenz 5'TAATGGTCTCGTGCGAATTCTTGAT3' (SEQ ID NR: 4), die antikomplementär zu dem derivatisierten Oligonukleotid ist. Ein nach der Autoradiografie beobachtetes Signal zeigte an, dass das derivatisierte Oligonukleotid tatsächlich mit der mRNA verbunden war.
Die verbleibenden neun Zehntel der mRNAs, die mit dem derivatisierten Oligonukleotid zur Reaktion gebracht wurden, wurden wie folgt revers transkribiert. Eine reverse Transkriptionsreaktion wurde mit reverser Transkriptase in Übereinstimmung mit den Angaben des Herstellers und 50 pmol Nonameren mit Zufallssequenzen als Primern durchgeführt.
Um sicherzustellen, dass die reverse Transkription durch die Cap-Struktur durchgeführt wurde, wurden zwei Arten von Experimenten durchgeführt.
In dem ersten Ansatz wurde, nachdem die RNA der cDNA:RNA Heteroduplizes, die von der reversen Transkriptionsreaktion erhalten wurden, durch alkalische Hydrolyse entfernt wurden, ein Teil der resultierenden einzelsträngigen cDNAs auf eine positiv geladene Membran gespottet und unter Verwendung herkömmlicher Verfahren mit einer mit ³²P markierten Sonde hybridisiert, die eine Sequenz hat, die identisch zu der des derivatisierten Oligonukleotids ist. Kontrollspots, die 1 pmol, 100 fmol, 50 fmol, 10 fmol und 1 fmol eines Kontroll-Oligodeoxyribonukleotids mit einer Sequenz, identisch zu der des derivatisierten Oligonukleotids ist, wurden eingeschlossen. Das in den Spots, die die cDNA enthielten, erhaltene Signal zeigte, dass etwa 15 fmol des derivatisierten Oligonukleotids revers transkribiert worden waren. Diese Ergebnisse zeigen, dass die reverse Transkription durch die Cap-Struktur hindurch durchgeführt werden kann und, insbesondere, dass die reverse Transkriptase die 5'-P-P-P-5'-Bindung der Cap-Struktur eukaryontischer Messenger-RNAs überwindet.
In der zweiten Ausführung des Experimentes wurden einzelsträngige cDNAs, die aus der oben beschriebenen Synthese des ersten Strangs erhalten wurden, als Templates für PCR-Reaktionen verwendet. Zwei Arten von Reaktionen wurden durchgeführt. Zunächst wurde eine spezifische Amplifikation der mRNAs für alpha-Globin, Dehydrogenase, pp15 und Elongationsfaktor E4 unter Verwendung der folgenden Oligodeoxyribonukleotid-Primerpaare durchgeführt.
alpha-Globin

GLO-S: 5'CCG ACA AGA CCA ACG TCA AGG CCG C3' (SEQ ID NR: 5)
GLO-As: 5'TCA CCA GCA GGC AGT GGC TTA GGA G3' (SEQ ID NR: 6)

Dehydrogenase

3 DH-S: 5'AGT GAT TCC TGC TAC TTT GGA TGG C3' (SEQ ID NR: 7)
3 DH-As: 5'GCT TGG TCT TGT TCT GGA GTT TAG A3' (SEQ ID NR: 8)

pp15

PP15-S: 5'TCC AGA ATG GGA GAC AAG CCA ATT T3' (SEQ ID NR: 9)
PP15-As: 5'AGG GAG GAG GAA ACA GCG TGA GTC C3' (SEQ ID NR: 10)

Elongationsfaktor E4

EFA1-S: 5'ATG GGA AAG GAA AAG ACT CAT ATC A3' (SEQ ID NR: 11)
EF1A-As: 5'AGC AGC AAC AAT CAG GAC AGC ACA G3' (SEQ ID NR: 12)

Zweitens wurden auch nicht-spezifische Amplifikationen mit den Antisense-Oligodeoxyribonukleotiden der oben beschriebenen Paare durchgeführt und mit einem Primer, der von der Sequenz des derivatisierten Oligodeoxyribonukleotids abgeleitet wurde (5'ATCAAGAATTCGCACGAGACCATTA3') (SEQ ID NR: 13).
Ein Zwanzigstel der folgenden RT-PCR-Produktproben wurden auf einem 1,5% Agarosegel laufengelassen und mit Ethidiumbromid gefärbt.
Probe 1: Die Produkte einer PCR-Reaktion unter Verwendung der Globin-Primer der SEQ ID NRn: 5 und 6 in Gegenwart von dazugegebener cDNA.
Probe 2: Die Produkte einer PCR-Reaktion unter Verwendung der Globin-Primer der SEQ ID NRn: 5 und 6 in Abwesenheit von dazugegebner cDNA.
Probe 3: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer der SEQ ID NRn: 7 und 8 in Gegenwart von dazugegebener cDNA.
Probe 4: Die Produkte einer PCR-Reaktion unter Verwendung der Dehydrogenase-Primer der SEQ ID NRn: 7 und 8 in Abwesenheit von dazugegebener cDNA.
Probe 5: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer der SEQ ID NRn: 9 und 10 in Gegenwart von dazugegebener cDNA.
Probe 6: Die Produkte einer PCR-Reaktion unter Verwendung der pp15-Primer der SEQ ID NRn: 9 und 10 in Abwesenheit von dazugegebener cDNA.
Probe 7: Die Produkte einer PCR-Reaktion unter Verwendung der ELF4-Primer der SEQ ID NRn: 11 und 12 in Gegenwart von dazugegebener cDNA.
Probe 8: Die Produkte einer PCR-Reaktion unter Verwendung der ELF4-Primer der SEQ ID NRn: 11 und 12 in Abwesenheit von dazugegebener cDNA.
Eine Bande der erwarteten Größe für das PCR-Produkt wurde nur in den Proben 1, 3, 5 und 7 beobachtet, was das Vorhandensein der korrespondierenden Sequenz in der cDNA-Population anzeigt.
PCR-Reaktionen wurden außerdem mit den Antisensenukleotiden der Globin- und Dehydrogenase-Primern (SEQ ID NRn: 6 und 8) und einem Oligonukleotid, dessen Sequenz der der des derivatisierten Oligonukleotids entspricht, durchgeführt. Das Vorhandensein von PCR-Produkten der erwarteten Größe in den Proben, die den obigen Proben 1 und 3 entsprechen, zeigten, dass das derivatisierte Oligonukleotid mit der mRNA verbunden worden war.
Die obigen Beispiele fassen die chemischen Verfahren zur Anreicherung von mRNAs mit intakten 5'-Enden wie in 1 dargestellt zusammen. Weitere Details bezüglich der chemischen Ansätze zum Erhalt solcher mRNAs sind in der internationalen Anmeldung Nr. WO 96/34981 , veröffentlicht am 7. November 1996, offenbart. Strategien auf Grundlage der oben genannten chemischen Modifikationen der 5'-Cap-Strukturen können verwendet werden, um cDNAs zu erzeugen, die so ausgewählt sind, dass sie die 5'-Enden der mRNAs, von denen sie abgeleitet sind, enthalten. In einer Version derartiger Verfahren werden die 5'-Enden der mRNAs wie oben beschrieben modifiziert. Anschließend wird eine reverse Transkriptionsreaktion durchgeführt, um einen Primer zu verlängern, der komplementär zu dem 5'-Ende der mRNA ist. Einzelsträngige RNAs werden eliminiert, um eine Population von cDNA/mRNA-Heteroduplizes zu erhalten, in denen die mRNA ein intaktes 5'-Ende enthält. Die resultierenden Heteroduplizes können auf einer festen Phase, die mit einem Molekül beschichtet ist, das fähig ist, mit dem für die Derivatisierung des 5'-Endes der mRNA verwendeten Moleküls zu interagieren, abgefangen werden. Anschließend werden die Stränge der Heteroduplizes voneinander getrennt, um einzelsträngige erste cDNA-Stränge zu gewinnen, die das 5'-Ende der mRNA enthalten. Die cDNA-Synthese des zweiten Strangs kann anschließend unter Verwendung her kömmlicher Methoden durchgeführt werden. Zum Beispiel können die in WO 96/34981 oder in Carninci et al., Genomics 37:327-336, 1996, offenbarten Verfahren verwendet werden, um cDNAs zu selektieren, welche die von dem 5'-Ende der kodierenden Sequenz der mRNA abgeleitete Sequenz enthalten.
Nach der Ligation des Oligonukleotid-Tags mit der 5'-Cap-Struktur der mRNA wird eine reverse Transkriptionsreaktion durchgeführt, um einen zu der mRNA des 5'-Endes der mRNA komplementären Primer zu verlängern. Nach der Eliminierung der RNA-Komponente aus der resultierenden Heteroduplex unter Verwendung von Standardmethoden wird die cDNA-Synthese des zweiten Strangs mit einem zu dem Oligonukleotid-Tag komplementären Primer durchgeführt.
2. Enzymatische Verfahren zum Erhalt von mRNAs mit intakten 5'-Enden
Andere Methoden zur Selektion von cDNAs, die sich bis zu dem 5'-Ende der mRNA erstrecken, von denen sie abgeleitet wurden, sind vollständig enzymatisch. Einige Versionen dieser Methoden sind in Dumas Milne Edwards J.B. (Doctoral Thesis of Paris VI University, Le clonage des ADNc complets: difficultes et perspectives nouvelles. Apports pour l'etude de la regulation de l'expression de la tryptophane hydroxylase de rat, 20. Dez. 1993), EPO 625572 und Kato et al, Gene 150:243-250, 1994 offenbart.
Kurz beschrieben wird die isolierte mRNA in solchen Ansätzen mit alkalischer Phosphatase behandelt, um die auf den 5'-Enden unvollständiger mRNAs ohne Cap-Struktur vorhandenen Phosphatgruppen zu entfernen. Im Anschluss an dieses Verfahren wird die Cap, die auf den vollständig langen mRNAs vorhanden ist, enzymatisch mit einem Decapping-Enzym, wie z.B. der T4-Polynukleotidkinase oder der sauren Pyrophosphatase des Tabaks entfernt. Ein Oligonukleotid, das entweder ein DNA-Oligonukleotid oder ein DNA-RNA-Hybridoligonukleotid sein kann, das eine RNA an dessen 3'-Ende aufweist, wird anschließend an das an dem 5'-Ende der mRNA mit entfernter Cap vorhandene Phosphat unter Verwendung von T4-RNA-Ligase ligiert. Das Oligonukleotid kann eine Restriktionsstelle enthalten, um die Klonierung der cDNAs im Anschluss an deren Synthese zu erleichtern. Beispiel 12 unten beschreibt ein enzymatisches Verfahren auf Grundlage der Doktorarbeit von Dumas.
BEISPIEL 12
Enzymatischer Ansatz zum Erhalt von 5'-ESTs
20 μg PolyA+-RNA wurden unter Verwendung von Phosphatase aus dem Kälberdarm, Calf Intestinal Phosphatase (Biolabs), dephosphoryliert. Nach einer Phenol-Chloroform-Extraktion wurde die Cap-Struktur der mRNA unter Verwendung der sauren Phosphatase des Tabaks hydrolysiert (die wie von Shinshi et al, Biochemistry 15:2185-2190, 1976) gereinigt wurde, und ein Hemi-5'DNA/RNA-3'-Oligonukleotid, das ein unphosphoryliertes 5'-Ende aufweist, ein Abschnitt von Adenosinribophosphat an dem 3'-Ende und eine EcoRI-Schnittstelle nahe dem 5'-Ende wurden an die 5'P-Enden der mRNA unter Verwendung der T4-RNA-Ligase (Biolabs) ligiert. Oligonukleotide, die zur Verwendung in diesem Verfahren geeignet sind, weisen vorzugsweise 30 bis 50 Basen Länge auf. Oligonukleotide, die ein unphosphoryliertes 5'-Ende haben, können durch Hinzufügen eines Fluorochroms an dem 5'-Ende synthetisiert werden. Der Einschluss eines Abschnitts von Adenosinribophosphaten an dem 3'-Ende des Oligonukleotids erhöht die Ligationseffizienz. Es wird verstanden, dass das Oligonukleotid andere Klonierungsstellen als EcoRI enthalten kann.
Nach der Ligation des Oligonukleotids an das an dem 5'-Ende der mRNA mit entferntem Cap vorhandene Phosphat wird eine Synthese eines ersten und zweiten cDNA-Strangs unter Verwendung herkömmlicher Verfahren oder den in EPO 625,572 und Kato et al, s.o., und Dumas Milne Edwards, s. o., deren Offenbarung hiermit durch Referenz eingeschlossen sind, durchgeführt. Die resultierende cDNA kann anschließend in Vektoren, wie z.B. den Kato et al., s. o., offenbarten oder anderen Nukleinsäurevektoren, die den Fachleuten auf dem Gebiet bekannt sind, unter Verwendung von Methoden wie den in Sambrook et al., Molecular Cloning: A Laboratory Manual 2d Ed., Cold Spring Harbor Laboratory Press, 1989 beschriebenen ligiert werden.
II. Erhalt und Charakterisierung der 5'ESTs gemäß der vorliegenden Erfindung
Die hierin beschriebenen 5'-ESTs wurden unter Verwendung der oben erwähnten chemischen und enzymatischen Methoden zum Anreichern von mRNAs mit intakten 51 Enden wie unten beschrieben erhalten.
1. Erhalt von 5'-ESTs unter Verwendung von mRNAs mit intakten 5'-Enden
Zunächst wurden mRNAs wie in Beispiel 13 unten beschrieben hergestellt.
BEISPIEL 13
Herstellung von mRNAs mit intakten 5'-Enden
Gesamte humane RNAs oder PolyA⁺-RNAs, die aus 29 verschiedenen Geweben stammten, wurden entsprechend von LABIMO und CLONTECH erworben und verwendet, um 44 cDNA-Bibliotheken wie folgt zu erzeugen. Die gekaufte RNA war aus Zellen oder Geweben unter Verwendung der sauren Guanidinthiocyanat-Phenol-Chloroform-Extraktion isoliert worden (Chomczyniski und Sacchi, Analytical Biochemistry 162:156-159, 1987). PolyA⁺-RNA wurde aus Gesamt-RNA (LABIMO) isoliert durch zwei Durchgänge der Oligo-dT-Chromatographie, wie von Aviv und Leder, Proc. Natl. Acad. Sd. USA 69:1408-1412, 1972 beschrieben, um ribosomale RNA zu eliminieren.
Die Qualität und Integrität der PolyA⁺-RNAs wurde überprüft. Northern Blots, die mit einer Globinsonde hybridisierten, wurden verwendet, um zu bestätigen, dass die mRNAs nicht degradiert waren. Kontaminationen der PolyA⁺-mRNAs durch ribosomale Sequenzen wurde unter Verwendung von Northern Blots und einer von der Sequenz der 28S rRNA abgeleiteten Sonde überprüft. Präparationen der mRNAs mit weniger als 5% rRNAs wurden bei der Konstruktion der Bibliothek verwendet. Um zu vermeiden, dass Bibliotheken mit RNAs konstruiert wurden, die durch exogene Sequenzen (prokaryontisch oder fungal) kontaminiert waren, wurde die Gegenwart bakterieller 16S ribosomaler Sequenzen oder von zwei stark exprimierten Pilz-mRNAs unter Verwendung von PCR untersucht.
Nach der Herstellung der mRNAs wurden die oben beschriebenen chemischen und/oder die enzymatischen Verfahren zum Anreichern von mRNAs mit intakten 5'-Enden angewendet, um 5'-ESTs aus den verschiedenen Geweben zu erhalten. In beiden Ansätzen wurde ein Oligonukleotid-Tag an die 5'-Enden der mRNAs angefügt. Der Oligonukleotid-Tag hatte eine EcoRI-Schnittstelle, um spätere Klonierungsverfahren zu erleichtern. Um die Verarbeitung der einzelsträngigen und doppelsträngigen cDNA zu erleichtern, die bei der Konstruktion der Bibliotheken erhalten wurde, wurde dieselbe Nukleotidsequenz verwendet, um die ligierten Oligonukleotide sowohl in den chemischen als auch enzymatischen Methoden zu konstruieren. Nichtsdestotrotz war der in den chemischen Verfahren verwendete Tag ein Oligodeoxyribonukleotid, das mit der Cap der mRNA verbunden war, während der Tag in der enzymatischen Ligation ein chimeres Hemi-5'DNA/RNA3'-Oligonukleotid war, das an das 5'-Ende der mRNA mit entferntem Cap wie in Beispiel 12 beschrieben ligiert war.
Nach dem Anfügen des Oligonukleotid-Tags an die mRNA entweder durch chemische oder enzymatische Verfahren wurde die Integrität der mRNA mittels Durchführung eines Northern Blots mit 200 bis 500 ng mRNA unter Verwendung einer Sonde, die komplementär zu dem Oligonukleotid-Tag ist, untersucht, bevor die Synthese des ersten Strangs wie in Beispiel 14 beschrieben durchgeführt wurde.
BEISPIEL 14
cDNA-Synthese unter Verwendung von mRNA-Templates mit intakten 5'-Enden
Für die mRNAs, die unter Verwendung sowohl von chemischen als auch enzymatischen Verfahren mit Oligonukleotid-Tags verbunden wurden, wurde die Synthese des ersten Strangs der cDNA unter Verwendung der Superscript II (Gibco BRL) oder der RNase H Minus M-MLV (Promega) reversen Transkriptase mit Zufallsnonameren als Primern durchgeführt. Um interne EcoRI-Schnittstellen in der cDNA vor Verdau in späteren Schritten des Verfahrens zu schützen, wurde methyliertes dCTP für die Synthese des ersten Strangs verwendet. Nach dem Entfernen der RNA durch eine alkalische Hydrolyse wurde der erste Strang der cDNA unter Verwendung von Isopropanol präzipitiert, um restliche Primer zu beseitigen.
Sowohl für die chemischen als auch die enzymatischen Verfahren wurde der zweite Strang der cDNA mit einem Klenow-Fragment unter Verwendung eines Primers synthetisiert, der dem 5'-Ende des in Beispiel 12 beschriebenen Oligonukleotids entspricht. Vorzugsweise ist der Primer 20 bis 25 Basen lang. Methyliertes dCTP wurde ebenfalls für die Synthese des zweiten Strangs verwendet, um die internen EcoRI-Stellen in der cDNA vor dem Verdau während des Klonierungsverfahrens zu schützen.
Nach der cDNA-Synthese wurden die cDNAs in pBlue Script wie in Beispiel 15 unten beschrieben kloniert.
BEISPIEL 15
Klonierung der von mRNA mit intakten 5'-Enden abgeleiteten cDNAs in Blue Script
Nach der Synthese des zweiten Strangs wurden die Enden der cDNA mit T4 DNA-Polymerase (Biolabs) stumpf gemacht, und die cDNA wurde mit EcoRI verdaut. Da während der cDNA-Synthese methyliertes dCTP verwendet wurde, war die in dem Tag vorhandene EcoRI-Schnittstelle die einzige hemi-methylierte Schnittstelle, und folglich die einzige Stelle, die empfindlich gegenüber einem Verdau mit EcoRI war. Die cDNA wurde anschließend nach Größe fraktioniert unter Verwendung einer Austauschchroma tographie (AcA, Biosepra) und Fraktionen, die den cDNAs mit einer Länge von mehr als 150 bp entsprachen, wurden vereinigt und mit Ethanol präzipitiert. Die cDNA wurde direkt in die SmaI- und ExoRI-Enden des Phagemids pBlue Script-Vektors (Stratagene) kloniert. Die Ligationsmischung wurde in Bakterien elektroporiert und unter einer geeigneten Selektion mit Antibiotikum propagiert.
Klone, die den Oligonukleotid-Tag angefügt enthielten, wurden anschließend wie in Beispiel 16 unten beschrieben selektiert.
BEISPIEL 16
Selektion der Klone, die den Oligonukleotid-Tag angefügt haben
Die Plasmid-DNAs, die 5'-EST-Bibliotheken enthielten, wurden wie oben beschrieben gereinigt (Qiagen). Eine positive Selektion der mit einem Tag versehenen Klone wurde wie folgt durchgeführt. Kurz beschrieben wurde die Plasmid-DNA in diesem Selektionsverfahren unter Verwendung der Gen II-Endonuklease des F1-Phagens in Kombination mit einer Exonuklease zu einzelsträngiger DNA umgewandelt (Chang et al., Gene 127:95-8, 1993), wie z.B. der Exonuklease III oder T7 Gen 6-Exonuklease. Die resultierende einzelsträngige wurde anschließend unter Verwendung von paramagnetischem Dienst wie von Fry et al., Biotechniques, 13:124-131, 1992 gereinigt. In diesem Verfahren wurde die einzelsträngige DNA mit einem biotinyliertem Oligonukleotid hybridisiert, das eine Sequenz aufweist, die dem 3'-Ende des in Beispiel 13 beschriebenen Oligonukleotids entspricht. Vorzugsweise hat der Primer eine Länge von 20 bis 25 Basen. Klone, die eine Sequenz enthalten, die komplementär zu dem biotinylierten Oligonukleotid ist, wurden durch Inkubation mit magnetischen Beads, die mit Streptavidin beschichtet sind, mittels magnetischer Selektion gewonnen. Nach der Gewinnung der positiven Klone wurde die Plasmid-DNA von den magnetischen Beads freigesetzt und unter Verwendung einer DNA-Polymerase, wie z.B. der von Amersham Pharmacia Biotech. erhaltenen Thermosequenase, in doppelsträngige DNA umgewandelt. Alternativ können Protokolle, wie z.B. das in dem Gene Trapper-Kit, das von Gibco BRL erhältlich ist, beschriebene, verwendet werden. Die doppelsträngige DNA wurde anschließend in Bakterien elektroporiert. Es wurde geschätzt, dass die Prozentzahl positiver Klone, welche das 5'-Tag-Oligonukleotid aufweisen, üblicherweise zwischen 90 und 98% unter Verwendung der Dot Blot-Analyse lagen.
Nach der Elektroporation wurden die Bibliotheken in 384 Mikrotiterplatten (MTP) angeordnet. Eine Kopie der MTP wurde für zukünftige Verwendungen gelagert. Anschließend wurden die Bibliotheken in 96 MTP transferiert und wie unten beschrieben sequenziert.
BEISPIEL 17
Sequenzierung der Inserts in ausgewählten Klonen
Die Plasmid-Inserts wurden zunächst mittels PCR auf PE 9600-Thermocyclern (perkin-Elmer, Applied Biosystems Division, Foster City, CA) unter Verwendung von SETA-A und SETA-B-Standardprimern (Genset SA), AmpliTaqGold (Perkin-Elmer), dNTPs (Boehringer), Puffer und Zyklusbedingungen, wie sie von dem Unternehmen Perkin-Elmer empfohlen werden, amplifiziert.
Die PCR-Produkte wurden anschließend unter Verwendung eines automatischen ABI Prism 377-Sequenzierers (Perkin-Elmer) sequenziert. Die Sequenzierungsreaktionen wurden unter Verwendung von PE 9600-Thermocyclern mit Farbstoff-Primer-Standardchemie und Thermosequenase (Amersham Pharmacia Biotech) durchgeführt. Die verwendeten Primer waren entweder T7 oder 221M13 (erhältlich von Genset SA), wie geeignet. Die Primer wurden mit JOE-, FAM-, ROX- und TAMRA-Farbstoffen markiert. Die in den Sequenzierungsreaktionen dNTPs und ddNTPs wurden von Boehringer erworben. Der Sequenzierungspuffer, Reagenzienkonzentrationen und Zyklusbedingungen waren wie von Amersham empfohlen.
Nach der Sequenzierungsreaktion wurden die Proben mit Ethanol präzipitiert, in Formamid-Ladepuffer resuspendiert und auf ein 4% Standard-Acrylamidgel geladen. Die Elektrophorese wurde für 2,5 Stunden bei 3000 V auf einem ABI 377-Sequenzierer durchgeführt, und die Sequenzierungsdaten wurden unter Verwendung der ABI Prism DNA-Sequenzierungs-Analysesoftware, Version 2.1.2, gewonnen und analysiert.
2. Computeranalyse der erhaltenen 5'-ESTs: Konstruktion von NetGene- und SignalTag-Datenbanken
Die Sequenzdaten der 44 cDNA-Bibliotheken, die wie oben beschrieben hergestellt wurden, wurden in eine geeignete Datenbank transferiert, in der die Kontrolle der Qualität und Auswertungsschritte durchgeführt wurden. Ein geschützter Base-Caller, der unter Verwendung eines Unix-Systems arbeitet, markierte automatisch mutmaßliche Peaks, wobei die Form der Peaks berücksichtigt wurde, die Zwischenpeakauflösung und der Geräuschpegel. Der geschützte Base-Caller führte außerdem ein automatisches Zurechtschneiden durch. Jeder Abschnitt mit 25 oder weniger Basen, der mehr als vier verdächtige Peaks aufwies, wurde als unzuverlässig betrachtet und verworfen. Sequenzen, die den Klonierungsvektor oder den Ligierungsoligonukleotiden entsprachen, wurden automatisch aus den EST-Sequenzen entfernt. Jedoch können die resultierenden EST-Sequenzen 1 bis 5 Basen enthalten, die zu den oben genannten Sequenzen gehören, an ihren 5'-Enden. Wenn dies erforderlich ist, können diese leicht auf einer Einzelfallgrundlage entfernt werden. Nach der Durchführung der Sequenzierung wie oben beschrieben wurden die Sequenzen der 5'-ESTs in NetGene^TM, einer geschützten Datenbank, die zur Lagerung und Manipulation wie unten beschrieben erforderlich ist, eingegeben. Die Fachleute auf dem Gebiet werden verstehen, dass die Daten in jedem Medium, dass von einem Computer gelesen und zugänglich ist, gelagert und manipuliert werden könnten. Computerlesbare Medien schließen magnetische, optische oder elektronische lesbare Medien ein. Zum Beispiel kann das computerlesbare Medium eine Festplatte, Diskette, ein Magnetband, CR-ROM, RAM oder ROM ebenso wie andere Arten weiterer Medien, die den Fachleuten auf dem Gebiet bekannt sind, sein.
Darüber hinaus können die Sequenzdaten in einer Vielzahl von Datenprozessorprogrammen in verschiedensten Formaten gespeichert und manipuliert werden. Zum Beispiel können die Sequenzdaten als Text in einem Worddokument gespeichert werden, wie z.B. Microsoft Word oder Word Perfect, oder als ASCII-Datei in einer Vielzahl von Datenprogrammen, die den Fachleuten auf dem Gebiet bekannt sind, wie z.B. DB2, SYBASE oder ORACLE.
Die computerlesbaren Medien, auf denen die Sequenzinformation gespeichert ist, können in einen Personalcomputer, einem Netzwerk, einem Server oder anderen Computersystemen, die den Fachleuten auf dem Gebiet bekannt sind, sein. Das Computersystem oder andere System beinhaltet vorzugsweise die oben beschriebenen Speichermedien sowie einen Prozessor, um auf die Sequenzdaten zuzugreifen und sie zu manipulieren. Sobald die Sequenzdaten gespeichert wurden, können sie manipuliert und recherchiert werden, um solche gespeicherten Sequenzen zu lokalisieren, die eine gewünschte Nukleinsäuresequenz enthalten oder die für ein Protein mit einer bestimmten funktionellen Domäne kodieren. Zum Beispiel kann die gespeicherte Sequenzinformation mit anderen Sequenzen verglichen werden, um Homologien zu identifizieren, Motive, die mit biologischen Funktionen im Zusammenhang stehen oder strukturelle Motive.
Programme, die verwendet werden können, um die gespeicherten Sequenzen zu recherchieren oder zu vergleichen, schließen die Programmserien MacPattern (EMBL), BLAST und BLAST2 (NCBI) ein, die Basic local alignment search tool programs für Nukleotide (BLASTN) und Peptide (BLASTX) Vergleiche (Altschul et al., J. Mol. Biol. 215:403, 1990) und FASIA (Pearson und Lipman, Proc. Natl. Acad. Sci. USA 85:2444, 1988). Die BLAST-Programme erweitern dann die Alignments auf Grundlage definierter Kriterien zur Übereinstimmung und Nichtübereinstimmung.
Motive, die unter Verwendung der oben genannten Programme sowie den in Beispiel 28 beschriebenen ermittelt werden können, schließen Sequenzen ein, die für Leucin-Zipper, Helix-turn-Helix-Motive, Glycosylierungsstellen, Ubiquitinierungsstellen, alpha-Helices und beta-Faltblätter, für Signalsequenzen, die für Signalpeptide kodieren, welche die Sekretion der kodierten Proteine steuern, Sequenzen, die an der Transkriptionssteuerung beteiligt sind, wie z.B. Homeoboxen, acidische Abschnitte, enzymatische Aktivierungsstellen, Substratbindungsstellen und enzymatische Spaltstellen kodieren.
Bevor die cDNAs in der NetGene^TM-Datenbank nach Sequenzmotiven von Interesse durchsucht werden, wurden die cDNAs, die von RNAs stammten, welche nicht von Interesse waren, identifiziert und aus der weiteren Betrachtung wie in Beispiel 18 unten beschrieben, ausgenommen.
BEISPIEL 18
Ausschließen ungewünschter Sequenzen von der weiteren Betrachtung
5'-ESTs in der NetGene^TM-Datenbank, die von ungewünschten Sequenzen abgeleitet waren, wie z.B. Transfer-RNAs, ribosomalen RNAs, mitochondrialen RNAs, prokaryontischen RNAs, Pilz-RNAs, Alusequenzen, L1-Sequenzen oder Wiederholungssequenzen, wurden unter Verwendung der FASIA- und BLASTN-Programme mit den in Tabelle 1 angegebenen Parametern identifiziert.
Um 5'-ESTs, die für tRNAs kodieren, aus der weiteren Betrachtung auszuschließen, wurden die 5'-EST-Sequenzen mit den Sequenzen von 1090 bekannten tRNAs verglichen, die von dem EMBL Release 38 stammten, von denen 100 menschlich war. Der Vergleich wurde unter Verwendung von FASIA auf beiden Strängen der 5'-ESTs durchgeführt. Die Sequenzen, die mehr als 80% Homologie über einen Bereich von mehr als 60 Nukleotiden aufwiesen, wurden als tRNAs identifiziert. Von den 144341 untersuchten Sequenzen wurden 26 als tRNAs identifiziert und von der weiteren Betrachtung ausgeschlossen.
Um 5'-ESTs von der weiteren Betrachtung auszuschließen, die für rRNAs kodieren, wurden die 5'-EST-Sequenzen mit den Sequenzen von 2497 bekannten rRNAs verglichen, die von EMBL Release 28 erhalten wurden, von denen 73 human waren. Der Vergleich wurde unter Verwendung von BLASTN auf beiden Strängen der 5'-ESTs mit dem Parameter S=108 durchgeführt. Sequenzen, die mehr als 80% Homologie über Abschnitte mit einer Länge von mehr als 40 Nukleotiden aufwiesen, wurden als rRNAs identifiziert. Von den 144341 untersuchten Sequenzen wurden 3312 als rRNAs identifiziert und von der weiteren Betrachtung ausgeschlossen.
Um 5'-ESTs von der weiteren Betrachtung auszuschließen, die für mtRNAs kodieren, wurden die 5'-EST-Sequenzen mit den Sequenzen von 2 bekannten mitochondrialen Genomen verglichen, für die die gesamten genomischen Sequenzen erhältlich sind sowie sämtliche transkribierte Sequenzen von diesen mitochondrialen Genomen, einschließlich tRNAs, rRNAs und mRNAs für insgesamt 38 Sequenzen. Der Vergleich wurde unter Verwendung von BLASTN auf beiden Strängen der 5'-ESTs mit dem Parameter S=108 durchgeführt. Sequenzen, die mehr als 80% Homologie über Abschnitte mit einer Länge von mehr als 40 Nukleotiden aufwiesen, wurden als mtRNAs identifiziert. Von den 144341 untersuchten Sequenzen wurden 6110 als mtRNAs identifiziert und von der weiteren Betrachtung ausgeschlossen.
Sequenzen, die von exogenen Kontaminanten stammen könnten, wurden von der weiteren Betrachtung durch Vergleich der 5'-EST-Sequenzen mit Release 46 der EMBL Bakteriellen Abteilung und Pilz-Abteilung unter Verwendung von BLASTN mit dem Parameter S=144 verglichen. Alle Sequenzen, die mehr als 90% Homologie über einen Bereich von wenigstens 40 Nukleotiden aufwiesen, wurden als exogene Kontaminanten identifiziert. Von den 42 untersuchten cDNA-Bibliotheken waren die durchschnittlichen Prozentzahlen prokaryontischer Sequenzen und Pilzsequenzen, die darin enthalten waren, 0,2% bzw. 0,5%. Unter diesen Sequenzen konnte nur eine als eine pilzspezifische Sequenz identifiziert werden. Die anderen waren entweder Pilz- oder prokaryontische Sequenzen, die Homologien zu vertebraten Sequenzen aufwiesen oder Wiederholungssequenzen enthielten, die während dem elektronischen Vergleich nicht ausgeblendet worden waren.
Zusätzlich wurden die 5'-ESTs mit 6093 Alusequenzen und 1115 Li-Sequenzen verglichen, um 5'-ESTs auszublenden, die derartige Wiederholungssequenzen enthalten. 5'-ESTs, die THE- und MER-Wiederholungen, SSTR-Sequenzen oder Satelliten, Mikrosatelliten oder telomere Wiederholungen enthalten, wurden ebenfalls von der weiteren Betrachtung ausgeschlossen. Im Durchschnitt enthielten 11,5% der Sequenzen in den Bibliotheken Wiederholungssequenzen. Von diesen 11,5% enthielten 7% Aluwiederholungen, 3,3% enthielten L1-Wiederholungen und die verbleibenden 1,2% waren von den anderen untersuchten Arten repetitiver Sequenzen abgeleitet. Diese Prozentzahlen sind in Übereinstimmung mit den in cDNA-Bibliotheken festgestellten, die von anderen Forschungsgruppen hergestellt wurden. Zum Beispiel enthielten die cDNA-Bibliotheken von Adams et al. zwischen 0% und 7,4% Aluwiederholungen, abhängig von der Quelle der RNA, die zur Herstellung der cDNA-Bibliothek verwendet wurde (Adams et al, Nature 377:174, 1996).
Die Sequenzen solcher 5'-ESTs, die nach der Eliminierung ungewünschter Sequenzen zurückblieben, wurden mit den Sequenzen bekannter humaner mRNAs verglichen, um die Genauigkeit der oben beschriebenen Sequenzierungsmethoden zu bestimmen.
BEISPIEL 19
Bestimmen der Sequenzierungsgenauigkeit durch Vergleich mit bekannten Sequenzen
Um weiterhin die Genauigkeit des oben beschriebenen Sequenzierungsverfahrens zu bestimmen, wurden die Sequenzen der von bekannten Sequenzen abgeleiteten 5'-ESTs identifiziert und mit den originalen bekannten Sequenzen verglichen. Zuerst wurde eine FASTA-Analyse mit Überhängen von einer Länge von weniger als 5 bp an beiden Enden auf den 5'-ESTs durchgeführt, um solche ESTs zu identifizieren, die mit einem Eintrag in der öffentlichen humanen mRNA-Datenbank übereinstimmen. Die 6655 5'-ESTs, die mit einer bekannten humanen mRNA übereinstimmten, wurden anschließend mit ihrer verwandten mRNA realigned, und eine dynamische Programmierung wurde verwendet, um Substitutionen, Insertionen und Deletionen in der Liste "Fehler", die erkannt werden würden, einzuschließen. Fehler, die in den letzten zehn Basen der 5'-EST-Sequenzen auftraten, wurden ignoriert, um den Einschluss störender Klonierungsstellen bei der Analyse der Sequenzierungsgenauigkeit zu vermeiden.
Diese Analyse zeigte, dass die in die NetGene^TM-Datenbank eingefügten Sequenzen eine Genauigkeit von mehr als 99,5% aufwiesen.
Um die Effizienz zu bestimmen, mit der die oben beschriebenen Selektionsverfahren cDNAs auswählen, die die 5'-Enden ihrer entsprechenden mRNAs einschließen, wurde die folgende Analyse durchgeführt.
BEISPIEL 20
Bestimmung der Effizienz der 5'-EST-Auswahl
Um die Effizienz zu bestimmen, mit der das oben genannte Selektionsverfahren 5'-ESTs isolierte, die Sequenzen nahe dem 5'-Ende der mRNAs enthalten, von denen sie abgeleitet sind, wurden die Sequenzen der Enden der 5'-ESTs, die von den Genen der Untereinheit α des Elongationsfaktors 1 und der schweren Kette von Ferritin abgeleitet sind, mit den bekannten cDNA-Sequenzen dieser Gene verglichen. Da die Transkriptionsstartstellen beider Gene gut charakterisiert sind, können sie verwendet werden, um die Prozentzahl abgeleiteter 5'-ESTs zu bestimmen, welche die authentischen Transkriptionsstartstellen beinhalten.
Für beide Gene enthielten mehr als 95% der erhaltenen 5'-ESTs tatsächlich Sequenzen nahe der 5'-Enden oder stromaufwärts der 5'-Enden der entsprechenden mRNAs.
Um die Analyse auf die Zuverlässigkeit des Verfahrens zur Isolierung von 5'-ESTs aus ESTs in der NetGene^TM-Datenbank auszudehnen, wurde eine ähnliche Analyse unter Verwendung einer Datenbank durchgeführt, die aus humanen mRNA-Sequenzen zusammengesetzt, die aus der GenBank-Datenbank Release 97 stammen, zum Vergleich. Die 5'-Enden von mehr als 85% der 5'-ESTs, die von mRNAs abgeleitet sind, die in der GenBank-Datenbank enthalten sind, wurden nahe den 5'-Enden der bekannten Sequenz lokalisiert. Da einige der mRNA-Sequenzen, die in der GenBank-Datenbank verfügbar sind, von genomischen Sequenzen abgeleitet sind, wird ein Übereinstimmen des 5'-Endes mit diesen Sequenzen als eine interne Übereinstimmung gezählt. Folglich unterschätzt das hierin verwendete Verfahren die Ausbeute an ESTs, die die authentischen 5'-Enden ihrer korrespondierenden mRNAs enthalten.
Die oben hergestellten EST-Bibliotheken enthielten mehrere 5'-ESTs, die von derselben mRNA abgeleitet waren. Die Sequenzen solcher 5'-ESTs wurden miteinander verglichen, und die längste 5'-EST für jede mRNA wurde identifiziert. Überlappende cDNAs wurden in kontinuierliche Sequenzen (contigs) zusammengesetzt. Die resultierenden fortlaufenden Sequenzen wurden anschließend mit öffentlichen Datenbanken verglichen, um ihre Ähnlichkeit mit bekannten Sequenzen zu ermitteln, wie in Beispiel 21 unten beschrieben.
BEISPIEL 21
Clustering der 5'-ESTs und Berechnung der Neuheitsindizes für cDNA-Bibliotheken
Für jede sequenzierte EST-Bibliothek wurden die Sequenzen mittels der 5'-Enden in Clustern angeordnet. Jede Sequenz in der Bibliothek wurde mit anderen mit BLASTN2 verglichen (direkter Strang, Parameter S=107). ESTs mit High Scoring Segment Pairs (HSPs) von wenigstens 25 bp Länge, die 95% identische Basen aufwiesen und mehr als 10 bp von jedem 5'-Ende begannen, wurden gruppiert. Die längste in dem Cluster gefundene Sequenz wurde als repräsentative Sequenz der Gruppe verwendet. Ein allgemeines Clustering zwischen den Bibliotheken wurde anschließend durchgeführt, was zu der Definition von Super-Contigs führte.
Um die Ausbeute neuer Sequenzen innerhalb der EST-Bibliotheken zu bestimmen, wurde eine Neuheitsrate (novelty rate, NR) bestimmt, die definiert war als: NR = 100 X (Anzahl der neuen einzigartigen Sequenzen, die in der Bibliothek gefunden wurden/gesamte Anzahl von Sequenzen aus der Bibliothek). Oblicherweise lag die Neuheitsrate im Bereich zwischen 10% und 41%, abhängig von dem Gewebe, aus dem die EST-Bibliothek erhalten wurde. Für die meisten Bibliotheken wurde eine Zufallssequenzierung der 5'-EST-Bibliotheken fortgeführt, bis die Neuheitsrate 20% erreichte.
Nach der Charakterisierung wie oben beschrieben wurde die Sammlung an 5'-ESTs in NetGene^TM untersucht, um solche 5'-ESTs zu identifizieren, die eine mögliche Signalsequenz enthielten, wie in Beispiel 22 unten beschrieben.
BEISPIEL 22
Identifikation möglicher Signalsequenzen in 5'-ESTs
Die 5'-ESTs in der NetGene^TM-Datenbank wurden untersucht, um solche zu identifizieren, die einen ununterbrochenen offenen Leserahmen (open reading frame, ORF) aufwiesen, der länger als 45 Nukleotide war und mit einem ATG-Kodon begann und bis zu dem Ende der EST fortlief. Etwa die Hälfte der cDNA-Sequenzen in NetGene^TM enthielten solch einen ORF. Die ORFs dieser 5'-ESTs wurden anschließend untersucht, um mögliche Signalmotive zu identifizieren, unter Verwendung von leichten Abänderungen des Verfahrens, das in von Heijne, Nucleic Acids Res. 14:4683-4690, 1986, offenbart ist. Solche 5'-EST-Sequenzen, die für einen Abschnitt von wenigstens 15 Aminosäuren Länge mit einem Wert von wenigstens 3,5 in der von Heijne Signalpeptid-Identifikationsmatrix, wurden als eine Signalsequenz besitzend betrachtet. Solche 5'-ESTs, die mit einer bekannten humanen mRNA oder EST-Sequenz übereinstimmten und ein 5'-Ende mit mehr als 20 Nukleotiden stromabwärts des bekannten 5'-Endes enthielten, wurden von der weiteren Analyse ausgeschlossen. Die übrigbleibenden cDNAs, die eine Signalsequenz beinhalteten, wurden in eine Datenbank eingefügt, die Signal-Tag^TM heißt.
Um die Genauigkeit des obigen Verfahrens zur Identifizierung von Signalsequenzen zu bestätigen, wurde die Analyse gemäß Beispiel 23 durchgeführt.
BEISPIEL 23
Bestätigung der Genauigkeit der Identifikation möglicher Signalsequenzen in 5'-ESTs
Die Genauigkeit des oben genannten Verfahrens zur Identifizierung von Signalsequenzen, die für Signalpeptide kodieren, wurde durch Anwenden des Verfahrens auf die 43 Aminosäuren, die an dem N-Terminus sämtlicher humaner SwissProt-Proteine lokalisiert sind, bestimmt. Der computerberechnete von Heijne-Wert für jedes Protein wurde mit der bekannten Charakterisierung des Proteins verglichen, und zwar als ein sezerniertes Protein oder als ein nichtsezerniertes Protein. Auf diese Weise wurde die Anzahl nichtsezernierter Proteine, die einen Wert höher als 3,5 haben (Falschpositive) und die Anzahl sezernierter Proteine, die einen Wert niedriger als 3,5 haben (Falschnegative) konnte berechnet werden.
Unter Verwendung der Ergebnisse der obigen Analyse wurde die Wahrscheinlichkeit, dass ein durch die 5'-Region der mRNA kodiertes Peptid tatsächlich ein echtes Signalpeptid aufgrund seines von Heijne-Wertes ist, auf Grundlage entweder der Annahme, dass 10% der Humanproteine sezerniert sind oder auf Grundlage der Annahme, dass 20% der Humanproteine sezerniert werden, berechnet. Die Ergebnisse dieser Analyse sind in 2 und Tabelle IV gezeigt.
Unter Verwendung des obigen Verfahrens zur Identifikation sekretorischer Proteine wurden 5'-ESTs der folgenden Peptide erhalten, von denen bekannt ist, dass sie sezerniert werden: humanes Glucagon, Gammainterferon-induzierter monokiner Vorläufer, sezer niertes Cyclophilin-ähnliches Protein, humanes Pleiotropin und humaner Biotinidasevorläufer. Folglich identifizierte das obige Verfahren erfolgreich solche 5'-ESTs, die für ein Signalpeptid kodieren.
Um zu bestätigen, dass das durch die 5'-ESTs kodierte Signalpeptid tatsächlich als ein Signalpeptid fungiert, können die Signalsequenzen aus den 5'-ESTs in einen Vektor kloniert werden, der für die Identifikation von Signalpeptiden konstruiert wurde. Solche Vektoren sind so gestaltet, dass sie die Fähigkeit zum Wachstum in selektivem Medium nur Wirtszellen verleihen, die einen Vektor mit einer funktionell verbundenen Signalsequenz enthalten. Zum Beispiel kann die Signalsequenz des 5'-ESTs, um zu bestätigen, dass ein 5'-EST für ein echtes Signalpeptid kodiert, stromaufwärts und im Leserahmen mit einer nichtsezernierten Form des Invertasegens aus Hefe in Signalpeptid-Selektionsvektoren, wie z.B. den in US-Patent Nr. 5,536,637 beschriebenen, insertiert werden. Das Wachstum von Wirtszellen, die die Signalsequenz-Selektionsvektoren mit der korrekt insertierten 5'-EST-Signalsequenz enthalten, bestätigt, dass die 5'-EST für ein echtes Signalpeptid kodiert.
Alternativ kann die Gegenwart eines Signalpeptides durch Klonieren der verlängerten cDNAs, die unter Verwendung der ESTs erhalten wurden, in Expressionsvektoren, wie z.B. pXT1 (wie unten in Beispiel 30 beschrieben) oder durch Konstruieren von Promotor-Signalsequenz-Reportergen-Vektoren, die für Fusionsproteine zwischen dem Signalpeptid und einem nachweisbaren Reporterprotein bestätigt werden. Nach Einführen dieser Vektoren in eine geeignete Wirtszelle, wie z.B. COS-Zellen oder NIH 3T3-Zellen, kann das Wachstumsmedium geerntet und auf die Gegenwart de sezernierten Proteins hin analysiert werden. Das Medium von diesen Zellen wird mit dem Medium von Kontrollzellen verglichen, die Vektoren enthalten, denen die Signalsequenz oder das verlängerte cDNA-Insert fehlt, um Vektoren zu identifizieren, die für ein funktionelles Signalpeptid oder ein echtes sezerniertes Protein kodieren.
Die 5'-ESTs, die für ein Signalpeptid kodieren, wie mit Hilfe des Verfahrens gemäß Beispiel 22 oben festgestellt, wurden weiterhin in vier Kategorien eingeteilt auf Grundlage ihrer Homologie mit bekannten Sequenzen, wie in Beispiel 24 unten beschrieben.
BEISPIEL 24
Kategorisierung von 5'-ESTs, die für ein Signalpeptid kodieren
Die 5'-ESTs, die eine Sequenz aufweisen, die weder mit irgendeiner vertebraten Sequenz noch mit irgendeiner öffentlich verfügbaren EST-Sequenz übereinstimmt, wurden als "neu" bezeichnet. Von den Sequenzen in der SignalTag^TM-Datenbank fielen 947 der 5'-ESTs, die einen von Heijne-Wert von wenigstens 3,5 hatten, in diese Kategorie.
Die 5'-ESTs, die eine Sequenz aufwiesen, die nicht mit einer vertebraten Sequenz übereinstimmten, jedoch mit einer öffentlich bekannten EST übereinstimmten, wurden als "EST-ext" bezeichnet, vorausgesetzt, dass die bekannte EST-Sequenz um wenigstens 40 Nukleotide in die 5'-Richtung verlängert war. Von diesen Sequenzen in der Signal-Tag^TM-Datenbank fielen 150 der 5'-ESTs mit einem von Heijne-Wert von wenigstens 3,5 in diese Kategorie.
Die ESTs, die nicht mit irgendeiner vertebraten Sequenz übereinstimmten, jedoch mit einer öffentlich bekannten EST übereinstimmten, ohne dass die bekannte EST um wenigstens 40 Nukleotide in die 5'-Richtung verlängert wurden, wurden "EST" genannt. Von den Sequenzen in der SignalTag^TM-Datenbank fielen 599 der 5'-ESTs mit einem von Heijne-Wert von wenigstens 3,5 in diese Kategorie.
Die 5'-EST-Sequenzen, die mit einer humanen mRNA-Sequenz übereinstimmten, jedoch die bekannte Sequenz um wenigstens 40 Nukleotide in die 5'-Richtung verlängerten, wurden "Wert-ext" genannt. Von den Sequenzen in der SignalTag^TM-Datenbank fielen 23 der ESTs mit einem von Heijne-Wert von wenigstens 3,5 in diese Kategorie. Eingeschlossen in diese Kategorie war ein 5'-EST, der die bekannte Sequenz der humanen Translocase-mRNA um mehr als 200 Basen in die 5'-Richtung verlängerte. Ein 5'-EST, der die Sequenz für ein humanes Tumor-Suppresorgen in die 5'-Richtung verlängerte, wurde ebenfalls identifiziert.
Tabelle V zeigt die Verteilung der 5'-ESTs in jeder Kategorie und die Anzahl der 5'-ESTs in jeder Kategorie, die einen bestimmten Minimum-von Heijne-Wert haben.
3. Auswertung der räumlichen und zeitlichen Expression von mRNAs, die den 5'-ESTs oder verlängerten cDNAs entsprechen
Jeder der 5'-ESTs wurde außerdem auf Grundlage des Gewebes, aus dem dessen korrespondierender mRNA erhalten wurde, wie unten in Beispiel 25 beschrieben kategorisiert.
BEISPIEL 25
Kategorisierung des Expressionsmusters
Tabelle VI zeigt die Verteilung der 5'-ESTs in jeder der oben definierten Kategorien im Hinblick auf die Gewebe, aus denen die 5'-ESTs der korrespondierenden mRNA erhalten wurden.
Tabelle II stellt die Sequenzidentifizierungsnummern der 5'-EST-Sequenzen zur Verfügung, die aus dem Hirn stammten, die Kategorien, in die diese Sequenzen fallen und die von Heijne-Werte der Signalpeptide, für die sie kodieren. Die 5'-EST-Sequenzen und Aminosäurensequenzen, für die sie kodieren, werden in den angefügten Sequenzprotokollen bereitgestellt. Tabelle III stellt die Sequenz-ID-Nummern der 5'-ESTs und die Sequenzen der Signalpeptide, für die sie kodieren, zur Verfügung. Die Sequenzen der 5'-ESTs und die Polypeptide, für die sie kodieren, werden in dem Sequenzprotokoll, was hieran angefügt ist, zur Verfügung gestellt.
Die DNA-Sequenz der SEQ ID NR: 149 kann leicht nach irgendwelchen Fehlern darin untersucht werden, und jegliche Sequenzzweideutigkeiten können durch erneutes Sequenzieren eines Fragmentes, das solche Fehler oder Zweideutigkeiten enthält, auf beiden Strängen geklärt werden. Solche Fragmente können von den Plasmiden erhalten werden, die in dem Labor der Erfinder gelagert werden, oder sie können unter Verwendung der hierin beschriebenen Methoden isoliert werden. Die Klärung solcher Zweideutigkeiten oder Fehler kann durch Verwendung von Primern erleichtert werden, die an Sequenzen hybridisieren, die nahe der zweideutigen oder fehlerhaften Sequenzen lokalisiert sind. Zum Beispiel können die Primer an Sequenzen innerhalb von 50-75 Basen der Zweideutigkeit oder des Fehlers hybridisieren. Nach Klärung eines Fehlers oder einer Zweideutigkeit kann die entsprechende Korrektur in der Proteinsequenz durchgeführt werden, die von einer DNA kodiert wird, die den Fehler oder die Zweideutigkeit enthält.
Zusätzlich zur Kategorisierung der 5'-ESTs im Hinblick auf ihren Gewebeursprung können die räumlichen und zeitlichen Expressionsmuster der mRNAs, die den 5'-ESTs entsprechen, ebenso wie deren Expressionslevel, wie in Beispiel 26 unten beschrieben bestimmt werden. Die Charakterisierung der räumlichen und zeitlichen Expressionsmuster und der Expressionslevel dieser mRNAs ist nützlich zur Konstruktion von Expressionsvektoren, die fähig sind, eine gewünschte Konzentration eines Genproduktes in einer gewünschten räumlichen oder zeitlichen Art und Weise zu produzieren, wie detaillierter unten erörtert werden wird.
Darüber hinaus können 5'-ESTs, deren korrespondierende mRNAs mit Krankheitszuständen in Zusammenhang stehen, ebenfalls identifiziert werden. Zum Beispiel kann eine bestimmte Krankheit aus dem Mangel an Expression, der Überexpression oder der Unterexpression einer mRNA resultieren, die einer 5'-EST entspricht. Durch Vergleichen der mRNA-Expressionsmuster und Mengen in Proben, die aus gesunden Individuen stammen, mit solchen aus Individuen, die an einer bestimmten Krankheit leiden, können 5'-ESTs identifiziert werden, die für die Krankheit verantwortlich sind.
Man wird verstehen, dass die Ergebnisse der obigen Charakterisierungsverfahren für 5'-ESTs auch für verlängerte cDNAs (erhältlich wie unten beschrieben) anwendbar sind, die Sequenzen enthalten, die den 5'-ESTs benachbart sind. Man wird auch verstehen, dass, wenn dies gewünscht ist, die Charakterisierung verschoben werden kann, bis verlängerte cDNAs erhalten wurden, eher als dass die ESTs selbst charakterisiert werden.
BEISPIEL 26
Auswertung der Expressionslevel und -muster von mRNAs, die den 5'-ESTs und verlängerten cDNAs entsprechen
Die Expressionslevel und -muster von mRNAs, die den 5'-ESTs oder verlängerten cDNAs (erhältlich wie unten in Beispiel 27 beschrieben) entsprechen, können durch Lösungshybridisierung mit langen Sonden, wie in der internationalen Patentanmeldung WO 97/05277 beschrieben, analysiert werden. Kurz beschrieben wird ein 5'-EST, eine verlängerte cDNA oder ein Fragment davon, das dem Gen entspricht, das für die zu charakterisierende mRNA kodiert, in eine Klonierungsstelle unmittelbar stromabwärts eines Bakteriophagen (T3, T7 oder SP6) RNA-Polymerase-Promotor insertiert, um Antisense-RNA herzustellen. Vorzugsweise hat der 5'-EST oder die verlängerte cDNA 100 oder mehr Nukleotide. Das Plasmid wird linearisiert und in den Gegenwart von Ribonukleotiden, die modifizierte Ribonukleotide umfassen (d. h. Biotin-UTP und DIG-UTP) transkribiert. Ein Überschuss dieser doppelt markierten RNA wird in Lösung mit mRNA hybridisiert, die aus Zellen oder Gewebe von Interesse hybridisiert wurde. Die Hybridisierungen werden unter stringenten Standardbedingungen (40-50°C für 16 Stunden in einem 80% Formamid, 0,4 M NaCl-Puffer, pH 7-8) durchgeführt. Die nichthybridisierte Sonde wird durch Verdau mit Ribonukleasen entfernt, die spezifisch sind für einzelsträngige RNA (d. h. RNasen CL3, T1, Phy M, U2 oder A). Die Gegenwart der Biotin-UTP-Modifizierung ermöglicht die Bindung des Hybrids auf einer Mikrotiterplatte, die mit Streptavidin beschichtet ist. Die Gegenwart der DIG-Modifikation ermöglicht es, das Hybrid nachzuwei sen und mittels ELISA unter Verwendung eines Anti-DIG-Antikörpers, der an alkalische Phosphatase gekoppelt ist, zu quantifizieren.
Die 5'-ESTs, verlängerten cDNAs oder Fragmente davon können außerdem mit Nukleotidsequenzen markiert werden zur seriellen Analyse der Genexpression (serial analysis of gene expression, SAGE), wie in UK-Patentanmeldung Nr. 2 305 241 A offenbart. In diesem Verfahren werden cDNAs aus Zellen, Gewebe, Organismen oder anderen Quellen von Nukleinsäuren, für die Genexpressionsmuster bestimmt werden müssen, präpariert. Die resultierenden cDNAs werden in zwei Gruppen eingeteilt. Die cDNAs in jeder Gruppe werden mit einer ersten Restriktionsendonuklease gespalten, die Ankerenzym genannt wird, die eine Erkennungsstelle hat, die vermutlich wenigstens einmal in den meisten cDNAs vorhanden ist. Die Fragmente, welche die am meisten 5'- oder 3'- gelegene Region der geschnittenen cDNA enthalten, werden durch Bindung an ein Bindungsmedium, wie z.B. mit Streptavidin beschichtete Beads, isoliert. Ein erster Oligonukleotidlinker, der eine erste Sequenz zur Hybridisierung eines Amplifikationsprimers und einer internen Restriktionsstelle für eine so genannte Taggingendonuklease enthält, wird mit den verdauten cDNAs des ersten der ersten Gruppe ligiert. Ein Verdau mit der zweiten Endonuklease produziert kurze Tag-Fragmente von den cDNAs.
Ein zweites Oligonukleotid, das eine zweite Sequenz für die Hybridisierung eines Amplifikationsprimers und einer internen Restriktionsschnittstelle enthält, wird mit den verdauten cDNAs in der zweiten Gruppe ligiert. Die cDNA-Fragmente in der zweiten Gruppe werden außerdem mit der Taggingendonuklease verdaut, um kurze Tag-Fragmente zu erzeugen, die aus den cDNAs in der zweiten Gruppen stammen. Die aus diesem Verdau der ersten und zweiten Gruppe mit dem Ankerenzym und der Taggingendonuklease resultierenden Tags werden miteinander ligiert, um so genannte Ditags zu erzeugen. In einigen Ausführungsformen werden die Ditags konkatamerisiert, um Ligationsprodukte herzustellen, die zwischen 2 bis 200 Ditags enthalten. Die Tag-Sequenzen werden anschließend bestimmt und mit den Sequenzen der 5'-ESTs oder verlängerten cDNAs verglichen, um zu bestimmen, welche 5'-ESTs oder verlängerten cDNAs in der Zelle, dem Gewebe oder dem Organismus oder der anderen Nukleinsäurequelle, aus der die Tags stammen, exprimiert sind. Auf diese Weise wird das Expressionsmuster der 5'-ESTs oder verlängerten cDNAs in der Zelle, dem Gewebe, dem Organismus oder der anderen Nukleinsäurequelle erhalten.
Eine quantitative Analyse der Genexpression kann ebenfalls unter Verwendung von Arrays durchgeführt werden. Wie hierin verwendet, bezeichnet der Begriff Array eine eindimensionale, zweidimensionale oder multidimensionale Anordnung von vollständig langen cDNAs (d. h. verlängerten cDNAs, welche die kodierende Sequenz für das Signalpeptid, die kodierende Sequenz für das reife Protein und ein Stoppkodon enthalten, von verlängerten cDNAs, von 5'-ESTs oder Fragmenten davon mit ausreichender Länge, um den spezifischen Nachweis der Genexpression zu erlauben. Vorzugsweise sind die Fragmente wenigstens 15 Nukleotide lang. Bevorzugter sind die Fragmente wenigstens 100 Nukleotide lang. Noch bevorzugter sind die Fragmente mehr als 100 Nukleotide lang. In einigen Ausführungsformen können die Fragmente länger als 500 Nukleotide sein.
Zum Beispiel kann die quantitative Analyse der Genexpression mit vollständig langen cDNAs, wie unten definiert, verlängerten cDNAs, 5'-ESTs oder Fragmenten davon in einem Mikroarray mit komplementärer DNA wie von Schena et al (Science 270:467-470, 15; Proc. Natl. Acad. Sci. USA 93:10614-10619, 1996) durchgeführt werden. Vollständig lange cDNAs, verlängerte cDNAs, 5'-ESTs oder Fragmente davon werden mit Hilfe einer PCR amplifiziert und aus 96 Well-Mikrotiterplatten auf silylierte Mikroskopobjektträger unter Verwendung von Hochgeschwindigkeitsrobotern angeordnet. Gedruckte Arrays werden in einer feuchten Kammer inkubiert, um die Rehydrierung der Arrayelemente zu ermöglichen und einmal in 0,2% SDS für 1 Minute, zweimal in Wasser für 1 Minute und einmal für 5 Minuten in Natriumborhydridlösung gespült. Die Arrays werden für 2 Minuten bei 95°C in Wasser getaucht, in 0,2% SDS für eine Minute transferiert, zweimal mit Wasser gespült, an der Luft getrocknet und im Dunklen bei 25°C gelagert.
mRNA aus Zellenoder Gewebe wird isoliert oder kommerziell erhalten, und Sonden werden durch eine einzige Runde reverser Transkription hergestellt. Die Sonden werden mit 1 cm² Mikroarrays unter 14 × 14 mm Glasdeckgläschen für 6-12 Stunden bei 60°C hybridisiert. Die Arrays werden für 5 Minuten bei 25°C in einem Waschpuffer mit geringer Stringenz (1 × SSC/0,2% SDS) gewaschen, anschließend für 10 Minuten bei Raumtemperatur in Waschpuffer mit hoher Stringenz (0,1 × SSC/0,2% SDS). Die Arrays werden in 0,1 × SSC unter Verwendung eines Fluoreszenzlaser-Scanninggerätes, das mit einem gewöhnlichen Filterset ausgerüstet ist, gescannt. Akkurate Messungen der differenziellen Expression werden erhalten, indem der Durchschnitt der Verhältnisse von zwei unabhängigen Hybridisierungen genommen wird.
Die quantitative Analyse der Expression von Genen kann ebenfalls mit vollständig langen cDNAs, verlängerten cDNAs, 5'-ESTs oder Fragmenten davon in Arrays mit komplementärer DNA wie von Pietu et al. (Genome Research 6:492-503, 1996) beschrieben durchgeführt werden. Die vollständig langen cDNAs, verlängerten cDNAs, 5'-ESTs oder Fragmente davon werden mittels PCR amplifiziert und auf Membranen gespottet. Anschließend werden die aus den verschiedenen Geweben stammenden mRNAs mit radioaktiven Nukleotiden markiert. Nach der Hybridisierung und dem Waschen unter kontrollierten Bedingungen werden die hybridisierten mRNAs mittels Phospho-Imaging oder Autoradiografie detektiert. Doppelte Experimente werden durchgeführt und eine quantitative Analyse der differenziell exprimierten mRNAs wird anschließend durchgeführt.
Alternativ kann die Expressionsanalyse der 5'-ESTs oder verlängerten cDNAs durch High Density-Nukleotidarrays wie von Lockhart et al. (Nature Biotechnology 14:1675-1680, 1996) und Sosnowsky et al. (Proc. Natl. Acad. Sci. 94:1119-1123, 1997) beschrieben durchgeführt werden. Oligonukleotide mit 15-50 Nukleotiden, die den Sequenzen der 5'-ESTs oder verlängerten cDNAs entsprechen, werden direkt auf dem Chip synthetisiert (Lockhart et al, s.o.) oder synthetisiert und anschließend auf den Chip gegeben (Sonowsky et al., s.o.). Vorzugsweise haben die Oligonukleotide eine Länge von etwa 20 Nukleotiden.
cDNA-Sonden, die mit einer geeigneten Verbindung markiert sind, wie z.B. Biotin, Digoxigenin oder Fluoreszenzfarbstoff, werden aus der geeigneten mRNA-Population synthetisiert und anschließend in zufällige Fragmente mit einer durchschnittlichen Größe von 50-100 Nukleotiden zerstückelt. Die genannten Sonden werden dann mit dem Chip hybridisiert. Nach dem Waschen wie in Lockhart et al., s.o., beschrieben und nach der Anwendung verschiedener elektrischer Felder (Sonowsky et al., s.o.) werden die Farbstoffen oder markierenden Verbindungen detektiert und quantifiziert. Doppelte Hybridisierungen werden durchgeführt. Eine vergleichende Analyse der Intensität der Signale, die von den cDNA-Sonden auf dem selben Zieloligonukleotid in verschiedenen cDNA-Proben stammen, zeigt eine differenzielle Expression der mRNA an, die dem 5'-EST oder der verlängerten cDNA entspricht, von dem/der die Oligonukleotidsequenz abgeleitet wurde.
III. Verwendung der 5'-ESTs, um verlängerte cDNAs zu klonieren und um die korrespondierenden genomischen DNAs zu klonieren
Sobald die 5'-ESTs, welche das 5'-Ende der korrespondieren mRNAs enthalten, unter Verwendung der oben beschriebenen Verfahren selektiert wurden, können sie verwendet werden, um verlängerte cDNAs zu isolieren, die Sequenzen enthalten, die den 5'-ESTs benachbart sind. Die verlängerten cDNAs können die gesamte kodierende Sequenz des Proteins, das durch die korrespondierende mRNA kodiert wird, enthalten, einschließlich der authentischen Translationsstartstelle, der Signalsequenz und der Sequenzen, die für das reife Protein kodieren, das nach der Abspaltung des Signalpeptids übrig bleibt. Derartige verlängerte cDNAs werden hierin als "vollständig lange cDNAs" beschrieben. Alternativ können die verlängerten cDNAs nur die Sequenz enthalten, die für das reife Protein kodiert, das nach dem Abspalten des Signalpeptids übrig bleibt oder nur die Sequenz, die für das Signalpeptid kodiert.
Beispiel 27 unten beschreibt ein allgemeines Verfahren zum Erhalt verlängerter cDNAs unter Verwendung von 5'-ESTs. Beispiel 28 unten stellt experimentelle Ergebnisse zur Verfügung, wobei das in Beispiel 27 erläuterte Verfahren verwendet wird, und beschreibt mehrere verlängerte cDNAs, die die gesamte kodierende Sequenz und das authentische 5'-Ende der korrespondierenden mRNA für mehrere sezernierte Proteine enthalten.
Die Verfahren gemäß der Beispiele 27, 28 und 29 können außerdem verwendet werden, um verlängerte cDNAs zu erhalten, die für weniger als die gesamte kodierende Sequenz der sezernierten Proteine kodieren, die durch die Gene kodiert werden, die den 5'-ESTs entsprechen. In einigen Ausführungsformen kodieren die verlängerten cDNAs, die mit Hilfe dieser Verfahren isoliert wurden, wenigstens 10 Aminosäuren des Proteins, das durch die Sequenz der SEQ ID NR: 149 kodiert wird. In weiteren Ausführungsformen kodieren die verlängerten cDNAs wenigstens 20 Aminosäuren des Proteins, das durch die Sequenz der SEQ ID NR: 149 kodiert wird. In anderen Ausführungsformen kodieren die verlängerten cDNAs für wenigstens 30 Aminosäuren der Sequenz der SEQ ID NR: 149. In einer bevorzugten Ausführungsform kodieren die verlängerten cDNAs eine vollständig lange Proteinsequenz, die die kodierende Sequenz des Proteins der SEQ ID NR: 149 enthält.
BEISPIEL 27
Allgemeines Verfahren zur Verwendung der 5'-ESTs, um cDNAs zu klonieren und zu sequenzieren, welche die gesamte kodierende Region und das authentische 5'-Ende der korrespondierenden mRNA enthalten.
Das folgende allgemeine Verfahren wurde verwendet, um verlängerte cDNAs, welche die authentischen 5'-Enden ihrer korrespondierenden mRNAs ebenso wie die kodierende Sequenz für das vollständige Protein enthalten und Sequenzen enthalten, die benachbart zu den Sequenzen der 5'-ESTs sind, die verwendet wurden, um sie zu erhalten, rasch und effizient zu isolieren. Dieses Verfahren kann angewendet werden, um verlängerte cDNAs für jeden 5'-EST in der NetGene^TM-Datenbank, einschließlich solcher 5'-ESTs, die für Polypeptide kodieren, die zu sezernierten Proteinen gehören, zu erhalten. Das Verfahren ist in 3 zusammengefasst.
1. Erhalt der verlängerten cDNAs
a) Synthese des ersten Strangs
Das Verfahren macht sich bekannte 5'-Sequenz der mRNA zunutze. Eine reverse Transkriptionsreaktion wird mit der gereinigten mRNA mit Hilfe eine Poly-14dT-Primers durchgeführt, der eine 49 Nukleotid lange Sequenz an dessen 5'-Ende enthält, welcher die Addition einer bekannten Sequenz an das Ende der cDNA erlaubt, die dem 3'-Ende der mRNA entspricht. Zum Beispiel kann der Primer die folgende Sequenz haben: 5'-ATC GTT GAG ACT CGT ACC AGC AGA GTC ACG AGA GAG ACT ACA CGG TAC TGG TTT TTT TTT TTT TTVN-3' (SEQ ID NR: 14). Die Fachleute auf dem Gebiet werden verstehen, dass auch andere Sequenzen an die Poly-dT-Sequenz angefügt werden können und verwendet werden können, um die Synthese des ersten Strangs zu primen. Unter Verwendung dieses Primers und einer reversen Transkriptase, wie z.B. des Superscript II-Enzyms (Gibco BRL) oder des RNase H Minus-MLV-Enzyms (Promega), wird ein reverses Transkript erzeugt, das an der 3'-PolyA-Stelle verankert ist.
Nach dem Entfernen der mit dem ersten Strang der cDNA hybridisierten mRNA mit Hilfe der alkalischen Hydrolyse werden die Produkte der alkalischen Hydrolyse und die restlichen Poly-dT-Primer mit Hilfe einer Ausschlusssäule, wie z.B. einer AcA34-Matrix (Biosepra), wie in Beispiel 11 erklärt, eliminiert.
b) Synthese des zweiten Strangs
Ein Paar nested Primer an jedem Ende wird auf Grundlage der bekannten 5'-Sequenz des 5'-ESTs und dem bekannten 3'-Ende, das durch den Poly-dT-Primer angefügt wurde, der bei der Synthese des ersten Strangs verwendet wurde, entworfen. Software, die zum Entwurf von Primern verwendet wird, basiert entweder auf dem GC-Gehalt und den Schmelztemperaturen von Oligonukleotiden, wie z.B. OSP (Illier und Green, PCR Meth. Appl. 1:124-128, 1991), oder basiert auf der Octamer Frequency Disparity Method (Griffcis et al., Nucleic Acids Res. 19:3887-3891, 1991), wie z.B. PC-Rare (http://bioinformatics.weizmann.ac.il/software/PC-Rare/doc/manuel.html).
Vorzugsweise werden die nested Primer an dem 5'-Ende voneinander durch vier oder neun Basen getrennt. Die Sequenzen der 5'-Primer können so ausgewählt werden, dass sie Schmelztemperaturen und Spezifitäten aufweisen, die für die Verwendung in der PCR geeignet sind. Vorzugsweise sind die nested Primer an dem 3'-Ende voneinander durch vier oder neun Basen getrennt. Zum Beispiel können die nested 3'-Primer die folgenden Sequenzen haben: (5'-CCA GCA GAG TCA CGA GAG AGA CTA CAC GG-3' (SEQ ID NR: 15) und 5'-CAC GAG AGA GAC TAC ACG GTA CTG G-3' (SEQ ID NR: 16). Diese Primer wurden ausgewählt, da sie Schmelztemperaturen und Spezifitäten aufweisen, die mit ihrer Verwendung in der PCR kompatibel sind. Jedoch werden die Fachleute auf dem Gebiet verstehen, dass andere Sequenzen ebenfalls als Primer verwendet werden können.
Der erste PCR-Lauf mit 25 Zyklen wird unter Verwendung des Advantage-Tth-Polymerasemix (Clontech) und dem äußeren Primer eines jeden nested Primerpaares durchgeführt. Eine zweite PCR mit 20 Zyklen unter Verwendung desselben Enzyms und des inneren Primers eines jeden nested Paares wird anschließend mit 1/2500 des ersten PCR-Produktes durchgeführt. Anschließend werden die Primernukleotide entfernt.
2. Sequenzieren der vollständig langen verlängerten cDNAs oder Fragmente davon
Aufgrund des Fehlens von Positionsbeschränkungen bei dem Entwurf der 5' nested Primer, die passend sind für die Verwendung in der PCR, unter Verwendung der OSP-Software, werden zwei Arten von Amplicons erhalten. Vorzugsweise ist der zweite 5'-Primer stromaufwärts des Translations-Initiations-Kodons lokalisiert, was ein nested PCR-Produkt erzeugt, das die gesamte kodierende Sequenz enthält. Eine solche vollständig lange verlängerte cDNA wird einem direkten Klonierungsverfahren wie in Abschnitt a beschrieben unterzogen. Jedoch ist der zweite 5'-Primer in einigen Fällen stromabwärts des Translations-Initiations-Kodons lokalisiert, wodurch ein PCR-Produkt erzeugt wird, das nur einen Teil des ORFs enthält. Derartige unvollständige PCR-Produkte werden einem modifizierten Verfahren unterzogen, das in Abschnitt b beschrieben ist.
a) Nested PCR-Produkte, die vollständige ORFs enthalten
Enthält das resultierende PCR-Produkt die vollständige kodierende Sequenz, wie sie von der 5'-EST-Sequenz vorhergesagt wird, wird es in einen geeigneten Vektor wie z.B. pED6dpc2 kloniert, wie in Abschnitt 3 beschrieben.
b) Nested PCR-Produkte, die unvollständige ORFs enthalten
Enthält das Amplicon keine vollständige kodierende Sequenz, sind Zwischenschritte notwendig, um sowohl die vollständige kodierende Sequenz als auch ein PCR-Produkt, das die vollständige kodierende Sequenz enthält, zu erhalten. Die vollständige kodierende Sequenz kann aus mehreren Teilsequenzen zusammengesetzt werden, wie sie direkt aus den verschiedenen PCR-Produkten wie unten in dem folgenden Abschnitt beschrieben bestimmt wurden.
Sobald die vollständige kodierende Sequenz vollständig bestimmt wurde, werden neue Primer entworfen, die für die Verwendung in der PCR kompatibel sind, um Amplicons zu erhalten, welche die gesamte kodierende Region enthalten. Jedoch sind in solchen Fällen, die für die PCR-Verwendung geeigneten 3'-Primer innerhalb der 3'-UTR der korrespondierenden mRNA lokalisiert, was Amplicons erzeugt, denen ein Teil dieser Region fehlt, d. h. der PolyA-Teil und manchmal das Polyadenylierungssignal, wie in 3 dargestellt. Solche vollständig langen verlängerten cDNAs werden anschließend in einen geeigneten Vektor wie in Abschnitt 3 beschrieben kloniert.
c) Sequenzieren der verlängerten cDNAs
Das Sequenzieren der verlängerten cDNAs wird unter Verwendung eines Die Terminator-Ansatzes mit dem AmpliTaq DNA Polymerase FS-Kit, das von Perkin-Elmer erhältlich ist, durchgeführt.
Um die PCR-Fragmente zu sequenzieren, wird ein Primer Walking unter Verwendung einer Software, wie z.B. OSP, durchgeführt, um Primer auszuwählen sowie unter Verwendung einer automatisierten Computersoftware wie z.B. ASMG (Sutton et al., Genome Science Technol. 1:9-19, 1995), um Contigs der Walking-Sequenzen zu konstruieren, die den ursprünglichen 5'-Tag und unter Verwendung einer minimalen Überlappung von 32 Nukleotiden enthalten. Vorzugsweise wird das Primer Walking durchgeführt, bis die Sequenzen der vollständig langen cDNAs erhalten wurden.
Die Vervollständigung der Sequenzierung eines bestimmten verlängerten cDNA-Fragmentes wird wie folgt bestimmt. Da Sequenzen, die nach dem PolyA-Teil lokalisiert sind, im Falle von nichtklonierten Produkten schwierig genau zu bestimmen sind, werden die Verfahren der Sequenzierung und des Primer Walkings für PCR-Produkte unterbrochen, wenn ein PolyA-Teil in den verlängerten cDNAs identifiziert wurde, die wie im Fall b beschrieben erhalten wurden. Die Sequenzlänge wird mit der Größe des nested PCR-Produktes verglichen, das wie oben beschrieben erhalten wurde. Aufgrund der limitierten Genauigkeit bei der Bestimmung der Größe des PCR-Produktes mittels Gelelektrophorese, wird eine Sequenz als vollständig erachtet, wenn die Größe der erhaltenen Sequenz wenigstens 70% der Größe des ersten nested PCR-Produktes ist. Ist die Länge der durch die Computeranalyse bestimmten Sequenz nicht wenigstens 70% der Länge des nested PCR-Produktes, werden diese PCR-Produkte kloniert, und die Sequenz der Insertion wird bestimmt. Sind Northern Blot-Daten verfügbar, wird die Größe der mRNA, die für ein bestimmtes PCR-Produkt nachgewiesen wurde, verwendet, um endgültig festzustellen, dass die Sequenz vollständig ist. Sequenzen, welche die oben genannten Kriterien nicht erfüllen, werden verworfen und einem neuen Isolationsverfahren unterzogen.
Die Sequenzdaten sämtlicher verlängerter cDNA werden anschließend in eine geschützte Datenbank übertragen, in der die Qualitätskontrollen und Auswertungsschritte wie in Beispiel 15 beschrieben durchgeführt werden.
3. Klonieren von vollständig langen verlängerten cDNAs
Das PCR-Produkt, das die vollständige kodierende Sequenz enthält, wird anschließend in einen geeigneten Vektor kloniert. Zum Beispiel können die verlängerten cDNAs in den Expressionsvektor pED6dpc2 (DiscoverEase, Genetics Institute, Cambridge, MA) wie folgt kloniert werden. PED6dpc2-Vektor-DNA wird mit stumpfen Enden hergestellt, indem ein EcoRI-Verdau gefolgt von einer Auffüllreaktion durchgeführt. Der Vektor mit stumpfen Enden wird dephosphoryliert. Nach dem Entfernen der PCR-Primer und einer Ethanolpräzipitation wird das PCR-Produkt, das die vollständige kodierende Sequenz oder die verlängerte cDNA enthält, das wie oben beschrieben erhalten wurde, mit einer Kinase phosphoryliert, anschließend durch Phenol-Sevag-Extraktion entfernt und präzipitiert. Die doppelsträngige verlängerte cDNA wird anschließend mit dem Vektor ligiert, und das resultierende Expressionsplasmid wird in geeignete Wirtszellen eingeführt.
Da die wie oben beschriebenen PCR-Produkte Moleküle mit stumpfen Enden sind, die in jeder Richtung kloniert werden können, wird die Orientierung der verschiedenen Klone für jedes PCR-Produkt bestimmt. Anschließend werden 4 bis 10 Klone in Mikrotiterplatten angeordnet und einer PCR-Reaktion unter Verwendung eines ersten Primers, der in dem Vektor nahe der Klonierungsstelle lokalisiert ist, und eines zweiten Primers, der in dem Teil der verlängerten cDNA lokalisiert ist, der dem 3'-Ende der mRNA entspricht, unterzogen. Dieser zweite Primer kann der Antisense-Primer sein, der in der Verankerungs-PCR im Falle der direkten Klonierung (Fall a) verwendet wurde, oder der Antisense-Primer, der innerhalb der 3'-UTR lokalisiert ist, im Falle der indirekten Klonierung (Fall b). Klone, in denen das Startkodon der verlängerten cDNA funktionell mit dem Promotor in dem Vektor verbunden ist, so dass die Expression des durch die verlängerte cDNA kodierten Proteins möglich ist, werden konserviert und sequenziert. Zusätzlich zu den Enden der cDNA-Inserts werden außerdem etwa 50 Basenpaare der Vektor-DNA an jeder Seite des cDNA-Inserts sequenziert.
Die klonierten PCR-Produkte werden anschließend vollständig in Übereinstimmung mit dem zuvor erwähnten Verfahren sequenziert. In diesem Fall wird anschließend die Kontigierung langer Fragmente auf Walking Sequenzen durchgeführt, die bereits während des Primer Walkings für unklonierte PCR-Produkte kontigiert wurden. Das Sequenzieren der geklonten Amplicons ist vollständig, wenn die resultierenden Contigs die gesamte kodierende Region ebenso wie überlappende Sequenzen mit der Vektor-DNA an beiden Enden enthalten.
4. Computeranalyse der vollständig langen verlängerten cDNA
Die Sequenzen sämtlicher vollständig langer verlängerter cDNAs werden anschließend für die weitere Analyse wie unten beschrieben zugelassen. Vor dem Durchsuchen der vollständig langen verlängerten cDNAs nach Sequenzen von Interesse werden verlängerte cDNAs, die nicht von Interesse sind (Vektor-RNAs, Transfer-RNAs, ribosomale RNAs, mitochondriale RNAs, prokaryontische RNAs und Pilz-RNAs), unter Verwendung von Verfahren, die den für die 5'-ESTs in Beispiel 18 beschriebenen im Wesentlichen ähnlich sind, verworfen.
a) Identifikation von strukturellen Merkmalen
Strukturelle Merkmale, z.B. ein PolyA-Schwanz und ein Polyadenylierungssignal, der Sequenzen der vollständig langen verlängerten cDNAs werden anschließend wie folgt bestimmt.
Ein PolyA-Schwanz ist definiert als ein homopolymerer Abschnitt von wenigstens 11 A mit wenigstens einer alternativen Base darin. Die Recherche nach dem PolyA-Schwanz ist auf die letzten 100 nt der Sequenz beschränkt und auf Abschnitte von 11 konsekutiven As beschränkt, das die Sequenzierungsreaktionen häufig nach einem solchen PolyA-Abschnitt nicht lesbar sind. Abschnitte, die mehr als 90% Homologie über 8 Nukleotide aufweisen, werden unter Verwendung von BLAST2N als PolyA-Schwänze identifiziert.
Um nach einem Polyadenylierungssignal zu suchen, wird der PolyA-Schwanz von der vollständig langen Sequenz abgeschnitten. Die 50 Basenpaare, die vor dem PolyA-Schwanz liegen, werden zuerst auf das vorschriftsmäßige Polyadenylierungssignal A-AUAAA untersucht und wenn das vorschriftsmäßige Signal nicht detektiert werden kann, nach dem alternativen Signal AUUAAA (Sheets et al., Nuc. Acids Res. 18:5799-5805, 1990). Wenn keines dieser Konsensus-Polyadenylierungssignale gefunden wird, wird das vorschriftsmäßige Motiv erneut gesucht, wobei ein Mismatch zugelassen wird, um mögliche Sequenzierungsfehler zu berücksichtigen. Mehr als 85% der identifizierten Polyadenylierungssignale von jedem Typ enden tatsächlich 10 bis 30 Basenpaare von dem PolyA-Schwanz entfernt. Alternative AUUAAA-Signale repräsentieren etwa 15% der gesamten Zahl identifizierter Polyadenylierungssignale.
b) Identifikation funktioneller Merkmale
Funktionelle Merkmale, wie z.B. ORFs und Signalsequenzen, der Sequenzen der vollständig langen verlängerten cDNAs wurden anschließend wie folgt bestimmt.
Die drei Rahmen des oberen Strangs der verlängerten cDNAs werden nach ORFs untersucht, die definiert sind als Fragmente mit maximaler Länge, die mit einem Translations-Initiations-Kodon beginnen und mit einem Stoppkodon enden. ORFs, die wenigstens für 20 Aminosäuren kodieren, sind bevorzugt.
Jeder gefundene ORF wird anschließend auf die Gegenwart eines Signalpeptids in den ersten 50 Aminosäuren oder, wenn dies angemessen ist, innerhalb kürzerer Regionen bis zu 20 Aminosäuren oder weniger in dem ORF abgesucht, wobei das Matrixverfahren von von Heijne verwendet wird (Nuc. Acids Res. 14:4683-4690, 1986), wie in Beispiel 22 beschrieben.
c) Homologie entweder mit nukleotidischen oder proteinischen Sequenzen
Die Kategorisierung der vollständig langen Sequenzen kann unter Verwendung von Verfahren erreicht werden, die den für 5'-ESTs in Beispiel 24 beschriebenen im Wesentlichen ähnlich sind.
Wie oben beschrieben hergestellte verlängerte cDNAs können anschließend manipuliert werden, um Nukleinsäuren zu erhalten, welche die gewünschten Teile der verlängerten cDNA enthalten, unter Verwendung herkömmlicher Verfahren, wie z.B. der Subklonierung, PCR oder in vitro-Oligonukleotidsynthese. Zum Beispiel können Nukleinsäuren, welche nur die vollständigen kodierenden Sequenzen enthalten (d. h. die Sequenzen, die für das Signalpeptid und das reife Protein kodieren, das übrig bleibt, nachdem das Signalpeptid abgespalten wurde), unter Verwendung von Methoden, die den Fachleuten auf dem Gebiet bekannt sind, erhalten werden. Alternativ können konventionelle Verfahren angewendet werden, um Nukleinsäuren zu erhalten, die nur die kodierenden Sequenzen für das reife Protein enthalten, das übrig bleibt, nachdem das Signalpeptid abgespalten wurde, oder Nukleinsäuren, die nur die kodierenden Sequenzen für die Signalpeptide enthalten.
In ähnlicher Weise können Nukleinsäuren erhalten werden, die irgendeinen gewünschten Teil der kodierenden Sequenzen für das sezernierte Protein enthalten. Zum Beispiel kann die Nukleinsäure wenigstens 10 konsekutive Basen einer verlängerten cDNA enthalten, wie z.B. einer der verlängerten cDNAs, die unten beschrieben sind. In einer weiteren Ausführungsform kann die Nukleinsäure wenigstens etwa 15 konsekutive Basen einer verlängerten cDNA enthalten, wie eine der verlängerten cDNAs, die unten beschrieben werden. Alternativ kann die Nukleinsäure wenigstens 20 konsekutive Basen einer verlängerten cDNA, wie z.B. einer der unten beschriebenen verlängerten cDNAs enthalten. In einer weiteren Ausführungsform kann die Nukleinsäure wenigstens 25 konsekutive Basen einer verlängerten cDNA, wie z.B. einer der unten beschriebenen verlängerten cDNAs enthalten. In noch einer weiteren Ausführungsform kann die Nukleinsäure wenigstens 40 konsekutive Basen einer verlängerten cDNA, wie z.B. einer der unten beschriebenen verlängerten cDNAs enthalten.
Sobald eine verlängerte cDNA erhalten worden ist, kann sie sequenziert werden, um die Aminosäuresequenz, für die sie kodiert, zu bestimmen. Sobald die kodierte Aminosäuresequenz bestimmt wurde, kann man irgendeine der vielen denkbaren cDNAs erzeugen und identifizieren, die für das Protein kodieren wird, indem man einfach die Degeneration des genetischen Codes verwendet. Zum Beispiel können allele Varianten oder andere homologe Nukleinsäuren wie unten beschrieben identifiziert werden. Alternativ können Nukleinsäuren, die für die gewünschte Aminosäuresequenz kodieren, in vitro synthetisiert werden.
In einer bevorzugten Ausführungsform kann die kodierende Sequenz ausgewählt werden unter Verwendung der bekannten Kodon- oder Kodonpaar-Präferenzen für den Wirtsorganismus, in welchem die cDNA exprimiert werden soll.
Die von den hierin beschriebenen 5'-ESTs abgeleiteten verlängerten cDNAs wurden wie in Beispiel 28 unten beschrieben erhalten.
BEISPIEL 28
Charakterisierung der klonierten verlängerten cDNAs, die unter Verwendung von 5'-ESTs erhalten wurden
Das in Beispiel 27 oben beschriebene Verfahren wurde verwendet, um die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten cDNAs in einer Vielzahl von Geweben zu erhalten. Die folgende Liste stellt einige wenige Beispiele der so erhaltenen verlängerten cDNAs zur Verfügung.
Unter Verwendung dieser Methode wurde die vollständig lange cDNA der SEQ ID NR: 17 (interne Identifizierungsnummer 48-19-3-G1-FL1) erhalten. Diese cDNAs fällt in die Kategorie "EST-ext", die oben beschrieben wurde, und kodiert für das Signalpeptid MKKVLLLITAILAVAVG (SEQ ID NR: 18), das einen von Heijne-Wert von 8,2 aufweist.
Die vollständig lange cDNA der SEQ ID NR: 19 (interne Identifizierungsnummer 58-34-2-E7-FL2) wurde ebenfalls unter Verwendung dieser Methode erhalten. Diese cDNA fällt in die Kategorie "EST-ext", die oben beschrieben wurde, und kodiert für das Signalpeptid MWWFQQGLSFLPSALVIWTSA (SEQ ID NR: 20), das einen von Heijne-Wert von 5,5 hat.
Eine weitere vollständig lange cDNA, die unter Verwendung des oben beschriebenen Verfahrens erhalten wurde, hat die Sequenz der SEQ ID NR: 21 (interne Identifizierungsnummer 51-27-1-E8-FL1). Diese cDNA fällt in die Kategorie "EST-ext", die oben beschrieben wurde, und kodiert für das Signalpeptid MVLTTLPSANSANSPVNMPTTGPNSLSYASSALSPCLT (SEQ ID NR: 22), die einen von Heijne-Wert von 5,9 hat.
Das obige Verfahren wurde außerdem verwendet, um eine vollständig lange cDNA zu erhalten, welche die Sequenz der SEQ ID NR: 23 aufweist (interne Identifizierungsnummer 76-4-1-E5-FL1). Diese cDNA fällt in die Kategorie "EST-ext", die oben beschrieben wurde, und kodiert für das Signalpeptid ILSTVTALTFAXA (SEQ ID NR: 24), das einen von Heijne-Wert von 5,5 hat.
Die vollständig lange cDNA der SEQ ID NR: 25 (interne Identifizierungsnummer 51-3-3-B10-FL3) wurde ebenfalls unter Verwendung dieses Verfahrens erhalten. Diese cDNA fällt in die Kategorie "neu", die oben beschrieben wurde, und kodiert für ein Signalpeptid LVLTLCTLPLAVA (SEQ ID NR: 26), das einen von Heijne-Wert von 10,1 hat.
Die vollständig lange cDNA der SEQ ID NR: 27 (interne Identifizierungsnummer 58-35-2-F10-FL2) wurde ebenfalls unter Verwendung dieses Verfahrens erhalten. Diese cDNA fällt in die Kategorie "neu", die oben beschrieben wurde, und kodiert für ein Signalpeptid LWLLFFLVTAIHA (SEQ ID NR: 28), das einen von Heijne-Wert von 10,7 hat.
Bakterienklone, welche Plasmide enthalten, die die oben beschriebenen vollständig langen cDNAs enthalten, werden zur Zeit in den Laboratorien des Erfinders unter den oben zur Verfügung gestellten internen Identifizierungsnummern gelagert. Die Inserts können aus dem gelagerten Material gewonnen werden, indem ein Aliquot des entsprechenden Bakterienklons in dem geeigneten Medium wachsen gelassen wird. Die Plasmid-DNA kann anschließend unter Verwendung von Plasmid-Isolierungsverfahren, die den Fachleuten auf dem Gebiet bekannt sind, wie z.B. alkalische Lyse-Minipreps oder Plasmid-Isolierungsverfahren der alkalischen Lyse im Großmaßstab, isoliert werden. Wenn gewünscht, kann die Plasmid-DNA weiterhin durch Zentrifugation auf einen Cäsiumchloridgradienten durch Größenausschlusschromatographie oder Anionenaustauschchromatographie angereichert werden. Die unter Verwendung dieser Verfahren erhaltene Plasmid-DNA kann dann unter Verwendung von Standard-Klonierungsmethoden, die mit denen die Fachleute auf dem Gebiet vertraut sind, manipuliert werden. Alternativ kann eine PCR durchgeführt werden mit Primern, die an beiden Enden des cDNA-Inserts entworfen wurden. Das PCR-Produkt, das der cDNA entspricht, kann anschließend un ter Verwendung von Standard-Klonierungsverfahren, mit denen die Fachleute auf dem Gebiet vertraut sind, manipuliert werden.
Die durch die verlängerten cDNAs kodierten Polypeptide können auf die Gegenwart von bekannten strukturellen oder funktionellen Motiven oder das Vorhandensein von identifizierenden Merkmalen (signatures), kurzen Aminosäurensequenzen untersucht werden, die bei den Mitgliedern einer Proteinfamilie gut konserviert werden. Die konservierten Regionen wurden verwendet, um Konsensusmuster oder Matrizes abzuleiten, die in der PROSITE-Datenbank, insbesondere in der Datei Prosite.dat (Ausgabe 13.0 von November 1995, zu finden unter http://expasy.hcuge.ch/sprot/prosite.html) abzuleiten. Prosite_convert und Prosite_scan-Programme (http://ulrec3.unil.ch/ftpserveur/prosite_scan) können verwendet werden, um identifizierende Merkmale (signatures) auf den verlängerten cDNAs zu finden.
Für jedes mit dem Prosite_convert-Programm aus der Prosite.dat-Datei erhaltenen Muster kann die Genauigkeit des Nachweises auf einer neuen Proteinsequenz durch Auswerten der Frequenz irrelevanter Treffer auf der Population humaner sezernierter Proteine, die in der Datenbank SWISSPROT enthalten sind, bewertet werden. Das Verhältnis zwischen der Anzahl von Treffern auf shuffled Proteinen (mit einer Fenstergröße von 20 Aminosäuren) und der Anzahl von Treffern auf Nativen (unshuffled) Proteinen, kann als Index verwendet werden. Jedes Muster, für welches das Verhältnis größer als 20% ist (ein Treffer auf shuffled Proteinen auf 5 Treffern auf nativen Proteinen) kann während der Recherche mit Prosite_scan übersprungen werden. Das zum Durchmischen von Proteinsequenzen verwendete Programm (db-shuffled) und das zum Bestimmen der Statistiken für jedes Muster in den Proteindatenbanken verwendete Programm (Prosite_statistics) sind auf der ftp-Seite http://ulrec3.unil.ch/ftpserveur/prosite_scan erhältlich.
Zusätzlich zu PCR-basierten Verfahren zum Erhalt verlängerter cDNAs können auch traditionell Hybridisierungs-basierte Verfahren verwendet werden. Diese Verfahren können auch verwenden werden, um die genomischen DNAs zu erhalten, die für die mRNAs kodieren, von denen die 5'-ESTs abgeleitet wurden, für mRNAs, die den verlängerten cDNAs entsprechen, oder für Nukleinsäuren, die homolog zu den verlängerten cDNAs oder 5'-ESTs sind. Beispiel 29 unten stellt Beispiele für derartige Verfahren zur Verfügung.
BEISPIEL 29
Verfahren zum Erhalt von cDNAs, welche die gesamte kodierende Region und das authentische 5'-Ende der korrespondierenden mRNA enthalten
Eine vollständig lange cDNA-Bibliothek kann hergestellt werden unter Verwendung der in den Beispielen 13, 14, 15 und 16 oben beschriebenen Strategien, indem das Zufallsnonamer, das in Beispiel 14 verwendet wird, durch einen Oligo-dT-Primer ersetzt wird. Zum Beispiel kann das Oligonukleotid der SEQ ID NR: 14 verwendet werden.
Alternativ kann einen cDNA-Bibliothek oder genomische DNA-Bibliothek von einer kommerziellen Quelle erhalten werden oder unter Verwendung von Methoden, die den Fachleuten auf dem Gebiet vertraut sind, hergestellt werden. Derartige cDNA- oder genomische DNA-Bibliotheken können verwendet werden, um verlängerte cDNAs zu isolieren, die von 5'-ESTs oder Nukleinsäuren erhalten wurden, die homolog zu den verlängerten cDNAs oder den 5'-ESTs sind, wie folgt. Die cDNA-Bibliothek oder genomische DNA-Bibliothek wird mit einer nachweisbaren Sonde hybridisiert, die wenigstens 10 konsekutive Nukleotide aus dem 5'-EST oder der verlängerten cDNA umfasst, unter Verwendung herkömmlicher Verfahren hybridisiert. Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 konsekutive Nukleotide des 5'-EST oder der verlängerten cDNA. Bevorzugter umfasst die Sonde wenigstens 20 bis 30 konsekutive Nukleotide aus dem 5'-EST oder der verlängerten cDNA. In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide aus dem 5'-EST oder der verlängerten cDNA.
Methoden zum Identifizieren von cDNA-Klonen in einer cDNA-Bibliothek, die mit einer bestimmten Sondensequenz hybridisieren, sind in Sambrook et al., Molecular Cloning: A Laboratory Manual, 2d Ed., Cold Springs Harbor Laboratory Press, 1989, offenbart. Dieselben Methoden können verwendet werden, um genomische DNAs zu isolieren.
Kurz beschrieben werden cDNA-Klone oder Klone genomischer DNA, die mit der nachweisbaren Sonde hybridisieren, wie folgt identifiziert und für die weitere Manipulation isoliert. Eine Sonde, die wenigstens 10 konsekutive Nukleotide aus dem 5'-EST oder der verlängerten cDNA umfasst, wird mit einer detektierbaren Markierung, wie z.B. einem Radioisotop oder einem fluoreszenten Molekül markiert. Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 konsekutive Nukleotide aus dem 5'-EST oder der verlängerten cDNA. Bevorzugter umfasst die Sonde 20 bis 30 konsekutive Nukleotide von dem 5'-EST oder der verlängerten cDNA. In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide von dem 5'-EST oder der verlängerten cDNA.
Methoden zum Markieren der Sonde sind wohlbekannt und schließen die Phosphorylierung mit Polynukleotidkinase, die Nick Translation, die in vitro-Transkription und nicht-radioaktive Methoden ein. Die cDNAs oder genomischen DNAs in der Bibliothek werden auf einen Nitrocellulosefilter oder Nylonfilter transferiert und denaturiert. Nach dem Blockieren von nicht-spezifischen Stellen wird der Filter mit der markierten Sonde inkubiert, in einer Menge und für eine Zeit, die ausreichend ist für die Sonde, um an die cDNAs oder genomischen DNAs zu binden, die eine Sequenz enthalten, die fähig zur Hybridisierung daran ist.
Durch Variieren der Stringenz der Hybridisierungsbedingungen, die zur Identifizierung verlängerter cDNAs und genomischer DNAs, die mit der nachweisbaren Sonde hybridisieren, verwendet werden, können die verlängerten cDNAs, die verschiedene Homologiegrade zu der Sonde aufweisen, wie unten beschrieben identifiziert und isoliert werden.
1. Identifikation von verlängerten cDNA-Sequenzen oder Sequenzen genomischer DNA, die einen hohen Grad an Homologie mit der markierten Sonde aufweisen
Um verlängerte cDNAs oder genomische DNAs zu identifizieren, die einen hohen Grad an Homologie mit der Sequenz der Sonde aufweisen, kann die Schmelztemperatur der Sonde unter Verwendung der folgenden Formeln berechnet werden.
Für Sonden mit einer Länge zwischen 14 und 70 Nukleotiden wird die Schmelztemperatur (Tm) unter Verwendung der Formel: Tm=81,5+16,6(log [Na+])+0,41(Anteil G+C)-(600/N) berechnet werden, wobei N die Länge der Sonde angibt.
Wenn die Hybridisierung in einer Lösung durchgeführt wird, die Formamid enthält, kann die Schmelztemperatur unter Verwendung der Gleichung Tm=81,5+16,6(log [Na+])+0,41(Anteil G+C)-(0,63% Formamid)-(600/N) berechnet werden, wobei N die Länge der Probe ist.
Eine Prähybridisierung kann in 6 X SSC, % X Denhardt's Reagens, 0,5% SDS, 100 μg denaturierte, fragmentierte Lachssperma-DNA oder 6 X SSC, 5 X Denhardt's Reagens, 0,5% SDS, 100 μg denaturierte, fragmentierte Lachssperma-DNA, 50% Formamid, durchgeführt werden. Die Formeln für SSC und Denhardt's Lösungen sind in Sambrook et al., s.o., angegeben.
Die Hybridisierung wird durchgeführt, indem die nachweisbare Sonde zu den oben angegebenen Prähybridisierungslösungen dazugegeben wird. Wenn die Sonde doppelsträngige DNA umfasst, wird sie vor der Zugabe zu der Hybridisierungslösung denaturiert. Der Filter wird mit der Hybridisierungslösung für einen ausreichenden Zeitraum in Kontakt gebracht, so dass die Sonde an die verlängerten cDNAs oder genomische DNAs enthaltende Sequenzen, die dazu komplementär oder damit homolog sind, hybridisieren kann. Für Sonden mit mehr als 200 Nukleotiden Länge kann die Hybridisierung bei 15-25°C unter der Tm ausgeführt werden. Für kürzere Sonden, wie z.B. Oligonukleotidsonden, kann die Hybridisierung bei 15-25°C unter der Tm durchgeführt werden. Vorzugsweise wird die Hybridisierung bei Hybridisierungen in 6 X SSC bei etwa 68°C durchgeführt. Vorzugsweise wird die Hybridisierung bei Hybridisierungen in 50% Formamid-enthaltenden Lösungen bei etwa 42°C durchgeführt.
Sämtliche der vorangehend beschriebenen Hybridisierungen würden als unter "stringenten" Bedingungen betrachtet werden.
Nach der Hybridisierung wird der Filter in 2 X SSC, 0,1% SDS bei Raumtemperatur für 15 Minuten gewaschen. Der Filter wird anschließend mit 0,1 X SSC, 0,5% SDS bei Raumtemperatur für 30 Minuten bis 1 Stunde gewaschen. Danach wird die Lösung bei der Hybridisierungstemperatur in 0,1 X SSC, 0,5% SDS gewaschen. Ein letzter Waschschritt wird in 0,1 X SSC bei Raumtemperatur durchgeführt.
Verlängerte cDNAs, Nukleinsäuren, die homolog zu den verlängerten cDNAs oder 5'-ESTs sind, oder genomische DNAs, die mit der Sonde hybridisiert haben, werden mittels Autoradiografie oder anderer herkömmlicher Verfahren identifiziert.
2. Erhalt von verlängerten cDNA-Sequenzen oder genomischen cDNA-Sequenzen, die einen geringeren Grad an Homologie zu der markierten Sonde aufweisen
Das obige Verfahren kann modifiziert werden, um verlängerte cDNAs, Nukleinsäuren, die homolog zu verlängerten cDNAs sind, oder genomische DNAs zu identifizieren, die niedrigere Homologiegrade zu der Sondensequenz aufweisen. Zum Beispiel können, um verlängerte cDNAs, Nukleinsäuren, die homolog zu den verlängerten cDNAs sind, oder genomische DNAs mit verringerter Homologie zu der nachweisbaren Sonde zu erhalten, weniger stringente Bedingungen verwendet werden. Zum Beispiel kann die Hybridisierungstemperatur in Schrittgrößen von 5°C von 68 auf 42°C verringert werden, in einem Hybridisierungspuffer, der eine Natriumkonzentration von etwa 1 M hat. Nach der Hybri disierung kann der Filter mit 2 X SSC, 0,5% SDS bei der Hybridisierungstemperatur gewaschen werden. Diese Bedingungen werden als "moderate" Bedingungen bei über 50°C und als "schwache" Bedingungen bei unter 50°C betrachtet.
Alternativ kann die Hybridisierung in Puffern, wie z.B. 6 X SSC, der Formamid enthält, bei einer Temperatur von 42°C durchgeführt werden. In diesem Fall kann die Konzentration des Formamids in dem Hybridisierungspuffer in 5%-Schritten von 50% auf 0% reduziert werden, um Klone zu identifizieren, die verringerte Homologiegrade mit der Sonde aufweisen. Nach der Hybridisierung kann der Filter mit 6 X SSC, 0,5% SDS bei 50°C gewaschen werden. Diese Bedingungen werden als "moderate" Bedingungen bei über 25% Formamid und als "schwache" Bedingungen bei unter 25% Formamid betrachtet.
Verlängerte cDNAs, Nukleinsäuren, die homolog zu den verlängerten cDNAs sind, oder genomische DNAs, die mit der Sonde hybridisiert haben, werden mittels Autoradiografie identifiziert.
3. Bestimmen des Homologiegrades zwischen den erhaltenen verlängerten cDNAs und der markierten Sonde
Wenn es gewünscht wird, Nukleinsäuren zu erhalten, die homolog zu den verlängerten cDNAs sind, wie z.B. allele Varianten davon, oder Nukleinsäuren, die für Proteine kodieren, die mit den durch die verlängerten cDNAs kodierten Proteinen verwandt sind, kann der Homologiegrad zwischen der hybridisierten Nukleinsäure und der verlängerten cDNA oder dem 5'-EST, die als Sonde verwendet wurden, weiterhin unter Verwendung von BLAST2N bestimmt werden; die Parameter können abhängig von der Länge der Sequenz und dem untersuchten Homologiegrad angepasst werden. Um den Grad der Homologie zwischen der hybridisierten Nukleinsäure und der verlängerten cDNA oder dem 5'-EST, von der/dem die Sonde abgeleitet wurde, zu bestimmen, werden die Nukleotidsequenzen der hybridisierten Nukleinsäure und der verlängerten cDNA und des 5'-ESTs, von der/dem die Sonde abgeleitet wurde, verglichen. Zum Beispiel können unter Verwendung der oben genannten Verfahren Nukleinsäuren, die wenigstens 95% Nukleinsäurehomologie zu der verlängerten cDNA oder dem 5'-EST, von der/dem die Sonde abgeleitet wurde, erhalten und identifiziert werden. In ähnlicher Weise kann man durch Verwenden von zunehmend weniger stringenten Hybridisierungsbedingungen Nukleinsäuren erhalten und identifizieren, die wenigstens 90%, wenigstens 85%, wenigstens 80% oder wenigstens 75% Homologie zu der verlängerten cDNA oder dem 5'-EST, von der/dem die Sonde abgeleitet wurde, erhalten und identifizieren.
Um zu bestimmen, ob ein Klon für ein Protein kodiert, das einen bestimmten Grad an Homologie mit dem durch die verlängerte cDNA oder den 5'-EST kodierten Protein aufweist, wird die Aminosäuresequenz, die durch die verlängerte cDNA oder den 5'-EST kodiert wird, mit der Aminosäuresequenz verglichen, die durch die hybridisierende Nukleinsäure kodiert wird. Es wird festgestellt, dass eine Homologie existiert, wenn eine Aminosäuresequenz in der verlängerten cDNA oder dem 5'-EST mit einer Aminosäuresequenz in der hybridisierenden Nukleinsäure nahe verwandt ist. Eine Sequenz ist nahe verwandt, wenn sie identisch mit der der verlängerten cDNA oder des 5'-EST ist oder wenn sie eine oder mehrere Aminosäuresubstitutionen enthält, in denen die füreinander substituierten Aminosäuren ähnliche Eigenschaften aufweisen. Unter Verwendung der oben genannten Verfahren und Algorithmen, wie z.B. FASTA mit Parametern, die abhängig von der Sequenz und dem untersuchten Grad der Homologie sind, kann man Nukleinsäuren erhalten, die für Proteine kodieren, die wenigstens 95%, wenigstens 90%, wenigstens 85%, wenigstens 50% oder wenigstens 75% Homologie zu den Proteinen aufweisen, die durch die verlängerte cDNA oder den 5'-EST kodiert werden, von der/dem die Sonde abgeleitet wurde.
Zusätzlich zu den oben beschriebenen Verfahren sind andere Protokolle vorhanden, um verlängerte cDNAs unter Verwendung von 5'-ESTs zu erhalten, wie in den folgenden Abschnitten dargelegt.
Verlängerte cDNAs können hergestellt werden, indem mRNA aus dem Gewebe, der Zelle oder dem Organismus von Interesse unter Verwendung von mRNA-Präparationsmethoden erhalten werden, die PolyA-Selektionsverfahren oder andere Methoden verwenden, die den Fachleuten auf dem Gebiet bekannt sind. Ein erster Primer, der fähig ist, mit dem PolyA-Schwanz der mRNA zu hybridisieren, wird mit der mRNA hybridisiert, und eine reverse Transkriptionsreaktion wird durchgeführt, um einen ersten cDNA-Strang zu erzeugen.
Der erste cDNA-Strang wird mit einem zweiten Primer hybridisiert, der wenigstens 10 konsekutive Nukleotide der Sequenz der SEQ ID NR: 149 enthält. Vorzugsweise umfasst der Primer wenigstens 12, 15 oder 17 konsekutive Nukleotide aus der Sequenz der SEQ ID NR: 149. Bevorzugter umfasst der Primer 20 bis 30 konsekutive Nukleotide aus der Sequenz der SEQ ID NR: 149. In einigen Ausführungsformen umfasst der Primer mehr als 30 Nukleotide aus der Sequenz der SEQ ID NR: 149. Wenn es gewünscht ist, verlängerte cDNAs zu erhalten, welche die kodierende Sequenz für das vollständige Protein enthalten, einschließlich der authentischen Translations-Initiationsstelle, enthält der zweite verwendete Primer Sequenzen, die stromaufwärts der Translations-Initiationsstelle liegen. Der zweite Primer wird verlängert, um einen zweiten cDNA-Strang zu erzeugen, der zu dem ersten cDNA-Strang komplementär ist. Alternativ kann eine RT-PCR durchgeführt werden, wie oben beschrieben, unter Verwendung von Primern von beiden Enden der zu erhaltenden cDNA.
Verlängerte cDNAs, die 5'-Fragmente der mRNA enthalten, können durch Hybridisieren einer mRNA hergestellt werden, welche die Sequenz des 5'-EST umfasst, für den eine verlängerte cDNA gewünscht wird, mit einem Primer, der wenigstens 10 konsekutive Nukleotide der zu der 5'-EST komplementären Sequenzen umfasst, und durch reverse Transkription des hybridisierten Primers, um einen ersten cDNA-Strang von den mRNAs herzustellen. Vorzugsweise umfasst der Primer wenigstens 12, 15 oder 17 konsekutive Nukleotide aus dem 5'-EST. Bevorzugter umfassen die Primer 20 bis 30 Nukleotide von dem 5'-EST.
Anschließend wird ein zweiter cDNA-Strang synthetisiert, der komplementär zu dem ersten cDNA-Strang ist. Der zweite cDNA-Strang kann hergestellt werden, indem ein Primer, der komplementär ist zu Sequenzen in dem ersten cDNA-Strang, mit dem ersten cDNA-Strang hybridisiert wird und der Primer verlängert wird, um den zweiten cDNA-Strang zu erzeugen.
Die unter Verwendung der oben beschriebenen Verfahren hergestellten doppelsträngigen cDNAs werden isoliert und kloniert. Die verlängerten cDNAs können in Vektoren, wie z.B. Plasmiden oder viralen Vektoren kloniert werden, die fähig sind in einer geeigneten Wirtszelle zu replizieren. Zum Beispiel kann die Wirtszelle eine Bakterienzelle, Säugerzelle, Vogelzelle oder Insektenzelle sein.
Methoden zum Isolieren von mRNA, zur reversen Transkription eines Primers, der mit mRNA hybridisiert ist, um einen ersten cDNA-Strang zu erzeugen, zum Verlängern eines Primers, um einen zweiten cDNA-Strang herzustellen, der komplementär zu dem ersten cDNA-Strang ist, zum Isolieren der doppelsträngigen cDNA und zum Klonieren der doppelsträngigen cDNA sind dem Fachleuten auf dem Gebiet wohlbekannt und in Current Protocols in Molecular Biology, John Wiley and Sons, Inc. 1997 und Sambrook et al., Molecular Cloning: A Laboratory Manual, zweite Ausgabe, Cold Springs Harbor Laboratory, 1989 beschrieben.
Alternativ können Verfahren wie das in Beispiel 29 beschriebene verwendet werden, um vollständig lange cDNAs oder verlängerte cDNAs zu erhalten. In diesem Ansatz werden vollständig lange oder verlängerte cDNAs von mRNA hergestellt und in doppelsträngige Phagemide wie folgt kloniert. Die cDNA-Bibliothek in den doppelsträngigen Phagemiden wird anschließend durch Behandlung mit Endonuklease, wie z.B. dem Gen II-Produkt oder dem Phagen F1, sowie einer Exonuklease einzelsträngig gemacht (Chang et al., Gene 127:95-8, 1993). Ein biotinyliertes Oligonukleotid, das die Sequenz eines 5'-EST umfasst oder ein Fragment, das wenigstens 10 Nukleotide davon enthält, wird mit den einzelsträngigen Phagemiden hybridisiert. Vorzugsweise umfasst das Fragment wenigstens 12, 15 oder 17 konsekutive Nukleotide aus dem 5'-EST. Bevorzugter umfasst das Fragment 20 bis 30 konsekutive Nukleotide aus dem 5'-EST. In einigen Verfahren kann das Fragment mehr als 30 konsekutive Nukleotide von dem 5'-EST umfassen.
Hybride zwischen dem biotinylierten Oligonukleotid und den Phagemiden, die Inserts haben, welche die 5'-EST-Sequenz enthalten, werden durch Inkubieren der Hybride mit paramagnetischen Beads, die mit Streptavidin beschichtet sind und durch Zurückgewinnen der Beads mit einem Magneten isoliert (Fry et al., Biotechniques, 13:124-131, 1992). Anschließend werden die resultierenden Phagemide, die die 5'-EST-Sequenz enthalten, von den Beads freigesetzt und unter Verwendung eines Primers, der spezifisch für die 5'-EST-Sequenz ist, in doppelsträngige DNA konvertiert. Alternativ können Protokolle wie z.B. das Gene Trapper-Kit (Gibco BRL) verwendet werden. Die resultierende doppelsträngige DNA wird in Bakterien transformiert. Verlängerte cDNAs, welche de 5'-EST-Sequenz enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
Unter Verwendung irgendeiner der oben beschriebenen Verfahren in Abschnitt III, kann eine Vielzahl von verlängerten cDNAs, welche die kodierenden Sequenzen für das vollständige lange Protein oder Sequenzen, die nur für das reife Protein kodieren, das nach ... spalten des Signalpeptids übrig bleibt, als cDNA-Bibliotheken für die anschließende Auswertung der kodierten Proteine oder die Verwendung in diagnostischen Assays wie unten beschrieben bereitgestellt werden.
IV. Expression von Proteinen, die durch die verlängerten cDNAs kodiert werden, die unter Verwendung von 5'-ESTs isoliert wurden
Verlängerte cDNAs, welche die kodierenden Sequenzen ihrer korrespondierenden mRNAs für das vollständige Protein oder Teile davon enthalten, wie z.B. cDNAs, die für das reife Protein kodieren, können verwendet werden, um die kodierten sezernierten Proteine oder Teile davon wie in Beispiel 30 unten beschrieben zu exprimieren. Wenn gewünscht, können die verlängerten cDNAs die Sequenzen enthalten, die für das Signalpeptid kodieren, um die Sekretion des exprimierten Proteins zu erleichtern. Es wird verstanden werden, dass eine Vielzahl von verlängerten cDNAs, die die kodierenden Sequenzen für das vollständige Protein oder Teile davon enthalten, gleichzeitig in Expressionsvektoren kloniert werden können, um eine Expressionsbibliothek für die Analyse der kodierten Proteine zu erzeugen, wie unten beschrieben.
BEISPIEL 30
Expression der Proteine, die durch die Gene kodiert werden, die den 5'-ESTs oder Teilen davon entsprechen
Um die Proteine zu exprimieren, die durch die Gene kodiert werden, die den 5'-ESTs entsprechen (oder Teilen davon), werden vollständig lange cDNAs wie in den Beispielen 27-29 beschrieben erhalten, die die kodierende Region für das gesamte Protein enthalten oder verlängerte cDNAs, die Sequenzen enthalten, die benachbart zu den 5'-ESTs sind (oder Teilen davon), und in geeignete Expressionsvektoren kloniert. Wenn gewünscht, können die Nukleinsäuren die Sequenzen enthalten, die für das Signalpeptid kodieren, um die Sekretion des exprimierten Proteins zu erleichtern. Die in die Expressionsvektoren Nukleinsäuren können außerdem Sequenzen stromaufwärts der für das Signalpeptid kodierenden Sequenzen enthalten, wie z.B. Sequenzen, die die Expressionslevel regulieren, oder Sequenzen, die eine gewebsspezifische Expression verleihen.
Die Nukleinsäure, die für das zu exprimierende Protein oder Polypeptid kodiert, wird unter Verwendung herkömmlicher Klonierungsmethoden funktionell mit einem Promotor in einem Expressionsvektor verbunden. Der Expressionsvektor kann irgendeines der Säuger-, Hefe-, Insekten- oder Bakterien-Expressionssysteme sein, die auf dem Gebiet bekannt sind. Kommerziell erhältliche Vektoren und Expressionssysteme sind von einer Vielzahl von Anbietern, einschließlich dem Genetics Institut (Cambridge, MA), Strategene (La Jolla, Kalifornien), Promega (Madison, Wisconsin) und Invitrogen (San Diego, Kalifornien) erhältlich. Wenn gewünscht, kann der Kodonkontext und die Kodonpaarung der Sequenz für einen bestimmten Expressionsorganismus, in den der Expressionsvektor eingeführt wird, wie von Hatfield et al., US-Patent Nr. 5,082,767 erklärt, optimiert werden, um die Expression zu verstärken und die richtige Proteinfaltung zu erleichtern.
Die in den Expressionsvektor klonierte cDNA kann für das gesamte Protein (d. h. das Signalpeptid und das reife Protein), für das reife Protein (d. h. das Protein, das durch Abspalten des Signalpeptids erzeugt wird), nur für das Signalpeptid oder für jeden anderen Teil davon kodieren.
Das Folgende wird nur als beispielhaftes Verfahren zur Verfügung gestellt, um die Proteine zu exprimieren, die durch die mit den 5'-ESTs korrespondierenden verlängerten cDNAs oder die oben beschriebenen Nukleinsäuren kodierten Proteine zu exprimieren. Zuerst werden das Methionin-Initiationskodon für das Gen und das PolyA-Signal des Gens identifiziert. Wenn der für das zu exprimierende Polypeptid kodierenden Nukleinsäure ein Methionin fehlt, das als die Initiationsstelle dienen soll, kann ein Anfangsmethionin neben das erste Kodon der Nukleinsäure unter Verwendung von herkömmlichen Verfahren eingeführt werden. In ähnlicher Weise kann diese Sequenz, wenn der verlängerten cDNA ein PolyA-Signal fehlt, an das Konstrukt angefügt werden, z.B. durch Ausschneiden des PolyA-Signals aus pSG5 (Strategene) unter Verwendung von BglII und SalI-Restriktionsendonukleaseenzymen und durch dessen Einfügung in den Säuger-Expressionsvektor pXT1 (Stratagene). PXT1 enthält die LTRs und einen Teil des Gag-Gens des Moloney Murinen-Leukämievirus. Die Position der LTRs in dem Konstrukt erlaubt eine effiziente stabile Transfektion. Der Vektor enthält einen Promotor der Thymidinkinase des Herpes Simplex und das selektierbare Neomycingen. Die verlängerte cDNA oder ein Teil davon, die/der für das zu exprimierende Polypeptid kodiert, wird durch PCR von dem bakteriellen Vektor erhalten, in dem Oligonukleotidprimer verwendet werden, die komplementär zu der verlängerten cDNA oder dem Teil davon sind, und die Restriktionsendonukleasesequenzen für PstI in dem 5'-Primer und für BglII an dem 5'-Ende des korrespondierenden cDNA 3'-Primers enthalten, wobei Acht gegeben wird, dass die verlängerte cDNA mit dem PolyA-Signal positioniert wird. Das gereinigte Fragment, das aus der resultierenden PCR-Reaktion erhalten wurde, wird mit PstI verdaut, mit einer Exonuklease werden stumpfe Enden hergestellt, es wird mit BglII verdaut, gereinigt und mit pXT1 ligiert, der ein PolyA-Signal enthält, und für diese Ligation vorbereitet wurde (stumpfe Ende/BglII).
Das ligierte Produkt wird in Maus NIH 3T3-Zellen unter Verwendung von Lipofectin (Life Technologies, Inc., Grand Island, New York) unter Bedingungen transfiziert, die in der Produktbeschreibung angegeben sind. Positive Transfektanden werden nach dem Wachstum der transfizierten Zellen in 600 μg/ml G418 (Sigma, St. Louis, Missouri) se tektiert. Vorzugsweise wird das exprimierte Protein in das Kulturmedium freigesetzt, wodurch die Reinigung erleichtert wird.
Alternativ können die verlängerten cDNAs in pED6dpc2 wie oben beschrieben kloniert werden. Die resultierenden pED6dpc2-Konstrukte können in eine geeignete Wirtszelle, wie z.B. COS 1-Zellen transfiziert werden. Methotrexat-resistente Zellen werden selektiert und expandiert. Vorzugsweise wird das von den verlängerten cDNAs exprimierte Protein in das Kulturmedium freigesetzt, wodurch die Reinigung erleichtert wird.
Proteine in dem Kulturmedium werden mittels Gelelektrophorese separiert. Wenn dies gewünscht wird, können die Proteine vor der Elektrophorese mit Ammoniumsulfat präzipitiert oder auf Grundlage der Größe oder Ladung separiert werden.
Als eine Kontrolle wird der Expressionsvektor, dem ein cDNA-Insert fehlt, in die Wirtszellen oder in den Organismus eingeführt, und die Proteine in dem Medium werden gewonnen. Die sezernierten Proteine, die in dem Medium vorhanden sind, werden unter Verwendung von Methoden, die den Fachleuten auf dem Gebiet bekannt sind, wie z.B. der Färbung mit Coomassie-Blau oder der Silberfärbung oder der Verwendung von Antikörpern gegen das durch die verlängerte cDNA kodierte Protein nachgewiesen.
Antikörper, die in der Lage sind, das Protein von Interesse spezifisch zu erkennen, können unter Verwendung von synthetischen 15-mer-Peptiden, die eine Sequenz haben, die durch den geeigneten 5'-EST, die verlängerte cDNA oder den Teil davon kodiert werden, erzeugt werden. Die synthetischen Peptide werden in Mäuse injiziert, um Antikörper gegen das 5'-EST, die verlängerte cDNA oder einen Teil davon kodierte Polypeptid zu erzeugen.
Sezernierte Proteine aus den Wirtszellen oder den Organismen, die einen Expressionsvektor enthalten, der die von einem 5'-EST abgeleitete verlängerte cDNA oder einen Teil davon enthält, werden mit denen aus Kontrollzellen oder Organismen verglichen. Das Vorhandensein in einer Bande in dem Medium aus Zellen, die den Expressionsvektor enthalten, die in dem Medium der Kontrollzellen nicht vorhanden ist, zeigt an, dass die verlängerte cDNA für ein sezerniertes Protein kodiert. Im Allgemeinen wird die Bande, die dem durch die verlängerte cDNA kodierten Protein entspricht, eine Mobilität haben, die nahe der auf Grundlage der Anzahl von Aminosäuren in dem offenen Leserahmen der verlängerten cDNA erwarteten Mobilität liegt. Jedoch kann die Bande eine Mobilität haben, die sich von der erwarteten unterscheidet, als Folge von Modifikationen wie z.B. Glycosylierung, Ubiquitinierung oder enzymatischer Spaltung.
Alternativ können die Proteine, wenn das Protein, das von dem oben genannten Expressionsvektor exprimiert wird, keine Sequenzen enthält, die dessen Sekretion steuern, können die Proteine, die von den Wirtszellen exprimiert werden, die einen Expressionsvektor mit einem für ein sezerniertes Protein oder einen Teil davon kodierendes Insert enthalten, mit den Proteinen verglichen werden, die in Kontrollwirtszellen exprimiert werden, die den Expressionsvektor ohne ein Insert enthalten. Das Vorhandensein einer Bande in Proben von Zellen, die den Expressionsvektor mit einem Insert enthalten, die in Proben aus Zellen, die den Expressionsvektor ohne ein Insert enthalten, nicht vorhanden ist, zeigt an, dass das gewünschte Protein oder ein Teil davon exprimiert wird. Im Allgemeinen wird die Bande die für das sezernierte Protein oder den Teil davon erwartete Mobilität aufweisen. Jedoch kann die Bande eine Mobilität haben, die sich von der erwarteten als Ergebnis von Modifikationen, wie z.B. Glycosylierung, Ubiquitinierung oder enzymatischer Spaltung unterscheidet.
Das durch die verlängerte cDNA kodierte Protein kann unter Verwendung von immunchromatographischen Standardmethoden gereinigt werden. In solchen Verfahren wird eine Lösung, die das sezernierte Protein enthält, wie z.B. das Kulturmedium oder ein Zellextrakt, auf eine Säule gegeben, die Antikörper gegen das sezernierte Protein an die Chromatographiematrix aufweist. Das sezernierte Protein wird an die Immunchromatographiesäule binden gelassen. Anschließend wird die Säule gewaschen, um nicht-spezifisch gebundene Proteine zu entfernen. Das spezifisch gebundene sezernierte Protein wird anschließend von der Säule freigesetzt und unter Verwendung von Standardmethoden gewonnen.
Wenn eine Antikörperproduktion nicht möglich ist, kann die verlängerte cDNA-Sequenz oder der Teil davon in Expressionsvektoren eingefügt werden, die für die Verwendung in Reinigungsschemata entwickelt wurden, welche chimere Polypeptide verwenden. In solchen Strategien wird die kodierende Sequenz der verlängerten cDNA oder des Teils davon im Leserahmen mit dem Gen, das für die andere Hälfte des Chimeres kodiert, insertiert. Die andere Hälfte der Chimere kann β-Globin oder ein Nickelbindendes Polypeptid sein. Eine Chromatographiematrix, die einen Antikörper gegen β-Globin oder Nickel daran angefügt aufweist, wird anschließend verwendet, um das chimere Protein zu reinigen. Proteasespaltstellen können zwischen das β-Globin gehen oder dem Nickel-bindenden Polypeptid oder der verlängerten cDNA oder Teil davon eingefügt werden. Folglich können die beiden Polypeptide der Chimere voneinander durch Proteaseverdau getrennt werden.
Ein nützlicher Expressionsvektor zur Erzeugung von β-Globin-Chimeren ist pSG5 (Stratagene), der für β-Globin des Kaninchens kodiert. Das Intron II des β-Gens des Kaninchens erleichtert das Splicen des exprimierten Transkriptes und das Polyadenylierungssignal, das in das Konstrukt eingefügt ist, erhöht die Expressionsmenge. Diese Methoden, wie sie beschrieben wurden, sind den Fachleuten auf dem Gebiet der Molekularbiologie wohlbekannt. Standardverfahren sind in Verfahrenstexten, wie z.B. Davis et al., (Basic Methods in Molecular Biology, Davis, Dibner und Battey, ed., Elsevier Press, NY, 1986) veröffentlicht, und viele der Verfahren sind von Strategene, Life Technologies, Inc. oder Promega erhältlich. Polypeptide können zusätzlich von dem Konstrukt hergestellt werden unter Verwendung von in vitro-Translationssystemen, wie z.B. dem in vitro Express^TM-Translation-Kit (Stratagene).
Nach der Expression und Reinigung der sezernierten Proteine, die durch die 5'-ESTs, verlängerten cDNAs oder Fragmente davon kodiert werden, können die gereinigten Proteine auf ihre Fähigkeit untersucht werden, an die Oberfläche verschiedener Zelltypen zu binden, wie in Beispiel 31 unten beschrieben. Man wird verstehen, dass eine Vielzahl von Proteinen, die von diesen cDNAs exprimiert werden, in eine Anordnung von Proteinen eingeschlossen werden kann, die gleichzeitig auf die unten spezifisch beschriebenen Aktivitäten hinuntersucht werden, ebenso wie auf andere biologische Rollen, für die Assays zur Bestimmung der Aktivität vorhanden sind.
BEISPIEL 31
Analyse der sezernierten Proteine, um zu bestimmen, ob sie an die Zelloberfläche binden
Die von den 5'-ESTs, verlängerten cDNAs oder Fragmenten davon kodierten Proteine werden in Expressionsvektoren wie die in Beispiel 30 beschriebenen kloniert. Die Proteine werden mittels Größe, Ladung, Immunchromatographie oder anderen Methoden, die den Fachleuten auf dem Gebiet vertraut sind, gereinigt. Nach der Reinigung werden die Proteine unter Verwendung von Methoden, die den Fachleuten auf dem Gebiet bekannt sind, markiert. Die markierten Proteine werden mit Zellen oder Zelllinien inkubiert, die von einer Vielzahl von Organen oder Geweben stammen, um die Proteine mit jedem auf der Zelloberfläche vorhandenen Rezeptor binden zu lassen. Nach der Inkubation werden die Zellen gewaschen, um nicht-spezifisch gebundenes Protein zu entfernen. Die markierten Proteine werden durch Autoradiografie nachgewiesen. Alternativ können unmarkierte Proteine mit den Zellen inkubiert werden und mit Antikörpern nachgewiesen werden, die eine nachweisbare Markierung daran angefügt haben, wie z.B. ein fluoreszentes Molekül.
Die Spezifität der Zelloberflächenbindung kann analysiert werden, indem eine Kompetitionsanalyse durchgeführt wird, in der verschiedene Mengen an unmarkiertem Protein zusammen mit dem markierten Protein inkubiert werden. Die Menge an markiertem Protein, das an die Zelloberfläche gebunden ist, nimmt mit zunehmender Menge an kompetitiv unmarkiertem Protein ab. Als Kontrolle werden verschiedene Mengen an unmarkiertem Protein, das mit dem markierten Protein in keiner Beziehung steht, in einigen Bindungsreaktionen eingeschlossen. Die Menge an markiertem Protein, das an die Zelloberfläche gebunden ist, verringert sich in Bindungsreaktionen, die zunehmende Mengen an verschiedenem unmarkiertem Protein enthalten, ab, was zeigt, dass das durch die cDNA kodierte Protein spezifisch an die Zelloberfläche bindet.
Wie oben erläutert wurde gezeigt, dass sezernierte Proteine eine Vielzahl wichtiger physiologischer Wirkungen ausüben und folglich eine wertvolle therapeutische Quelle darstellen. Die sezernierten Proteine, die durch die verlängerten cDNAs oder Teile davon kodiert werden, die in Übereinstimmung mit den Beispielen 27-29 hergestellt wurden, können untersucht werden, um deren physiologische Aktivitäten wie unten beschrieben festzustellen.
BEISPIEL 32
Untersuchen der Proteine, die von den verlängerten cDNAs oder Teilen davon exprimiert werden, auf ihre Aktivität als Cytokin, ihre Zellteilungsaktivität oder Zelldifferenzierungsaktivität
Wie oben erläutert können sezernierte Proteine als Cytokine wirken oder können die zelluläre Proliferation oder Differenzierung beeinträchtigen. Viele bisher entdeckte Proteinfaktoren, einschließlich sämtlicher bekannter Cytokine, zeigten eine Aktivität in einem oder mehreren Faktor-abhängigen Zellproliferations-Assays, und folglich dienen die Assays als praktische Bestätigung der Cytokinaktivität. Die Aktivität eines durch die verlängerten cDNAs kodierten Proteins wird durch irgendeines der vielen Routine-Assays der Faktor-abhängigen Zellproliferation für Zelllinien nachgewiesen, einschließlich, jedoch ohne Beschränkung, von: 32D, DA2, DA1G, T10, B9, B9/11, BaF3, MC9/G, M⁺ (preB M⁺), 2E8, RB5, DA1, 123, T1165, HT2, CTLL2, TF-1, Mo7c und CMK. Die durch die oben genannten verlängerten cDNAs oder Teile davon kodierten Proteine können auf ihre Fähigkeit, die T-Zell- oder Thymocyten-Proliferation zu regulieren, in Assays wie z.B. den oben beschriebenen oder in den folgenden Referenzen beschriebenen, untersucht werden: Current Protocols in Immunology, herausgegeben durch Coligan et al., Greene Publishing Associates and Wiley-Interscience; Takai et al. J. Immunol. 137:3494-3500, 1986; Bertagnolli et al., J. Immunol. 145:1706-1712, 1990; Bertagnolli et al., Cell. Immunol. 133:327-341, 1991; Bertagnolli et al., J. Immunol. 149:3778-3783, 1992; Bowman et al., J. Immunol. 152:1756-1761, 1994.
Darüber hinaus sind zahlreiche Assays für die Cytokinproduktion und/oder die Proliferation von Milzzellen, Zellen der Lymphknoten und Thymocyten bekannt. Diese schließen die in Current Protocols in Immunology, s.o., 1:3.12.1-3.12.14 ein; sowie Schreiber in Current Protocols in Immunology, s.o., 1:6.8.1-6.8.8.
Die durch die cDNAs kodierten Proteine können außerdem auf ihre Fähigkeit hin untersucht werden, die Proliferation und Differenzierung von hematopoetischen oder lymphopoetischen Zellen zu regulieren. Viele Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich den in den folgenden Referenzen eingeschlossenen Assays: Bottomly et al., in Current Protocols in Immunology, s.o., 1:6.3.1-6.3.12; deVries et al., J. Exp. Med. 173:1205-1211, 1991; Moreau et al., Nature 36:690-692, 1988; Greenberger et al., Proc. Natl. Acad. Sci. USA 80:2931-2938, 1983; Nordan, R., in Current Protocols in Immunology, s.o., 1:6.6.1-6.6.5; Smith et al., Proc. Natl. Acad. Sci. USA 83:1857-1861, 1986, Gennett et al., in Current Protocols in Immunology, s.o., 1:6.15.1; Ciarletta et al., in Current Protocols in Immunology, s.o., 1:6.13.1.
Die durch die cDNAs kodierten Proteine können außerdem auf ihre Fähigkeit hin untersucht werden, die T-Zell-Antworten auf Antigene zu regulieren. Viele Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich den in den folgenden Referenzen beschriebenen Assays: Kapitel 3 (In Vitro Assays for Mouse Lymphocyte Function), Kapitel 6 (Cytokines and Their Cellular Receptors) und Kapitel 7 (Immunologic Studies in Humans) in Current Protocols in Immunology, s.o.; Weinberger et al., Proc. Natl. Acad. Sci. USA 77:6091-6095, 1980, Weinberger et al., Eur. J. Immun. 11:405-411, 1981; Takei et al., J. Immunol. 137:3494-3500, 1986; Takei et al., J. Immunol. 140:508-512, 1988.
Die Proteine, die eine Cytokin-, Zellproliferations- oder Zelldifferenzierungsaktivität zeigen, können anschließend als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in denen die Induktion der Zellproliferation oder der Zelldifferenzierung von Nutzen ist. Alternativ können die Gene, wie unten detaillierter beschrieben wird, die für diese Proteine kodieren oder Nukleinsäuren, welche die Expression dieser Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu steigern oder zu verringern.
BEISPIEL 33
Untersuchen der Proteine, die von den verlängerten cDNAs oder Teilen davon exprimiert werden, auf ihre Aktivität als Regulatoren des Immunsystems
Die durch die cDNAs kodierten Proteine können außerdem auf ihre Wirkungen als Immunregulatoren hin untersucht werden. Zum Beispiel können die Proteine auf ihre Aktivität untersucht werden, die Zytotoxizität der Thymocyten oder Splenocyten zu beeinflussen. Zahlreiche Assays für derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen beschriebenen: Kapitel 3 (In Vitro Assays for Mouse Lymphocyte Function 3.1-3.19) und Kapitel 7 (Immunologic Studies in Humans) in Current Protocols in Immunology, Coligan et al., Hrsg., Greene Publishing Associates and Wiley-Interscience; Hermann et al., Proc. Natl. Acad. Sci. USA 78:2488-2492, 1981; Herrmann et al., J. Immunol. 128:1968-1974, 1982; Handa et al., J. Immunol. 135:1564-1572, 1985; Takei et al., J. Immunol. 137:3494-3500, 1986; Takei et al., J. Immunol. 140:508-512, 1988; Bowman et al., J. Virology 61:1992-1998; Bertagnolli et al., Cell. Immunol. 133:327-341, 1991, Brown et al., J. Immunol. 153:3079-3092, 1994.
Die durch die cDNAs kodierten Proteine können außerdem auf ihre Wirkungen auf T-Zell-abhängige Immunglobulinantworten und Isotypenwechsel untersucht. Verschiene Assays für derartige Aktivitäten sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Maliszewski, J. Immunol. 144:3028-3033, 1990; Mond et al., in Current Protocols in Immunology, 1:3.8.1-3.8.16, s.o.,
Die durch cDNAs kodierten Proteine können außerdem auf ihre Wirkung auf Immuneffektorzellen, einschließlich ihres Effektes auf Th1-Zellen und auf zytotoxische Lymphozyten, untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Kapitel 3 (In Vitro Assays for Mouse Lymphocyte Function 3.1-3.19) und Kapitel 7 (Immunologic Studies in Humans) in Current Protocols in Immunology, s.o., Takei et al., J. Immunol. 137:3494-3500, 1986; Takei et al., J. Immunol. 140:508-512, 1988; Bertagnolli et al., J. Immunol. 149:3778-3783, 1992.
Die durch die cDNAs kodierten Proteine können außerdem auf ihre Wirkung auf die durch dendritische Zellen vermittelte Aktivierung von naiven T-Zellen untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Guery et al., J. Immunol. 134:536-544, 1995; Inaba et al., J. Exp. Med. 173:549-559, 1991; Macatonia et al., J. Immunol. 154:5071-5079, 1995; Porgador et al., J. Exp. Med. 182:255-260, 1995; Nair et al., J. Virol. 67:4062-4069, 1993; Huang et al., Science 264:961-965, 1994; Macatonia et al., J. Exp. Med. 169:1255-1264, 1989; Bhardwaj et al., Journal of Clinical Investigation 94:797-807, 1994; und Inaba et al., J. Exp. Med. 172:631-640, 1990.
Die durch die cDNAs kodierten Proteine können außerdem auf ihren Einfluss auf die Lebenszeit von Lymphozyten untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich den in den folgenden Referenzen offenbarten Assays: Darzynkiewicz et al., Cytometry 13:795-808, 1992; Gorczyca et al., Leukemia 7:659-670, 1993; Gorczyca et al., Cancer Res. 53:1945-1951, 1993; Itoh et al., Cell 66:233-243, 1991; Zacharchuk, J. Immunol. 145:4037-3045, 1990; Zamai et al., Cytometry 14:891-897, 1993; Gorczyca et al., Int. J. Oncol. 1:639-648, 1992.
Die durch die cDNAs kodierten Proteine können außerdem auf ihren Einfluss auf die frühen Schritten der T-Zell-Festlegung und der T-Zell-Entwicklung untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich und ohne Beschränkung der Assays, die in den folgenden Referenzen offenbart sind: Antica et al., Blood 84:111-117, 1994; Fine et al., Cell. Immunol. 155:111-122, 1994; Galy et al., Blood 85:2770-2778, 1995; Toki et al., Proc. Natl. Acad. Sci. USA 88:7748-7751, 1991.
Die Proteine, die eine Aktivität als Regulatoren des Immunsystems zeigen, können anschließend als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in denen die Regulation der Immunaktivität nützlich ist. Zum Beispiel können die Proteine nützlich sein bei der Behandlung von verschiedenen Immundefizienzen und Immunerkrankungen (einschließlich der schweren kombinierten Immundefekte), z.B. bei der Regulierung (herauf und herunter) des Wachstums und der Proliferation von T- und/oder B-Lymphozyten sind, ebenso wie bei der Bewirkung der zytolytischen Aktivität von NK-Zellen und anderen Zellpopulationen. Diese Immundefizienzen können genetisch sein oder durch virale (z.B. HIV) ebenso bakterielle oder Pilzinfektionen verursacht sein, oder aus einer Autoimmunerkrankung resultieren. Spezifischer kann eine infektiöse Erkrankung, die durch eine virale Infektion, bakterielle Infektion, Pilzinfektion oder andere Infektionen verursacht wurde, behandelbar sein, indem ein Protein verwendet wird, das durch die verlängerten cDNAs kodiert wird, die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleitet sind, einschließlich von Infektionen durch HIV, Hepatitisviren, Herpesviren, Mycobakterien, Leishmania spp, Plasmodium und verschiedenen Pilz-Infektionen, wie z.B. Candidiase. Natürlich kann in diesem Zusammenhang ein Protein, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiertes Protein außerdem nützlich sein, wenn ein Boost des Immunsystems allgemein gewünscht sein kann, d. h. bei der Behandlung von Krebs.
Alternativ können die Proteine, die durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert werden, bei der Behandlung von Autoimmunerkrankungen nützlich sein, einschließlich z.B. der Bindegewebserkrankung, Multiple Sklerose, systemischen Lupus erythematosus, rheumatoider Arthritis, autoimmuner pulmonaren Entzündung, Guillain-Barre-Syndrom, autoimmuner Thyroiditis, Insulin-abhängiger Diabetes mellitus, Myasthenia gravis, Graft-versus-Host-Erkrankung und autoimmunentzündlicher Augenerkrankung. Ein solches Protein, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert wird, kann außerdem nützlich bei der Behandlung allergischer Reaktionen und Zustände sein, wie z.B. Asthma (insbesondere allergischem Asthma) oder anderen respiratorischen Problemen. Andere Zustände, in denen die Immunsuppression gewünscht wird (einschließlich, z.B., der Organtransplantation), können ebenfalls behandelbar sein, indem ein Protein verwendet wird, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert wird.
Durch Verwendung der Proteine gemäß der Erfindung kann es außerdem möglich sein, entweder hoch oder herunterzuregulieren.
Eine Herabregulierung kann die Inhibierung oder Blockierung einer Immunantwort umfassen, die bereits imgange ist, oder kann das Verhindern der Induktion einer Immunantwort umfassen. Die Funktionen aktivierter T-Zellen können durch Unterdrücken der T-Zell-Antworten oder durch Induzieren einer spezifischen Toleranz in T-Zellen oder durch beides inhibiert werden. Eine Immunsuppression von T-Zell-Antworten ist im Allgemeinen ein aktiver, nicht-antigenspezifischer Prozess, der eine kontinuierlich Exposition der T-Zellen gegenüber dem suppressiven Agens erfordert. Toleranz, die das Induzieren einer Nicht-Ansprechempfindlichkeit oder Anergie in T-Zellen umfasst, ist von der Immunsuppression dadurch unterscheidbar, da sie im Allgemeinen Antigen-spezifisch ist und nach dem Ende der Exposition gegenüber dem tolerisierenden Agens fortdauert. Funktionell kann Toleranz nachgewiesen werden durch das Fehlen einer T-Zell-Antwort bei erneuter Exposition gegenüber einem spezifischen Antigen in Abwesenheit des tolerisierenden Agens.
Die Herabregulation oder die Vermeidung einer oder mehrerer Antigenfunktionen (einschließlich, ohne Beschränkung, von B-Lymphozyten-Antigenfunktionen, wie z.B. der B7-Kostimulation), z.B. die Vermeidung der Synthese von hohen Konzentrationen von Lymphokinen durch aktivierte T-Zellen, wird in Situationen der Gewebs-, Haut- und Organtransplantation und bei der Graft-versus-Host-Erkrankung (graft-versus-host disease, GVHD) nützlich sein. Zum Beispiel sollte das Blockieren der T-Zell-Funktion zu einer verringerten Gewebszerstörung bei der Gewebstransplantation führen. Typischerweise wird die Abstoßung des Transplantats bei Gewebetransplantaten durch dessen Erkennung als fremd durch T-Zellen initiiert, gefolgt von einer Immunreaktion, welche das Transplantat zerstört. Das Verabreichen eines Moleküls, das die Interaktion eines B7-Lymphozytenantigens mit dessen natürlichen Ligand(en) auf Immunzellen inhibiert oder blockiert (wie z.B. eine lösliche, monomere Form eines Peptids, das allein oder zusammen mit einer monomeren Form eines Peptids, das eine Aktivität eines anderen B-Lymphozytenantigens aufweist (z.B. B7-1, B7-3) oder in Verbindung mit einem blockierenden Antikörper), vor der Transplantation, kann zu der Bindung des Moleküls an den natürlichen Ligand(en) auf den Immunzellen ohne die Übermittlung des entsprechenden kostimulatorischen Signals führen. Ein Blockieren der B-Lymphozyten-Antigenfunktion in dieser Angelegenheit verhindert die Cytokinsynthese durch Immunzellen, wie z.B. T-Zellen, und wirkt dadurch als ein Immunsuppressor. Darüber hinaus kann das Fehlen einer Kostimulation auch ausreichend sein, um die T-Zelle zu anergisieren, wodurch eine Toleranz in einem Individuum induziert wird. Die Induktion einer Langzeittoleranz durch B-Lymphozytenantigen-blockierende Reagenzien kann die Notwendigkeit von wiederholter Verabreichung dieser blockierenden Reagenzien vermeiden. Um eine ausreichende Immunsuppression oder Toleranz in einem Individuum zu erreichen, kann es außerdem notwendig sein, die Funktion einer Kombination von B-Lymphozytenantigenen zu blockieren.
Die Effizienz von bestimmten blockierenden Reagenzien bei der Vermeidung von Organtransplantatsabstoßungen oder GVHD kann untersucht werden, indem Tiermodelle verwendet werden, die für die Effizienz im Menschen Vorhersagekraft haben. Beispiele für geeignete Systeme, die verwendet werden können, schließen allogene Herztransplantate in Ratten und xenogene Transplantate der Lange Hans'schen Inselzellen in Mäusen ein, die beide verwendet wurden, um die immunsuppressiven Wirkungen von CTLA4Ig-Fusionsproteinen in vivo zu untersuchen, wie in Lenschow et al., Science 257:789-792, 1992 und Turka et al., Proc. Natl. Acad. Sci. USA 89:11102-11105, 1992 beschrieben. Darüber hinaus können Maus-Modelle für GVHD (siehe Paul ed., Fundamental Immunology, Raven Press, New York, 1989, Seiten 846-847) verwendet werden, um die Wirkung der Blockierung der B-Lymphozytenantigenfunktion in vivo auf die Entwicklung dieser Krankheit zu untersuchen.
Eine Blockierung der Antigenfunktion kann außerdem therapeutisch nützlich sein für die Behandlung von Autoimmunkrankheiten. Viele Autoimmunerkrankungen sind das Ergebnis einer ungeeigneten Aktivierung von T-Zellen, die gegen Eigengewebe reaktiv sind und die die Produktion von Cytokinen und von Autoantikörpern, die an der Pathologie der Erkrankung beteiligt sind, begünstigen. Ein Verhindern der Aktivierung von autoreaktiven T-Zellen kann die Erkrankungssymptome reduzieren oder eliminieren. Ein Verabreichen von Reagenzien, welche die Kostimulation von T-Zellen blockieren, indem sie die Rezeptor/Liganden-Interaktionen von B-Lymphozytenantigenen zerstören, kann verwendet werden, um die T-Zell-Aktivierung zu inhibieren und die Produktion von Autoantikörpern oder von T-Zell-abgeleiteten Cytokinen, welche potenziell an dem Fortschreiten der Erkrankung beteiligt sind, zu verhindern. Darüber hinaus können blockierende Reagenzien eine Antigen-spezifische Toleranz autoreaktiver T-Zellen induzieren, die zu einer längerfristigen Linderung der Krankheit führen könnte. Die Effizienz von blockierenden Reagenzien bei der Vermeidung oder der Linderung von Autoimmunerkrankungen kann bestimmt werden, indem eine Zahl gut charakterisierter Tiermodelle für humane Autoimmunkrankheiten verwendet wird. Beispiele schließen die experimentelle Autoimmunencephalitis der Maus, systemischer Lupus erythematosus in MRL/pr/pr-Mäusen oder NZB-Hybrid-Mäusen, die autoimmune Kollagenarthritis in Mäusen, Diabetes mellitus in OD-Mäusen und BB-Ratten und die experimentellen Myasthenia gravis der Maus ein (siehe Paul Ed., s.o., Seiten 840-856) ein.
Eine Hochregulation einer Antigenfunktion (vorzugsweise eine B-Lymphozytenantigenfunktion) als Mittel zur Hochregulation von Immunantworten kann ebenfalls in der Therapie nützliche sein. Eine Hochregulation von Immunantworten kann entweder das Verstärken einer vorhandenen Immunantwort umfassen oder das Hervorrufen einer ersten Immunantwort, wie durch die folgenden Beispiele gezeigt wird. Zum Beispiel kann die Verstärkung einer Immunantwort durch Stimulieren der B-Lymphozytenantigenfunktion in Fällen der viralen Infektion nützlich sein. Darüber hinaus eine systemische virale Erkrankung, wie z.B. Influenza, der gemeinen Erkältung sowie Encephalitis durch die systemische Verabreichung einer stimulatorischen Form B-Lymphozytenantigenen gelindert werden.
Alternativ können antivirale Immunantworten in einem infizierten Patienten durch Entfernen der T-Zellen aus dem Patienten, durch Kostimulieren der T-Zellen in vitro mit APCs, die mit viralem Antigen gepulst wurden, die entweder ein durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodierten Peptid exprimieren oder zusammen mit einer stimulatorischen Form eines löslichen Peptids, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert wird, und durch Wiedereinführen der in vitro geprimten T-Zellen in den Patienten verstärkt werden.
Die infizierten Zellen wären jetzt fähig, ein kostimulatorisches Signal an T-Zellen in vivo zu liefern, wodurch die T-Zellen aktiviert werden.
In einer anderen Anwendung kann die Hochregulation oder das Verstärken der Antigenfunktion (vorzugsweise der B-Lymphozytenantigenfunktion) bei der Induktion einer Tumorimmunität nützlich sein. Tumorzellen (z.B. Sarkom, Melanom, Lymphom, Leukämie, Neuroblastom, Karzinom), die mit einer Nukleinsäure transfiziert sind, die wenigstens für ein Peptid kodieren, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert wird, können einem Individuum verabreicht werden, um die tumorspezifische Toleranz in dem Individuum zu überwinden. Wenn dies gewünscht wird, kann die Tumorzelle transfiziert werden, so dass sie eine Kombination von Peptiden exprimiert. Zum Beispiel können die von einem Patienten erhaltenen Tumorzellen ex vivo mit einem Expressionsvektor transfiziert werden, der die Expression eines Peptids mit B7-2-ähnlicher Aktivität steuert, allein oder zusammen mit einem Peptid, das eine B7-1-ähnliche Aktivität und/oder B7-3-ähnliche Aktivität aufweist. Die transfizierten Tumorzellen werden dem Patienten zurückgeführt, was zu einer Expression der Peptide auf der Oberfläche der transfizierten Zellen führt. Alternativ können Gentherapieverfahren verwenden werden, um eine Tumorzelle für die in vivo-Transfektion gezielt zu erreichen.
Die Gegenwart des Peptids, das durch die von den 5'-ESTs gemäß der Erfindung abgeleiteten cDNAs kodiert wird, das die Aktivität eines oder mehrerer B-Lymphozytenantigene auf der Oberfläche der Tumorzelle aufweist, stellt T-Zellen das notwendige kostimulatorische Signal zur Verfügung, um eine T-Zell-vermittelte Immunantwort gegen die transfizierten Tumorzellen zu erzeugen. Zusätzlich können Tumorzellen, denen ausreichende Mengen der MHC Klasse 1- oder MHC Klasse 2-Moleküle fehlen, oder die es nicht schaffen, ausreichende Mengen an MHC Klasse 1- oder MHC Klasse 2-Molekülen zu reexprimieren, mit Nukleinsäure transfiziert werden, die für die ganze oder einen Teil (z.B. einen Teil, bei dem die zytoplasmatische Domäne trunkiert ist) einer MHC Klasse 1-α-Kette und eines β 2-Mikroglobulins oder einer MHC Klasse 2-α-Kette und einer MHC Klasse 2-β-Kette transfiziert werden, um dadurch MHC Klasse 1-bzw. MHC Klasse 2-Proteine auf der Zelloberfläche zu exprimieren. Die Expression der entsprechenden MHC Klasse 1-Moleküle oder MHC Klasse 2-Moleküle zusammen mit einem Peptid, das die Aktivität eines B-Lymphozytenantigens hat (z.B. B7-1, B7-2, B7-3) induziert eine T-Zell-vermittelte Immunantwort gegen die transfizierte Tumorzelle. Optional kann auch ein Gen, das für ein Antisensekonstrukt kodiert, das der Expression eines MHC Klasse 2-assoziierten Proteins, wie z.B. die invariante Kette, blockiert, ebenso mit einer DNA kotransfiziert werden, die für ein Peptid kodiert, das die Aktivität eines B-Lymphozytenantigens hat, um die Präsentation von tumorassoziierten Antigenen zu fördern und eine tumorspezifische Immunität zu induzieren. Folglich kann die Induktion einer T-Zell-vermittelten Immunantwort in einem menschlichen Individuum ausreichen, um die tumorspezifische Toleranz in dem Individuum zu überwinden. Wie detaillierter unten beschrieben, können alternativ Gene, die für diese Regulatorproteine des Immunsystems kodieren, oder Nukleinsäuren, die die Expression solcher Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
BEISPIEL 34
Untersuchen der von den verlängerten cDNAs oder Teilen davon exprimierten Proteine auf eine die Hematopoese regulierende Aktivität
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre die Hematopoese regulierende Aktivität untersucht werden. Zum Beispiel kann die Wirkung der Proteine auf die Differenzierung von embryonalen Stammzellen untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Johansson et al., Cell. Biol. 15:141-151, 1995; Keller et al., Mol. Cell. Biol. 13:473-478, 1993; McClanahan et al., Blood 81:2903-2915, 1993.
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können außerdem auf ihren Einfluss auf die Lebensdauer von Stammzellen und auf die Stammzelldifferenzierung untersucht werden. Zahlreihe Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Freshney, Methylcellulose Colony Forming Assays, in Culture of Hematopoietic Cells, Freshney et al., Eds. Seiten 265-268, Wiley-Liss, Inc., New York, NY, 1994; Hirayama et al., Proc. Natl. Acad. Sci. USA 89:5907-5911, 1992; McNiece und Briddell, in Culture of Hematopoietic Cells, s.o., Neben et al., Exp. Hematol. 22:353-359, 1994; Ploemacher und Cobblestone in Culture of Hematopoietic Cells, s.o., 21, Spooncer et al., in Culture of Hematopoietic Cells, s.o., 163-179 und Sutherland in Culture of Hematopoietic Cells, s.o., 139-162.
Die Proteine, die eine die Hematopoese regulierende Aktivität zeigen, können anschließend als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in denen die Regulation der Hematopoese vorteilhaft ist, wie z.B. bei der Behandlung von Defizienzen myeloider Zellen oder lymphoider Zellen. Eine Beteiligung an der Regulierung der Hematopoese wird bereits durch maginale biologische Aktivität zur Unterstützung von koloniebildenden Zellen oder Faktor-abhängigen Zelllinien angezeigt. Zum Beispiel zeigen Proteine, welche das Wachstum und die Proliferation von erythroiden Vorläuferzellen allein oder im Kombination mit anderen Cytokinen unterstützen, Nützlichkeit an, z.B. bei der Behandlung verschiedener Anämien oder zur Verwendung zusammen mit Bestrahlung/Chemotherapie, um die Produktion erythroider Vorläufer und/oder erythroider Zellen zu stimulieren. Proteine, welche das Wachstum und die Proliferation myeloider Zellen unterstützen, wie z.B. Granulozyten und Monozy ten/Makrophagen (d. h. die traditionelle CSF-Aktivität) können nützlich sein, z.B. zusammen mit Chemotherapie, um eine konsequente Myelosuppression zu verhindern oder zu behandeln. Proteine, welche das Wachstum und die Proliferation von Megakaryocyten unterstützen und folglich von Blutplättchen, erlauben die Vermeidung oder Behandlung verschiedener Erkrankungen der Blutplättchen, einschließlich der Thrombocytopenie und können im Allgemeinen anstelle von Transfusionen mit Blutplättchen oder ergänzend zu Transfusionen mit Blutplättchen verwendet werden. Proteine, welche das Wachstum und die Proliferation hematopoetischer Stammzellen unterstützen, die in der Lage sind, in sämtliche der oben genannten hematopoetischen Zellen zu reifen, können daher therapeutischen Nutzen bei verschiedenen Stammzellerkrankungen finden (einschließlich solcher, die gewöhnlicherweise mit Transplantation behandelt werden, einschließlich, jedoch ohne Beschränkung, der aplastischen Anämie und der paroxysmalen nokturnen Hämoglobinurie), ebenso wie bei der Erneuerung des Stammzellbestandes nach der Bestrahlung/Chemotherapie, entweder in vivo oder ex vivo (d. h. zusammen mit einer Knochenmarkstransplantation oder mit einer Transplantation peripherer Vorläuferzellen (homolog oder heterolog)), als normale Zellen oder genetisch manipuliert für die Gentherapie. Wie detaillierter unten beschrieben, können alternativ Gene, die für Proteine mit die Hematopoese regulierender Aktivität kodieren oder Nukleinsäuren, die die Expression solcher Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
BEISPIEL 35
Untersuchen der Proteine, die von den verlängerten cDNAs oder Teilen davon exprimiert werden, auf eine Regulation des Gewebewachstums
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre Wirkung auf das Gewebewachstum untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet bekannt, einschließlich der in der internationalen Patentveröffentlichung Nr. WO 95/16035 , internationalen Patentveröffentlichung Nr. WO 95/05846 und internationalen Patentveröffentlichung Nr. WO 91/07491 offenbarten Assays.
Assays für die Wundheilungsaktivität schließen ohne Beschränkung die in Winter, Epidermal Wound Healing, Seiten 71-112, Maibach und Rovee, Editoren, Jahrbuch Medical Publishers, Inc., Chicago, wie von Eaglstein und Mertz, J. Invest. Dermatol. 71:382-84, 1978 modifiziert, ein.
Die Proteine, die an der Regulation des Gewebewachstums beteiligt sind, können anschließend als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in denen die Regulation des Gewebewachstums vorteilhaft ist. Zum Beispiel kann ein Protein, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert wird, auch einen Nutzen in Zusammensetzungen haben, die für das Gewebewachstum oder die Regeneration von Knochen, Knorpel, Sehnen, Bändern und/oder Nerven verwendet werden, ebenso wie für die Wundheilung und die Wiederherstellung oder den Ersatz von Gewebe, sowie bei der Behandlung von Verbrennungen, Schnitten und Ulzera.
Ein durch die von den 5'-ESTs gemäß der Erfindung verlängerten cDNAs kodiertes Protein, das das Wachstum von Knorpel und/oder Knochen induziert, in Fällen, in denen der Knochen nicht normal ausgebildet ist, findet Anwendung bei der Heilung von Knochenfrakturen und Knorpelschäden oder Knorpeldefekten in Menschen und anderen Tieren. Eine derartige Herstellung, die ein Protein gemäß der Erfindung verwendet, kann eine prophylaktische Verwendung bei der Reduktion sowohl von geschlossenen als auch von offenen Brüchen und auch bei der verbesserten Fixierung künstlicher Gelenke haben. Die de novo-Knochensynthese, die durch ein osteogenisches Agens induziert wird, trägt zu der Wiederherstellung von craniofacialen Defekten bei, die erblich bedingt sind, durch ein Trauma induziert wurden oder durch die onkologische Resektion induziert wurden und ist außerdem nützlich in der kosmetisch plastischen Chirurgie.
Ein Protein gemäß dieser Erfindung kann außerdem bei der Behandlung von Periodontalerkrankungen und bei anderen Zahnwiederherstellungsverfahren verwendet werden. Derartige Agenzien können eine Umgebung bereitstellen, um knochenbildende Zellen anzuziehen, das Wachstum von knochenbildenden Zellen zu stimulieren oder eine Differenzierung knochenbildender Vorläuferzellen zu induzieren. Ein Protein gemäß der Erfindung kann außerdem nützlich bei der Behandlung von Osteoporose oder Osteoarthritis sein, wie z.B. durch Stimulation der Wiederherstellung des Knochens und/oder des Knorpels oder durch Blockieren der Entzündung oder von Gewebszerstörungsprozessen (Kollagenaseaktivität, Osteoklastenaktivität, usw.), die durch inflammatorische Vorgänge vermittelt wird.
Eine weitere Kategorie der Gewebsregenerationsaktivität, die den durch die von 5'-ESTs gemäß der Erfindung abgeleiteten verlängerten cDNAs kodierten Proteinen zugerechnet werden könnte, ist die Bildung von Sehnen/Bändern. Ein durch die von den 5'-ESTs ge mäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiertes Protein, das Bänder/Sehnen-ähnliches Gewebe induziert oder andere Gewebsbildung in Fällen, in denen ein solches Gewebe normalerweise nicht gebildet wird, findet Anwendung bei der Heilung von Sehnenrissen oder Bänderrissen, Deformationen und anderen Störungen der Sehnen oder Bänder in Menschen oder anderen Tieren. Eine solche Herstellung verwendet ein Protein, das Sehnen/Bänder-ähnliches Gewebe induziert, das eine prophylaktische Verwendung bei der Verhinderung von Schäden an Sehne- oder Bändergewebe haben, ebenso wie Verwendung bei der verbesserten Fixierung von Sehnen oder Bändern an Knochen oder anderen Geweben und bei der Wiederherstellung von Sehnen- oder Bändergewebe. Die de novo-Bildung von Sehnen/Bänder-ähnlichem Gewebe, die durch eine Zusammensetzung induziert wird, die durch von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten cDNAs kodiert wird, trägt zu der Wiederherstellung von Sehnen oder Bänderdefekten bei, die angeborenen, traumatischen oder anderen Ursprungs sind, und ist außerdem nützlich in der kosmetisch plastischen Chirurgie zur Anheftung oder zur Wiederherstellung von Sehnen oder Bändern. Die durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodierten Zusammensetzungen können eine Umgebung zur Verfügung stellen, um Sehnen- oder Bänder-bildende Zellen anzulocken, das Wachstum von Sehnen- oder Bänder-bildenden Zellen zu stimulieren, die Differenzierung von Vorläufern von Sehnen- oder Bänder-bildenden Zellen zu induzieren oder das Wachstum von Sehnen/Bänderzellen oder Vorläufern ex vivo zu induzieren, um sie in vivo wieder einzubringen, um eine Wiederherstellung des Gewebes zu bewirken. Die Zusammensetzungen gemäß der Erfindung können außerdem nützlich sein bei der Behandlung von Tendinitis, des Carpal-Tunnel-Syndroms und anderen Sehnen- oder Bänderfehlern. Die Zusammensetzungen können außerdem eine geeignete Matrix und/oder ein sequestrierendes Mittel als Träger umfassen, wie auf dem Gebiet wohlbekannt ist.
Das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodierte Protein kann außerdem nützlich für die Proliferation neuronaler Zellen und die Regeneration von Nerven- und Hirngewebe sein, d. h. für die Behandlung von Erkrankungen des zentralen und peripheren Nervensystems sowie von Neuropathien, ebenso wie für mechanische und traumatische Erkrankungen, welche die Degeneration, den Tod oder ein Trauma der neuralen Zellen oder des Nervengewebes umfassen. Spezifischer kann ein Protein verwendet werden bei der Behandlung von Erkrankungen des peripheren Nervensystems, wie z.B. Verletzungen der peripheren Nerven, peripherer Neuropathie und lokalisierter Neuropathien sowie Erkrankungen des zentralen Nervensystems, wie z.B. Alzheimer'sche Erkrankung, Parkinson'sche Erkrankung, Chores Huntington, amyotrophe Lateralsklerose und Shy-Drager-Syndrom. Weitere Zustände, die in Übereinstimmung mit der vorliegenden Erfindung behandelt werden können, schließen mechanische und traumatische Erkrankungen ein, wie z.B. Erkrankungen des Rückenmarks, Schädeltraumata und zerebrovaskuläre Erkrankungen, wie z.B. Schlaganfall. Periphere Neuropathien, die aus der Chemotherapie oder anderen medizinischen Therapien resultieren, können ebenfalls unter Verwendung eines Proteins gemäß der Erfindung behandelbar sein.
Proteine gemäß der Erfindung können außerdem nützlich sein, um eine bessere und schnellere Schließung von nicht heilenden Wunden zu fördern, einschließlich, jedoch ohne Beschränkung, von Druckulzera, Ulzera, die mit einer vaskulären Insuffizienz assoziiert sind, chirurgischen und traumatischen Wunden und dergleichen.
Es ist zu erwarten, dass ein Protein, das durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiert wird, außerdem eine Aktivität zur Generation und Regeneration anderer Gewebe zeigen kann, wie z.B. von Organen (einschließlich, z.B., Pankreas, Leber, Darm, Niere, Haut, Endothel), Muskel (glatt, skelettal oder kardial) und vaskulärem Gewebe (einschließlich vaskulärem Endothel) oder zur Förderung des Wachstums von Zellen, die solche Gewebe umfassen. Ein Teil der gewünschten Wirkungen könnte durch die Inhibition oder Modulation der fibrotischen Narbenbildung erfolgen, um normales Gewebe zu erzeugen. Ein Protein gemäß der Erfindung kann außerdem eine aniogene Aktivität zeigen.
Ein durch die von den 5'-ESTs gemäß der Erfindung abgeleiteten verlängerten cDNAs kodiertes Protein kann außerdem nützlich sein für den Schutz oder die Regeneration des Darms sowie für die Behandlung von einer Fibrose der Lunge oder Leber, von Reperfusionsverletzungen in verschiedenen Geweben sowie Zuständen, die aus einem systemischen Cytokinschaden resultieren.
Ein durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiertes Protein kann außerdem nützlich sein für die Förderung oder die Inhibition der Differenzierung von Geweben, wie oben beschrieben, von Vorläufergeweben oder Vorläuferzellen; oder für die Inhibition des Wachstums von Geweben, wie oben beschrieben.
Wie unten detaillierter beschrieben wird, können die Gene, die für Proteine mit Gewebswachstum regulierender Aktivität kodieren oder die Nukleinsäuren, welche die Expression solcher Proteine regulieren, alternativ in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
BEISPIEL 36
Untersuchen der Proteine, die von den verlängerten cDNAs oder Teilen davon exprimiert werden, auf Regulation von Reproduktionshormonen
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre Fähigkeit untersucht werden, Reproduktionshormone zu regulieren, einschließlich des Follikel-stimulierenden Hormons. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich den in den folgenden Referenzen offenbarten Assays: Vale et al., Endocrinol. 91:562-572, 1972; Ling et al., Nature 321:779-782, 1986; Vale et al., Nature 321:776-779, 1986; Mason et al., Nature 318:659-663, 1985; Forage et al., Proc. Natl. Acad. Sci. USA 83:3091-3095, 1986; Kapitel 6.12 in Current Protocols in Immunology, Coligan et al., Eds. Greene Publishing Associates and Wiley-Interscience; Taub et al., J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:149-146, 1995; Muller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol. 153:1762-1768, 1994.
Proteine, die eine Aktivität als Reproduktionshormone oder Regulatoren der Zellbewegung zeigen, können anschließend als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in denen die Regulation der Reproduktionshormone nützlich ist. Zum Beispiel kann ein durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleitete verlängerten cDNAs kodiertes Protein außerdem Acitivin- oder Inhibin-spezifische Aktivitäten zeigen. Inhibine sind gekennzeichnet durch ihre Fähigkeit, die Freisetzung des Follikel-stimulierenden Hormons (FSH) zu inhibieren, während Activine gekennzeichnet sind durch ihre Fähigkeit, die Freisetzung von FSH zu stimulieren. Folglich kann ein durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiertes Protein nützlich sein als Kontrazeptivum auf Grundlage der Fähigkeit von Inhibinen, die Fruchtbarkeit in weiblichen Säugetieren zu verringern und die Spermatogenese in männlichen Säugetieren zu verringern. Die Verabreichung ausreichender Mengen anderer Inhibine kann die Unfruchtbarkeit in diesen Säugetieren induzieren. Alternativ kann das Protein gemäß der Erfindung als Homodimer oder als Heterodimer mit anderen Proteinuntereinheiten der Inhibin B-Gruppe nützlich sein als Fruchtbarkeit-induzierendes Therapeutikum, basierend auf der Fähigkeit der Acitivinmoleküle, die FSH-Freisetzung von Zellen des Hypophysenvorderlappens zu stimulieren. Siehe, z.B., US-Patent 4,798,885 . Ein Protein kann außerdem nützlich sein für das Vorziehen des Beginns der Fruchtbarkeit in sexuell unreifen Säugetieren, um so die Lebenszeit der Reproduktionsleistung von Haustieren wie z.B. Kühen, Schafen und Schweinen zu erhöhen.
Wie unten detaillierter beschrieben, können die Gene, die für Proteine mit einer die Reproduktionshormone regulierenden Aktivität kodieren, oder Nukleinsäuren, welche die Expression solcher Proteine regulieren, alternativ in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu verringern.
BEISPIEL 37
Untersuchen der Proteine, die von verlängerten cDNAs oder Teilen davon exprimiert werden, auf chemotaktische/chemokinetische Aktivität
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können außerdem auf chemotaktische/chemokinetische Aktivität untersucht werden. Zum Beispiel kann ein durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodiertes Protein eine chemotaktische oder chemokinetische Aktivität (z.B. als ein Chemokin wirken) für Säugerzellen haben, einschließlich z.B. Monozyten, Fibroblasten, Neutrophilen, T-Zellen, Mastzellen, Eosinophilen, Epithelzellen und/oder Endothelzellen. Chemotaktische und chemokinetische Proteine können verwendet werden, um eine gewünschte Zellpopulation zu einer gewünschten Wirkungsstätte zu mobilisieren oder anzulocken. Chemotaktische oder chemokinetische Proteine stellen bestimmte Vorteile bei der Behandlung von Wunden und anderen Gewebstraumata, ebenso wie bei Behandlung lokalisierter Infektionen zur Verfügung. Zum Beispiel kann das Anlocken von Lymphozyten, Monozyten oder Neutrophilen zu Tumoren oder Infektionsorten zu verbesserten Immunantworten gegen den Tumor oder das infizierende Agens führen.
Ein Protein oder Peptid hat eine chemotaktische Aktivität für eine bestimmte Zellpopulation, wenn es die Orientierung oder die Bewegung einer solchen Zellpopulation direkt oder indirekt stimulieren kann. Vorzugsweise hat das Protein oder Peptid die gerichtete Bewegung von Zellen direkt zu stimulieren. Ob ein bestimmtes Protein eine chemotakti sche Aktivität für eine Zellpopulation aufweist, kann leicht durch Verwenden eines solchen Proteins oder Peptids in irgendeinem bekannten Assay für die Zellchemotaxis bestimmt werden.
Die Aktivität eines Proteins gemäß der Erfindung kann, u. a., durch die folgenden Verfahren gemessen werden:
Assays zur chemotaktischen Aktivität (die Proteine identifizieren werden, welche die Chemotaxis induzieren oder verhindern) bestehen aus Untersuchungen, welche die Fähigkeit eines Proteins messen, die Migration von Zellen über eine Membran zu induzieren, ebenso wie die Fähigkeit eines Proteins, die Adhäsion einer Zellpopulation an eine andere Zellpopulation zu induzieren. Geeignete Assays für die Bewegung und die Adhäsion schließen die in den folgenden Referenzen beschriebenen ein, sind jedoch nicht darauf limitiert: Current Protocols in Immunology, herausgegeben durch Coligan, Kruisbeek, Margulies, Shevach und Strober, , Pub. Greene Publishing Associates and Wiley-Interscience, Kapitel 6.12: 6.12.1-6.12.28; Taub et al. J. Clin. Invest. 95:1370-1376, 1995; Lind et al., APMIS 103:140-146, 1995; Mueller et al., Eur. J. Immunol. 25:1744-1748; Gruber et al., J. Immunol. 152:5860-5867, 1994; Johnston et al., J. Immunol. 153:1762-1768, 1994.
BEISPIEL 38
Untersuchung der Proteine, die von den verlängerten cDNAs oder Teilen davon exprimiert werden, auf die Regulation der Blutgerinnung
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können ferner auf ihre Wirkungen auf die Blutgerinnung untersucht werden. Zahlreiche Assays für eine derartige Aktivität sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Linet et al., J. Clin. Pharmacol. 26:131-140, 1986; Burdick et al., Thrombosis Res. 45:413-419, 1987; Humphrey et al., Fibrinolysis 5:71-79, 1991; Schaub, Prostaglandins 35:467-474, 1988.
Die Proteine, die an der Regulation der Blutgerinnung beteiligt sind, können anschließend als Pharmazeutika formuliert werden und verwendet werden, um klinische Zustände zu behandeln, in denen die Regulation der Blutgerinnung vorteilhaft ist. Zum Beispiel ein Protein gemäß der Erfindung ebenfalls eine hemostatische oder thrombolytische Aktivität zeigen. Als ein Ergebnis wird von einem solchen Protein erwartet, dass es nützlich bei der Behandlung verschiedener Störungen der Koagulation ist (einschließlich erblicher Störungen, wie z.B. die Hämophilie) oder um die Koagulation und andere hemostatische Ereignisse bei der Behandlung von Wunden, die von Traumata, der Chirurgie oder anderen Ursachen resultieren, zu verstärken. Ein Protein gemäß der Erfindung kann außerdem nützlich sein zum Auflösen von Thrombosen oder zur Inhibition der Bildung von Thrombosen sowie zur Behandlung und Verhinderung von Zuständen, die daraus resultieren (wie z.B. dem Infarkt von Herzgefäßen und Gefäßen des zentralen Nervensystems (z.B. Schlaganfall)). Wie unten detaillierter beschrieben wird, können die Gene, die für Proteine mit Blutgerinnungsaktivität kodieren, oder Nukleinsäuren, welche die Expression solcher Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu erhöhen oder zu verringern.
BEISPIEL 39
Überprüfen der von den verlängerten cDNAs oder Teilen davon exprimierten Proteine auf ihre Beteilung an Rezeptor/Liganden-Interaktionen
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteine können außerdem auf ihre Beteiligung an Rezeptor/Liganden-Interaktionen untersucht werden. Zahlreiche Assays für eine derartige Beteilung sind den Fachleuten auf dem Gebiet vertraut, einschließlich der in den folgenden Referenzen offenbarten Assays: Kapitel 7.7.28.1-7.28.22 in Current Protocols in Immunology, Coligan et al., Editoren Green Publishing Associates und Wiley-Interscience; Takai et al., Proc. Natl. Acad. Sci. USA 84:6864-6868, 1987; Bierer et al., J. Exp. Med. 168:1145-1156, 1988; Rosenstein et al., J. Exp. Med. 169:149-160, 1989; Stoltenborg et al., J. Immunol. Methods 175:59-68, 1994; Stitt et al., Cell 80:661-670, 1995; Gyuris et al., Cell 75:791-803, 1993.
Zum Beispiel können die durch die von den 5'-ESTs gemäß der vorliegenden Erfindung abgeleiteten verlängerten cDNAs kodierten Proteine außerdem eine Aktivität als Rezeptoren, Rezeptorliganden oder Inhibitoren oder Agonisten von Rezeptor/Liganden-Interaktionen zeigen. Beispiele für derartige Rezeptoren und Liganden schließen ohne Beschränkung Cytokinrezeptoren und ihre Liganden, Rezeptorkinasen und ihre Liganden, Rezeptorphosphatasen und ihre Liganden, Rezeptoren, die an Zell-Zell-Interaktionen beteiligt sind sowie ihre Liganden (einschließlich, jedoch ohne Beschränkung, von zellulären Adhäsionsmolekülen (wie z.B. Selektinen, Integrinen und deren Liganden) und Rezeptor/Liganden-Paaren, die an der Antigenpräsentation beteiligt sind, der Antigenerkennung und der Entwicklung von zellulären und humoralen Immunantwor ten). Rezeptoren und Liganden sind außerdem nützlich zum Screenen von potenziellen Peptidinhibitoren oder kleinmolekularen Inhibitoren der relevanten Rezeptor/Liganden-Interaktion. Ein durch die von den beschriebenen 5'-ESTs abgeleiteten verlängerten cDNAs kodiertes Protein (einschließlich, jedoch ohne Beschränkung, von Fragmenten von Rezeptoren und Liganden) kann selbst nützlich als Inhibitor von Rezeptor/Liganden-Interaktionen sein. Wie unten detaillierter beschrieben wird, können Gene, die für Proteine kodieren, die an Rezeptor/Liganden-Interaktionen beteiligt sind, oder Nukleinsäuren, welche die Expression solcher Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
BEISPIEL 40
Untersuchen der von den verlängerten cDNAs oder Teilen davon exprimierten Proteine auf antiinflammatorische Aktivität
Die durch die verlängerten cDNAs und einen Teil davon kodierten Proteine können außerdem auf antiinflammatorische Aktivität untersucht werden. Die antiinflammatorische Aktivität kann erreicht werden, indem ein Stimulus einer Zelle zur Verfügung gestellt wird, die an der inflammatorischen Antwort beteiligt ist, in den Zell-Zell-Interaktionen inhibiert oder gefördert werden (wie z.B. die Zelladhäsion), indem die Chemotaxis von Zellen, die an dem inflammatorischen Prozess beteiligt sind, inhibiert oder gefördert wird, die Zellextravasation inhibiert oder gefördert wird oder indem die Produktion anderer Faktoren, die auf direktere Weise eine inflammatorische Antwort inhibieren oder fördern, stimuliert oder unterdrückt wird. Proteine, die derartige Aktivitäten zeigen, können verwendet werden, um inflammatorische Zustände zu behandeln, einschließlich chronische oder akute Zustände, einschließlich und ohne Beschränkung von einer Inflammation, die mit einer Infektion assoziiert ist (wie z.B. ein septischer Schock Sepsis oder ein systemisches inflammatorisches Antwortsyndrom), Ischämie-Reperfusioninurie, Endotoxinlethalität, Arthritis, Komplement-vermittelte hyperakute Abstoßung, Nephritis, Cytokin- oder Chemokin-induzierte Lungenschädigung, inflammatorische Darmerkrankung, Morbus Crohn oder zur Behandlung von Inflammation, die aus einer Überproduktion von Cytokinen, wie z.B. TNF oder IL-1 resultiert. Die Proteine gemäß der Erfindung können außerdem nützlich sein, um Anaphylaxe und Hypersensitivität gegenüber einer antigenen Substanz oder einem Material zu behandeln. Wie unten detaillierter beschrieben wird, können die Gene, die für Proteine mit antiinflammatorischer Aktivität kodieren oder Nuk leinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
BEISPIEL 41
Untersuchung der von den verlängerten cDNAs oder Teilen davon exprimierten Proteine auf eine Tumorinhibitionsaktivität
Die durch die verlängerten cDNAs oder Teile davon kodierten Proteinen können außerdem auf ihre Tumorinhibitionsaktivität untersucht werden. Zusätzlich zu den oben für die immunologische Behandlung oder die Verhinderung von Tumoren beschriebenen Aktivität, kann ein Protein gemäß der Erfindung weitere Antitumoraktivitäten aufweisen. Ein Protein kann das Tumorwachstum direkt oder indirekt inhibieren (wie z.B. über ADCC). Ein Protein kann seine tumorinhibitorische Aktivität zeigen, indem es auf ein Tumorgewebe oder Tumorvorläufergewebe wirkt, indem die Bildung von Geweben, die notwendig sind, um das Tumorwachstum zu unterstützen, inhibiert (wie z.B. durch Inhibieren der Angiogenese), indem es die Produktion weiterer Faktoren, Agenzien oder Zelltypen verursacht, die das Tumorwachstum inhibieren, oder indem es Faktoren, Agenzien oder Zelltypen, die das Tumorwachstum fördern, supprimieren, eliminieren oder inhibieren. Wie unten detaillierter beschrieben wird, können die Gene, die für Proteine mit Tumorinhibitionsaktivität kodieren, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
Ein Protein gemäß der Erfindung kann außerdem ein oder mehrere der folgenden zusätzlichen Aktivitäten oder Wirkungen zeigen: Inhibieren des Wachstums, der Infektion oder der Funktion von infektiösen Agenzien, oder das Zerstören der infektiösen Agenzien, einschließlich, jedoch ohne darauf beschränkt zu sein, von Bakterien, Viren, Pilzen und anderen Parasiten; Hervorrufen (Unterdrücken oder Verstärken) körperlicher Eigenschaften, einschließlich, jedoch ohne darauf beschränkt zu sein, der Größe, des Gewichtes, Haarfarbe, Augenfarbe, Haut, Fat to lean-Verhältnis oder Pigmentierung eines anderen Gewebes, oder Größe oder Form eines Organs oder Körperteils (wie z.B. einer Brustvergrößerung oder -verkleinerung, einer Veränderung der Knochenform oder Gestalt); Hervorrufen von Biorhythmen oder circadierten Zyklen oder Rhythmen; Hervorrufen der Fruchtbarkeit von männlichen oder weiblichen Individuen; Bewirken des Metabolismus, Catabolismus, Anabolismus, der Prozessierung, Verwendung, Speicherung oder Eliminierung von diätetischem Fett, Lipid, Protein, Kohlenhydraten, Vitaminen, Mineralien, Kofaktoren oder anderen Ernährungsfaktoren oder Bestandteilen; Hervorrufen von Verhaltenseigenschaften, einschließlich, jedoch ohne darauf beschränkt zu sein, des Appetits, der Libido, Stress, Kognition (einschließlich kognitiver Störungen), Depression (einschließlich depressiver Störungen) und gewalttätigen Verhaltensweisen; Bereitstellen von schmerzstillenden Wirkungen oder anderen schmerzreduzierenden Wirkungen; Förderung der Differenzierung und des Wachstums von embryonalen Stammzellen in Linien, die nicht hematopoetische Linien sind; hormonelle oder endokrine Aktivität; in dem Fall von Enzymen, die Korrektur von Defizienzen des Enzyms und die Behandlung von Defizienz-vermittelten Erkrankungen; die Behandlung von hyperproliferativen Störungen (wie z.B. Psoriasis); Immunglobulin-ähnliche Aktivität (wie z.B. die Fähigkeit, Antigene oder Komplement zu binden; sowie die Fähigkeit, als ein Antigen in einer Vaccinzusammensetzung zu wirken, um eine Immunantwort gegen ein derartiges Protein oder ein anderes Material oder eine andere Einheit, die mit einem solchen Protein kreuzreagiert, hervorzurufen. Wie unten detaillierter beschrieben wird, können Gene, die für Proteine kodieren, die an irgendeiner der oben genannten Aktivität beteiligt sind, oder Nukleinsäuren, welche die Expression derartiger Proteine regulieren, alternativ in geeignete Wirtszellen eingeführt werden, um die Expression der Proteine wie gewünscht zu verstärken oder zu verringern.
BEISPIEL 42
Identifikation von Proteinen, die mit Polypeptiden interagieren, die durch die verlängerten cDNAs kodiert werden
Proteine, die mit den Polypeptiden interagieren, die durch die von den 5'-ESTs oder Fragmenten davon abgeleiteten cDNAs kodiert werden, wie z.B. Rezeptorproteine, können unter Verwendung von Two Hybrid-Systemen, wie z.B. dem Matchmaker Two Hybrid-System 2 (Katalog Nr. K1604-1, Clontech) identifiziert werden. Wie in dem Handbuch beschrieben wird, das dem Kit beiliegt, und das hierin als Referenz eingeschlossen wird, werden die cDNAs, die von den 5'-ESTs abgeleitet sind, oder Fragmente davon in einen Expressionsvektor insertiert, so dass sie sich im Leserahmen mit der DNA befinden, die für die DNA bindende Domäne des Hefetranskriptionsaktivators GAL4 kodiert. cDNAs in einer cDNA-Bibliothek, die für Proteine kodiert, die mit den durch die verlängerten cDNAs oder Teile davon kodierten Polypeptide interagieren, werden in einen zweiten Expressionsvektor insertiert, so dass sie sich im Leserahmen mit einer DNA befinden, die für die Aktivierungsdomäne von GAL4 kodiert. Die beiden Expressionsplasmide werden in Hefe transformiert, und die Hefe wird auf Selektionsmedium ausplattiert, das auf die Expression eines nachweisbaren Markers auf jedem der Expressionsvektoren, ebenso auf eine GAL4-abhängige Expression des HIS3-Gens selektiert. Transformanten, die fähig sind, auf dem Medium ohne Histidin zu wachsen, werden auf GAL4-abhängige lacZ-Expression untersucht. Die Zellen, die sowohl in der Histidinselektion als auch in dem lacZ-Assay positiv sind, enthalten Plasmide, die für Proteine kodieren, die mit durch die verlängerten cDNAs oder Teile davon kodierten Polypeptid interagieren.
Alternativ kann das in Lustig et al., Methods in Enzymology 283:83-99, 1997, und in US-Patent Nr. 5,654,150 beschriebene System zum Identifizieren von Molekülen, die mit dem durch die verlängerten cDNAs kodierten Polypeptiden interagieren, zu identifizieren. In derartigen Systemen werden in vitro-Transkriptionsreaktionen mit einem Pool von Vektoren durchgeführt, die verlängerte cDNA-Inserts enthalten, die stromabwärts eines Promotors kloniert wurden, der die in vitro-Transkription steuert. Die resultierenden Pools von mRNAs werden in Oocyten von Xenopus laevis eingeführt. Die Oocyten werden anschließend auf eine gewünschte Aktivität untersucht.
Alternativ können die gepoolten in vitro-Transkriptionsprodukte, die wie oben beschrieben erzeugt wurden, in vitro translatiert werden. Die gepoolten in vitro-Translationsprodukte können auf eine gewünschte Aktivität oder auf eine Interaktion mit einem bekannten Polypeptid untersucht werden.
Proteine oder andere Moleküle, die mit den durch die verlängerten cDNAs kodierten Polypeptiden interagieren, können durch eine Vielzahl zusätzlicher Methoden aufgefunden werden. In einem Verfahren können Affinitätssäulen hergestellt werden, die das Polypeptid enthalten, das durch die verlängerten cDNAs oder einen Teil davon kodiert wird. In einigen Versionen dieses Verfahrens enthält die Affinitätssäule chimere Proteine, in denen das durch die verlängerte cDNA oder einen Teil davon kodierte Protein mit einer Glutathion S-Transferase fusioniert ist. Eine Mischung zellulärer Proteine oder eine Vereinigung exprimierter Proteine wie oben beschrieben wird auf die Affinitätssäule aufgebracht. Proteine, die mit dem an die Säule angehefteten Polypeptid interagieren, können anschließend isoliert und auf einem 2D-Elektrophoresegel wie in Ramunsen et al., Electrophoresis 18:588-598, 1997 beschrieben analysiert werden. Alternativ können die auf der Affinitätssäule zurückgehaltenen Proteine durch Elektrophorese-basierte Verfahren gereinigt werden und sequenziert werden. Dasselbe Verfahren kann verwendet werden, um Antikörper zu isolieren, Phagendisplay-Produkte zu untersuchen oder Phagendisplay-humane Antikörper zu untersuchen.
Proteine, die mit dem durch die verlängerten cDNAs oder Teile davon kodierten Polypeptiden interagieren, können außerdem unter Verwendung eines Optical Biosensor, wie in Edwards und Leatherbarrow, Analytical Biochemistry 246:1-6, 1997, beschrieben, untersucht werden. Der Hauptvorteil dieses Verfahrens ist, dass es die Bestimmung der Assoziationsrate zwischen dem Protein und anderen interagierenden Molekülen erlaubt. Folglich ist es möglich, interagierende Moleküle mit einer hohen oder niedrigen Assoziationsrate spezifisch zu selektieren. Üblicherweise ist ein Zielmolekül an die Sensoroberfläche (über eine Carboxylmethyldextranmatrix) gebunden, und einer Auswahl von Testmolekülen wird mit den Zielmolekülen in Kontakt gebracht. Das binden eines Testmoleküls an das Zielmolekül verursacht eine Veränderung des Brechungsindex und/oder der Dicke. Diese Veränderung wird durch den Biosensor detektiert, vorausgesetzt, dass es in dem evaneszenten Feld auftritt (das sich einige wenige Hundert Nanometer von der Sensoroberfläche befindet). In diesem Screening-Assay kann das Zielmolekül eines der Polypeptide sein, das durch die verlängerten cDNAs oder einen Teil davon kodiert wird, und die Testprobe kann eine Sammlung von Proteinen sein, die aus Geweben oder Zellen extrahiert wurden, ein Pool exprimierter Proteine, kombinatorische Peptid und/oder chemische Bibliotheken oder Phagendisplay-Peptide. Die Gewebe oder Zellen, aus denen die Testproteine gewonnen werden, können aus irgendeiner Spezies stammen.
In anderen Verfahren wird ein Zielmolekül immobilisiert und die Testpopulation ist eine Sammlung einzigartiger Polypeptide, die durch die verlängerten cDNAs oder Teile davon kodiert werden.
Um die Interaktion der durch die verlängerten cDNAs oder Teile davon kodierten Proteine mit Arzneimitteln zu untersuchen, kann die Mikrodialyse, die an ein HPLC-Verfahren gekoppelt ist und von Wang et al., Chromatographia 44:205-208, 1997 beschrieben wird, oder die Affinitäts-Kapillar-Elektrophorese-Methode, die von Bush et al., J. Chromatogr. 777:311-328, 1997 beschrieben wird, verwendet werden.
Die Fachleute auf dem Gebiet werden verstehen, dass die von den verlängerten cDNAs oder Teilen exprimierten Proteine auf zahlreiche Aktivitäten zusätzlich zu den spezifisch oben aufgezählten untersucht werden können. Zum Beispiel können die exprimierten Proteine auf Anwendungen untersucht werden, welche die Kontrolle und die Regulation von Entzündung, Tumorproliferation oder Metastase, Infektion oder anderen klinischen Zuständen umfasst. Zusätzlich können die von den verlängerten cDNAs oder Teilen davon exprimierten Proteine nützlich als Ernährungsmittel oder kosmetische Mittel sein.
Die von den cDNAs oder Teilen davon exprimierten Proteine können verwendet werden, um Antikörper zu erzeugen, die fähig sind, an die exprimierten Proteine oder Fragmente davon spezifisch zu binden, wie in Beispiel 40 unten beschrieben. Die Antikörper können fähig sein, an ein vollständig langes Protein zu binden, dass durch eine cDNA kodiert wird, die von einem 5'-EST stammt, an ein reifes Protein (d. h. das Protein, das durch Abspalten des Signalpeptids erzeugt wird), das durch eine von einer 5'-EST stammende cDNA kodiert wird, oder an ein Signalpeptid, das durch eine von einer 5'-EST stammende cDNA kodiert wird. Alternativ können die Antikörper fähig sein, Fragmente von wenigstens 10 Aminosäuren der Proteine zu binden, die durch die oben genannten cDNAs kodiert werden. In einigen Ausführungsformen können die Antikörper fähig sein, Fragmente von wenigstens 15 Aminosäuren der durch die oben genannten cDNAs kodierten Proteine zu binden. In anderen Ausführungsformen können die Antikörper fähig sein, Fragmente von wenigstens 25 Aminosäuren der durch die verlängerten cDNAs exprimierten Proteine zu binden, die wenigstens 25 Aminosäuren der durch die oben genannten cDNAs kodierten Proteine umfassen. In weiteren Ausführungsformen können die Antikörper fähig sein, Fragmente von wenigstens 40 Aminosäuren der durch die oben genannten cDNAs kodierten Proteine zu binden.
BEISPIEL 43
Herstellung eines Antikörpers gegen ein humanes Protein
Im Wesentlichen reines Protein oder Polypeptid wird aus den transfizierten oder transformierten Zellen wie in Beispiel 30 oben beschrieben isoliert. Die Konzentrierung eines Proteins in der Endherstellung wird angepasst, z.B. durch Konzentrierung auf einer Amiconfiltereinheit auf eine Konzentration von wenigen Mikrogramm/Milliliter. Ein monoklonaler oder polyklonaler Antikörper gegen das Protein kann anschließend wie folgt hergestellt werden.
1. Herstellung eines monoklonalen Antikörpers mittels Hybridomfusion
Ein monoklonaler Antikörper gegen Epitope eines jeden der identifizierten und wie beschrieben isolierten Peptide kann aus murinen Hybridomen gemäß dem klassischen Verfahren von Kohler und Milstein, Nature 256:459, 1995, oder davon abgeleiteten Verfahren hergestellt werden. Kurz beschrieben wird eine Maus wiederholt mit einigen wenigen Mikrogramm des ausgewählten Proteins oder der ausgewählten Peptide, die davon abgeleitet sind, über einen Zeitraum von einigen Wochen inokuliert. Die Maus wird anschließend geopfert, und die Antikörperproduzierenden Zellen der Milz werden isoliert. Die Milzzellen werden mittels Polyethylenglycol mit Myelomzellen der Maus fusioniert, und der Überschuss an nicht-fusionierten Zellen wird durch Wachstum des Systems auf selektiven Medien, die Aminopterin enthalten (HAT-Medien) beseitigt. Die erfolgreich fusionierten Zellen werden verdünnt und Aliquots der Verdünnung werden in Vertiefungen einer Mikrotiterplatte gegeben, wo das Wachstum der Kultur fortgesetzt wird. Antikörper produzierende Klone werden durch Nachweis von Antikörpern in dem Überstand der Vertiefungen mittels Immunassaymethoden, wie z.B. ELISA, wie ursprünglich von Engvall, Meth. Enzymol. 70:419, 1980 beschrieben sowie davon abgeleiteten Verfahren identifiziert. Ausgewählte positive Klone können expandiert werden, und ihr Produkt, der monoklonale Antikörper, kann für die weitere Verwendung gewonnen werden. Detaillierte Methoden zur Herstellung von monoklonalem Antikörper werden in Davis et al. in Basic Methods in Molecular Biology Elsevier, New York, Abschnitt 21-2 beschrieben.
2. Herstellung eines polyklonalen Antikörpers durch Immunisierung
Polyklonales Antiserum, das Antikörper gegen heterogene Epitope eines einzigen Proteins enthält, kann hergestellt werden, indem geeignete Tiere mit dem exprimierten Protein oder den davon abgeleiteten Peptiden immunisiert wird, wobei das Protein unmodifiziert sein kann oder modifiziert, um die Immunogenizität zu verstärken. Eine effektive Herstellung von monoklonalem Antikörper wird durch zahlreiche Faktoren beeinträchtigt, die sowohl mit dem Antigen als auch den Wirtsspezies zusammenhängen. Zum Beispiel neigen kleine Moleküle dazu, weniger immunogen als andere zu sein und können die Verwendung von Trägern und einem Adjuvans erfordern. Außerdem variiert die Antwort des Wirtstieres abhängig von dem Ort der Inokulationen und den Dosen, wobei sowohl unzureichende als auch überhöhte Dosen des Antigens zu einem geringen Titerantiserum führen. Geringe Dosen (ng-Konzentration) des Antigens, die an verschiedenen intradermalen Orten verabreicht werden, scheinen die verlässlichsten zu sein. Ein wirksames Immunisierungsprotokoll für Kaninchen ist in Vaitukaitis et al., J. Clin. Endocrinol. Metab. 33:988-991 (1971) zu finden.
Booster-Injektionen können in regelmäßigen Intervallen verabreicht werden, und Antiserum wird gewonnen, wenn der Antikörpertiter davon zu fallen beginnt, wie semi-quantitativ bestimmt wird, z.B. durch doppelte Immundiffusion in Agar gegen bekannte Konzentrationen des Antigens. Siehe, z.B., Ouchterlony et al., Kap. 19 in: Handbook of Experimental Immunology D. Wier (Ed.) Blackwell (1973). Die Plateaukonzentration des Antikörpers bewegt sich im Allgemeinen in dem Bereich von 0,1 bis 0,2 mg/ml Serum (etwa 12 μM). Die Affinität der Antisera für das Antigen wird durch Anfertigen kompetitiver Bindungskurven, wie z.B. von Fisher D., Kap. 42 in: Manual of Clinical Immunology, 2. Ed. (Rose und Friedman, Hrsg.) Amer. Soc. For Microbiol., Washington, D.C. (1980) beschrieben, bestimmt.
Die in Übereinstimmung mit einem der Protokolle hergestellten Antikörperpräparationen sind nützlich in quantitativen Immunassays, die die Konzentrationen von Antigentragenden Substanzen in biologischen Proben bestimmen; sie werden außerdem semi-quantitativ oder qualitativ verwendet, um das Vorhandensein des Antigens in einer biologischen Probe zu bestimmen. Die Antikörper können außerdem in therapeutischen Zusammensetzungen verwendet werden, um Zellen zu töten, die das Protein exprimieren oder die Konzentrationen des Proteins im Körper zu reduzieren.
V. Verwendung der 5'-ESTs oder davon erhältlichen Sequenzen oder Teilen davon als Reagenzien
Die 5'-ESTs der vorliegenden Erfindung (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) können als Reagenzien in Isolierungsverfahren, diagnostischen Assays und forensischen Verfahren verwendet werden. Zum Beispiel können die Sequenzen von den 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) nachweisbar markiert werden und als Sonden verwendet werden, um andere Sequenzen zu isolieren, die fähig sind, an sie zu hybridisieren. Darüber hinaus können die Sequenzen von den 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) verwendet werden, um PCR-Primer zu entwerfen, die in Isolations-, diagnostischen oder forensischen Verfahren verwendet werden sollen.
1. Verwendung von 5'-ESTs oder Sequenzen, die davon erhältlich sind oder Teilen davon in Isolations-, diagnostischen und forensischen Verfahren
BEISPIEL 44
Herstellung von PCR-Primern und Amplifikation von DNA
Die 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) können verwendet werden, um PCR-Primer für eine Vielzahl von Anwendungen herzustellen, einschließlich Isolationsverfahren zum Klonieren von Nukleinsäuren, die in der Lage sind, an solche Sequenzen zu hybridisieren, diagnostische Verfahren und forensische Verfahren. Die PCR-Primer sind wenigstens 10 Basen lang und vorzugsweise wenigstens 12, 15 oder 17 Basen. Bevorzugter sind die PCR-Primer 20 bis 30 Basen lang. In einigen Ausführungsformen können die PCR-Primer mehr als 30 Basen lang sein. Es ist bevorzugt, dass die Primerpaare etwa dasselbe G/C-Verhältnis aufweisen, so dass die Schmelztemperaturen in etwa dieselben sind. Eine Vielzahl von PCR-Methoden sind den Fachleuten auf dem Gebiet vertraut. Für ein Review von PCR-Methoden, siehe Molecular Cloning to Genetic Engineering, White Ed. In Methods in Molecular Biology 67: Humana Press, Totowa 1997. In jedem dieser PCR-Verfahren werden PCR-Primer auf beiden Seiten der zu amplifizierenden Nukleinsäuresequenzen zu einer auf geeignete Weise hergestellten Nukleinsäureprobe zusammen mit dNTPs und einer thermostabilen Polymerase, wie z.B. Taq-Polymerase, Pfu-Polymerase oder Vent-Polymerase, dazugegeben. Die Nukleinsäure in der Probe wird denaturiert, und die PCR-Primer werden spezifisch an komplementäre Nukleinsäuresequenzen in der Probe hybridisiert. Die hybridisierten Primer werden verlängert. Danach wird ein weiterer Zyklus aus Denaturierung, Hybridisierung und Verlängerung gestartet. Die Zyklen werden mehrere Male wiederholt, um ein amplifiziertes Fragment herzustellen, das die Nukleinsäuresequenz zwischen den Primerorten enthält.
BEISPIEL 45
Verwendung von 5'-ESTs als Sonden
Sonden, die von 5'-ESTs abgeleitet sind (oder cDNAs oder genomischen DNAs, die davon erhältlich sind), einschließlich vollständig langer cDNAs oder genomischer Sequenzen, können detektierbaren Markierungen markiert werden, die den Fachleuten auf dem Gebiet vertraut sind, einschließlich Radioisotopen und nichtradioaktiven Markierungen, um eine detektierbare Sonde zur Verfügung zu stellen. Die detektierbare Sonde kann einzelsträngig oder doppelsträngig sein und kann unter Verwendung von Methoden hergestellt werden, die auf dem Gebiet bekannt sind, einschließlich der in vitro-Transkript, Nick-Translation oder Kinase-Reaktionen. Eine Nukleinsäureprobe, welche eine Sequenz enthält, die fähig ist, an die markierte Sonde zu hybridisieren, wird mit der mar kierten Sonde in Kontakt gebracht. Wenn die Nukleinsäure in der Probe doppelsträngig ist, kann sie vor dem in Kontaktbringen mit der Sonde denaturiert werden. In einigen Anwendungen kann die Nukleinsäureprobe auf einer Oberfläche, wie z.B. einer Nitrocellulosemembran oder eine Nylonmembran, immobilisiert werden. Die Nukleinsäureprobe kann Nukleinsäuren enthalten, die aus einer Vielzahl von Quellen stammen, einschließlich die genomischer DNA, cDNA-Bibliotheken, RNA oder Gewebeproben.
Methoden, die für den Nachweis des Vorhandenseins von Nukleinsäuren, die fähig sind, mit der nachweisbaren Sonde zu hybridisieren, verwendet werden, schließen wohlbekannte Methoden wie z.B. Southern Blotting, Northern Blotting, Dot Blotting, Kolonienhybridisierung und Plaquehybridisierung ein. In einigen Anwendungen kann die Nukleinsäure, die fähig ist, mit der markierten Sonde zu hybridisieren, in Vektoren wie z.B. Expressionsvektoren, Sequenzierungsvektoren oder in vitro-Transkriptionsvektoren kloniert werden, um die Charakterisierung und die Expression der hybridisierenden Nukleinsäuren in der Probe zu erleichtern. Zum Beispiel können derartige Methoden verwendet werden, um Sequenzen in einer genomischen Bibliothek oder cDNA-Bibliothek zu isolieren und zu klonieren, die in der Lage sind, mit der nachweisbaren Sonde zu hybridisieren, wie in Beispiel 30 oben beschrieben.
PCR-Primer, die wie in Beispiel 44 oben beschrieben hergestellt wurden, können in forensischen Analysen, wie z.B. dem DNA-Fingerprinting, verwendet werden, wie in den Beispielen 46 bis 50 unten beschrieben wird. Derartige Analysen können nachweisbare Sonden oder Primer verwenden, die auf den Sequenzen der 5'-ESTs oder cDNAs oder genomischen DNAs, die unter Verwendung der 5'-ESTs isoliert wurden, basieren.
BEISPIEL 46
Forensischer Abgleich mittels DNA-Sequenzierung
In einem beispielhaften Verfahren werden DNA-Proben aus forensischen Proben z.B. des Haars, des Spermas, der Blutes oder der Hautzellen mittels konventioneller Verfahren isoliert. Eine Reihe von PCR-Primern, die auf einer Anzahl von 5'-ESTs aus Beispiel 25 basieren, oder cDNAs oder genomischen DNAs, die daraus wie oben isoliert wurden, wird anschließend in Übereinstimmung mit Beispiel 44 verwendet, um DNA mit einer Länge von 100 bis 200 Basen aus den forensischen Proben zu amplifizieren. Die korrespondierenden Sequenzen werden von einem Testindividuum erhalten. Jede dieser Identifikations-DNAs wird anschließend unter Verwendung von Standardverfahren se quenziert und ein einfacher Datenbankvergleich bestimmt die Unterschiede, sofern vorhanden, zwischen den Sequenzen aus dem Individuum und denen aus der Probe. Statistisch signifikante Unterschiede zwischen den DNA-Sequenzen des Verdächtigen und denen aus der Probe beweisen schlüssig das Fehlen von Identität. Dieses Fehlen von Identität kann z.B. mit oder ohne eine Sequenz bewiesen werden. Identität sollte andererseits mit einer großen Anzahl von Sequenzen, die alle passen, nachgewiesen werden. Vorzugsweise wird ein Minimum von 50 statistisch identischen Sequenzen mit einer Länge von 100 Basen verwendet, um Identität zwischen dem Verdächtigen und der Probe zu beweisen.
BEISPIEL 47
Positive Identifizierung mittels DNA-Sequenzierung
Die in dem vorherigen Beispiel kurz dargestellte Methode kann auch in größerem Maßstab verwendet werden, um eine einzigartige Fingerprint-ähnliche Identifizierung irgendeines Individuums zur Verfügung zu stellen. In diesem Verfahren werden Primer von einer großen Zahl von 5'-EST-Sequenzen aus Beispiel 25 oder cDNA-Sequenzen oder genomischen Sequenzen, die davon ableitbar sind, hergestellt. Vorzugsweise 20 bis 50 verschiedene Primer werden verwendet. Diese Primer werden verwendet, um eine entsprechende Anzahl von PCR-erzeugten DNA-Segmenten von dem Individuum in Frage in Übereinstimmung mit Beispiel 44 zu erhalten. Jedes dieser DNA-Segmente wird sequenziert unter Verwendung des in Beispiel 46 dargestellten Verfahrens. Die Datenbank der durch dieses Verfahren erzeugten Sequenzen identifiziert auf einzigartige Weise das Individuum, aus dem die Sequenzen erhalten wurden. Dieselbe Reihe von Primern kann anschließend verwendet werden zu irgendeinem späteren Zeitpunkt, um Gewebeproben oder andere biologische Proben mit diesem Individuum absolut zueinander in Beziehung zu setzen.
BEISPIEL 48
Southern Blot forensische Identifizierung
Die Methode gemäß Beispiel 47 wird wiederholt, um eine Reihe von wenigstens 10 amplifizierten Sequenzen aus einem Individuum und einer Probe zu amplifizieren. Vorzugsweise enthält diese Reihe wenigstens 50 amplifizierte Sequenzen. Bevorzugter enthält die Reihe 100 amplifizierte Sequenzen. In einigen Ausführungsformen enthält die Reihe 200 amplifizierte Sequenzen. Diese PCR-erzeugte DNA wird anschließend mit einer Kombination aus vorzugsweise 4 Basen-spezifischen Restriktionsenzymen verdaut. Derartige Enzyme sind kommerziell erhältlich und den Fachleuten auf dem Gebiet bekannt. Nach dem Verdau werden die resultierenden Genfragmente über ihre Größe in mehreren Duplikats-Vertiefungen auf einem Agarosegel aufgetrennt und unter Verwendung von Southern Blot-Methoden, die den Fachleuten auf dem Gebiet wohlbekannt sind, auf Nitrocellulose transferiert. Für ein Review über das Southern Blotting siehe Davis et al. (Basic Methods in Molecular Biology, 1986, Elsevier Press, Seiten 62-65).
Eine Reihe von Sonden, die auf den Sequenzen der 5'-ESTs basieren (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) oder Fragmente davon mit wenigstens 10 Basen, werden radioaktiv oder colorimetrisch unter Verwendung von auf dem Gebiet bekannten Verfahren markiert, wie z.B. der Nick-Translation, oder dem Endlabeling und unter Verwendung von auf dem Gebiet bekannten Methoden mit dem Southern Blot hybridisiert (Davis et al., s.o.). Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 konsekutive Nukleotide von dem 5'-EST (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). Bevorzugter umfasst die Sonde wenigstens 20-30 konsekutive Nukleotide von dem 5'-EST (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide von dem 5'-EST (oder cDNAs oder genomischen DNAs, die davon erhältlich sind).
Vorzugsweise werden wenigstens 5 bis 10 dieser markierten Sonden verwendet und bevorzugter werden wenigstens 20 oder 30 verwendet, um ein einzigartiges Muster bereitzustellen. Die resultierenden Banden, die sich aus der Hybridisierung einer großen Probe des 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) ergibt, wird ein einzigartiges Identifizierungsmittel sein. Da die Spaltung durch Restriktionsenzyme für jedes Individuum anders sein wird, wird auch das Bandenmuster auf dem Southern Blot einzigartig sein. Eine Erhöhung der Anzahl von Sonden der 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) wird einen statistisch höheren Grad an Vertrauen zu der Identifizierung bereitstellen, da es eine größere Anzahl von Bandensets gegen wird, die für die Identifizierung verwendet werden.
BEISPIEL 49
Methode zur Dot Blot-Identifizierung
Eine andere Methode zum Identifizieren von Individuen unter Verwendung der 5'-EST-Sequenzen, die hierin offenbart sind, verwendet ein Dot Blot-Hybridisierungsverfahren. Genomische DNA wird aus zu identifizierenden Nuklei isoliert. Oligonukleotidsonden mit etwa 30 Basenpaaren Länge werden synthetisiert, die wenigstens 10, vorzugsweise 50 Sequenzen von den 5'-ESTs oder cDNAs oder genomischen DNAs, die davon erhältlich sind, entsprechen. Die Sonden werden verwendet, um sie mit der genomischen DNA mittels Bedingungen, die den Fachleuten auf dem Gebiet bekannt sind, zu hybridisieren. Die Oligonukleotide werden mit ³²P unter Verwendung von Polynukleotidkinase (Pharmacia) am Ende markiert. Dot Blots werden durch Aufbringen der genomischen DNA auf Nitrocellulose oder dergleichen unter Verwendung eines Vakuum Dot Blot-Gerätes (Bio-Rad, Richmond Kalifornien) erzeugt. Der Nitrocellulosefilter, der die genomischen Sequenzen enthält, wird gebacken oder mit dem Filter durch UV verbunden, prähybridisiert und mit der markierten Sonde unter Verwendung von auf dem Gebiet bekannten Methoden hybridisiert (Davis et al., s.o.). Die mit ³²P markierten DNA-Fragmente werden der Reihe nach mit zunehmenden stringenten Bedingungen hybridisiert, um minimale Unterschiede zwischen der 30 bp-Sequenz und der DNA zu detektieren. Tetramethylammoniumchlorid ist nützlich zum Identifizieren von Klonen, die eine geringe Anzahl an Nukleotid-Fehlpaarungen enthalten (Wood et al., Proc. Natl. Acad. Sci. USA 82(6):1585-1588, 1985). Ein einzigartiges Muster an Dots unterscheidet ein Individuum von einem anderen Individuum.
5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) oder Oligonukleotide, die wenigstens 10 konsekutive Basen aus diesen Sequenzen aufweisen, können als Sonden in der folgenden alternativen Fingerprinting-Methode verwendet werden. Vorzugsweise umfasst die Sonde wenigstens 12, 15 oder 17 konsekutive Nukleotide aus den 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). Bevorzugter umfasst die Sonde wenigstens 20 bis 30 konsekutive Nukleotide von den 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). In einigen Ausführungsformen umfasst die Sonde mehr als 30 Nukleotide aus den 5'-EST-Sequenzen (oder cDNAs oder genomischen DNAs, die davon erhältlich sind).
Vorzugsweise wird eine Mehrzahl von Sonden, die Sequenzen von verschiedenen Genen haben, in dem alternativen Fingerprinting-Verfahren verwendet. Beispiel 50 unten stellt ein repräsentatives alternatives Fingerprinting-Verfahren zur Verfügung, in dem die Sonden von dem 5'-EST abgeleitet sind.
BEISPIEL 50
Alternative "Fingerprint"-Identifizierungsmethode
20-mer Oligonukleotide werden von einer großen Anzahl, z.B. 50, 100 oder 200 5'-ESTs unter Verwendung von kommerziell erhältlichen Oligonukleotid-Serviceeinrichtungen, wie z.B. Genset, Paris, Frankreich, hergestellt. Zellproben aus dem Testindividuum werden für die DNA aufbereitet, unter Verwendung von Verfahren, die den Fachleuten auf dem Gebiet wohlbekannt sind. Die Nukleinsäure wird mit Restriktionsenzymen, wie z.B. EcoRI und XbaI verdaut. Nach dem Verdau werden die Proben für die Elektrophorese in Vertiefungen gegeben. Das Verfahren, das auf dem Gebiet bekannt ist, kann modifiziert werden, um es mit der Polyacrylamid-Elektrophorese in Einklang zu bringen. In diesem Beispiel jedoch werden Proben, die 5 μg DNA enthalten, in Vertiefungen gegeben und auf ein 0,8% Agarosegel aufgetrennt. Die Gele werden auf Nitrocellulose übertragen unter Verwendung von Southern Blotting Standardmethoden.
10 μg eines jeden Oligonukleotids werden gepoolt und mit ³²P endmarkiert. Die Nitrocellulose wird mit Blockierungslösung prähybridisiert und mit den markierten Sonden hybridisiert.
Nach der Hybridisierung und dem Waschen wird der Nitrocellulosefilter mit einem X-Omat AR Röntgenfilm exponiert. Das resultierende Hybridisierungsmuster wird für jedes Individuum einzigartig sein.
Es wird außerdem in diesem Beispiel in Erwägung gezogen, dass die Anzahl von verwendeten Sondensequenzen für eine zusätzliche Akkuratesse oder Klarheit variiert werden kann.
Die durch die verlängerten cDNAs kodierten Proteine können außerdem verwendet werden, um Antikörper zu erzeugen, wie in den Beispielen 30 und 43 erläutert wurde, um die Gewebeart oder die Zellarten zu identifizieren, aus denen eine Probe stammt, wie in Beispiel 51 beschrieben.
BEISPIEL 51
Identifizierung von Gewebsarten oder Zellarten mittels markierter, gewebsspezifischer Antikörper
Die Identifizierung eines spezifischen Gewebes wird durch die Visualisierung gewebsspezifischer Antigene mit Hilfe von Antikörperherstellungen in Übereinstimmung mit den Beispielen 30 und 43, die direkt oder indirekt mit einem nachweisbaren Marker konjugiert sind, erreicht. Ausgewählte markierte Antikörperspezies binden an ihren spezifischen Antigen-Bindungspartner in Gewebeschnitten, Zellsuspensionen oder in Extrakten löslicher Proteine aus einer Gewebeprobe, um ein Muster für die qualitative oder semiqualitative Interpretation zur Verfügung zu stellen.
Antisera für diese Verfahren müssen eine Potenz aufweisen, die über der der nativen Präparation liegt, und aus diesem Grund werden Antikörper auf eine Milligramm/ml-Konzentration durch Isolation der Gammaglobulinfraktion, z.B. mittels Ionenaustauschchromatographie oder mittels Ammoniumsulfaffraktionierung konzentriert. Außerdem müssen, um die spezifischsten Antiseren herzustellen, ungewollte Antikörper, z.B. gegen gewöhnliche Proteine, aus der Gammaglobulinfraktion entfernt werden, z.B. mittels unlöslicher Immunabsorptionsmittel, bevor die Antikörper mit dem Marker markiert werden. Sowohl monoklonales als auch heterologes Antiserum ist für beide Verfahren geeignet.
A. Immunhistochemische Methoden
Gereinigte Antikörper mit hohem Titer, die wie oben beschrieben hergestellt wurden, werden mit einem detektierbaren Marker wie beschrieben, z.B. von Fudenberg, Kap. 26 in: Basic and Clinical Immunology, 3. Ed. Lange, Los Altos, Kalifornien, 1980 oder Rose et al., Kap. 12 in: Methods in Immunodiagnosis, 2 Ed. John Wiley and Sons, New York (1980), konjugiert.
Ein fluoreszenter Marker, entweder Fluorescein oder Rhodamin, wird bevorzugt, jedoch können die Antikörper auch mit einem Enzym markiert werden, das eine farbproduzierende Reaktion mit einem Substrat unterstützt, wie z.B. Meerrettich-Peroxidase. Marker können in einem zweiten Schritt an den Gewebegebundenen Antikörper angefügt werden, wie unten beschrieben wird. Alternativ können die spezifischen Antigewebe-Antikörper mit Ferritin oder anderen elektronendichten Partikeln markiert werden, und die Lokalisierung des an Ferritin gekoppelten Antigen-Antikörper-Komplexes wird mittels eines Elektronenmikroskops erreicht. In noch einem anderen Ansatz werden die Antikörper radioaktiv markiert, z.B. mit 1251, und durch Überlagern der mit dem Antikörper behandelten Herstellung mit fotografischer Emulsion.
Herstellungen zur Ausführung der Verfahren können monoklonale oder polyklonale Antikörper gegen ein einziges Protein oder Peptid umfassen, das als spezifisch für einen Gewebetyp identifiziert wurde, z.B. Hirngewebe, oder Antikörperherstellung gegen mehrere antigenisch unterschiedliche gewebsspezifische Antigene können in Reihen verwendet werden, unabhängig oder in Mischungen, wie dies benötigt wird.
Gewebsschnitte und Zellsuspensionen werden für die immunhistochemische Untersuchung in Übereinstimmung mit üblichen histologischen Methoden hergestellt. Mehrfache Cryostatschnitte (etwa 4 μm, nicht fixiert) des unbekannten Gewebes und einer bekannten Kontrolle werden auf Objektträger aufgebracht, und jeder Objektträger wird mit verschiedenen Lösungen der Antikörperherstellung beschichtet. Schnitte bekannter und unbekannter Gewebe sollten ebenfalls mit den Herstellungen behandelt werden, um eine positive Kontrolle zur Verfügung zu stellen, eine negative Kontrolle, z.B. Präimmunsera und eine Kontrolle für nichtspezifische Färbung, z.B. Puffer.
Behandelte Schnitte werden in einer feuchten Kammer für 30 Minuten bei Raumtemperatur inkubiert, gespült, anschließend in Puffer für 30-45 Minuten gewaschen. Überschüssige Flüssigkeit wird aufgesogen und der Marker entwickelt.
Wenn der gewebsspezifische Antikörper in der ersten Inkubation nicht markiert war, kann es in einer zweiten Antikörper-Antikörper-Reaktion markiert werden, z.B. durch Zugabe von Fluorescein- oder Enzym-konjugiertem Antikörper gegen die Immunglobulinklasse der Antiserum-produzierenden Spezies, z.B. ein mit Fluorescein markierter Antikörper gegen Maus IgG. Derartig markierte Seren sind kommerziell erhältlich.
Das in den Geweben durch das obige Verfahren nachgewiesene Antigen kann quantifiziert werden, indem die Intensität der Farbe oder der Fluoreszenz auf dem Gewebeschnitt gemessen wird und das Signal unter Verwendung von geeigneten Standards kalibriert wird.
B. Identifizierung von gewebsspezifischen löslichen Proteinen
Die Visualisierung von gewebsspezifischen Proteinen und die Identifizierung von unbekannten Geweben aus diesem Verfahren wird ausgeführt, indem die Reagenzien mit markiertem Antikörper und einer Nachweisstrategie wie für die Immunhistochemie beschrieben verwendet werden; jedoch wird die Probe in Übereinstimmung mit einer E lektrophoresetechnik hergestellt, um die aus dem Gewebe extrahierten Proteine in einer geordneten Anordnung auf Basis des Molekulargewichtes für die Detektion zu verteilen.
Eine Gewebeprobe wird unter Verwendung eines Virtis-Apparates homogenisiert; Zellsuspensionen werden durch Dounce-Homogenisierung oder osmotische Lyse aufgeschlossen, unter Verwendung von Detergenzien im jeweiligen Fall, wie sie benötigt werden, um die Zellmembranen zu zerstören, wie es auf dem Gebiet Praxis ist.
Unlösliche Zellkomponenten wie z.B. Nuklei, Mikrosomen und Membranfragmente werden durch Ultrazentrifugation entfernt und die das lösliche Protein enthaltende Fraktion wird, falls erforderlich, konzentriert und für die Analyse aufbewahrt.
Eine Probe der Lösung mit dem löslichen Protein wird mittels konventioneller SDS-Polyacrylamid-Elektrophorese, wie z.B. von Davis et al., Abschnitt 19-2 in: Basic Methods in Molecular Biology, Leder Ed., Elsevier, New York, 1986 beschrieben, in einzelne Proteinspezies aufgetrennt, unter Verwendung einer Auswahl von Polyacrylamidmengen in einem Set von Gelen, um den gesamten Bereich des Molekulargewichtes der Proteine, die in der Probe nachgewiesen werden sollen, aufzutrennen. Ein Größenmarker wird parallel laufen gelassen, zum Zwecke der Abschätzung der Molekulargewichte der einzelnen Proteine. Eine praktische Probengröße für die Analyse ist ein Volumen zwischen 5 und 55 μl und einem Gehalt von etwa 1 bis 100 μg Protein. Ein Aliquot eines jeden der aufgetrennten Proteine wird durch Blotten auf ein Nitrocellulosefilterpapier transferiert, ein Prozess, der das Muster der Auftrennung beibehält. Mehrere Kopien werden hergestellt. Das Verfahren, das als Western Blot-Analyse ist gut in Davis L. et al., s.o., Abschnitt 19-3, beschrieben. Ein Set Nitrocelluloseblots wird mit Coomassieblau-Farbstoff gefärbt, um das gesamte Set an Proteinen zum Vergleich mit den Antikörpergebundenen Proteinen zu visualisieren. Die verbleibenden Nitrocellulosefilter werden anschließend mit einer Lösung aus einem oder mehreren spezifischen Antiseren gegen gewebsspezifische Proteine, die wie in den Beispielen 30 und 43 hergestellt wurden, inkubiert. In diesem Verfahren werden, wie in dem Verfahren A oben, geeignete positive und negative Proben und Kontrollreagenzien laufengelassen.
In jedem der Verfahren A oder B kann ein nachweisbarer Marker an den primären Gewebeantigen-primären Antikörper-Komplex in Übereinstimmung mit verschiedenen Strategien und Abwandlungen davon angefügt werden. In einem direkten Ansatz kann der primäre spezifische Antikörper markiert werden; alternativ kann der unmarkierte Komplex durch einen markierten sekundären Anti-IgG-Antikörper gebunden werden. In ande ren Ansätzen wird entweder der primäre oder sekundäre Antikörper mit einem Biotinmolekül konjugiert, das in einem anschließenden Schritt Avidin-konjugierten Marker bindet. In Übereinstimmung mit noch einer anderen Strategie wird ein markiertes Enzym oder radioaktives Protein A, das die Eigenschaft hat, an irgendein IgG zu binden, in einem letzten Schritt entweder an den primären oder sekundären Antikörper gebunden.
Die Visualisierung der gewebsspezifischen Antigenbindung in Konzentrationen, die über den in den Kontrollgeweben beobachteten liegen, haben ein oder mehrere gewebsspezifische Antikörper, die aus den Gensequenzen hergestellt wurde, die in den verlängerten cDNA-Sequenzen identifizierten wurden, kann Gewebe mit unbekannter Herkunft identifizieren, z.B. forensische Proben oder differenziertes Tumorgewebe, das an andere Körperstellen metastasiert ist.
Zusätzlich zu ihren Anwendungen in der Forensik und zur Identifizierung können die 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) chromosomal kartiert werden. Beispiel 52 unten beschreibt eine Radiation Hybrid (RH)-Kartierung von humanen chromosomalen Regionen unter Verwendung von 5'-ESTs. Beispiel 53 unten beschreibt ein repräsentatives Verfahren zur Kartierung eines 5'-ESTs an dessen Lokalisierung auf einem humanen Chromosom. Beispiel 54 unten beschreibt die Kartierung 5'-ESTs auf Metaphasechromosomen durch Fluoreszenz-In Situ-Hybridisierung (FISH). Die Fachleute auf dem Gebiet werden verstehen, dass das Verfahren gemäß der Beispiele 52 bis 54 außerdem verwendet werden kann, um cDNAs oder genomische DNAs, die von den 5'-ESTs erhältlich sind, an deren chromosomalen Orten zu kartieren.
2. Verwendung von 5'-ESTs oder Sequenzen, die davon erhältlich sind oder Teilen davon bei der Chromosomenkartierung
BEISPIEL 52
Radiation Hybrid-Kartierung von 5'-ESTs in humanem Genom
Radiation Hybrid (RH)-Kartierung ist ein somatischer zellgenetischer Ansatz, der verwendet werden kann zur hoch auflösenden Kartierung des humanen Genoms. In dieser Methode werden Zelllinien, die ein oder mehrere humane Chromosomen enthalten, letal bestrahlt, wodurch jedes Chromosom in Fragmente zerbrochen wird, dessen Größe von der Bestrahlungsdosis abhängig ist. Diese Fragmente werden durch Fusion mit kultivierten Nagerzellen geborgen, was Subklone erzeugt, die verschiedene Teile des humanen Genoms enthalten. Diese Methode ist durch Benham et al., Genomics 4:509-517, 1989; und Cox et al., Science 250:245-250, 1990, beschrieben worden. Die zufällige und unabhängige Eigenschaft der Subklone erlaubt eine effiziente Kartierung von jedem Marker des humanen Genoms. Humane DNA, die aus einer Reihe von 80 bis 100 Zelllinien isoliert wurde, stellt ein Kartierungsreagenz zum Ordnen von 5'-ESTs zur Verfügung. In diesem Ansatz wird die Frequenz der Brüche zwischen den Markern verwendet, um die Distanz zu messen, was die Aufstellung von hoch auflösenden Karten erlaubt, wie sie unter Verwendung herkömmlicher ESTs durchgeführt wurde (Schuler et al., Science 274:540-546, 1996).
RH-Kartierung wurde verwendet, um eine hoch auflösende Radiation Hybrid-Kartierung des gesamten Genoms für das humane Chromosom 17q22-q25.3 über die Gene für das Wachstumshormon (Growth hormone, GH) und die Thymidinkinase (TK) hinaus zu erzeugen (Foster et al., Genomics 33:185-192, 1996), für die Region, die das Gen für das Gorlinsyndrom umgibt (Obermayr et al., Eur. J. Hum. Genet. 4:242-245, 1996) für 60 Loci, die den gesamten kurzen Arm von Chromosom 12 bedecken (Raeymaekers et al., Genomics 29:170-178, 1995), für die Region des humanen Chromosoms 22, die den Locus für Neurofibromatosis Typ 2 enthält (Frazer et al., Genomics 14:574-584, 1992) und für 13 Loci auf dem langen Arm für Chromosom 5 (Warrington et al., Genomics 11:701-708, 1991).
BEISPIEL 53
Kartierung der 5'-ESTs auf humane Chromosomen unter Verwendung von PCR-Methoden
5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) können unter Verwendung von PCR-basierten Methoden den humanen Chromosomen zugeordnet werden. In derartigen Methoden werden Oligonukleotid-Primerpaare von den 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) konstruiert, um die Wahrscheinlichkeit, durch ein Intron zu amplifizieren, zu minimieren. Vorzugsweise haben die Oligonukleotidprimer eine Länge von 18-23 Basenpaaren und sind für die PCR-Amplifikation entworfen. Die Erzeugung von PCR-Primern aus bekannten Sequenzen ist den Fachleuten auf dem Gebiet wohlbekannt. Für ein Review über PCR-Methoden siehe Erlich in PCR Technology, Principles and Applications for DNA Amplification, Freeman and Co., New York, 1992.
Die Primer werden in Polymerasekettenreaktion (PCR) verwendet, um Templates aus der gesamten genomischen DNA zu amplifizieren. Die PCR-Bedingungen sind die Folgenden: 60 ng genomische DNA wird als Template für die PCR verwendet, mit 80 ng von jedem Oligonukleotidprimer, 0,6 Einheiten der Taq-Polymerase und 1 μCu eines mit ³²P Deoxycytidintriphosphates. Die PCR wird in einem Mikroplatten-Thermocycler (rechne) unter den folgenden Bedingungen durchgeführt: 30 Zyklen mit 94°C, 1,4 Minuten; 55°C, 2 Minuten; und 72°C, 2 Minuten; mit einer Endverlängerung bei 72°C für 10 Minuten. Die amplifizierten Produkte werden auf einem 6% Polyacrylamid-Sequenzierungsgel und durch Autoradiografie visualisiert. Wenn die Länge des PCR-Produktes mit der Entfernung zwischen den Enden der Primersequenzen in der verlängerten cDNA, von der die Primer abgeleitet wurden, übereinstimmt, wird die PCR-Reaktion mit DNA-Templates aus zwei Reihen von Human-Nager-somatischen Zellhybriden, BIOS PCRable DNA (BIOS Corporation) und NIGMS Human Rodent Somatic Cell Hybrid Mapping Panel Number 1 (NIGMS, Camden, NJ) wiederholt.
Die PCR wird verwendet, um eine Reihe somatischer Zellhybridzelllinien zu untersuchen, die definierte Sets von humanen Chromosomen enthalten, auf das Vorhandensein eines bestimmten 5'-EST (oder cDNAs oder genomischen DNAs, die davon erhältlich sind). Die DNA wird aus den somatischen Hybriden isoliert und als Start-Templates für PCR-Reaktionen unter Verwendung der Primerpaare von dem 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich sind), verwendet. Nur solche somatischen Zellhybride mit Chromosomen, die das humane Gen enthalten, das den 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich ist) entspricht, werden ein amplifiziertes Fragment ergeben. Der 5'-EST (oder die cDNA oder genomische DNA, die davon erhältlich sind) wird einem Chromosom zugeordnet durch Analyse des Segregationsmusters der PCR-Produkte aus den DNA-Templates der somatischen Hybride. Das einzige humane Chromosom, das in sämtlichen Zellhybriden vorhanden ist, die ein amplifiziertes Fragment ergeben, ist das Chromosom, das den 5'-EST (oder die cDNA oder genomische DNA, die davon erhältlich sind) enthält. Für ein Review über Methoden und die Analyse von Ergebnissen aus somatischen Zellgen-Kartierungsexperimenten, siehe Ledbetter et al., Genomics 6:475-481, 1990.
BEISPIEL 54
Kartierung von verlängerten 5'-ESTs auf Chromosomen unter Verwendung der Fluoreszenz-In Situ-Hybridisierung
Fluoreszenz-In Situ-Hybridisierung erlaubt es, den 5'-EST (oder die cDNA oder genomischen DNA, die davon erhältlich ist) auf einen bestimmten Bereich auf einem bestimmten Chromosom zu kartieren. Die für die Fluoreszenz-In Situ Hybridisierungsmethoden zu verwendenden Chromosomen können aus einer Vielzahl von Quellen verwendet werden, einschließlich Zellkulturen, Gewebe oder Gesamtblut.
In einer bevorzugten Ausführungsform wird die chromosomale Lokalisierung eines 5'-EST (oder einer cDNA oder genomischen DNA, die davon erhältlich sind) mittels FISH wie von Cherif et al., (Proc. Natl. Acad. Sci. USA, 87:6639-6643, 1990) erhalten. Metaphasechromosomen werden von mit Phytohemagglutinin (PHA) stimulierten Blutzellspendern hergestellt. PHA-stimulierte Lymphozyten von gesunden männlichen Spendern werden 72 Stunden in RPMI-1640-Medium kultiviert. Für die Synchronisierung wird Methotrexat (10 μM) für 17 Stunden dazugegeben, gefolgt von einer Zugabe von 5-Bromodexoyuridin (5-BrdU, 0,1 mM) für 6 Stunden. Colcemid (1 μg/ml) wird für die letzten 15 Minuten dazugegeben, bevor die Zellen geerntet werden. Die Zellen werden gesammelt, in RPMI gewaschen, mit einer hypotonen Lösung aus KCl (75 mM) bei 37°C für 15 Minuten inkubiert und in drei Wechseln von Methanol:Essigsäure (3:1) fixiert. Die Zellsuspension wird auf einen Glasobjektträger aufgeträufelt und an der Luft getrocknet. Der 5'-EST (oder die cDNA oder genomischen DNA, die davon erhältlich ist) wird mit Biotin-16 dUTP mittels Nick-Translation in Übereinstimmung mit den Angaben des Herstellers (Bethesda Research Laborstories, Bethesda, MD) markiert, unter Verwendung einer Sephadex G-50-Säule (Pharmacia, Uppsala, Schweden) gereinigt und präzipitiert. Kurz vor der Hybridisierung wird das DNA-Pellet in Hybridisierungspuffer (50% Formamid, 2 X SSC, 10% Dextransulfat, 1 mg/ml beschallte Lachssperma DNA, pH 7) aufgelöst, und die Probe wird bei 70°C für 5-10 Minuten denaturiert.
Objektträger, die bei –20°C gelagert wurden, werden für 1 Stunde bei 37°C mit RNase A (100 μg/ml) behandelt, dreimal in 2 X SSC gespült und in Ethanolreihen dehydriert. Chromosomenherstellungen werden in 70% Formamid, 2 X SSC für 2 Minuten bei 70°C denaturiert, anschließend bei 4°C dehydriert. Die Objektträger werden mit Proteinase K (1 μg/100 ml in 20 mM Tris-HCl, 2 mM CaCl₂) bei 37°C für 8 Minuten behandelt und dehydriert. Die Hybridisierungsmischung, welche die Sonde enthält, wird auf den Objektträger gegeben, mit einem der Gläschen bedeckt, mit Gummiklebstoff versiegelt und über Nacht in einer feuchten Kammer bei 37°C inkubiert. Nach der Hybridisierung und nach den anschließenden Waschschritten wird die biotinylierte Sonde durch Avidin-FITC detektiert und mit zusätzlichen Schichten von biotinyliertem Ziege Anti-Avidin und Avidin- FITC amplifiziert. Für die chromosomale Lokalisierung werden fluoreszente R-Banden wie zuvor beschrieben (Cherif et al., s.o.) erhalten. Die Objektträger werden unter einem LEICA Fluoreszenzmikroskop (DMRXA) betrachtet. Die Chromosomen werden mit Propidiumiodid gegengefärbt, und das Fluoreszenzsignal der Sonde erscheint als zwei symmetrische gelbgrüne Punkte auf beiden Chromatiden des fluoreszenten R-Banden-Chromosoms (rot). Folglich kann ein bestimmter 5'-EST (oder eine cDNA oder genomische DNA, die davon erhältlich ist) auf einer bestimmten zytogenen R-Bande auf einem bestimmten Chromosom lokalisiert werden.
Sobald die 5'-ESTs (oder die cDNA oder genomische DNA, die davon erhältlich sind) bestimmten Chromosomen unter Verwendung der in den Beispielen 52-54 oben beschriebenen Methoden zugeordnet wurden, können sie verwendet werden, um eine hoch auflösende Karte der Chromosomen, auf denen sie lokalisiert sind, herzustellen, oder um die Chromosomen in einer Probe zu identifizieren.
BEISPIEL 55
Verwendung des 5'-EST, um Chromosomenkarten zu erstellen oder zu erweitern
Die Chromosomenkartierung beinhaltet das Zuordnen einer bestimmten einzigartigen Sequenz zu einem bestimmten Chromosom wie oben beschrieben. Sobald die einzigartige Sequenz einem bestimmten Chromosom zugeordnet wurde, wird es relativ zu anderen einzigartigen Sequenzen auf demselben Chromosom geordnet. Ein Ansatz zur Chromosomenkartierung verwendet eine Reihe von künstlichen Hefechromosomen (yeast artificial chromosomes, YACs), die mehrere Tausend lange Inserts enthalten, die von den Chromosomen der Organismen abgeleitet sind, von dem die verlängerten cDNAs (oder genomischen DNAs, die davon erhältlich sind) erhalten wurden. Diese Methode wird in Nagaraja et al., Genome Research 7:210-222, 1997, beschrieben. Kurz beschrieben wird in dieser Methode jedes Chromosom in überlappende Stücke zerbrochen, die in den YAC-Vektor insertiert werden. Die YAC-Inserts werden unter Verwendung von PCR oder anderen Verfahren untersucht, um zu bestimmen, ob sie den 5'-EST (oder die cDNA oder genomische DNA, die davon erhältlich ist), dessen Position bestimmt werden soll, enthalten. Sobald ein Insert gefunden wurde, das den 5'-EST (oder die cDNA oder genomische DNA, die davon erhältlich ist) enthält, kann das Insert durch PCR oder andere Verfahren analysiert werden, um zu bestimmen, ob das Insert auch andere Sequenzen enthält, von denen bekannt ist, dass sie sich auf dem Chromosom oder in der Region befinden, von der der 5'-EST (oder die cDNA oder genomische DNA, die davon erhältlich ist) stammte. Dieses Verfahren kann für jedes Insert in der YAC-Bibliothek wiederholt werden, um die Lokalisierung von jeder der verlängerten cDNAs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) relativ zueinander und zu den anderen bekannten chromosomalen Markern zu bestimmen. Auf diese Weise kann eine hoch auflösende Karte der Verteilung zahlreicher einzigartiger Marker in jedem der Chromosomen der Organismen erhalten werden.
Wie in Beispiel 56 unten beschrieben wird, können verlängerte cDNAs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) auch verwendet werden, um Gene zu identifizieren, die mit einem bestimmten Phenotyp in Zusammenhang stehen, wie z.B. einer Erbkrankheit oder einer Arzneimittelantwort.
3. Verwendung von 5'-ESTs oder davon erhaltenen Sequenzen oder Fragmenten davon bei der Genidentifizierung
BEISPIEL 56
Identifizierung von Genen, die mit Erbkrankheiten oder Arzneimittelantwort in Zusammenhang stehen
Dieses Beispiel veranschaulicht eine Methode, die nützlich ist für die Assoziation von 5'-ESTs (oder cDNA oder genomischer DNA, die davon erhältlich ist) mit bestimmten phenotypischen Eigenschaften. In diesem Beispiel wird ein bestimmter 5'-EST (oder eine cDNA oder genomische DNA, die davon erhältlich ist) als eine Testprobe verwendet, um diesen 5'-EST (oder die cDNA oder genomische DNA, die davon erhältlich ist) mit einer bestimmten phenotypischen Eigenschaft.
5'-ESTs (oder davon erhältliche cDNAs oder genomischen DNAs) werden auf eine bestimmte Lokalisierung auf einem humanen Chromosom unter Verwendung von Methoden wie den in Beispiel 52 und 53 beschriebenen oder anderen auf dem Gebiet bekannten Methoden kartiert. Eine Recherche des Mendelian Inheritance in Man (McKusick in Mendelian Inheritance in Man (erhältlich online über die Johns Hopkins University Welch Medical Library) lässt erkennen, dass die Region auf dem humanen Chromosom, die den 5'-EST enthält (oder die cDNA oder genomische DNA, die davon erhältlich ist) eine sehr genreiche Region ist, die mehrere bekannte Gene und mehrere Krankheiten oder Phenotypen, für die Gene noch nicht identifiziert wurden, enthält. Das zu diesem 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich ist) korrespondierende Gen wird folglich zu einem unmittelbaren Kandidaten für jede dieser genetischen Erkrankungen.
Zellen aus Patienten mit diesen Erkrankungen oder Phenotypen werden isoliert und in Kultur expandiert. PCR-Primern von dem 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich ist) werden verwendet, um genomische DNA, mRNA oder cDNA zu untersuchen, die von den Patienten erhalten wurde. 5'-ESTs (oder cDNA oder genomische DNA, die davon erhältlich ist), die in dem Patienten nicht amplifiziert sind, können positiv mit einer bestimmten Krankheit assoziiert werden, indem eine weitere Analyse durchgeführt wird. Alternativ kann die PCR-Analyse Fragmente verschiedener Längen erzeugen, wenn die Proben von einem Individuum stammen, das den mit der Krankheit assoziierten Phenotyp aufweist, im Vergleich zu einer Probe, die von einem gesunden Individuum stammt, was anzeigt, dass das den 5'-EST enthaltende Gen für die genetische Erkrankung verantwortlich sein kann.
VI. Verwendung des 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich ist), um Vektoren zu konstruieren
Die vorliegenden 5'-ESTs (oder cDNA oder genomische DNA, die davon erhältlich ist) kann außerdem verwendet werden, um Sekretionsvektoren zu konstruieren, die in der Lage sind, die Sekretion der durch die darin kodierten Proteine zu steuern. Derartige Sekretionsvektoren können die Reinigung oder die Anreicherung der durch die daran insertierten Gene kodierten Proteine erleichtern, indem die Anzahl der Hintergrundproteine, aus denen das gewünschte Protein gereinigt werden oder angereichert werden muss, reduziert wird. Beispielhafte Sekretionsvektoren sind in Beispiel 57 unten beschrieben.
1. Konstruktion von Sekretionsvektoren
BEISPIEL 57
Konstruktion von Sekretionsvektoren
Die Sekretionsvektoren enthalten eine Promotor, der in der Lage ist, die Genexpression in der Wirtszelle, dem Gewebe oder dem Organismus von Interesse zu steuern. Derartige Promotoren schließen den Rous Sarkom Virus-Promotor ein, den SV 40-Promotor, den humanen Cytomegalovirus-Promotor sowie andere Promotoren, die den Fachleuten auf dem Gebiet vertraut sind.
Eine Signalsequenz von einem 5'-EST (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) wird funktionell mit dem Promotor verbunden, so dass die von dem Promotor transkribierte mRNA die Translation des Signalpeptids steuern wird. Die Wirtszelle, das Gewebe oder der Organismus kann irgendeine Zelle, ein Gewebe oder Organismus sein, der das Signalpeptid, das durch die Signalsequenz in dem 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich ist) kodiert, erkennt. Geeignete Wirte schließen Säugerzellen, -gewebe oder -organismen, Zellen, Gewebe oder Organismen von Vögeln, Insektenzellen, -gewebe oder -organismen oder Hefe ein.
Darüber hinaus enthält der Sekretionsvektor Klonierungsstellen, um Gene zu insertieren, die für die zu sezernierenden Proteine kodieren. Die Klonierungsstellen erleichtern das Klonieren des insertierten Gens im Leserahmen mit der Signalsequenz, so dass ein Fusionsprotein von der von dem Promotor transkribierten mRNA exprimiert wird, in dem das Signalpeptid mit dem durch das insertierte Gen kodierten Protein fusioniert ist.
Der Sekretionsvektor kann DNA oder RNA sein und kann in das Chromosom des Wirtes integrieren, stabil als extrachromosolames Replicon in dem Wirt aufrechterhalten werden, ein künstliches Chromosom sein oder transient in dem Wirt vorhanden sein. Viele Nukleinsäure-Backbones, die für die Verwendung als Sekretionsvektoren geeignet sind, sind den Fachleuten auf dem Gebiet bekannt, einschließlich retroviraler Vektoren, SV 40-Vektoren, bovines Papillomvirus-Vektoren, Hefe-integrierende Plasmide, Hefe-episomale Plasmide, Hefe-künstliche Chromosomen, humane künstliche Chromosomen, P-Element-Vektoren, Baculovirus-Vektoren oder bakterielle Plasmide, die fähig sind, transient in den Wirt eingeführt zu werden.
Der Sekretionsvektor kann außerdem ein PolyA-Signal enthalten, so dass das PolyA-Signal stromabwärts von dem insertierten Gen in dem Sekretionsvektor lokalisiert ist.
Nachdem das Gen, das für das Protein kodiert, für das eine Sekretion erwünscht wird, in den Sekretionsvektor insertiert wurde, wird der Sekretionsvektor in die Wirtszelle, das Gewebe oder den Organismus unter Verwendung der Calciumphosphatpräzipitation, DEAE-Dextran, Elektroporation, Liposomen-vermittelten Transfektion, viralen Partikeln oder als nackte DNA eingeführt. Das durch das insertierte Gen kodierte Protein wird anschließend gereinigt oder von dem Überstand angereichert, unter Verwendung herkömmlicher Methoden, wie z.B. Ammoniumsulfatpräzipitation, Immunpräzipitation, Immunchromatographie, Größenausschlusschromatographie, Ionenaustauschchromatographie und HPLC. Alternativ kann das sezernierte Protein in einem ausreichend an gereicherten oder reinen Zustand in dem Überstand oder Wachstumsmedium des Wirtes vorhanden sein, um die Verwendung für dessen beabsichtigen Zweck ohne weitere Anreicherung zu erlauben.
Die Signalsequenzen können außerdem in Vektoren insertiert werden, die für die Gentherapie entworfen wurden. In derartigen Vektoren ist die Signalsequenz funktionell mit einem Promotor verbunden, so dass die von dem Promotor transkribierte mRNA für das Signalpeptid kodiert. Eine Klonierungsstelle ist stromabwärts von der Signalsequenz lokalisiert, so dass ein Gen, das für ein Protein kodiert, dessen Sekretion gewünscht ist, einfach in den Vektor insertiert und an die Signalsequenz fusioniert wird. Der Vektor wird in eine geeignete Wirtszelle eingeführt. Das von dem Promotor exprimierte Protein wird extrazellulär sezerniert, wodurch ein therapeutischer Effekt produziert wird.
Die 5'-ESTs können außerdem verwendet werden, um Sequenzen zu klonieren, die stromaufwärts von den 5'-ESTs lokalisiert sind, die in der Lage sind, die Genexpression zu regulieren, einschließlich Promotorsequenzen, Enhancersequenzen und andere stromaufwärts gelegener Sequenzen, welche die Transkriptions- oder Translationslevel beeinflussen. Sobald sie identifiziert und kloniert wurden, können diese stromaufwärts gelegenen regulatorischen Sequenzen in Expressionsvektoren verwendet werden, die zur Steuerung der Expression eines insertierten Genes auf eine gewünschte räumliche, zeitliche, entwicklungsgemäße oder quantitative Weise zu steuern. Beispiel 58 beschreibt ein Verfahren zum klonieren von Sequenzen, die stromaufwärts der verlängerten cDNAs oder 5'-ESTs liegen.
2. Identifizierung von stromaufwärts gelegenen Sequenzen mit fördernden oder regulatorischen Aktivitäten
BEISPIEL 58
Verwendung von verlängerten cDNAs oder 5'-ESTs, um stromaufwärts gelegene Sequenzen der genomischen DNA zu klonieren
Sequenzen, die von den verlängerten cDNAs oder 5'-ESTs abgeleitet sind, können verwendet werden, um die Promotoren der dazugehörigen Gene unter Verwendung von Chromosome Walking-Methoden zu isolieren. In einer Chromosome Walking-Methode, die den GenomeWalker^TM-Kit verwendet, der von Clontech erhältlich ist, werden fünf vollständige genomische DNA-Proben jeweils mit einem anderen Restriktionsenzym verdaut, das eine 6 Basen lange Erkennungsstelle hat und ein stumpfes Ende hinterlässt. Nach dem Verdau werden die Oligonukleotidadaptoren an jedes Ende der resultierenden Fragmente genomischer DNA ligiert.
Für jede der fünf genomischen DNA-Bibliotheken wird eine erste PCR-Reaktion in Übereinstimmung mit den Angaben des Herstellers unter Verwendung eines äußeren Adaptorprimers, der in dem Kit vorhanden ist, und eines äußeren genspezifischen Primers durchgeführt. Der genspezifische Primer sollte so ausgewählt sein, dass er spezifisch für die verlängerte cDNA oder den 5'-EST von Interesse ist, und er sollte eine Schmelztemperatur, Länge und Lokalisierung in der verlängerten cDNA oder dem 5'-EST haben, die mit dessen Verwendung in den PCR-Reaktionen vereinbar ist. Jede erste PCR-Reaktion enthält 5 ng genomische DNA, 5 μl 10X Tth-Reaktionspuffer, 0,2 mM von jedem dNTP, 0,2 μM von jedem äußeren Adapterprimer und äußeren genspezifischen Primer, 1,1 mM Mg(OAc)₂ und 1 μl der Tth-Polymerase 50X Mischung, in einem gesamten Volumen von 50 μl. Der Reaktionszyklus der ersten PCR-Reaktion ist wie folgt: 1 min-94°C/2 s-94°C, 3 min-72°C (7 Zyklen)/2 s-94°C, 3 min-68°C (32 Zyklen)/5 min-67°C.
Das Produkt der ersten PCR-Reaktion wird verdünnt und als Template für eine zweite PCR-Reaktion in Übereinstimmung mit den Angaben des Herstellers unter Verwendung eines Paares von nested Primern verwendet, die intern auf dem Amplicon lokalisiert sind, das aus der ersten PCR-Reaktion resultiert. Zum Beispiel können 5 μl des Reaktionsproduktes der ersten PCR-Mischung 180fach verdünnt werden. Rektionen werden in einem 50 μl-Volumen durchgeführt und haben eine Zusammensetzung, die der der ersten PCR-Reaktion entspricht, außer dass nested Primer verwendet werden. Der erste nested Primer ist spezifisch für den Adaptor und wird mit dem GenomeWalker^TM-Kit zur Verfügung gestellt. Der zweite nested Primer ist spezifisch für die jeweilige verlängerte cDNA oder den 5'-EST, für den der Promotor kloniert werden soll und sollte eine Schmelztemperatur, Länge und Lokalisierung in der verlängerten cDNA oder dem 5'-EST haben, die mit dessen Verwendung in den PCR-Reaktionen vereinbar ist. Die Reaktionsparameter der zweiten PCR-Reaktion sind wie folgt: 1 min-94°C/2 s-94°C, 3 min-72°C (6 Zyklen)/2 s-94°C, 3 min-67°C (25 Zyklen)/5 min-67°C. Das Produkt der zweiten PCR-Reaktion wird gereinigt, kloniert und unter Verwendung von Standardmethoden sequenziert.
Alternativ können zwei oder mehr Bibliotheken humaner genomischer DNA konstruiert werden, indem zwei oder mehrere Restriktionsenzyme verwendet werden. Die verdaute genomische DNA wird in Vektoren kloniert, die in einzelsträngige, zirkuläre oder lineare DNA umgewandelt werden können. Ein biotinyliertes Oligonukleotid, das wenigstens 15 Nukleotide der verlängerten cDNA oder der 5'-EST-Sequenz umfasst, wird mit der einzelsträngigen DNA hybridisiert. Hybride zwischen dem biotinylierten Oligonukleotid und der einzelsträngigen DNA, die die verlängerte cDNA oder EST-Sequenz enthalten, werden wie in Beispiel 29 oben beschrieben isoliert. Anschließend wird die einzelsträngige DNA, die die verlängerte cDNA oder die EST-Sequenz enthält, von den Beads freigesetzt und unter Verwendung eines Primers, der spezifisch für die verlängerte cDNA oder die 5'-EST-Sequenz ist, oder eines Primers, der einer Sequenz entspricht, die in dem Klonierungsvektor enthalten ist, in doppelsträngige DNA umgewandelt. Die resultierende doppelsträngige DNA wird in Bakterien transformiert. DNAs, die die 5'-EST oder verlängerte cDNA-Sequenzen enthalten, werden durch Kolonie-PCR oder Kolonie-Hybridisierung identifiziert.
Sobald die stromaufwärts gelegenen genomischen Sequenzen wie oben beschrieben kloniert und sequenziert worden sind, können potenzielle Promotoren und Transkriptionsstartstellen innerhalb der stromaufwärts gelegenen Sequenzen durch Vergleich der Sequenzen, die stromaufwärts der verlängerten cDNAs oder 5'-ESTs liegen, mit Datenbanken, die bekannte Transkriptionsstartstellen, Transkriptionsfaktor-Bindungsstellen oder Promotorsequenzen enthalten, identifiziert werden.
Darüber hinaus können Promotoren in den stromaufwärts gelegenen Sequenzen unter Verwendung von Promotor-Reportervektoren wie im Beispiel beschrieben identifiziert werden.
BEISPIEL 59
Identifizierung von Promotoren in den klonierten stromaufwärts liegenden Sequenzen
Die genomischen Sequenzen, die stromaufwärts von den verlängerten cDNAs oder 5'-ESTs liegen, werden in einen geeigneten Promotor-Reportervektor kloniert, wie z.B. den von Clontech erhältlichen Promotor-Reportervektor (pSEAP-Basic, pSEAP-Enhancer, pβgal-Basic, pβgal-Enhancer oder pEGFP-1. Kurz beschrieben enthält jeder dieser Promotor-Reportervektoren multiple Klonierungsstellen, die sich stromaufwärts eines Reportergens befinden, das das für ein leicht zu untersuchendes Protein, wie z.B. sezernierte alkalische Phosphatase, β-Galactosidase oder grün fluoreszierendes Protein kodiert. Die Sequenzen stromaufwärts der verlängerten cDNAs oder 5'-ESTs werden in die Klonierungsstellen stromaufwärts des Reportergens in beiden Orientierungen insertiert und in eine geeignete Wirtszelle eingeführt. Die Konzentration an Reporterprotein wird untersucht und mit der Konzentration verglichen, die von einem Vektor erhalten wird, dem ein Insert in der Klonierungsstelle fehlt. Das Vorhandensein einer erhöhten Expressionskonzentration in dem das Insert enthaltenden Vektor in Bezug auf den Kontrollvektor zeigt das Vorhandensein eines Promotors in dem Insert an. Wenn notwendig, können die stromaufwärts gelegenen Sequenzen in Vektoren kloniert werden, die einen Enhancer für die Verstärkung der Transkriptionskonzentrationen von schwachen Promotorsequenzen enthalten. Eine signifikante Expressionsmenge über der, die mit dem Vektor beobachtet wird, dem ein Insert fehlt, zeigt, dass eine Promotorsequenz in der insertierten stromaufwärts gelegenen Sequenz vorhanden ist.
Geeignete Wirtszellen für die Promotor-Reportervektoren können auf Grundlage der Ergebnisse der oben beschriebenen Bestimmung der Expressionsmuster der verlängerten cDNAs und ESTs ausgewählt werden. Zum Beispiel kann, wenn die Analyse des Expressionsmusters andeutet, dass die einer bestimmten verlängerten cDNA oder einem 5'-EST entsprechenden mRNA in Fibroblasten exprimiert wird, der Promotor-Reportervektor in eine humane Fibroblastenzelllinie eingeführt werden.
Promotorsequenzen innerhalb der stromaufwärts genomischen DNA können außerdem durch Konstruktion von nested Deletionen in der stromaufwärts gelegenen DNA unter Verwendung herkömmlicher Methoden, wie z.B. dem Verdau mit Exonuklease III, definiert werden. Die resultierenden Deletionsfragmente können in den Promotor-Reportervektor insertiert werden, um zu bestimmen, ob die Deletion die Promotoraktitivität reduziert oder ausgelöscht hat. Auf diese Weise können die Grenzen der Promotoren definiert werden. Wenn dies gewünscht ist, können potenzielle individuell regulatorische Stellen innerhalb des Promotors unter Verwendung der ortsspezifischen Mutagenese oder des Linker-Scannings, um potenzielle Transkriptorfaktor-Bindungsstellen innerhalb des Promotors einzeln oder in Kombination zu zerstören, identifiziert werden. Die Wirkungen dieser Mutationen auf die Transkriptionslevel können bestimmt werden, indem die Mutationen in die Klonierungsstellen in den Promotor-Reportervektoren insertiert werden.
BEISPIEL 60
Klonierung und Identifizierung von Promotoren
Unter Verwendung des in Beispiel 58 oben mit 5'-ESTs beschriebenen Verfahrens werden Sequenzen stromaufwärts verschiedener Gene erhalten. Unter Verwendung der Primerpaare GGG AAG ATG GAG ATA GTA TTG CCT G (SEQ ID NR: 29) und CTG CCA TGT ACA TGA TAG AGA GAT TC (SEQ ID NR: 30) wurde der Promotor mit der internen Bezeichnung P13H2 (SEQ ID NR: 31) erhalten.
Unter Verwendung der Primerpaare GTA CCA GGGG ACT GTG ACC ATT GC (SEQ ID NR: 32) und CTG TGA CCA TTG CTC CCA AGA GAG (SEQ ID NR: 33) wurde der Promotor mit der internen Bezeichnung P15B4 (SEQ ID NR: 34) erhalten.
Unter Verwendung der Primerpaare CTG GGA TGG AAG GCA CGG TA (SEQ ID NR: 35) und GAG ACC ACA CAG CTA GAC AA (SEQ ID NR: 36) wurde der Promotor mit der internen Bezeichnung P29B6 (SEQ ID NR: 37) erhalten.
4 stellt eine schematische Beschreibung der isolierten Promotoren sowie die Art und Weise, wie sie mit den entsprechenden 5'-Tags zusammengefügt wurden, zur Verfügung. Die stromaufwärts gelegenen Sequenzen wurden auf das Vorhandensein von Motiven, die Transkriptionsfaktor-Bindungsstellen oder bekannten Transkriptionsstartstellen ähneln, unter Verwendung des Computerprogramms MatInspector, Ausgabe 2.0, August 1996, untersucht.
Tabelle VII beschreibt die Transkriptionsfaktor-Bindungsstellen, die in jedem dieser Promotoren vorhanden sind. Die Spalten, die mit Matrix bezeichnet sind, geben den Namen der verwendeten MatInspector-Matrix an. Die Spalte, die mit Position bezeichnet ist, gibt die 5'-Position der Promotorstelle an. Die Nummerierung der Sequenz beginnt bei der Transkriptionsstelle, wie sie durch Abgleich der genomischen Sequenz mit der 5'-EST-Sequenz bestimmt wurde. Die Spalte, die mit "Orientierung" bezeichnet ist, gibt den DNA-Strang an, in dem sich die Stelle befindet, wobei der +-Strang der kodierende Strang ist, wie er durch Abgleich der genomischen Sequenz mit der Sequenz der 5'-EST bestimmt wurde. Die Spalte, die mit "Wert" bezeichnet ist, gibt den MatInspector-Wert an, der für diese Stelle gefunden wurde. Die Spalte, die mit "Länge" bezeichnet wird, gibt die Länge der Stelle in Nukleotiden an. Die Spalte, die mit "Sequenz" bezeichnet ist, gibt die Sequenz der gefundenen Stelle an.
Bakterienklone, die Plasmide enthalten, die die oben beschriebenen Promotorsequenzen enthalten, werden derzeit in den Laboratorien der Erfindung unter den internen oben angegebenen Identifizierungsnummern gelagert. Die Inserts können aus den hinterleg ten Materialien, gewonnen werden, indem ein Aliquot des entsprechenden Bakterienklons in dem geeigneten Medium wachsen gelassen wird. Die Plasmid-DNA kann anschließend unter Verwendung von Plasmidisolierungsverfahren, die Fachleuten auf dem Gebiet bekannt sind, wie z.B. von alkalische Lyse-MiniPreps oder Plasmidisolationsverfahren der alkalischen Lyse im Großmaßstab, isoliert werden. Wenn dies gewünscht ist, kann die Plasmid-DNA weiter durch Zentrifugation auf einen Cäsiumchloridgradienten, durch Größenausschlusschromatographie oder Anionenaustauschchromatographie angereichert werden. Die unter Verwendung dieser Methoden erhaltene Plasmid-DNA kann anschließend unter Verwendung von Standard-Klonierungsmethoden, die den Fachleuten auf dem Gebiet vertraut sind, manipuliert werden. Alternativ kann eine PCR durchgeführt werden mit Primern, die an beiden Enden der EST-Insertion entworfen werden. Das PCR-Produkt, das dem EST entspricht, kann anschließend unter Verwendung von Standard-Klonierungsmethoden, die den Fachleuten auf dem Gebiet vertraut sind, manipuliert werden.
Die Promotoren und anderen regulatorischen Sequenzen, die stromaufwärts der verlängerten cDNAs oder 5'-ESTs liegen, können verwendet werden, um Expressionsvektoren zu konstruieren, die in der Lage sind, die Expression eines insertierten Gens in einer gewünschten räumlichen, zeitlichen entwicklungsgemäßen oder quantitativen Weise zu steuern. Ein Promotor, der fähig ist, die gewünschten räumlichen, entwicklungsgemäßen und quantitativen Muster zu steuern, kann ausgewählt werden unter Verwendung der Ergebnisse der Expressionsanalyse, die in Beispiel 26 oben beschrieben wird. Zum Beispiel kann, wenn ein Promotor, der einen hohen Expressionslevel im Muskel verleiht, gewünscht wird, die Promotorsequenz stromaufwärts einer verlängerten cDNA oder eines 5'-ESTs, der von einer mRNA abgeleitet ist, die im Muskel in hohen Konzentrationen exprimiert wird, wie durch das Verfahren gemäß Beispiel 26 bestimmt wird, in dem Expressionsvektor verwendet werden.
Vorzugsweise wird der gewünschte Promotor nahe der multiplen Restriktionsstellen angeordnet, um die Klonierung des gewünschten Inserts stromabwärts des Promotors zu erleichtern, so dass der Promotor in der Lage ist, die Expression des insertierten Genes zu steuern. Der Promotor kann in konventionellen Nukleinsäure-Backbones insertiert werden, die für die extrachromosomale Replikation, die Integration in die Wirtschromosomen oder die transiente Expression entworfen wurden. Geeignete Backbones für die vorliegenden Expressionsvektoren schließen retrovirale Backbones, Backbones aus eu karyontischen Episomen, wie z.B. SV 40 oder dem bovinen Papillomvirus, Backbones aus bakteriellen Episomen oder künstliche Chromosomen ein.
Vorzugsweise enthalten die Expressionsvektoren auch ein PolyA-Signal stromabwärts der multiplen Restriktionsstellen, um die Polyadenylierung der von dem in den Expressionsvektor insertierten Gen-transkribierten mRNA zu steuern.
Nach der Identifikation von Promotorsequenzen unter Verwendung der Verfahren gemäß den Beispielen 58-60, können Proteine, die mit dem Promotor interagieren, wie in Beispiel 61 unten identifiziert werden.
BEISPIEL 61
Identifikation von Proteinen, die mit Promotorsequenzen, stromaufwärts gelegenen regulatorischen Sequenzen oder mRNA interagieren
Sequenzen innerhalb der Promotorregion, die wahrscheinlich Transkriptionsfaktoren binden, können durch Homologie mit bekannten Transkriptionsfaktor-Bindungsstellen oder durch herkömmliche Mutagenese oder Deletionsanalysen von Reporterplasmiden, die die Promotorsequenz enthalten, identifiziert werden. Zum Beispiel können Deletionen in einem Reporterplasmid hergestellt werden, dass die Promotorsequenz von Interesse, funktionell verbunden mit einem untersuchbaren Reportergen, enthält. Die Reporterplasmide, die verschiedene Deletionen innerhalb der Promotorregion aufweisen, werden in eine geeignete Wirtszelle transfiziert, und die Auswirkungen der Deletionen auf die Expressionslevel werden untersucht. Transkriptionsfaktor-Bindungsstellen innerhalb der Regionen, in denen Deletionen die Expressionslevel reduzieren, können weiterhin unter Verwendung der ortsgerichteten Mutagenese, der Linker-Scanninganalyse oder anderen den Fachleuten auf dem Gebiet vertrauten Methoden lokalisiert werden.
Nukleinsäuren, die für Proteine kodieren, die mit Sequenzen in dem Promotor interagieren, können unter Verwendung von One-Hybrid-Systemen, wie den in dem Handbuch, das dem Matchmaker One-Hybrid-Systemkit beigefügt ist, das von Clontech erhältlich ist (Katalog Nr. K1603-1) beschriebenen, identifiziert werden. Kurz beschrieben wird das Matchmaker One-Hybrid-System wie folgt verwendet. Die Zielsequenz, für die es gewünscht wird, bindende Proteine zu identifizieren, wird stromaufwärts eines selektierbaren Reportergens kloniert und in das Hefegenom integriert. Vorzugsweise werden mehrere Kopien der Zielsequenzen in das Reporterplasmid in Tandem insertiert. Eine Biblio thek, die aus Fusionen zusammengesetzt ist, zwischen cDNAs, die auf ihre Fähigkeit, an den Promotor zu binden, untersucht werden sollen und der Aktivierungsdomäne eines Transkriptionsfaktors der Hefe, wie z.B. GAL4, wird in den Hefestamm transformiert, der die integrierte Reportersequenz enthält. Die Hefen werden auf Selektionsmedium ausplattiert, um Zellen zu selektieren, die den selektierbaren Marker, verbunden mit der Promotorsequenz exprimieren. Die Kolonien, die auf dem Selektionsmedium wachsen, enthalten Gene, die für Proteine kodieren, die an die Zielsequenz binden. Die Inserts der für die Fusionsproteine kodierenden Gene werden weiter charakterisiert durch Sequenzierung. Zusätzlich können die Inserts in Expressionsvektoren oder in in vitro-Transkriptionsvektoren insertiert werden. Die Bindung der durch die Inserts kodierten Polypeptide an die Promotor-DNA kann durch Methoden bestätigt werden, die den Fachleuten auf dem Gebiet vertraut sind, wie z.B. der Gel-Shift-Analyse oder der DNase-Protection-Analyse.
VII. Verwendung von 5'-ESTs (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) in der Gentherapie
Ebenfalls hierin beschrieben wird die Verwendung von 5'-ESTs (oder cDNA oder genomischen DNA, die davon erhältlich ist) in Gentherapieansätzen, einschließlich der Antisense- und Triele Helix-Strategien, wie in den Beispielen 62 und 63 unten beschrieben. In Antisense-Methoden werden Nukleinsäuresequenzen, die komplementär zu einer mRNA sind, intrazellulär mit der mRNA hybridisiert, wodurch die Expression des durch die mRNA kodierten Proteins blockiert wird. Die Antisensesequenzen können die Genexpression durch verschiedenste Mechanismen verhindern. Zum Beispiel können die Antisensesequenzen die Fähigkeit der Ribosomen, die mRNA zu translatieren, inhibieren. Alternativ können die Antisensesequenzen den Transport der mRNA aus dem Nukleus in das Cytoplasma blockieren, wodurch die Menge an mRNA, die für die Translation zur Verfügung steht, limitiert wird. Ein anderer Mechanismus, durch den Antisensesequenzen die Genexpression inhibieren können, ist durch Interferieren mit dem mRNA-Splicing. In noch einem anderen Ansatz kann Antisense-Nukleinsäure in ein Ribozym eingeschlossen werden, das fähig ist, die Ziel-mRNA spezifisch zu spalten.
BEISPIEL 62
Herstellung und Verwendung von Antisense-Oligonukleotiden
Die in der Gentherapie zu verwendenden Antisense-Nukleinsäuremoleküle können entweder DNA- oder RNA-Sequenzen sein. Sie können eine Sequenz umfassen, die komplementär zu der Sequenz des 5'-EST (oder der cDNA oder genomischen DNA, die davon erhältlich sind) ist. Die Antisense-Nukleinsäuren sollten eine Länge und Schmelztemperatur aufweisen, die ausreichen, um die Bildung einer intrazellulären Duplex mit ausreichender Stabilität, um die Expression der mRNA in der Duplex zu inhibieren, zu erlauben. Strategien zum Entwurf von Antisense-Nukleinsäuren, die für die Verwendung in der Gentherapie geeignet sind, sind in Green et al., Ann. Rev. Biochem. 55:569-597, 1986; und Izant und Weintraub, Cell 36:1007-1015, 1984, offenbart.
In einigen Ansätzen werden Antisensemoleküle von einer Nukleotidsequenz erhalten, die für ein Protein kodiert, in dem die Orientierung der kodierenden Region im Hinblick auf einen Promotor umgekehrt wird, so dass der gegenüberliegende Strang von dem, der normalerweise in der Zelle transkribiert wird, transkribiert wird. Die Antisensemoleküle können unter Verwendung von in vitro-Transkriptionssystemen, wie z.B. solchen, die T7 oder SP6-Polymerase verwenden, um das Transkript zu erzeugen, transkribiert werden. Ein anderer Ansatz umfasst die Transkription der Antisense-Nukleinsäuren in vivo, indem eine DNA, welche die Antisensesequenz enthält, funktionell mit einem Promotor in einem Expressionsvektor verbunden wird.
Alternativ können Oligonukleotide, die komplementär zu dem normalerweise in der Zelle transkribierten Strang sind, in vitro synthetisiert werden. Folglich sind die Antisense-Nukleinsäuren komplementär zu der korrespondierenden mRNA und in der Lage, mit der mRNA zu hybridisieren, um eine Duplex zu erzeugen. In einigen Ausführungsformen können die Antisensesequenzen modifizierte Zucker-Phosphat-Backbones enthalten, um die Stabilität zu erhöhen und sie weniger sensitiv gegenüber der RNase-Aktivität zu machen. Beispiele für geeignete Modifikationen zur Verwendung in Antisensestrategien werden von Rossi et al., Pharmacol. Ther. 50(20):245-254, 1991, beschrieben.
Verschiedene Arten von Antisense-Oligonukleotiden, die komplementär zu der Sequenz des 5'-ESTs (oder der cDNA oder genomischen DNA, die davon erhältlich sind), sind, können verwendet werden. In einer bevorzugten Ausführungsform werden stabile und semi-stabile Antisense-Oligonukleotide verwendet, die in der internationalen Anmeldung Nr. PCT WO 94/23026 beschrieben werden. In diesen Molekülen sind das 3'-Ende oder sowohl das 3'-Ende und das 5'-Ende an der intramolekularen Wasserstoffbrückenbindung zwischen komplementären Basenpaaren beteiligt. Diese Moleküle sind deshalb in der Lage, den Attacken durch Exonuklease zu widerstehen, und zeigen eine erhöhte Stabilität im Vergleich zu herkömmlichen Antisense-Oligonukleotiden.
In einer weiteren bevorzugten Ausführungsform werden Antisense-Oligodeoxynukleotide gegen den Herpes Simplex-Virus Typ 1 und 2, die in der internationalen Anmeldung Nr. WO 95/04141 beschrieben werden, verwendet.
In noch einer weiteren bevorzugten Ausführungsform werden die kovalent kreuzvernetzten Antisense-Oligonukleotide, die in der internationalen Anmeldung Nr. WO 96/31523 beschrieben werden, verwendet. Diese doppel- oder einzelsträngigen Oligonukleotide umfassen ein bzw. mehrere inter- oder intra-Oligonukleotid-kovalente Kreuzvernetzungen, wodurch die Verknüpfung aus einer Amidbindung zwischen einer primären Amingruppe in einem Strang und einer Carboxylgruppe in dem anderen Strang bzw. in demselben Strang, einer primären Amingruppe, die direkt in der 2'-Position des Strangs des Nukleotidmonosaccharidrings substituiert ist und der Carboxylgruppe, die in einer aliphatischen Spacergruppe enthalten ist, die in einem Nukleotid substituiert ist, oder einem Nukleotid des anderen Strangs bzw. desselben Strangs besteht.
Die in der internationalen Anmeldung Nr. WO 92/18522 offenbarten Antisense-Oligodeoxynukleotide und Oligonukleotide können ebenfalls verwendet werden. Diese Moleküle sind stabil gegenüber einer Degradation und enthalten wenigstens eine Transkriptionskontroll-Erkennungssequenz, die bindet, um Proteine zu kontrollieren, und sind wirksam als Köder dafür. Diese Moleküle können "Hairpin"-Strukturen, "Dumbbell"-Strukturen, "modifizierte Dumbbell"-Strukturen, "kreuzvernetzte" Köderstrukturen und "Loop"-Strukturen enthalten.
In einer weiteren bevorzugten Ausführungsform werden zyklische doppelsträngige Oligonukleotide verwendet, die in der europäischen Patentanmeldung Nr. 0 572 287 A2 beschrieben werden. Diese ligierten Oligonukleotid-"Dumbbells" enthalten die Bindungsstelle für einen Transkriptionsfaktor und inhibieren die Expression des Genes, das unter Kontrolle des Transkriptionsfaktors steht, indem der Faktor sequestriert wird.
Die Verwendung geschlossener Antisense-Oligonukleotide, die in der internationalen Anmeldung Nr. WO 92/19732 offenbart werden, ist ebenfalls in Erwägung gezogen. Da diese Moleküle keine freien Enden haben, sind sie resistenter gegenüber der Degradation durch Exonukleasen als es herkömmlichen Oligonukleotide sind. Diese Oligonukleo tide können multifunktionell sein, mit mehreren Regionen interagieren, die auf der ZielmRNA nicht benachbart sind.
Die geeignete Menge an Antisense-Nukleinsäuren, die zum Inhibieren der Genexpression benötigt wird, kann unter Verwendung der in vitro-Expressionsanalyse bestimmt werden. Das Antisensemolekül kann in die Zellen mittels Diffusion, Injektion, Infektion, Transfektion oder H-Region-vermitteltem Import unter Verwendung von auf dem Gebiet bekannten Verfahren eingeführt werden. Zum Beispiel können die Antisense-Nukleinsäuren in den Körper als lose oder nackte Oligonukleotide, in Lipid eingekapselte Oligonukleotide, durch virale Proteine eingekapselte Oligonukleotidsequenzen oder als Oligonukleotid, das funktionell mit einem in einem Expressionsvektor enthaltenen Promotor verbunden ist, in den Körper eingeführt werden. Der Expressionsvektor kann irgendeiner aus einer Vielzahl von auf dem Gebiet bekannten Expressionsvektoren sein, einschließlich retroviraler oder viraler Vektoren, Vektoren, die zur extrachromosomalen Replikation fähig sind oder Integrationsvektoren. Die Vektoren können DNA oder RNA sein.
Die Antisensemoleküle werden in Zellproben in einer Anzahl verschiedener Konzentrationen, vorzugsweise zwischen 1 × 10^–10 M bis 1 × 10^–4 M eingeführt. Sobald die Minimumkonzentration, die in geeigneter Weise die Genexpression kontrollieren kann, identifiziert wurde, wird die optimierte Dosis in eine für die in vivo-Verwendung geeignete Dosierung umgerechnet. Zum Beispiel rechnet sich eine inhibierende Konzentration in Kultur von 1 × 10^–7 in einer Dosis von etwa 0,6 mg/kg Körpergewicht um. Konzentrationen des Nukleotids nahe 100 mg/kg Körpergewicht oder höher können möglich sein, nachdem die Toxizität des Oligonukleotids in Labortieren getestet wurde. Es wird außerdem in Erwägung gezogen, dass Zellen aus dem Wirbeltier entfernt werden, mit dem Antisense-Oligonukleotid behandelt werden und in das Wirbeltier wiedereingeführt werden.
Es wird ferner in Betracht gezogen, dass die Antisense-Oligonukleotidsequenz in eine Ribozymsequenz eingefügt wird, um der Antisensesequenz zu ermöglichen, spezifisch zu binden und dessen Ziel-mRNA zu spalten. Für technische Anwendungen von Ribozym und Antisense-Oligonukleotiden siehe Rossi et al., s.o.
In einer bevorzugten Anwendung dieser Erfindung wird das durch das Gen kodierte Polypeptid zuerst identifiziert, so dass die Wirksamkeit der Antisenseinhibition auf die Translation unter Verwendung von Methoden beobachtet werden kann, die Antikörper vermittelte Tests, wie z.B. RIAs und ELISA, funktionelle Assays oder radioaktive Markierung einschließen, jedoch nicht auf diese beschränkt sind.
Die 5'-ESTs gemäß der vorliegenden Erfindung (oder cDNAs oder genomischen DNAs, die davon erhältlich sind) können außerdem in Gentherapieansätzen verwendet werden, die auf der Bildung einer intrazellulären Triele Helix basieren. Triele Helix-Oligonukleotide werden verwendet, um die Transkription von einem Genom zu inhibieren. Sie sind besonders nützlich zur Untersuchung der Veränderungen der Zellaktivität, das mit einem bestimmten Gen assoziiert ist. Die 5'-EST-Sequenzen (oder die cDNAs oder genomischen DNAs, die davon erhältlich sind) gemäß der vorliegenden Erfindung, oder, bevorzugter, ein Teil dieser Sequenzen, können verwendet werden, um die Genexpression in Individuen zu inhibieren, die Erkrankungen aufweisen, die mit der Expression eines bestimmten Genes assoziiert sind. In ähnlicher Weise kann ein Teil der 5'-EST-Sequenzen (oder der cDNAs oder genomischen DNAs, die davon erhältlich sind) verwendet werden, um die Wirkung der Inhibition der Transkription eines bestimmten Genes innerhalb einer Zelle zu untersuchen. Traditionell wurden Homopurinsequenzen als die nützlichsten für Triele Helix-Ansätze betrachtet. Jedoch können Homopyrimidinsequenzen ebenfalls die Genexpression inhibieren. Derartige Homopyrimidin-Oligonukleotide binden an die größere Furche in Homopurin:Homopyrimidin-Sequenzen. Folglich werden beide Arten von Sequenzen des 5'-EST oder von dem Gen, das dem 5'-EST entspricht, innerhalb des Umfangs dieser Erfindung in Betracht gezogen.
BEISPIEL 63
Herstellung und Verwendung von Triple Helix-Sonden
Die Sequenzen der 5'-ESTs (oder der cDNAs oder genomischen DNAs, die davon erhältlich sind) werden untersucht, um 10-mer oder 20-mer Homopyrimidin- oder Homopurin-Abschnitte zu identifizieren, die in Triele Helix-basierten Ansätzen zur Inhibition der Genexpression verwendet werden könnten. Nach der Identifikation von möglichen Homopyrimidin- oder Homopurin-Abschnitten, wird deren Wirksamkeit bei dem Inhibieren der Genexpression durch Einführen verschiedener Mengen an Oligonukleotiden, die die Kandidatensequenzen enthalten, in Gewebskulturzellen, die normalerweise das Zielgen exprimieren, untersucht. Die Oligonukleotide können auf einem Oligonukleotid-Synthetisierer hergestellt werden, oder sie können kommerziell von einer Firma erworben werden, die auf die kundenspezifische Oligonukleotidsynthese spezialisiert ist, wie z.B. GENSET, Paris, Frankreich.
Die Oligonukleotide können in die Zellen unter Verwendung einer Vielzahl von den Fachleuten auf dem Gebiet bekannten Verfahren eingeführt werden, einschließlich der Calciumphosphatpräzipitation, DEAE-Dextran, Elektroporation, Liposom-vermittelter Transfektion oder nativer Aufnahme, ohne darauf beschränkt zu sein.
Behandelte Zellen werden unter Verwendung von Methoden, wie z.B. dem Northern Blotting, RNase Protection Assays, PCR-basierten Ansätzen, um die Transkriptionslevel des Zielgens in Zellen, die mit dem Oligonukleotid behandelt wurden, zu beobachten, auf eine veränderte Zellfunktion oder reduzierte Genexpression untersucht. Die zu beobachtenden Zellfunktionen werden auf Grundlage der Homologien des Zielgens, das der verlängerten cDNA entspricht, von dem das Oligonukleotid abgeleitet wurde, mit bekannten Gensequenzen, die mit einer bestimmten Funktion in Verbindung gebracht wurden, vorhergesagt. Die Zellfunktionen können außerdem auf Grundlage des Vorhandenseins anomaler Physiologien in den von Individuen mit einer bestimmten Erbkrankheit abgeleiteten Zellen vorhergesagt werden, insbesondere, wenn die verlängerte cDNA mit der Krankheit assoziiert ist, unter Verwendung der in Beispiel 56 beschriebenen Methoden.
Die Oligonukleotide, die wirksam bei dem Inhibieren der Genexpression in Gewebskulturzellen sind, können anschließend unter Verwendung der oben und in Beispiel 62 beschriebenen Methoden in vivo eingeführt werden, mit einer Dosierung, die auf Grundlage der in vitro-Ergebnisse berechnet wird, wie in Beispiel 62 beschrieben.
In einigen Ausführungsformen können natürliche (beta) Anomere der Oligonukleotideinheiten durch alpha-Anomere ersetzt werden, um das Oligonukleotid gegenüber Nukleasen resistenter zu machen. Darüber hinaus kann ein interkalierendes Mittel, wie z.B. Ethidiumbromid oder dergleichen an das 3'-Ende des alpha-Oligonukleotides angefügt werden, um die Triele Helix zu stabilisieren. Für Informationen zur Erzeugung von Oligonukleotiden, die für die Triele Helix-Bildung geeignet sind, siehe Griffin et al., Science 245:967-971, 1989.
BEISPIEL 64
Verwendung der unter Verwendung der 5'-ESTs erhaltenen cDNAs, um ein kodiertes Protein in einem Wirtsorganismus zu exprimieren
Die wie oben beschrieben unter Verwendung der 5'-ESTs gemäß der vorliegenden Erfindung erhaltenen cDNAs können außerdem verwendet werden, um ein kodiertes Protein in einem Wirtsorganismus zu exprimieren, um eine vorteilhafte Wirkung zu erzeugen. In derartigen Verfahren kann das kodierte Protein transient in dem Wirtsorganismus exprimiert werden oder stabil in dem Wirtsorganismus exprimiert werden. Das kodierte Protein kann irgendeine der oben beschriebenen Aktivitäten haben. Das kodierte Protein kann ein Protein sein, das dem Wirtsorganismus fehlt oder alternativ, kann das kodierte Protein die vorhandenen Mengen des Proteins in dem Wirtsorganismus erhöhen. Eine vollständig lange verlängerte cDNA, die für das Signalpeptid und das reife Protein kodiert, oder eine verlängerte cDNA, die nur für das reife Protein kodiert, wird in den Wirtsorganismus eingeführt. Die verlängerte cDNA kann in den Wirtsorganismus unter Verwendung einer Vielzahl von den Fachleuten auf dem Gebiet bekannten Methoden eingeführt werden. Zum Beispiel kann die verlängerte cDNA in dem Wirtsorganismus als nackte DNA injiziert werden, so dass das kodierte Protein in dem Wirtsorganismus exprimiert wird, wodurch eine vorteilhafte Wirkung erzeugt wird.
Alternativ kann die verlängerte cDNA in einen Expressionsvektor stromabwärts von einem Promotor kloniert werden, der in dem Wirtsorganismus aktiv ist. Der Expressionsvektor kann irgendeiner der für die Verwendung in der Gentherapie entworfenen Expressionsvektoren sein, einschließlich viraler oder retroviraler Vektoren. Der Expressionsvektor kann direkt in den Wirtsorganismus eingeführt werden, so dass das kodierte Protein in dem Wirtsorganismus exprimiert wird, um eine vorteilhafte Wirkung zu erzeugen. In einem anderen Ansatz kann der Expressionsvektor in vitro in Zellen eingeführt werden. Zellen, die den Expressionsvektor enthalten, werden danach selektiert und in den Wirtsorganismus eingeführt, wo sie das kodierte Protein exprimieren, um eine vorteilhafte Wirkung zu erzeugen.
BEISPIEL 65
Verwendung von durch die 5'-ESTs oder davon erhaltene Sequenzen kodierten Signalpeptiden, um Proteine in Zellen zu importieren
Die kurze hydrophobe Kernregion (h) von Signalpeptiden, die durch die 5'-ESTs oder verlängerten cDNAs kodiert werden, die von SEQ ID NR: 149 abgeleitet sind, kann ebenfalls als Träger verwendet werden, um ein Peptid oder ein Protein von Interesse, so genannte Fracht, in Gewebskulturzellen zu importieren (Lin et al., J. Biol. Chem. 270:14225-14258, 1995; Du et al., J. Peptide Res. 51:235-243, 1998; Rojas et al., Nature Biotech., 16:370-375, 1998).
Wenn zellpermeable Peptide von begrenzter Größe (etwa bis zu 25 Aminosäuren) über die Zellmembran translokalisiert werden sollen, kann die chemische Synthese verwendet werden, um die h-Region entweder an den C-Terminus oder den N-Terminus an das Frachtpeptid von Interesse anzufügen. Alternativ können, wenn längere Peptide oder Proteine in Zellen importiert werden sollen, Nukleinsäuren genetisch modifiziert werden, um die verlängerte cDNA-Sequenz, die für die h-Region kodiert, an das 5'- oder 3'-Ende einer DNA-Sequenz anzufügen, die für ein Frachtpolypeptid kodiert, unter Verwendung von Methoden, die den Fachleuten auf dem Gebiet vertraut sind. Derartig genetisch manipulierte Nukleinsäuren werden anschließend entweder in vitro oder in vivo nach der Transfektion in geeignete Zellen translatiert, unter Verwendung herkömmlicher Methoden, um das resultierende zellpermeable Polypeptid herzustellen. Geeignete Wirtszellen werden anschließend einfach mit dem zellpermeablen Polypeptid inkubiert, das dann über die Membran translokalisiert wird.
Dieses Verfahren kann angewendet werden, um die verschiedenen intrazellulären Funktionen und zellulären Prozesse zu untersuchen. Zum Beispiel wurde es verwendet, um funktionell relevante Domänen intrazellulärer Proteine zu erforschen und Protein-Protein-Interaktionen, die an den Signalübertragungswegen beteiligt sind, zu untersuchen (Lin et al., s.o.; Lin et al., J. Biol. Chem., 271:5305-5308, 1996; Rojas et al., J. Biol. Chem., 271:27456-27461, 1996; Liu et al., Proc. Natl. Acad. Sci. USA 93:11819-11824, 196; Rojas et al., Bioch. Biophys. Res. Commun., 234:675-680, 1997).
Derartige Techniken können in der zellulären Therapie verwendet werden, um Proteine zu importieren, die therapeutische Wirkungen ausüben. Zum Beispiel können Zellen, die von einem Patienten isoliert wurden, mit wichtigen therapeutischen Proteinen behandelt werden und anschließend in den Wirtsorganismus wiedereingeführt werden.
Alternativ könnte die h-Region von Signalpeptiden gemäß der vorliegenden Erfindung in Verbindung mit einem nukleären Lokalisierungssignal verwendet werden, um Nukleinsäuren in den Zellnukleus einzuführen. Derartige Oligonukleotide können Antisense-Oligonukleotide oder Oligonukleotide sein, die entworfen wurden, damit sie Triele Helizes bilden, wie in den Beispielen 62 bzw. 63 beschrieben, um die Prozessierung und/oder Reifung einer zellulären Ziel-RNA zu inhibieren.
Wie oben erläutert, können die cDNAs oder Teile davon, die unter Verwendung der 5'-ESTs gemäß der vorliegenden Erfindung erhalten wurden, für verschiedene Zwecke verwendet werden. Die Polynukleotide können verwendet werden, um ein rekombinantes Protein zur Analyse, Charakterisierung oder für therapeutische Verwendungen zu exprimieren; als Marker für Gewebe, in denen das entsprechende Protein vorzugsweise exprimiert wird (entweder konstitutiv oder zu einem bestimmten Stadium der Gewebedifferenzierung oder der Entwicklung oder in einem Krankheitszustand); als Molekulargewichtsmarker auf Southern Gelen; als Chromosomenmarker oder Tags (sofern markiert), um Chromosomen zu identifizieren oder Genpositionen zu kartieren; um Vergleiche mit endogenen DNA-Sequenzen in Patienten herzustellen, um mögliche genetische Erkrankungen zu identifizieren; als Sonde zum Hybridisieren und folglich zum Entdecken neuer, verwandter DNA-Sequenzen; als Informationsquelle, um PCR-Primer für das genetische Fingerprinting abzuleiten, zum Selektieren und Herstellen von Oligomeren zum Anfügen an einen "Gen Chip" oder einen anderen Träger, einschließlich der Untersuchung von Expressionsmustern; um Anti-Proteinantikörper zu erzeugen, unter Verwendung von DNA-Immunisierungsmethoden; und als ein Antigen, um Anti-DNA-Antikörper hervorzurufen, oder eine andere Immunantwort herzurufen. Soweit das Polypeptid für ein Protein kodiert, das an ein anderes Protein bindet oder möglicherweise bindet (wie z.B. in einer Rezeptor-Ligand-Interaktion), kann das Polynukleotid auch in Interaction Trap Assays (wie z.B. dem in Gyuris et al., Cell 75:791-803, 1993, beschriebenen) verwendet werden, um Polynukleotide zu identifizieren, die das andere Protein kodieren, mit dem die Bindung auftritt oder um Inhibitoren der Bindungsinteraktion zu identifizieren.
Die Proteine und Polypeptide, die durch die vorliegende Erfindung zur Verfügung gestellt werden, können in ähnlicher Weise in Assays verwendet werden, um die biologische Aktivität zu bestimmen, einschließlich der Verwendung in einer Anordnung mehrerer Proteine für das High Throughput Screening; um Antikörper hervorzurufen oder eine andere Immunantwort hervorzurufen; als ein Reagenz (einschließlich des markierten Reagenz) in Assays, die zur quantitativen Bestimmung der Proteinmenge (oder dessen Rezeptors) in biologischen Flüssigkeiten entworfen wurden; als Marker für Gewebe, in denen das dazugehörige Protein vorzugsweise exprimiert wird (entweder konstitutiv oder zu einem bestimmten Stadium der Gewebsdifferenzierung oder der Entwicklung oder in einem Krankheitszustand); und, selbstverständlich, um entsprechende Rezeptoren oder Liganden zu isolieren. Soweit das Protein an ein anderes Protein bindet oder möglicher weise bindet (wie z.B. einer Rezeptor-Ligand-Interaktion), kann das Protein verwendet werden, um das andere Protein, mit dem die Bindung auftritt, zu identifizieren oder Inhibitoren der Bindungsinteraktion zu identifizieren. Proteine, die an diesen Bindungsinteraktionen beteiligt sind, können außerdem verwendet werden, um nach Peptidinhibitoren oder kleine Moleküle-Inhibitoren oder Agonisten der Bindungsinteraktion zu suchen.
Einzeln oder insgesamt sind diese Forschungshilfsmittel geeignet, zu einem Reinheitsgrad oder einer Kitausführung für die Kommerzialisierung als Forschungsprodukte entwickelt zu werden.
Verfahren zur Durchführung der oben aufgelisteten Verwendungen sind den Fachleuten auf dem Gebiet wohlbekannt. Referenzen, die derartige Verfahren offenbaren, schließen ohne Beschränkung ein: Molecular Cloning: A Laborstory Manual, 2. Ed., Cold Spring Harbor Laborstory Press, Sambrook, Fritsch und Maniatis Hrsg., 1989, und Methods in Enzymology: Guide to Molecular Cloning Techniques, Academic Press, Berger und Kimmer Hrsg., 1987.

Polynukleotide und Proteine gemäß der vorliegenden Erfindung können außerdem als Nahrungsquellen oder Nahrungsergänzungen verwendet werden. Derartige Verwendungen schließen, ohne Beschränkung, die Verwendung als Protein oder Aminosäurepräparat, die Verwendung als Kohlenstoffquelle, die Verwendung als Stickstoffquelle und die Verwendung als Kohlenhydratquelle ein. In derartigen Fällen kann das Protein oder Polypeptid gemäß der Erfindung dazugegeben werden, um einen bestimmten Organismus zu füttern oder es kann als getrennte feste oder flüssige Herstellung verabreicht werden, z.B. in Form von Puder, Pillen, Lösungen, Suspensionen oder Kapseln. In dem Fall von Mikroorganismen kann das Protein oder Polypeptid gemäß der Erfindung zu dem Medium dazugegeben werden, auf dem der Mikroorganismus kultiviert wird.

Minimum-Signalpeptid-Wert	Rate Falsch-positiver	Rate Falsch-negativer	Proba (0,1)	Proba (0,2)
3,5	0,121	0,036	0,467	0,664
4	0,096	0,06	0,519	0,708
4,5	0,078	0,079	0,565	0,745
5	0,062	0,098	0,615	0,782
5,5	0,05	0,127	0,659	0,813
6	0,04	0,163	0,694	0,836
6,5	0,033	0,202	0,725	0,855
7	0,025	0,248	0,763	0,878
7,5	0,021	0,304	0,78	0,889
8	0,015	0,368	0,816	0,909
8,5	0,012	0,418	0,836	0,92
9	0,009	0,512	0,856	0,93
9,5	0,007	0,581	0,863	0,934
10	0,006	0,679	0,835	0,919

TABELLE IV

Minimum-Signalpeptid-Wert	Sämtliche ESTs	Neue ESTs	ESTs, die mit allgemein bekanntem EST übereinstimmen, näher als 40 bp vom Anfang	ESTs, die bekannte mRNA verlängern, mehr als 40 bp	ESTs, die öffentlich bekannten EST verlängern, mehr als 40 bp
3,5	2674	947	599	23	150
4	2278	784	499	23	126
4,5	1943	647	425	22	112
5	1657	523	353	21	96
5,5	1417	419	307	19	80
6	1190	340	238	18	68
6,5	1035	280	186	18	80
7	893	219	161	15	48
7,5	753	173	132	12	36
8	636	133	101	11	29
8,5	543	104	83	8	26
9	456	81	63	6	24
9,5	364	57	48	6	18
10	303	47	35	6	15

TABELLE V

Gewebe	Sämtliche ESts	Neue ESTs	ESTs, die mit allgemein bekanntet EST übereinstimmen, näher als 40 bp vom Anfang	ESTs, die bekannte mRNA verlängern, mehr als 40 bp	ESTs, die öffentlich bekannten EST verlängern, mehr als 40 bp
Hirn	329	131	75	3	24
Kanzeröse Prostata	134	40	37	1	6
Cerebellum	17	9	1	0	6
Kolon	21	11	4	0	0
Dystropher Muskel	41	18	8	0	1
Fötales Hirn	70	37	16	0	1
Fötale Niere	227	116	46	1	19
Fötale Leber	13	7	2	0	0
Herz	30	15	7	0	1
Hypertrophe Prostata	86	23	22	2	2
Niere	10	7	3	0	0
Dickdarm	21	8	4	0	1
Leber	23	9	6	0	0
Lunge	24	12	4	0	1
Lunge (Zellen)	57	38	6	0	4
Lymphganglien	163	60	23	2	12
Lymphozyten	23	6	4	0	2
Muskel	33	16	6	0	4
Normale Prostata	181	61	45	7	11
Ovar	90	57	12	1	2
Pankreas	48	11	6	0	1
Plazenta	24	5	1	0	0
Prostata	34	16	4	0	2
Milz	56	28	10	0	1
Substantia nigra	108	47	27	1	6
Surrenals	15	3	3	1	0
Hoden	131	68	25	1	8
Schilddrüse	17	8	2	0	2
Nabelschnur	55	17	12	1	3
Uterus	28	15	3	0	2
Nicht gewebespezifisch	568	48	177	2	28
Gesamt	2677	947	601	23	150

TABELLE VI

Beschreibung der Transkriptionsfaktor-Bindungsstellen, die in Promotoren vorhanden sind, die aus SignalTag-Sequenzen isoliert wurden

Promotorsequenz P13H2 (646 bp):
Matrix	Position	Orientierung	Wert	Länge	Sequenz
CMYB_01	-502	+	0.983	9	TGTCAGTTG
MYOD_06	-501	–	0.981	10	CCCAACTGAC
S8_01	-444	–	0.960	11	AATAGAATTAG
S8_01	-425	–	0.968	11	AACTAAATTAG
DELTAEF1_01	-390	–	0.960	11	GCACACCTCAG
GATA_C	-384	–	0.964	11	AGATAAATCCA
CMYB_01	-349	+	0.958	9	CTTCAGTTG
GATA1_02	-343	+	0.959	14	TTGTAGATAGGACA
GATA_C	-339	+	0.953	11	AGATAGGACAT
TAL1ALPHAE47_01	-235	+	0.973	18	CATAACAGATGGTAAG
TAL1BETAE47_01	-235	+	0.983	18	CATAACAGATGGTAAG
TAL1BETAITF2_01	-235	+	0.978	16	CATAACAGATGGTAAG
MYOD_06	-232	–	0.954	10	ACCATCTGTT
GATA1_04	-217	–	0.953	13	TCAAGATAAAGTA
IK1_01	-128	+	0.963	13	AGTTGGGAATTCC
IK2_01	-126	+	0.985	12	AGTTGGGAATTC
CREL_01	-123	+	0.962	10	TGGGAATTCC
GATA1_02	-96	+	0.950	14	TCAGTGATATGGCA
SRY_02	-41	–	0.951	12	TAAAACAAAACA
E2F_02	-33	+	0.957	8	TTTAGCGC
MZF1_01	-5	–	0.975	8	TGAGGGGA

Promotorsequenz P16B4 (861 bp):
Matrix	Position	Orientierung	Wert	Länge	Sequenz
NFY_Q6	-748	–	0.958	11	GGACCAATCAT
MZF1_01	-738	+	0.962	8	CCTGGGGA
CMYB_01	-684	+	0.994	9	TGACCGTTG
VMYB_02	-682	–	0.985	9	TCCAACGGT
STAT_01	-673	+	0.968	9	TTCCTGGAA
STAT_01	-673	–	0.951	9	TTCCAGGAA
MZF1_01	-556	–	0.956	8	TTGGGGGA
IK2_01	-451	+	0.965	12	GAATGGGATTTC
MZF1_01	-424	+	0.986	8	AGAGGGGA
SRY_02	-398	–	0.955	12	GAAAACAAAACA
MZE1_01	-216	+	0.960	8	GAAGGGGA
MYOD_Q6	-190	+	0.981	10	AGCATCTGCC
DELTAEF1_01	-176	+	0.958	11	TCCCACCTTCC
S8_01	5	–	0.992	11	GAGGCAATTAT
MZF1_01	16	–	0.986	8	AGAGGGGA

Promotorsequenz P29B6 (555 bp):
Matrix	Position	Orientierung	Wert	Länge	Sequenz
ARNT_01	-311	+	0.964	16	GGACTCACGTGCTGCT
NMYC_01	-309	+	0.965	12	ACTCACGTGCTG
USF_01	-309	+	0.985	12	ACTCACGTGCTG
USF_01	-309	–	0.985	12	CAGCACGTGAGT
NMYC_01	-309	–	0.956	12	CAGCACGTGAGT
MYCMAX_02	-309	–	0.972	12	CAGCACGTGAGT
USF_C	-307	+	0.997	8	TCACGTGC
USF_C	-307	–	0.991	8	GCACGTGA
MZF1_01	-292	–	0.968	8	CATGGGGA
ELKI_02	-105	+	0.963	14	CTCTCCGGAAGCCT
CETS1P54_01	-102	+	0.974	10	TCCGGAAGCC
AP1_Q4	-42	–	0.963	11	AGTGACTGAAC
AP1FJ_Q2	-42	–	0.961	11	AGTGACTGAAC
PADS_C	45	+	1.000	9	TGTGGTCTC

TABELLE VII

SEQUENZPROTOKOLL

Claims

Ein Signalpeptid, das die Sequenz der Aminosäuren -22 bis -1 der SEQ ID NR: 307 hat.
Ein Polynukleotid, das für das Signalpeptid gemäß Anspruch 1 kodiert.
Das Polynukleotid gemäß Anspruch 2, das die Sequenz der Polynukleotide 89 bis 154 der SEQ ID NR: 149 hat.
Eine gereinigte und isolierte Nukleinsäure, die für ein Polypeptid kodiert, umfassend das Signalpeptid gemäß Anspruch 1 an dem 5'-Ende der kodierenden Sequenz, wobei die genannte Nukleinsäuresequenz im Leserahmen an das 5'-Ende einer Sequenz fusioniert ist, die für ein Polypeptid kodiert, das heterolog zu einem Polypeptid ist, das die Aminosäuren 1 bis 106 der SEQ ID NR: 307 umfasst.
Nukleinsäure gemäß Anspruch 4, wobei die Nukleinsäure eine Polynukleotidsequenz umfasst, die die Sequenz der Nukleotide 89 bis 154 der SEQ ID NR: 149 hat.
Ein Expressionsvektor, der ein Polynukleotid gemäß Anspruch 2 oder 3 umfasst, das funktionell mit einem Promotor verbunden ist.
Ein Expressionsvektor, der eine Nukleinsäure gemäß Anspruch 4 oder 5 umfasst, die funktionell mit einem Promotor verbunden ist.
Expressionsvektor gemäß Anspruch 6 oder 7, wobei der genannte Vektor ein Sekretionsvektor ist.
Expressionsvektor gemäß Anspruch 6 oder 7, wobei der genannte Vektor ein Gentherapie-Vektor ist.
Ein Polypeptid, das durch ein Polynukleotid gemäß Anspruch 4 oder 5 kodiert wird.
Polypeptid gemäß Anspruch 10, wobei das genannte Polypeptid ein humanes sezerniertes Protein ist.
Ein Fusionsprotein, das durch eine Nukleinsäure gemäß Anspruch 4 kodiert wird.
Verwendung eines Signalpeptids gemäß Anspruch 1 zum Steuern der extrazellulären Sekretion eines Polypeptids, das heterolog zu einem Polypeptid ist, das die Aminosäuren 1 bis 106 der SEQ ID NR: 307 umfasst.
Verwendung eines Signalpeptids gemäß Anspruch 1 zur Vereinfachung der Proteinreinigung eines Polypeptids, das heterolog zu einem Polypeptid ist, das die Aminosäuren 1 bis 106 der SEQ ID NR: 307 umfasst.
Verwendung eines Vektors gemäß einem der Ansprüche 6 bis 9 zum Steuern der extrazellulären Sekretion eines Polypeptids.
Verwendung eines Vektors gemäß einem der Ansprüche 6 bis 9 zur Vereinfachung der Proteinreinigung eines gewünschten Polypeptids.
Verwendung gemäß einem der Ansprüche 13 bis 16, worin das genannte Polypeptid ein Polypeptid gemäß einem der Ansprüche 12 bis 15 ist.
Ein Verfahren zur Herstellung eines sezernierten Proteins, das heterolog zu einem Polypeptid ist, das die Aminosäuren 1 bis 106 der SEQ ID NR: 307 umfasst, umfassend den Schritt des Insertierens eines Gens, das für ein nicht-sezerniertes Protein kodiert, im Leserahmen mit einem Polynukleotid gemäß Anspruch 2 oder 3 in einen Vektor, so dass das durch das insertierte Gen kodierte Protein von der transkribierten mRNA exprimiert wird.
Verfahren gemäß Anspruch 18, das weiterhin den Schritt des Einführens des genannten Vektors in eine Wirtszelle, ein Gewebe oder einen Organismus in vitro umfasst.
Ein Verfahren zur Herstellung eines sezernierten Proteins, umfassend den Schritt des Einführens eines Vektors gemäß Anspruch 7 in eine Wirtszelle, ein Gewebe oder einen Organismus in vitro.
Verfahren gemäß einem der Ansprüche 18 bis 20, das weiterhin den Schritt des Isolierens des sezernierten Proteins in vitro umfasst.
Verfahren gemäß Anspruch 21, worin der Schritt des Isolierens des sezernierten Proteins die Reinigung des sezernierten Proteins aus dem Überstand, dem Kulturmedium oder dem Zellextrakt der genannten Wirtszelle umfasst.