-
GEBIET DER
ERFINDUNG
-
Diese
Erfindung betrifft ein Verfahren zur Bestimmung einer Genexpressionsregion
für eine
DNA-Sequenz, deren Nucleotidsequenz bereits bekannt ist und ein
Verfahren zur Bestimmung einer Genexpressionsregion in einer beliebigen
Region des Genoms oder des gesamten Genoms durch wiederholte Ausführung des vorstehend
erwähnten
Verfahrens. Die Erfindung betrifft auch ein genomisches Gen, das
durch dieses Verfahren als eine Genexpressionsregion bestimmt wurde,
und ein von diesem Gen codiertes Protein.
-
Während die
Nucleotidsequenzen der Genome in verschiedensten biologischen Arten,
einschließlich des
menschlichen Genoms, das aus drei Milliarden Basen besteht, entschlüsselt werden,
ist die Entwicklung des so genannten 'Post-Genoms' jetzt im Gange. Demgemäß beschreibt
Hochgeschwender (1992), TIGS, 41–44, Verfahren zur Identifizierung
insbesondere transkribierter Gene innerhalb des menschlichen Genoms. Außerdem beschreibt
Datson (1996), Nucl. Acids Res. 24, 1105–1111, Verfahren um Genfragmente
zu screenen, die zum Nachweis der Anwesenheit einer genomischen
Sequenz in einer RNA-Probe verwendet werden können. Weiterhin beschreibt
Holzinger (1995), in Immunogenetics 42, 315–322, ein Verfahren zum Screenen von
Genfragmenten. Im Besonderen beschreibt Holzinger (a. a. O.) die
Bestimmung, ob LST1, eine DNA-Sequenz, die nachweislich im menschlichen
Genom enthalten ist, exprimiert wird. Es ist das Ziel von 'Post-Genom', die Arten und Aktivitäten aller
Proteine zu verstehen, die von einem lebenden Organismus während seines
gesamten Lebens produziert werden. Ferner ist ein Hauptziel des
menschlichen 'Post-Genom'-Projekts die Entwicklung
neuer Medikamente auf der Basis von Gen-Funktionsanalysen (Herstellung von
genomischen Arzneistoffen) und die Gründung einer Basis für maßgeschneiderte
medizinische Behandlungen (vgl. DeRisi et al., Science, Bd. 278,
S. 680, 1997).
-
Im 'Post-Genom' wird insbesondere
der Expressions-Modus von RNA als 'Transkriptom' bezeichnet. In der Transkriptom-Analyse
ist die Identifizierung aller Gene des Genoms ein wichtiges Thema.
In diesem Zusammenhang offenbart EP-A1 0 969 101 Verfahren zur Prüfung von
Ziel-Nucleinsäuren,
die für
die Untersuchung unbekannter Gene nützlich sind. Auch wenn die
Sequenz einer genomischen DNA entschlüsselt wird, ist damit noch
nicht jedes Gen identifiziert.
-
Die
Anzahl der Gene auf dem menschlichen Genom wird auf hunderttausend
geschätzt,
aber nur sechstausend sind bis jetzt entschlüsselt worden. Selbst wenn einige
der verbleibenden Gene wichtige Funktionen haben, ist es schwierig,
sie zu identifizieren.
- (1) In einer zweidimensionalen
Elektrophorese sind zum Beispiel seltenere Proteine einfach zwischen 'Housekeeping-Proteinen', die in großen Mengen
vorkommen, verborgen, sodass deren Unterscheidung praktisch unmöglich ist.
Auch eine Analyse von cDNA-Banken hat das gleiche Problem, nämlich, dass
die Wahrscheinlichkeit, eine seltene cDNA zu selektieren und sie
einer Nucleotidsequenz-Bestimmung zu unterwerfen, extrem klein ist.
Außerdem
kann zurzeit, wenn das Ziel die Identifizierung aller Gene ist,
der Grad der Durchführung
mit diesen Verfahren nicht erfasst werden.
- (2) Zum Beispiel ist ein Mikro-Array eine Technik, um mehrere
tausend Arten von cDNA unter Verwendung von Sonden (tips), an welche
die cDNAs gebunden werden, zu identifizieren. Aber nachdem die gebunden cDNAs
Moleküle
bereits identifiziert sind, werden so üblicher Weise keine unbekannten
neuen Gene identifiziert.
- (3) Auch wurde beispielsweise über einen Versuch berichtet
(vgl., Bork et al., Nature Genet., vol. 18, S. 313, 1998), Gene
unter Verwendung eines Computers neu zu identifizieren. Programme
wie GRAIL, HEXON und GENSCAN werden zur Ausführung dieses Verfahrens zur
Verfügung
gestellt. Aber es versteht sich von selbst, dass in der Transkriptom-Analyse
die Identifizierung von Genen durch experimentelle Daten, und nicht
durch Annahmen, fest erwartet wird.
-
Demnach
ist es Aufgabe dieser Erfindung, ein neues Transkriptom-Analyseverfahren
bereitzustellen.
-
ZUSAMMENFASSUNG
DER ERFINDUNG
-
Eine
erste Ausführungsform
der Erfindung, die gemacht wurde, um das vorstehend erwähnte Ziel
zu erreichen, ist ein Verfahren zum Feststellen, ob eine durchgehende
beliebige DNA-Sequenz, die im Genom einer beliebigen biologischen
Art vorliegt, eine Genexpressionsregion ist oder nicht, welches
den Nachweis umfasst, ob eine Nucleotidsequenz, die der Nucleotidsequenz
der Region entspricht, in der RNA der biologischen Art vorhanden
ist oder nicht, wobei der Nachweis das Feststellen umfasst, ob DNA
oder RNA amplifiziert wird oder nicht, indem DNA oder RNA, die auf
der RNA der biologischen Art basiert, unter Verwendung eines Oligonucleotids
amplifiziert wird, das homolog ist zu einer Sequenz, die mindesten
zehn oder mehr durchgehende Basen umfasst und im 5'-Ende der Genexpressionsregion
liegt, und eines weiteren Oligonucleotids, das komplementär ist zu
einer Sequenz, die mindestens zehn oder mehr durchgehende Basen
umfasst und im 3'-Ende
der Genexpressionsregion liegt und wobei der Nachweis, ob die DNA
oder RNA amplifiziert wird oder nicht, durch ein Verfahren durchgeführt wird,
in welchem die Amplifikation in Gegenwart einer Oligonucleotidsonde
durchgeführt
wird, die spezifisch an die DNA oder RNA binden kann, die durch
die Amplifikation gebildet wird, und mit einem intercalierenden
Fluoreszenzfarbstoff markiert ist (mit der Maßgabe, dass das Oligonucleotid
eine Sequenz ist, die kein komplementäres Binden mit einem der vorstehend
genannten Oligonucleotide zeigt), und Veränderungen in einem Fluoreszenzmerkmal
der Reaktionslösung
gemessen werden.
-
Eine
zweite Ausführungsform
der Erfindung betrifft die erste Erfindung, bei der die DNA-Sequenz
eine DNA-Region von 100 bis 200 Basen ist.
-
Eine
dritte Ausführungsform
der Erfindung betrifft die vorhergehende Ausführungsform, wobei die Amplifikation
eine RNA Amplifikation ist, bei welcher unter Verwendung von Oligonucleotiden,
von denen eines eine RNA-transkribierbare Promotorsequenz in seinem
5'-Ende hat, (1)
ein DNA-Fragment, das komplementär zu
einem Teil der RNA der biologischen Art ist, mittels RNA-abhängiger DNA-Polymerase
von einem der beiden Oligonucleotide unter Verwendung der von der
biologischen Art abgeleiteten RNA als Matrize synthetisiert wird,
wodurch die Bildung eines RNA-DNA-Hybrides bewirkt wird, (2) ein
einzelsträngiges
DNA-Fragment durch Hydrolysieren der von der biologischen Art abgeleiteten
RNA des RNA-DNA-Hybrids mit Ribonuclease H gebildet wird, (3) ein
DNA- Fragment, das
komplementär
zu dem einzelsträngigen
DNA-Fragment ist, mittels DNA-abhängiger DNA-Polymerase
vom anderen Oligonucleotid unter Verwendung des einzelsträngigen DNA-Fragments
als Matrize synthetisiert wird, wodurch die Bildung eines doppelsträngigen DNA-Fragments bewirkt
wird, das eine Promotorsequenz hat, die in der Lage ist, Transkription
von RNA als Teil der RNA der biologischen Art oder von RNA, die
komplementär
zu einem Teil davon ist, durchzuführen, (4) ein RNA-Transkriptionsprodukt
aus der doppelsträngigen
DNA unter Verwendung von RNA-Polymerase gebildet wird, und dann
(5) die Schritte von (1) bis (4) unter Verwendung des RNA-Transkriptionsprodukts
als Matrize wiederholt werden.
-
Eine
vierte Ausführungsform
der Erfindung betrifft die vorhergehenden Ausführungsformen, wobei die Sonde
eine komplementäre
Bindung mit zumindest einem Teil der Sequenz des DNA-Transkriptionsprodukts oder
RNA-Transkriptionsprodukts eingehen kann, das durch die Amplifikation
gebildet wurde und sich das Fluoreszenzmerkmal im Vergleich mit
dem Fall, in dem der Komplex nicht gebildet wird, verändert.
-
Eine
fünfte
Ausführungsform
der Erfindung ist ein Verfahren zum Feststellen der Genexpressionsregion
in einer beliebigen Region des Genoms oder des gesamten Genoms,
das das wiederholte Ausführen
des Verfahrens nach der ersten bis vierten Ausführungsform der Erfindung umfasst.
-
KURZE BESCHREIBUNG
DER ERFINDUNG
-
1 zeigt
eine Beziehung zwischen den Nucleotidsequenzen jeder einzelnen der
Genexpressionsregionen 1 bis 5 und den komplementären Bindungspositionen
jedes einzelnen der Primer 1F, 1R, 1S, 2F, 2R, 2S, 3F, 3R, 3S, 4F,
4R, 4S, 5F, 5R, und 5S.
-
2 zeigt
die Nicht-Transkriptions-Region und die Transkriptions-Region der
Genexpressionsregionen 1 bis 5.
-
3 zeigt
ein Elektrophoresemuster, wenn 30 Zyklen von RT-PCR für 200 ng
mRNA unter Verwendung von Primern für die Genexpressionsregionen
1 bis 5 mittels des in Beispiel 3 gezeigten Verfahrens durchgeführt wurden.
-
4A, 4B, 4C zeigen
die entsprechenden Elektrophoresemuster, wenn 10, 20 und 30 Minuten
von TRC für
200 ng mRNA unter Verwendung von Primern für die Genexpressionsregionen
von 1 bis 5 mittels des in Beispiel 4 gezeigten Verfahrens durchgeführt wurden.
-
5 ist
eine graphische Darstellung, die die Beziehung zwischen der Reaktionszeit
und dem Fluoreszenzintensitäts-Verhältnis zeigt,
die mit der Bildung von RNA ansteigt, wenn TRC für 200 ng mRNA mittels des in
Beispiel 5 gezeigten Verfahrens unter Verwendung von Primern für die Genexpressionsregion
3 durchgeführt
wurde.
-
6A und 6B zeigen
entsprechende Elektrophoresemuster, wenn 30 Zyklen von RT-PCR oder 30 Minuten
von TRC für
200 ng mRNA mittels des in Beispiel 6 gezeigten Verfahrens unter
Verwendung von Primern für
die Genexpressionsregion 3 durchgeführt wurden.
-
7A und 7B zeigen
entsprechende Elektrophoresemuster, wenn 30 Zyklen von RT-PCR oder 30 Minuten
von TRC für
0 oder 2 ng mRNA oder 0 bis 200 ng genomischer DNA mittels des in
Beispiel 7 gezeigten Verfahrens unter Verwendung von Primern für die Genexpressionsregion
3 durchgeführt
wurden.
-
8 ist
eine graphische Darstellung die die Beziehung zwischen der Reaktionszeit
und dem Fluoreszenzintensitäts-Verhältnis zeigt,
die mit der Bildung von RNA ansteigt, wenn TRC für 200 ng genomischer DNA mittels
des in Beispiel 7 gezeigten Verfahrens unter Verwendung von Primern
für eine
Region bestehend aus den Genexpressionsregionen 1, 2 und 3 durchgeführt wurde.
-
GENAUE BESCHREIBUNG
DER ERFINDUNG
-
Im
Folgenden wird die Erfindung im Detail beschrieben.
-
Das
Verfahren der Erfindung wird auf eine durchgehende beliebige DNA-Sequenz
angewandt, die im Genom einer beliebigen biologischen Art vorliegt.
Eine solche DNA-Sequenz,
deren Länge
nicht besonders limitiert ist, aber 200 oder weniger Basen, vorzugsweise
im Bereich von 100 bis 200 Basen ist, kann durch Auswahl von publizierten
genomischer DNA-Sequenzen festgelegt werden. Gemäß dem Verfahren der Erfindung kann
eine Möglichkeit,
dass die DNA-Sequenz eine Genexpressionsregion ist, nur in dem Fall
bestimmt werden, in dem der gesamte Anteil einer beliebigen bestimmten
DNA-Sequenz in einem Exon enthalten ist. Obwohl die Anzahl der Exons
in einem Gen und die Länge
jedes Exons, abhängig
von der Art des Gens, stark variiert, ist in jedem Gen ein Exon
vorhanden, das ein Terminationscodon und ein Poly-A-Verbindungssignal hat
und das länger
als die anderen Exons ist und mehr als 400 Basenpaare hat. Wenn
daher eine beliebige genomische Region in eine DNA-Sequenz von 200
Basenpaaren oder weniger fragmentiert wird, ist zumindest eines
der Fragmente in einem Exon enthalten und wird daher nicht übersehen.
-
Gemäß der vorliegenden
Erfindung wird der folgende Nachweis unter Verwendung einer durchgehenden
beliebigen, im Genom vorliegenden DNA-Sequenz durchgeführt. Die
Genexpressionsregion kann auf einer beliebigen Region im Genom oder
im gesamten Genom, bestimmt werden, indem die beliebige Region oder
das gesamte Genom in Fragmente zerlegt wird und der Nachweis unter
Verwendung jedes einzelnen Fragments wiederholt wird.
-
Die
Erfindung bestimmt, ob eine DNA-Sequenz eine Genexpressionsregion
ist oder nicht, indem die Anwesenheit oder Abwesenheit einer Nucleotidsequenz,
die der Nucleotidsequenz der Genexpressionsregion der RNA derselben
biologischen Art entspricht, nachgewiesen wird. Die RNA, die bei
der Erfindung zum Einsatz kommt, ist mRNA, die aus derselben biologischen
Art hergestellt wird, in der das Genom enthalten ist, in dem eine
Genexpressionsregion nachgewiesen werden soll. Besonders wenn das
Genom das Genom eines höheren
Organismus ist, ist es erstrebenswert, verschiedene Arten von mRNA,
vorzugsweise aus allen Geweben hergestellte, zu verwenden. In diesem
Fall kann die mRNA jedes Gewebes getrennt oder gemischt verwendet
werden. Wenn im letzteren Fall die Anwesenheit einer Genexpressionsregion
gefunden wird, macht die nachfolgende getrennte Verwendung von mRNA
aus jedem Gewebe die Auffindung des Gewebes möglich, welches das Gen des
Genoms exprimiert, das als Genexpressionsregion bestimmt wurde.
Der Grund, warum mRNA-Arten gemischt werden können, ist folgender. In der
Annahme, dass das durchschnittliche Molekulargewicht von mRNA 300,000
ist, wird 1 ng mRNA 2 × 109 mRNA-Moleküle enthalten.
Folglich sind sogar im Fall eines Gens, das nur in einem von 1000
Geweben exprimiert wird, und dessen Expressions-Höhe einen
Anteil von 1/100,000 der mRNA im Gewebe ausmacht, 2 × 104 Kopien in 1 μg derselben Menge eines mRNA-Gemischs
vorhanden, die jeweils aus 1,000 Geweben einschließlich dieses
Gewebes gewonnen wurde. Wie später
noch in den Beispielen beschrieben wird, ist diese Kopienzahl ausreichend
nachweisbar.
-
Verschiedene
Verfahren können
für den
vorstehend erwähnten
Nachweis angewendet werden. Beispielsweise kann die Anwendung eines
Hybidisierungsverfahrens und eines Nucleinsäure-Amplifikationsverfahrens
als Beispiel dienen. Wenn ein Amplifikationsverfahren verwendet
wird, werden zumindest zwei Oligonucleotide (Primer), die basierend
auf der Genexpressionsregion entworfen wurden, in sowohl DNA-Amplifikation als
auch RNA-Amplifikation verwendet, wobei eines von ihnen ein Oligonucleotid
ist, das homolog ist zu einer Sequenz, die mindestens 10 oder mehr
durchgehende Basen umfasst und im 5'-Ende der Genexpressionsregion liegt,
und das andere ein Oligonucleotid ist, das komplementär ist zu
einer Sequenz, die mindestens 10 oder mehr durchgehende Basen umfasst
und im 3'-Ende der
Genexpressionsregion liegt. Oligonucleotide von zumindest 10 oder
mehr Basen werden verwendet, um eine Spezifität hinsichtlich der Bindung
der Oligonucleotide an die Genexpressionsregion zu bewahren.
-
Beispiele
des Nucleinsäure-Amplifikationsverfahrens
beinhalten ein DNA-Amplifikationsverfahren, verkörpert durch
eine RT-PCR, in welchem cDNA von der mRNA unter Verwendung von Primern
und einer Reversen Transkriptase synthetisiert wird und dann DNA
(DNA, die aus der Genexpressionsregion besteht) mittels einer Primer-Elongations-Reaktion unter Verwendung
von Primern und einer DNA-Polymerase und der DNA als Matrize amplifiziert
wird, sowie ein RNA-Amplifikationsverfahren, in welchem zu der RNA
komplementäre
cDNA unter Verwendung von Primern und einer Reversen Transkriptase
und der mRNA als Matrize synthetisiert wird, eine Elongationsreaktion
der DNA durchgeführt
wird, indem sie an einen Promotor-Primer gebunden wird, der eine
Einheit enthält,
die komplementär
zu der DNA ist, und dann RNA (RNA, die aus der Genexpressionsregion besteht)
in großer
Menge synthetisiert wird, indem einer RNA-Polymerase gestattet wird, mit
der auf diese Weise synthetisierten doppelsträngigen DNA zu reagieren.
-
Der
erste Fall ist ein bereits weit und allgemein bekanntes Verfahren
und Beispiele für
den letzteren Fall beinhalten NASBA (nucleic acid sequence based
amplification)-Verfahren, 3SR-Verfahren und das Verfahren, das später in den
Beispielen beschrieben werden wird.
-
Beschreibt
man das NASBA-Verfahren und das in den Beispielen beschriebene Verfahren
skizzenhaft, so sind sie RNA-Amplifikationen, in denen unter Verwendung
von Oligonucleotiden, von denen eines der beiden eine RNA-transkribierbare
Promotor-Sequenz im 5'-Ende
hat, (1) ein DNA-Fragment, das komplementär zu einem Teil der RNA der
biologischen Art ist, mittels RNA-abhängiger DNA-Polymerase von einer
der beiden Oligonucleotide unter Verwendung der von der biologischen
Art abgeleiteten RNA als Matrize synthetisiert wird, wodurch die
Bildung eines RNA-DNA-Hybrids bewirkt wird, (2) durch Hydrolysieren
der von der biologischen Art abgeleiteten RNA des RNA-DNA-Hybrids
mit Ribonuclease H, ein einzelsträngiges DNA-Fragment gebildet
wird, (3) ein DNA-Fragment,
das komplementär
zum einzelsträngigen
DNA-Fragment ist, mittels DNA-abhängiger DNA-Polymerase
vom anderen Oligonucleotid unter Verwendung des einzelsträngigen DNA-Fragments
als Matrize synthetisiert wird, wodurch die Bildung eines doppelsträngigen DNA-Fragments bewirkt
wird, das eine Promotorsequenz hat, die in der Lage ist, Transkription
von RNA als Teil der RNA der biologischen Art oder von RNA, die
komplementär
zu einem Teil davon ist, durchzuführen, (4) ein RNA-Transkriptionsprodukt
von der doppelsträngigen
DNA unter Verwendung von RNA-Polymerase gebildet wird und dann (5)
die Schritte von (1) bis (4) unter Verwendung des RNA-Transkriptionsprodukts
als Matrize wiederholt werden.
-
Das
Verfahren, das in den Beispielen beschrieben wird, kann von den
Gesichtspunkten aus als Beispiel eines besonders wünschenswerten
Nachweisverfahrens beschrieben werden, dass die Bestimmung der Erfindung
innerhalb einer kurzen Zeitperiode erfolgen kann, da die Amplifikation
innerhalb einer ausgesprochen kurzen Zeit von 10 Minuten beendet
ist, dass es eine hohe Sensitivität hat, die die Amplifikation
von sogar einigen pg RNA, die die Genexpressionsregion beinhaltet,
ermöglicht,
und dass der Einfluss von DNA, die die Möglichkeit hat, RNA zu kontaminieren,
ausgeschlossen werden kann.
-
Die
DNA und RNA, die durch die vorstehende Amplifikation gebildet werden,
können
durch ein bereits bekanntes Nachweisverfahren, wie eine Elektrophorese,
nachgewiesen werden, aber im Besonderen bevorzugt ist ein Verfahren,
in dem die Amplifikation in Gegenwart einer Oligonucleotidsonde,
die spezifisch an die DNA oder RNA, die durch die Amplifikation
gebildet wird und mit einem intercalierenden Fluoreszenzfarbstoff markiert
ist, durchgeführt
wird, und Veränderungen
in einem Fluoreszenzmerkmal der Reaktionslösung gemessen werden. Selbstverständlich hat
diese Sonde eine Sequenz, die keine komplementären Bindungen mit den Oligonucleotiden,
die für
die Amplifikation verwendet werden, bilden kann. Beispiele dieser
Oligonucleotidsonde beinhalten jene, in welchen ein intercalierender
Fluoreszenzfarbstoff über
einen Linker an den Phosphor eines Oligonucleotids gebunden ist.
Im Falle einer solchen geeigneten Sonde, wenn die gebildete DNA oder
RNA durch komplementäre
Bindung an eine Genexpressionsregion (oder eine Sequenz komplementär zu der
Genexpressionsregion) einen Doppelstrang bildet, intercaliert der
intercalierende Fluoreszenzfarbstoff in die doppelsträngige Einheit
und verändert
sein Fluoreszenzmerkmal, sodass es nicht notwendig ist, die Sonde,
die keine komplementäre
Bindung eingegangen ist, abzutrennen (Ishiguro, T. et. al., (1996),
Nucleic Acids Res., 24 (24), 4992–4997).
-
Die
Nucleotidsequenz der Oligonucleotidsonde ist, mit der Maßgabe, dass
sie eine Sequenz hat, die mit der gebildeten DNA oder RNA eine komplementäre Bindung
eingehen kann, nicht besonders eingeschränkt, aber um die Spezifität in Bezug
auf die Bindung an die gebildete DNA oder RNA zu erhalten, ist es wünschenswert,
dass sie etwa zehn Basen hat, die komplementär zu mindestens zehn durchgehenden
Basen sind, die in der DNA oder RNA vorhanden sind. In diesem Zusammenhang
ist es wünschenswert,
die Hydroxylgruppe des 3'-Endes der Sonde chemisch
zu verändern
(z. B. Zugabe von Glykolsäure),
wenn die Amplifikation in Gegenwart der Oligonucleotidsonde durchgeführt wird,
um so die Elongationsreaktion, in der die Sonde als Primer verwendet
wird, zu unterdrücken.
-
Wenn
die Amplifikation, wie vorstehend beschrieben, in Gegenwart einer
Oligonucleotidsonde durchgeführt
wird, kann das Nachweisverfahren der Erfindung in einem Reaktionsgefäß bei einer
konstanten Temperatur und in einem Schritt durchgeführt werden,
sodass sein Einsatz im automatischen Betrieb leicht gemacht werden
kann.
-
Die
Einzelheiten des Genomanalyse-Verfahrens der Erfindung, das durch
Wiederholung des Genexpressionsregion-Bestimmungsverfahrens durchgeführt wird,
sind wie folgt. Das Verfahren kann in jeder biologischen Art zum
Einsatz gelangen, sofern die genomische Sequenz bestimmt ist. Das
Genom der besagten biologischen Art ist zum Beispiel in DNA-Sequenzen
von jeweils 200 Basenpaaren geteilt. Wenn eine Nucleinsäure-Amplifikation als
Nachweisverfahren verwendet wird, wird ein Primer-Satz angefertigt,
der zwei Oligonucleotide enthält,
die für
die Amplifikation jeder Genexpressionsregion erforderlich sind.
In diesem Zusammenhang variiert die Anzahl der erforderlichen Primer
und ihrer Sequenz, je nach dem zum Einsatz kommenden Nucleinsäure-Amplifikationsverfahren.
Ferner ist es zur Verbesserung der Arbeitseffizienz wirkungsvoll, eine
DNA-Sequenz von den Untersuchungen auszuschließen, die in einer Region vorliegt,
die durch frühere Studien
schon als Genexpressionsregion bekannt ist, sowie eine DNA-Sequenz,
die in einer Region vorliegt, die aufgrund ihrer DNA-Sequenz offensichtlich
keine Genexpressionsregion ist. Daraufhin wird die RNA unter Verwendung
eines Primer-Satzes für
jede DNA-Sequenz nachgewiesen.
-
Wenn
ein Genom mittels des Verfahrens der Erfindung analysiert wird,
können
alle Gene einer biologischen Art identifiziert werden. Darüber hinaus
wird es möglich,
ein Protein zu bestimmen, das durch ein Gen, das von Interesse ist,
codiert wird, indem das Gen, das als Genexpressionsregion bestimmt
wurde, isoliert wird und das Protein unter Zuhilfenahme der isolierten
DNA hergestellt wird. Zum Beispiel kann eine Nucleotidsequenz ermittelt
werden, indem eine cDNA mit vollständinger Länge auf dem üblichen
Weg unter Verwendung einer Nucleinsäure als Sonde, die mittels
des Verfahrens der Erfindung amplifiziert wurde, isoliert wird.
Auf diese Weise wird die genomische Struktur einschließlich des
Verhältnisses
zwischen Intron und Exon in der Genomexpressions-Region aufgedeckt.
Ferner kann ein Protein, das durch das Gen codiert ist, bekannt
werden, indem die cDNA mittels Screenen einer cDNA-Bank auf dem üblichen
Weg unter Verwendung der amplifizierten Nucleinsäure als Sonde isoliert wird.
Darüber
hinaus kann dieses Protein, falls es exprimiert ist, durch Erzeugung
einer Rekombinanten unter Verwendung der cDNA sowie unter Verwendung
einer mikrobischen oder tierischen Wirtszelle auf dem üblichen
Weg exprimiert werden.
-
Beispiele
der Erfindung werden nachstehend als Erläuterung und nicht als Einschränkung gegeben.
-
BEISPIEL 1
-
Bestimmung der Regionen
-
Um
die Umsetzungsmöglichkeit
des Bestimmungsverfahrens für
Genexpressionsregion, das durch die Erfindung bereitgestellt wird,
zu zeigen, wurde der folgende Modellversuch durchgeführt.
-
Als
die genomische Region wurde eine Region ausgewählt, die aus 900 Basenpaaren
besteht und aus einem G1-Stamm hergestellt wurde, der ein genetisch
veränderter,
transformierter Methanol-assimilierender Hefestamm ist und der mittels
des, von den vorliegenden Erfindern in der Japanischen Patentanmeldung
Nummer 11-188650 beschriebenen Verfahrens, erzeugt wurde. Wenn der
G1-Stamm durch Methanol induziert wird, exprimiert er ein menschliches
Fusionsprotein, IL-6R-IL-6, das aus einer Polypeptidkette von 397
Aminosäureresten
besteht (vgl., Japanische Patentveröffentlichung Nummer P2001-8690A).
-
Wie
in 1 gezeigt wird, wurde die Region, die aus 900
Basenpaaren besteht, in fünf
DNA-Sequenzen von je 180 Basenpaaren geteilt. Außerdem wird der mRNA-Expressions-Modus der Region,
der schon aus der Japanischen Patentveröffentlichung Nummer P2001-8690A bekannt ist,
in 2 gezeigt. Wie aus 1 und 2 offensichtlich
ist, enthält
die Genexpression-Region 1 (Basennummern 1 bis 180) 159 Basenpaare einer
Nicht-Transkriptions-Region
sowie 21 Basenpaare einer Transkriptions-Region. Jede einzelne der
Genexpressionsregion 2 (Basennummern 181 bis 360), Genexpressionsregion
3 (Basennummern 361 bis 540), Genexpressionsregion 4 (Basennummern
541 bis 720) und Genexpressionsregion 5 (Basennummern 721 bis 900)
enthält
nur eine Transkriptions-Region.
-
Die
Oligonucleotid-(Primer)-Sätze
(Vorwärts-Primer;
F, Rückwärts-Primer; R, Schneide-Sonde
(scissor-probe); S, die in 1 gezeigt
werden, und die SEQ ID NO 1 bis 15, wurden für jede der fünf vorstehenden erwähnten Genexpressionsregionen
synthetisiert. Wenn eine DNA-Amplifikation (RT-PCR) durchgeführt wurde,
wurden der Vorwärts-Primer
und der Rückwärts-Primer
unter ihnen benützt.
Wenn eine RNA-Amplifikation (TRC;
transcription reverse transcription concerting amplification) durchgeführt wurde,
wurden der Vorwärts-Primer,
der Rückwärts-Primer
und die Schneide-Sonde
benützt.
In der TRC kann eine Genexpressionsregion nicht amplifiziert werden,
wenn sie nicht am 5'-Terminus
der mRNA liegt. Die Schneide-Sonde ist ein Oligonucleotid (DNA),
das in diesem Fall dazu benützt
wird, um die Genexpressionsregion an der 5'-Seite der mRNA zu lokalisieren, indem
sie komplementär
an die 5'-Seite
der Genexpressionsregion gebunden wird und die komplementär-gebundene
Region durch die Einwirkung einer Ribonuclease geschnitten wird.
-
BEISPIEL 2
-
Erzeugung von mRNA
-
Eine
mRNA-Probe wurde mittels des folgenden Verfahrens aus dem G1-Stamm
erzeugt.
-
Der
G1-Stamm wurde in 3 ml BMGY (Bacto Yeast Extrakt 10 g/l, Bacto Peptone
20 g/l, Yeast Nitrogen Base ohne Aminosäuren 1,34 g/l, 100 mM Kaliumphosphat-Puffer,
pH 6,0, Glycerin 10 g/l und Biotin 0,4 mg/ml)-Medium inokuliert
und bei 28°C
für 24
Stunden auf einem Schüttler,
gezüchtet.
-
Ein
100 μl-Anteil
der Kulturbrühe
wurde in 3 ml BMGY (Bacto Yeast Extract 15 g/l, Bacto Peptone 30 g/l
und den anderen Bestandteilen, die die gleiche Zusammensetzung wie
im vorstehend erwähnten
BMGY haben)-Medium inokuliert und bei 28°C für 16 Stunden gezüchtet.
-
Nach
Bestätigung
des Aufbrauchens von Methanol wurden 100 μl Methanol zum Medium zugefügt, um die
Expression des menschlichen IL-6R-IL-6 Fusions-Proteins zu induzieren.
Zwei Stunden nach der Zugabe von Methanol wurden die Zellen geerntet
und 5 × 107 Zellen wurden sofort mit flüssigem Stickstoff
eingefroren.
-
Sie
wurden unter Verwendung eines handelsüblichen Kits (Yeast cell lysis
preparation kit, hergestellt von BIO 01 Inc.) einer Zellwand-Lyse
unterworfen. Als Nächstes
wurde mRNA unter Verwendung eines handelsüblichen Kits (QuickPrep mRNA
Purification Kit, hergestellt von Amersham Pharmacia) erzeugt.
-
BEISPIEL 3
-
Bestimmung
der Genexpression-Region durch DNA-Amplifikation
-
Unter
Verwendung der in Beispiel 2 erhaltenen mRNA wurde untersucht, ob
die DNA-Amplifikation für einen
Primer, der aus einer Region abgeleitet wurde, die ausschließlich aus
einer Genexpressionsregion besteht, spezifisch ist oder nicht.
-
Ein
handelsüblicher
Kit (RT-PCR beads, hergestellt von Amersham Pharmacia) wurde in
der RT-PCR verwendet.
-
Das
heißt,
cDNA wurde von 200 ng mRNA unter Verwendung von Oligo(dT) als Primer
durch eine 15 minütige
Reaktion bei 42°C
synthetisiert. Als Nächstes
wurde eine PCR-Reaktion
unter Verwendung des Vorwärts-Primers
und des Rückwärts-Primers,
durchgeführt.
Unter Verwendung eines PCR-Geräts
wurden 30 Zyklen für
die Dauer von ungefähr
3 Stunden durchgeführt.
Ein Zyklus bestand aus 95°C
für 1 Minute,
55°C für 1 Minute
und 72°C
für 2 Minuten.
Sofort nach der Reaktion wurde eine Elektrophorese unter Verwendung
von 4% Agarose, die danach mit SYBR-Grün gefärbt wurde, durchgeführt. Wie
aus 3 offensichtlich ist, wurde keine Amplifikation
durch den aus der Genexpressionsregion 1 stammenden Primer gefunden,
aber eine Amplifikation mittels der aus den Genexpressionsregionen
2 bis 5 stammenden Primern wurde gefunden.
-
Diese
Ergebnisse zeigen, dass die DNA-Amplifikation spezifisch für einen
Primer ist, der von einer Region abgeleitet ist, die ausschließlich aus
einer Genexpressionsregion besteht. Das heißt, ob eine durchgehende beliebige
DNA-Sequenz, die im Genom einer beliebigen, biologischen Art vorliegt,
eine Genexpressionsregion ist oder nicht, kann durch den Nachweis
der Anwesenheit oder Abwesenheit einer Nucleotidsequenz, die einer
Nucleotidsequenz der Region in der RNA der biologischen Art entspricht,
und durch eine DNA-Amplifikation, die durch eine RT-PCR verkörpert wird,
festgestellt werden.
-
BEISPIEL 4
-
Bestimmung
der Genexpressionsregion durch RNA-Amplifikation
-
Unter
Verwendung der in Beispiel 2 erhaltenen mRNA wurde untersucht, ob
die RNA-Amplifikation für einen
Primer, der aus einer Region abgeleitet wurde, die ausschließlich aus
einer Genexpressionsregion besteht, spezifisch ist oder nicht.
- (1) Unter Verwendung einer RNA-Verdünnungslösung (10
mM Tris-HCl (pH 8,0) und 1 mM EDTA) wurde die Probe auf 200 ng/5 μl verdünnt.
- (2) Ein 20,8 μl-Anteil
einer Reaktionslösung
der folgenden Zusammensetzung wurde in Röhrchen mit 0,5 ml Fassungsvermögen verteilt
und 5 μl
der vorstehend erwähnten
RNA-Probe wurden
beigemengt.
Zusammensetzung der Reaktionslösung (jede Konzentration entspricht
einer Konzentration in 30 μl
der endgültigen
Reaktionslösung)
60
mM Tris-HCl (pH 8,6),
13 nM MgCl2,
90
mM KCl,
39 Einheiten Rnase-Inhibitor,
1 mM DTT,
0,25
mM jeweils von dATP, dCTP, dGTP und dTTP
3,6 mM ITP,
3,0
mM jeweils von ATP, CTP, GTP und TTP
0,16 μM Schneide-Sonde,
1 μM Vorwärts-Primer,
1 μM Rückwärts-Primer,
13%
DMSO und
destilliertes Wasser zur Einstellung des Volumens.
- (3) Diese Reaktionslösung
wurde bei 65°C
für 15
Minuten und dann bei 4l°C
für 5 Minuten
inkubiert und dann wurden 4,2 μl
einer Enzymlösung
mit der folgenden Zusammensetzung beigemengt.
Zusammensetzung
der Enzymlösung
(jede Konzentration entspricht einer Konzentration in 30 μl der endgültigen Reaktionslösung).
1,7%
Sorbit,
3 μg
Rinderserumalbumin,
142 Einheiten T7 RNA-Polymerase (hergestellt
von Gibco),
8 Einheiten AMV-Reverse Transkriptase (hergestellt
von Takara Shuzo),
destilliertes Wasser, verwendet zur Einstellung
des Volumens.
- (4) Anschließend
wurden die Röhrchen
für 10,
20 oder 30 Minuten bei 41°C
gehalten. Sofort nach der Reaktion wurde eine Elektrophorese unter
Verwendung von 4% Agarose, die danach mit SYBR Grün gefärbt wurde,
durchgeführt.
-
Wie
aus den 4A, 4B und 4C offensichtlich
ist, wurde keine Amplifikation nachgewiesen, wenn der Primer für die Genexpressionsregion
1, jeweils im Falle der 10 minütigen
Reaktion (4A), 20 minütigen Reaktion (4B)
und 30 minütigen
Reaktion (4C), verwendet wurde, sie wurde
aber gefunden, wenn die Primer für
die Genexpressionsregionen 2 bis 5 verwendet wurden.
-
Diese
Ergebnisse zeigen, dass eine RNA-Amplifikation spezifisch für einen
Primer ist, der von einer Region abgeleitet wird, die ausschließlich aus
einer Genexpressionsregion besteht, das heißt, ob eine durchgehende beliebige
DNA-Sequenz, die im Genom einer beliebigen, biologischen Art vorliegt,
eine Genexpressionsregion ist oder nicht, kann durch den Nachweis
der Anwesenheit oder Abwesenheit einer Nucleotidsequenz, die einer
Nucleotidsequenz der Region in der RNA der biologischen Art entspricht,
und durch eine RNA-Amplifikation, die durch eine TRC verkörpert wird,
festgestellt werden.
-
Ferner,
während
die in Beispiel 3 gezeigte RT-PCR Amplifikation sogar mit Hilfe
eine PCR-Geräts
3 Stunden benötigte,
waren 10 Minuten für
die Amplifikation durch TRC ausreichend.
-
BEISPIEL 5
-
Messung unter
Verwendung einer Oligonucleotidsonde die mit intercalierendem Fluoreszenzfarbstoff
markiert ist
-
Unter
Verwendung der in Beispiel 2 erhaltenen mRNA, wurde die Messung
unter Verwendung einer Oligonucleotidsonde, die mit einem intercalierendem
Fluoreszenzfarbstoff markiert ist, durchgeführt.
- (1)
Unter Verwendung einer RNA-Verdünnungslösung (10
mM Tris-HCl (pH 8,0) und 1 mM EDTA) wurde die Probe auf 200 ng/5 μl verdünnt.
- (2) Ein 20,8 μl-Anteil
einer Reaktionslösung
der folgenden Zusammensetzung wurde in Röhrchen mit 0,5 ml Fassungsvermögen verteilt
und 5 μl
der vorstehend erwähnten
RNA-Probe wurden
beigemengt.
Zusammensetzung der Reaktionslösung (jede Konzentration entspricht
einer Konzentration in 30 μl
der endgültigen
Reaktionslösung)
60
mM Tris-HCl (pH 8,6),
13 mM MgCl2,
90
mM KCl,
39 Einheiten Rnase-Inhibitor,
1 mM DTT,
0,25
mM jeweils von dATP, dCTP, dGTP und dTTP
3,6 mM ITP,
3,0
mM jeweils von ATP, CTP, GTP und TTP
0,16 μM Schneide-Sonde (3S, SEQ ID
NO: 9, die 3'-terminale
Hydroxyl-Gruppe
ist aminiert),
1 μM
Vorwärts-Primer
(3F, SEQ ID NO: 7),
1 μM
Rückwärts-Primer
(3R, SEQ ID NO: 8),
25 nM eines Oligonucleotids, das mit einem
intercalierendem Fluoreszenzfarbstoff markiert ist (YO-3, SEQ ID
NO: 16, der intercalierende Fluoreszenzfarbstoff ist am Phosphor,
zwischen dem „T" in sechster Position und
dem „T" in siebenter Position,
gezählt
vom 5'-Ende, markiert
und die 3'-terminale Hydroxylgruppe
ist mit einer Glycol-Gruppe modifiziert),
13% DMSO und
destilliertes
Wasser zur Einstellung des Volumens.
- (3) Diese Reaktionslösung
wurde bei 65°C
für 15
Minuten und dann bei 41°C
für 5 Minuten
inkubiert und dann wurden 4,2 μl
einer Enzymlösung
mit der folgenden Zusammensetzung hinzugefügt.
Zusammensetzung der
Enzymlösung
(jede Konzentration entspricht einer Konzentration in 30 μl der endgültigen Reaktionslösung).
1,7%
Sorbit,
3 μg
Rinderserumalbumin,
142 Einheiten T7 RNA-Polymerase (hergestellt
von Gibco),
8 Einheiten AMV-Reverse Transkriptase (hergestellt
von Takara Shuzo),
destilliertes Wasser, verwendet zur Volumen-Einstellung.
- (4) Anschließend
wurden die Röhrchen
bei 41°C
gehalten und die Reaktionslösung
wurde periodisch bei einer Anregungs-Wellenlänge von 470 nm und einer Fluoreszenz-Wellenlänge von
510 nm unter Verwendung eines direkt messenden Fluoreszenz-Spektrophotometers,
das mit einer Temperaturkontrollfunktion ausgestattet ist, gemessen.
-
Periodische
Vernderungen im Fluoreszenzintensitäts-Verhältnis der Probe (Fluoreszenzintensitäts-Wert
zu einer vorgegeben Zeit/Hintergrundsfluoreszenz-Intensität-Wert), berechnet
durch Festlegung der Zeit der Enzymzugabe als Minute 0, sind in 5 gezeigt.
-
Wie
in 5 gezeigt, wurde die Ziel-RNA, die in 200 ng mRNA
enthalten ist, innerhalb von 6 Minuten nachgewiesen. Darüber hinaus
wurde die Ziel-RNA innerhalb von 11 Minuten nachgewiesen, selbst
wenn die Menge an mRNA auf 0,02 ng reduziert wurde. Demnach wurde
gezeigt, dass schnelle und hoch sensitive Messungen unter Verwendung
einer Oligonucleotidsonde, die mit einem intercalierenden Fluoreszenzfarbstoff markiert
ist, gemacht werden können.
-
BEISPIEL 6
-
Sensitivität
-
Sensitivitäten von
RT-PCR und TRC werden verglichen.
-
Unter
Verwendung von 0 bis 200 ng der in Beispiel 2 erhaltenen mRNA wurde
die Amplifikation von DNA oder RNA durch 30 Zyklen von RT-PCR durch
das in Beispiel 3 gezeigte Verfahren oder durch 30 Minuten von TRC
durch das in Beispiel 4 gezeigte Verfahren durchgeführt.
-
Wie
aus den 6A und 6B offensichtlich
ist, wurde die Amplifikation von 0,002 ng der mRNA nicht über RT-PCR,
sondern über
TRC nachgewiesen. Folglich wurde gezeigt, dass TRC eine zehnmal
höhere Sensitivität als RT-PCR
erzielen kann.
-
BEISPIEL 7
-
Auswirkung von DNA-Kontamination
-
Die
Auswirkungen der Kontamination von mRNA mit DNA in RT-PCR und TRC
wurden untersucht.
-
Zunächst wurde
genomische DNA, die aus dem Zellwand-lysierten G1 Zell-Stamm durch
das in Beispiel 1 beschriebene Verfahren erhalten wurde, unter Verwendung
eines handelsüblichen
Kits (G Nome, hergestellt von BIO 101 Inc.) erzeugt. Unter Verwendung
von 0 bis 200 ng der DNA oder 0 bis 200 ng der in Beispiel 2 erhaltenen
mRNA wurden 30 Zyklen RT-PCR gemäß dem in
Beispiel 3 gezeigten Verfahren durchgeführt und 30 Minuten TRC gemäß dem in
Beispiel 4 gezeigten Verfahren. Wie aus den 7A und 7B offensichtlich
ist, wurde Amplifikation durch RT-PCR sogar in der Abwesenheit von
mRNA beobachtet, wenn von 2 bis 200 ng der genomischen DNA vorhanden
waren. Andererseits fand die Amplifikation durch TRC in der Abwesenheit
von mRNA nicht statt, auch wenn von 2 bis 200 ng der genomischen
DNA vorhanden waren.
-
Weiterhin
wurde das Verhältnis
zwischen Denaturierungsbedingungen und Amplifikation von genomischer
DNA in der TRC untersucht. Unter Verwendung von 200 ng der genomischen
DNA, wurde die Messung mit einer Oligonucleotidsonde (YO-3, SEQ
ID NO: 16), die mit einem intercalierendem Fluoreszenzfarbstoff markiert
war, durch das in Beispiel 5 gezeigte Verfahren durchgeführt. In
diesem Fall wurde 1S (SEQ ID NO: 3) statt 3S (SEQ ID NO: 9) als
die Schneide-Sonde verwendet und 1F (SEQ ID NO: 1) wurde statt 3F
(SEQ ID NO: 7) als der Vorwärts-Primer
verwendet. Der Grund für
die Änderung
der Schneide-Sonde und des Vorwärts-Primers
ist, die Bildung von Amplifikation von RNA durch die Änderung
der Amplifikations-Region zu einer Region von 540 Basenpaaren, bestehend
aus den Genexpressionsregionen 1, 2 und 3, die die 159 Basenpaare
der nicht transkribierten Region enthalten, zu verhindern. Weiterhin
wurde die konstante Verfahrensbedingung der Reaktionslösung vor
der Zugabe der Enzym-Lösung
(Inkubation bei 65°C
für 15
Minuten und dann bei 41°C
für 5 Minuten)
in die folgenden drei Bedingungen, geändert.
- (1)
Inkubation bei 95°C
für 15
Minuten und dann bei 41°C
für 5 Minuten
- (2) Inkubation bei 65°C
für 15
Minuten und dann bei 41°C
für 5 Minuten
- (3) Inkubation bei 41°C
für 5 Minuten
-
Wie
aus der 8 offensichtlich ist, dauerte
es unter Bedingung (1) ungefähr
28 Minuten, bis das Fluoreszenzintensitäts-Verhältnis 1,2 überschritten hatte, und ungefähr 40 Minuten
unter Bedingung (2), unter Bedingung (3) wurde aber keine Zunahme
gefunden.
-
Dieses
Ergebnis zeigt, dass Amplifikation auch von DNA erfolgen kann, indem
die Denaturierungsbedingungen verstärkt werden. In diesem Fall
ist eine Änderung
der Verfahrensbedingung der Reaktionslösung vor der Zugabe der Enzymlösung zu
der Bedingung (3) zweckmäßig, um
die Amplifikation von DNA zu hemmen. Es wird jedoch erwartet, dass
die Amplifikation von RNA aufgrund der Bildung der Sekundärstuktur
der RNA gehemmt wird. Da die periodischen Änderungen des Fluoreszenzintensitäts-Verhältnisses
zwischen der Amplifikation von RNA und der Amplifikation von DNA
sehr unterschiedlich sind, ist es außerdem ausgesprochen einfach,
zwischen beiden Fällen
durch Vergleich von 5 mit 8 zu unterscheiden.
-
In
Zusammenfassung der vorstehend erwähnten Ergebnisse, wird eine
Inkubationsbedingung bei 65°C
für 15
Minuten und dann bei 41°C
für 5 Minuten
als die angemessene Verfahrensbedingung der Reaktionslösung vor
Zugabe der Enzymlösung
angesehen, um die Erfindung ausführen
zu können.
-
Nachdem
die Verwendung des bereitgestellten Verfahrens die Entschlüsselung
von Genexpressionsregionen im gesamten Genom und auch der Genom-Struktur,
einschließlich
des Intron-Exon-Verhältnisses, möglich macht,
können
Sequenzen aller Proteine, die in der Lage sind, in einer beliebigen
biologischen Art exprimiert zu werden, leicht nachgewiesen werden.
-
Infolgedessen,
wird gemäß der vorliegenden
Erfindung angenommen, dass das Verstehen aller grundlegenden Phänomene möglich wird,
indem schnelle Erfolge im 'Post-Genom' erzielt werden.
Außerdem
wird erwartet, dass das menschliche 'Post-Genom' zu einer Entwicklung von neuen, therapeutischen
und diagnostischen Arzneistoffen führen wird und dass es auch
sehr zum Fortschritt von medizinischen Behandlungen beitragen wird.
Es wird auch sehr zur Identifizierung von industriell nutzbaren
Proteinen aus Mikroorganismen, die unter extremen Umweltbedingungen
leben, sowie zu deren Anwendung beitragen.
-
Während die
Erfindung eingehend und mit Verweisen auf spezifische Ausführungsformen
davon beschrieben wurde, wird es für einen Fachmann offensichtlich
sein, dass verschiedene Änderungen
und Modifikationen darin gemacht werden können.
-
-
-
-