-
Die
Erfindung betrifft ein Verfahren zur quantitativen Bestimmung von
Nukleinsäuren in einer Probe, insbesondere zur quantitativen
Bestimmung von Gentranskripten, genomischer DNA oder genomischen
Nukleinsäureabschnitten, wie z. B. DNA, RNA, mRNA, cDNA,
microRNA, non-codingRNA, Aptamer-DNA und -RNA, sowie die Bereitstellung
von Markern zur Durchführung der Analyseverfahren.
-
Die
Quantifizierung von Nukleinsäuren hat große wissenschaftliche
und kommerzielle Bedeutung in allen Bereichen der Lebenswissenschaften.
So ist zum einen wichtig zu wissen, welche Genprodukte (z. B. für Proteine
kodierende und nicht-kodierende RNA) wie häufig vorkommen
(Genexpression-Studien), zum anderen wie die Transkription reguliert
wird, z. B. durch epigenetische Eigenschaften der genomischen DNA.
Zudem ist die Bestimmung der Häufigkeit von Kopien von
Genabschnitten zur Karyotypisierung eine wichtige Diagnosemöglichkeit
von Krankheiten wie z. B. Krebs.
-
Dieser
Bedarf hat zur Entwicklung verschiedener Verfahren geführt,
die in der Regel entweder auf der unspezifischen Messung der Gesamtmenge
aller oder bestimmter Nukleinsäuren durch z. B. photometrische Methoden
(Gesamt-RNA oder DNA) beruhen, oder es sollen eine Vielzahl verschiedener
Nukleinsäure-Moleküle bestimmter Sequenz individuell
quantifiziert werden. Die dazu verwendeten Methoden können
grundsätzlich in 2 Gruppen eingeteilt werden: Die erste
Gruppe bilden Verfahren, die schon bekannte oder anderweitig charakterisierte
Sequenzen quantifizieren können. Sie basieren in der Regel
auf der Bindung der zu quantifizierenden Nukleinsäuren
an bekannte oder anderweitig charakterisierte Sequenzen, die an
eine feste Oberfläche gebunden sind. Beispiele sind alle
Formen des Southern-Blots, Northern-Blots oder sogenannte DNA- oder
RNA-Micro-Arrays (Chips).
-
Die
zweite Gruppe bilden Verfahren, die auf der Quantifizierung der
Nukleinsäuren durch Sequenzierung möglichst vieler
individueller Nukleinsäure-Moleküle und Auszählen
der sequenzierten Moleküle im Gemisch beruhen. Da in der
Regel mehr Nukleinsäuremoleküle im Gemisch vorhanden
sind, als sequenziert werden, wird so die relative Häufigkeit
einer Nukleinsäure bestimmter Sequenz im Gemisch erhalten.
-
Die
hier vorgestellte Erfindung verbessert die Sicherheit und Genauigkeit
der Quantifizierung von Nukleinsäuren durch nahezu alle
auf Sequenzierung und Auszählung basierenden Verfahren.
Darunter fallen sowohl so genannte „Tag”-basierte
Verfahren, wobei der Tag ein für die Nukleinsäure
möglichst repräsentatives Teilstück darstellt,
anhand dessen die Nukleinsäure identifiziert werden kann,
als auch Verfahren, bei der die Anzahl kompletter DNA- und RNA-Moleküle
wie etwa die von Viren bestimmt wird.
-
Sequenz-basierte,
quantitative Verfahren finden aufgrund der Entwicklung von Techniken
zur gleichzeitigen Sequenzierung von Hunderttausenden bis Millionen
von Nukleinsäure-Molekülen, immer breitere Anwendung
und ersetzten qualitative, Array-basierten Verfahren in vielen Bereichen.
Deshalb wird die Sequenz-basierte Quantifizierung in Zukunft einen
immer höheren Stellenwert erhalten. Eine Liste der wichtigsten Sequenz-basierten
Quantifizierungsmethoden für Nukleinsäuren findet
sich in S. M. Wang (2007) Understanding SAGE data, Trends
in Genetics 23: 42–50. Im Einzelnen gehören
dazu:
- – ”Serial analysis
of gene expression” (SAGE, V. E. Velculescu et
al., Serial analysis of gene expression, Science 270 (1995), pp.
484–487, US-Patent
5,695,937 ): SAGE erleichtert die globale, quantitative
Charakterisierung eines Transcriptoms indem es ein Typ-II Restriktionsenzym
(BsmFI) als ”Tagging Enzym” verwendet, um aus
einer cDNA ein 14-Bp langes Fragment, den sogenannten ”Tag” hinter
der am weitesten zum 3'-Ende gelegenen Schnittstelle für
ein häufigschneidendes Restriktionsenzym (meist hinter
der NlaIII-Schnittstelle CATG) herauszuschneiden. Bei SAGE werden
jeweils 2 Tags Kopf-an Kopf zu so genannten Ditags zusammenligiert,
die dann zu längeren Ketten (”Konkatemere”)
verbunden (”konkatemerisiert”) werden. Diese Konkatemere
werden dann kloniert und sequenziert. Die Tags repräsentieren
die Ausgangs-mRNA-Moleküle, von denen die cDNA generiert
wurde. Daher stellt die Menge der sequenzierten Tags ein Maß für
die relative Häufigkeit dar, mit der die mRNA im mRNA-Gemisch
vertreten war. Heute kann man auf Konkatemer-Bildung und Klonierung
verzichten, weil die Ditags nach einer PCR direkt mit hochparallelen
Sequenziertechniken wie etwa den oben beschriebenen Verfahren sequenziert
werden können (z. B. Nielsen KL, Høgh
AL, Emmersen J., Nucleic Acids Res. 2006; 34(19): e133. DeepSAGE-digital
transcriptomics with high sensitivity, simple experimental protocol
and multiplexing of samples).
- – ”LongSAGE” (S. Saha et
al., Using the transcriptome to annotate the genome, Nat. Biotechnol.
20 (2002), pp. 508–512) wurde entwickelt um die
Spezifität der nur 14 Bp langen SAGE-tags zu erhöhen,
indem hier durch Verwendung eines anderen Typ-II-Restriktionsenzyms
(MmeI) 21 Bp lange tags generiert werden. Dadurch wird die Zuordnung
zu genomischen oder EST-Sequenzen verbessert.
Die Quantifizierung
mit dem SAGE-Verfahren und insbesondere mit der LongSAGE ist problematisch,
so ist es z. B. oft nötig vermehrungsbedingte Verfälschungen
der Quantifizierung durch biostatistische Analyseverfahren (z. B. Emmersen,
J. et al., BMC Bioinformatics 2007, 8: 92) zu beheben.
Diese Verfahren beruhen jedoch auf statistischen Annahmen und können
daher die tatsächliche relative Häufigkeit der
Tags in einer Probe nur ungefähr abschätzen.
- – ”SuperSAGE” (H. Matsumura
et al., Gene expression analysis of plant host-pathogen interactions
by SuperSAGE, Proc. Natl. Acad. Sci. U. S. A. 100 (2003), pp. 15718–15723)
bringt durch Verwendung des Typ-III-Restriktionsenzyms EcoP15I als
Tagging-Enzyme 25–27 Bp lange Tags hervor, die neben der
weiter verbesserten Zuordnung zu anderen Sequenzen weitere Vorteile
besitzen.
- – ”Cap analysis gene expression” (CAGE,
T. Shiraki et al., Cap analysis gene expression for high-throughput
analysis of transcriptional starting point and identification of
promoter usage, Proc. Natl. Acad. Sci. U. S. A. 100 (2003), pp.
15776–15781) wurde entwickelt, um Transcript-Initiationssequenzen
und Promotoren zu identifizieren. Bei dem Verfahren werden 21 Bp
lange Fragmente isoliert und sequenziert, die direkt an die 5'-CAP-Sequenz
einer mRNA anschließen.
- – ”Gene identification signature” (GIS,
C. L. Wei et al., 5' Long serial analysis of gene expression (LongSAGE)
and 3' LongSAGE for transcriptome characterization and genome annotation,
Proc. Natl. Acad. Sci. U. S. A. 101 (2004), pp. 11701–11706)
dient dazu, gleichzeitig die 5'-und 3'-Enden von mRNAs zu bestimmen. GIS-Tags
sind 20 Bp lang und können dazu verwendet werden, die Enden
eines Gens im Genom zu identifizieren.
- – „Digitale Karyotypisierung” DK;
(T. L. Wang et al., Digital karyotyping, Proc. Natl. Acad.
Sci. U. S. A. 99 (2002), pp. 16156–16161) adaptiert
das LongSAGE-Protokoll um 21 Bp-tags aus genomischer DNA zu gewinnen.
Damit lässt sich die krankhafte Vermehrung oder der Verlust
bestimmter Chromosomenabschnitte sowie Insertionen und Fremd-DNA
z. B. in Krebszellen genau bestimmen (J. T. Park et al.,
Notch3 gene amplification in ovarian cancer, Cancer Res. 66 (2006),
pp. 6312–6318).
- – „Methylierungsspezifisches Digitales Karyotypisieren” (MSDK)
(Min Hu et al., Methylation-specific digital karyotyping
Nature Protocols 1, – 1621–1636 (2006))
wendet das Prinzip des Digital Karyotyping für die quantitative
Bestimmung unterschiedlicher Methylierungszustände zweier
Proben an.
- – ”Paired-end ditag” (C.
L. Wei et al., A global map of p53 transcription-factor binding
sites in the human genome, Cell. 124 (2006), pp. 207–219)
zielt darauf ab, Protein-bindende Sequenzen im Genom zu identifizieren.
Dabei wird das Prinzip von GIS dazu verwendet, Tags von beiden Enden
eines DNA-Fragments zu isolieren und zu quantifizieren, die an ein
bestimmtes Protein (z. B. einen Transkriptionsfaktor) gebunden sind,
das zusammen mit der gebundenen DNA durch Immuno-Präzipitation
spezifisch aus dem Protein-DNA-Gemisch gefällt wird. Paired-end
ditag wurde verwendet, um p53-Bindestellen im Menschgenom zu identifizieren.
- – Metagenomische Analysen verfolgen das Ziel, die Zusammensetzung
einer komplexen Mischung von Organismen zu ermitteln. Dabei werden
dieselben Verfahren wie bei der Digitalen Karyotypisierung verwendet Krause
et al., Phylogenetic classification of short environmental DNA fragments,
Nucleic Acids Res. 2008 April; 36(7): 2230–2239.
-
In
allen beschriebenen Verfahren reicht die zur Verfügung
stehende Menge an Nukleinsäuren einer Probe meist nicht
für alle nachfolgenden Analysen aus. Darum ist vor der
Analyse fast immer eine Vermehrung des Materials notwendig.
-
Beispielsweise
benötigen hochparallele Sequenzierverfahren (z. B. das „454” Picoliter
Verfahren von Roche Diagnostics, Deutschland, oder das Solexa-Pyrosequenzierverfahren
der Firma Illumina, Inc., San Diego, USA) 5–3000 ng DNA.
Zudem benötigen beide Verfahren spezifische Sequenzen (Adapter)
an beiden Enden der zu sequenzierenden Nukleinsäure, die
als Primerbindungsstelle dienen. Um das Vorhandensein dieser spezifischen
Sequenzen an allen zu sequenzierenden Molekülen zu gewährleisten,
wird die Polymerase-Kettenreaktion (PCR) benutzt, wobei Oligonukleotide
die den Adaptersequenzen komplementär sind, als Primer
Verwendung finden. Auch für eine Klonierung der Fragmente
ist oft ihre vorhergehende Amplifikation notwendig.
-
Die
Amplifikation, z. B. mittels PCR, birgt jedoch die Gefahr, dass
bestimmte Nukleinsäuren präferentiell vermehrt
werden. So werden kürzere Nukleinsäuren bevorzugt,
aber auch die individuelle Basenabfolge kann die Effizienz der Amplifikation
beeinflussen. Dadurch kann die relative Häufigkeit einer
Nukleinsäure in einer Nukleinsäurepopulation vor
und nach der Amplifikation stark voneinander abweichen.
-
Die
Quantifizierung von Nukleinsäure-Zusammensetzungen wird
zudem häufig, wie etwa bei der Quantifizierung von Expressed-Sequenced
Tags (ESTs), auch ohne vorherige PCR-Amplifikation z. B. nach einer
Klonierung der Nukleinsäuren durchgeführt. Auch
hierbei kann aufgrund unterschiedlicher Fitness individueller Bakterien
und aufgrund von Effekten der Nukleinsäuren auf das Wachstum
der transformierten Zellen eine Verfälschung der ursprünglichen
Zusammensetzung der Nukleinsäurepopulation entstehen.
-
Aufgabe
der vorliegenden Erfindung war es nun ein einfaches Verfahren zur
Verfügung zu stellen, bei dem die während der
Vermehrung der zu quantifizierenden Nukleinsäuren in einer
Probe auftretenden Verfälschungen der Nukleinsäure-Zusammensetzungen
besser erkannt und bei einer quantitativen Auswertung korrigiert
werden können.
-
Die
Aufgabe wird dadurch gelöst, dass alle Nukleinsäuren
eines Nukleinsäuregemischs, egal ob doppelsträngige
oder einzelsträngige, vor der Amplifikation mit einem „Random
Tag” (RAT) versehen werden, der aus einem Gemisch aus synthetischen
Oligonukleotiden stammt, wobei das Gemisch genügend RATs
mit unterschiedlichen Sequenzen enthält um zu gewährleisten,
dass die entstehenden Random-Tag-Nukleinsäuren (RAT-NS)-Kombinationen
praktisch einzigartig sind. Die Methoden, wie die Nukleinsären
vor der Amplifikation mit einem RAT versehen werden können,
können sehr unterschiedlich sein. Nach einer Sequenzierung
können die RAT-Nukleinsäure-Kombinationen ermittelt
werden, es entsteht ein Datensatz mit den individuellen Sequenzinformationen
der RAT-NS. RAT-Nukleinsäure-Kombinationen, die mehr als
einmal oder mindestens häufiger als statistisch wahrscheinlich
vorkommen sind somit als Kopien erkennbar. Eliminiert man alle Kopien aus
dem Datensatz, so ergibt sich die ursprüngliche Zusammensetzung
des Nukleinsäuregemischs vor der Amplifikation.
-
Folglich
ist der Gegenstand der vorliegenden Erfindung ein Verfahren zur
quantitativen Bestimmungen von Nukleinsäuren (Nukleinsäurepopulation)
in einer Probe bei dem
- a) Nukleinsäurekonstrukte,
enthaltend
- – mindestens eine kennzeichnende Polynukleotiddomäne
(TAG) einer, in einer Probe vorhandenen Nukleinsäure, die
quantitativ bestimmt werden soll und
- – mindestens eine artifizielle Polynukleotiddomaine
mit zufälliger Sequenz („Random-Tag” oder
abgekürzt RAT) und
- – mindestens einer Primer- oder Polymerasebindungsstelle
(PB) wobei jeweils eine kennzeichnende Polynukleotiddomäne
(TAG) und mindestens eine Polynukleotiddomäne mit zufälliger
Sequenz (RAT) eine charakteristische Domänenkombination
(TAG-RAT-Kombination) bilden, die von mindestens einer Polymerase-
oder Primerbindungsstelle (PB) flankiert wird, in Anwesenheit einer
Polymerase amplifiziert werden und
- b) nach der Amplifikation zumindest die Sequenz der Polynukleotiddomänen
mit zufälliger Sequenz (RAT) und zumindest eines Teils
der kennzeichnenden Polynukleotiddomäne (TAG) ermittelt
werden, wobei zur quantitativen Bestimmung der in der Probe vorhandenen
Nukleinsäure sequenzidentische und gegebenenfalls zusätzlich
sequenzähnliche Kombinationen einer kennzeichnenden Polynukleotiddomäne
(TAG) und einer Polynukleotiddomäne mit zufälliger
Sequenz (RAT) als Kopien einer kennzeichnenden Polynukleotiddomäne
(TAG) der ursprünglich in der Probe vorhandenen Nukleinsäure
identifiziert werden können.
-
Als „Nukleinsäure” im
Sinne der vorliegenden Erfindung werden die quantitativ zu bestimmenden
Nukleinsäuren verstanden, die in einer Probe vorliegen.
Die zu bestimmenden Nukleinsäuren können in der
Probe sowohl einzelsträngig als auch doppelsträngig
vorliegen. Dabei handelt es sich um DNAs und RNAs, insbesondere
um mRNAs, microRNAs, rRNA und nicht kodierende RNAs sowie deren,
durch reverse Transkription erzeugte cDNAs, die für eine
Genexpressionsanalyse und eine Analyse der nicht-codierenden RNAs
herangezogen werden können. Zudem umfasst der Begriff „Nukleinsäure” auch
Aptamer-DNA und -RNA bzw. Fragmente genomischer DNA, die insbesondere
auch methyliert sein kann. Weiter zielt die Erfindung auf die Quantifizierung
von durch Immunpräzipitation gewonnenen DNA Fragmenten
und von Fragmenten, die durch Digital Karyotyping und Methylation-Specific
Digital Karyotyping quantifiziert werden. Ebenso verbessert die Erfindung
die Quantifizierung von DNA-Fragmenten für metagenomische
Analysen sowie zur Analyse von Fragmenten aus subtraktiven DNA-Bibliotheken.
Ebenfalls fallen unter den Begriff „Nukleinsäuren” einzel-
oder doppelsträngige Polynukleotide künstlichen
(synthetischen) Ursprungs, darunter auch solche, deren Phosphat-Gruppen
durch andere Atome ersetzt bzw. deren Basen modifiziert wurden und
die mittels Polymerisation amplifizierbar und die sequenzierbar
sind.
-
Als „Primer-
oder Polymerasebindungsstelle (PB)” wird eine Nukleinsäure
bekannter Sequenz bezeichnet, die bevorzugt als Bindestelle für
einen Primer z. B. für die PCR dienen kann, wobei die Amplifikation unter
Verwendung der entsprechenden Primer und Polymerasen durch enzymatische
Polymerisation erfolgt. Weiterhin können auch bekannte
Sequenzen für eine Polymeraseanbindung zur Initiation einer
enzymatischen Amplifikation benutzt werden, wie sie z. B. in bekannten
Plasmiden oder anderen Vektoren bereits enthalten sind. In einem
solchen Fall kann, unter Verwendung einer Insertionssequenz, der
Einbau der RAT-TAG-Kombinationen in einen Vektor erfolgen, wodurch
ein Nukleinsäurekonstrukt im Sinne der vorliegenden Erfindung entsteht,
dass durch Klonierung vermehrt werden kann. Bei der Polymerasebindungsstelle
kann es sich z. B. um eine Promotorsequenz für eine RNA-Polymerase,
etwa um SP6 oder T7-RNA-Polymerase handeln, wobei von der Bindungsstelle
aus eine lineare Amplifikation des Nukleinsäure-Konstrukts
durch die entsprechende Polymerase erfolgen kann.
-
Unter
einer „kennzeichnenden Polynukleotiddomäne”,
wird ein sogenannter „TAG” verstanden, nämlich
eine Nukleinsäuredomäne deren Sequenz kennzeichnend
für eine in der Probe vorkommende und quantitativ zu bestimmende
Nukleinsäure ist. Welcher Teil einer Nukleinsäure
als kennzeichnende Polynukleotiddomäne ausgewählt
wird ist prinzipiell frei wählbar, solange die einzelnen
TAGs einer bestimmten, in der Probe vorliegenden Nukleinsäure
zugeordnet werden können. Ist diese Zuordnung nicht eindeutig,
können weitere Verfahren angewendet werden, um diese Eindeutigkeit
zu gewährleisten, z. B. mit Real time PCR mit spezifischen
Primern. Als TAG können z. B. konservierte Teile einer
Gensequenz genutzt werden, bevorzugt werden aber kennzeichnende
Polynukleotiddomänen mit einer ausreichenden Sequenzlänge
benutzt. Bevorzugt sollten die kennzeichnenden Polynukleotiddomänen
eine Sequenzlänge von mindestens 8 Nukleotiden, bevorzugt
von mindestens 12 Nukleotiden, besonders bevorzugt von mindestens
15 Nukleotiden besitzen. Eine kennzeichnende Polynukleotiddomäne
kann dabei auch die gesamte zu bestimmende Nukleinsäure
sein. Bevorzugt sollte die Domäne allerdings eine Länge
von 50 Nukleotiden, bevorzugt von 35 Nukleotiden, insbesondere von
27 Nukleotiden nicht übersteigen. Dabei können
auch längere, kennzeichnende Polynukleotiddomänen
in ein Nukleinsäurekonstrukt eingebaut werden, wobei es
allerdings häufig ausreicht, nur einen Teil dieser Sequenz
im Anschluss an eine Amplifizierung der Konstrukte zu bestimmen.
-
Eine „Polynukleotiddomäne
mit zufälliger Sequenz” im Sinne der vorliegenden
Erfindung ist ein synthetisch hergestellter (artifizieller) „Random
Tag” (RAT), dessen Sequenz eine eindeutige Markierung der
kennzeichnenden Polynukleotiddomäne zulässt. Die
RATs werden üblicherweise kommerziell durch eine „statistische” Verknüpfung
der einzelnen Nukleotide hergestellt. Es wird dabei eine Mischung
aus RATs erhalten, wobei die Wahrscheinlichkeit des Vorliegens von
RATs mit gleicher Sequenz bei steigender Sequenzlänge und mit
abnehmender Anzahl an RAT-Molekülen in der Mischung sinkt.
Die so hergestellten Polynukleotiddomänen besitzen eine
zufällige Sequenz im Sinne der Erfindung. Aufwendiger ist
die Herstellung von RATs mit einer bekannten Sequenz, wobei so RATs
hergestellt werden können, deren Sequenz garantiert einmalig
ist. Auch solche RATs stellen eine „zufällige
Sequenz” im Sinne der vorliegenden Erfindung dar. Auch
können RATs aus einer Mischung bekannter, unterschiedlicher
Sequenzen hergestellt werden.
-
Einzelsträngige
RATs können als Oligonukleotide hergestellt oder erworben
werden. Zur Herstellung von doppelsträngigen RATs werden
bevorzugt einzelsträngige Oligonukleotide mit einer zufälligen
Sequenz (RAT) und einem bekannten Sequenzanteil verwendet, wobei
der bekannte Sequenzanteil am 3'-Ende des einzelsträngigen
Oligonukleotides liegt. An den bekannten Sequenzanteil werden Oligonukleotide
mit komplementärer Sequenz als Primer hybridisiert und
mit Hilfe einer Polymerase (z. B. mit dem so genannten Klenow-Fragment
der DNA-Polymerase I) in ein doppelsträngiges Oligonukleotid überführt,
dass einen doppelsträngigen RAT enthält. Reine
doppelstränge RATs ohne weitere Domänen können
Integration einer Tagging-Enzym-Site und einer Primerbindungsstelle
erzeugt werden, wobei nach Zweitstrangsynthese mit Hilfe des Tagging-Enzyms
der RAT abgespalten wird. Weiterhin kann der einzelsträngige
RAT bevorzugt an einem Ende mit einer bekannten Sequenz versehen
werden, die bestimmte Polynukleotiddomänen wie eine Tagging-Enzym-Site,
Restriktionssite, Ligationsstelle etc. enthalten kann. Am anderen
Ende des RAT wird dann bevorzugt eine Primerbindungsstelle eingefügt,
die auch zur Synthese des Doppelstranges mit dem Klenow Fragment
herangezogen werden kann.
-
Um
RATs mit geeigneten Ligationsstellen (LS) zu versehen, die zu überhängenden
Restriktionsschnittstellen komplementär sind, können
Oligonukleotide die eine Primerbindungsstelle gefolgt von einem
RAT und der entsprechenden Restriktionsschnittstelle gefolgt von
einem weiteren RAT und einer weiteren Primerbindungsstelle enthalten,
hergestellt werden. Es wird ein Konstrukt mit folgendem Aufbau erhalten:
PB-RAT-Restriktionsschnittstelle-RAT-PB. Nach der Erzeugung des
doppelsträngigen Konstruktes werden die Oligonukleotide
mit dem entsprechenden Restriktionsenzym verdaut, es werden aus
einem Oligonukleotid jeweils zwei RATs erhalten die mit überstehenden
Enden für die Ligation modifiziert sind.
-
Außerdem
können die RATs durch Hybridisierung zweier aus einer Zufallskombination
bestehenden einzelsträngigen Oligonukleotiden hergestellt
werden, die unter stringenten Bedingungen miteinander hybridisiert
werden. Bei RATs die aus bekannten Sequenzen aufgebaut sind, ist
dies die bevorzugte Methode.
-
Als „ Nukleinsäurekonstrukte” werden
Polynukleotide verstanden, die zumindest eine kennzeichnende Polynukleotiddomäne,
die für eine in der Probe enthaltene und quantitativ zu
bestimmende Nukleinsäure kennzeichnend ist (TAG), eine
Polynukleotiddomäne, mit einer zufälligen Sequenz
(RAT) und mindestens einer Primer- oder Polymerase-Bindungsstelle
(PB) enthalten. Darüber hinaus können weitere
Polynukleotiddomänen in den Nukleinsäurekonstrukten
enthalten sein, wie z. B. Linkersequenzen, Ligationsstellen (LS),
Restriktionsenzymschnittstellen oder Tagging-Enzym-Bindungsstellen
(TES). In einer bevorzugten Abfolge der Polynukleotiddomänen
sind die kennzeichnende Polynukleotiddomäne (TAG) und die
Polynukleotiddomäne mit zufälliger Sequenz (RAT)
kovalent miteinander verknüpft. Die Verknüpfung
kann durch direkte Ligation der einzelnen Domänen erfolgen.
Alternativ können die einzelnen Domänen auch über
Linkersequenzen miteinander verbunden werden, wobei sich die Linkersequenz
durch die Ligation von korrespondierenden, überhängenden Enden
ergibt. Die miteinander verknüpften TAG- und RAT-Domänen
werden schließlich durch mindestens eine Primer- oder PolymeraseBindungsstelle
(PB) ergänzt, die bevorzugt kovalent, entweder an die kennzeichnende
Polynukleotiddomäne (TAG) oder an die Polynukleotiddomäne
mit zufälliger Sequenz (RAT) gebunden ist. In einer bevorzugten
Ausführungsform liegen die TAG-Domäne und die
RAT-Domäne flankiert von zwei verschiedenen Primerbindungsstellen
(PB, PB') vor. Neben einer direkten Verknüpfung der Primer-
oder Polymerasebindungsstellen mit den jeweiligen Enden der TAG-RAT-Domänenkombination
kann auch eine Verknüpfung über einen Polynukleotidlinker
in Frage kommen. Auch die Primer- oder Polymerasebindungsstellen (PBs)
können durch Ligation in die Nukleinsäurekonstrukte
eingebunden werden. Alternativ können TAGs aber insbesondere
auch RATs eingesetzt werden, die schon im Vorfeld mit einer Primerbindungsstelle
(PB) versehen sind.
-
In
einer alternativen Ausführungsform können die
zur enzymatischen Amplifikation vorbereiteten Nukleinsäurefragmente
neben mindestens einer kennzeichnenden Polynukleotiddomäne
(TAG) auch zwei oder mehr Polynukleotiddomänen mit zufälliger
Sequenz (RATs) enthalten. Dabei können ein, zwei oder mehr
Kombinationen aus einem TAG und einem RAT in einem Nukleinsäurekonstrukt
enthalten sein. Die Orientierung der TAG-RAT-Kombinationen im Konstrukt
spielt dabei keine Rolle. Weiterhin können einzelne TAG-RAT-Kombinationen
unabhängig voneinander von einer Primer- oder Polymerase-Bindungsstelle
(PB) flankiert vorliegen. Möglich ist allerdings auch,
dass zwei Primer-Bindungsstellen (PBs) alle TAG-RAT-Kombinationen
in einem Nukleinsäurekonstrukt einschließen bzw.
eine Primer- oder Polymerase-Bindungsstelle (PB) an einem Ende der
TAG-RAT-Kombinationen liegt.
-
So
sind insbesondere Nukleinsäurekonstrukte mit folgender
Polynukleotiddomänenabfolge von besonderem Interesse:
- a) PB-TAG-RAT
- b) PB-RAT-TAG
- c) PB-TAG-RAT-PB'
- d) PB-RAT-TAG-RAT
- e) PB-RAT-TAG-RAT-PB'
- f) PB-RAT-TAG-TAG-RAT
- g) PB-RAT-(TAG)n-PB; mit n = 2 bis 50,
bevorzugt mit n = 2 bis 10
- h) PB-RAT-(TAG)n-RAT-PB; mit n = 2 bis
50, bevorzugt mit n = 2 bis 10
- i) PB-RAT-(TAG)n; mit n = 2 bis 50,
bevorzugt mit n = 2 bis 10
- j) PB-RAT-TAG-RAT-TAG
- k) PB-TAG-RAT-TAG-RAT
- l) PB-RAT-TAG-RAT-TAG-PB'
- m) PB-(RAT-TAG)n-PB'; mit n = 3 bis
50, bevorzugt mit n = 3 bis 10
- n) PB-RAT-TAG-PB'-PB''-RAT-TAG-PB'''
- o) PB-RAT-TAG-PB'-PB''-RAT-TAG-PB'''-PB''''-RAT-TAG-PB'''''
- p) PB-RAT-TAG-PB'-(PB-RAT-TAG-PB')n-PB-TAG-RAT-PB';
mit n = 0 bis 10
- (PB, PB', PB'', PB''', PB'''',
PB''''' = Primerbindungsstellen, wobei die Primerbindungsstellen
bevorzugt unterschiedliche Sequenzen haben aber auch die gleiche
Sequenz besitzen können.)
-
Dabei
sind Nukleinsäurekonstrukte gemäß den
Ausführungsformen a) b) c) e) und g) und h) besonders bevorzugt
im Sinne der vorliegenden Erfindung.
-
Nukleinsäurekonstrukte
können einzel- oder doppelsträngig vorliegen,
wobei bei einzelsträngigen Nukleinsäurekonstrukten
unter einer Primer-Bindungsstelle auch eine Sequenz verstanden wird,
die einer Primer-Bindungsstelle auf dem Gegenstrang entspricht,
während in einem doppelsträngigen Nukleinsäurekonstrukt
sowohl die Primer-Bindungsstelle als auch deren korrespondierende
Sequenz auf dem Gegenstrang enthalten ist.
-
Die
Nukleinsäurekonstrukte dienen als Matrizen (Templates)
für deren enzymatische Amplifikation durch eine Polymerase.
-
Die
Nukleinsäurekonstrukte können auch weitere Oligonukleotiddomänen
enthalten, wie z. B. Linker, Ligationsstellen, Restriktionssites
und Tagging-Enzym Bindungsstellen (TES).
-
In
einer weiteren bevorzugten Ausführungsform enthält
das Nukleinsäurekonstrukt oder Vorstufen diese Konstruktes
eine oder mehrere Bindungsstellen für ein Tagging-Enzym
(TE). Eine Tagging-Enzym-Site (TES) stellt eine Bindungsstelle für
ein entfernt von seiner Erkennungsstelle schneidendes Typ-II oder
Typ-III Restriktionsenzym, bevorzugt für EcoP15I, MmeI
oder Bsmfl, dar. Durch Einsatz eines Tagging-Enzyms können
insbesondere Nukleinsäurefragmente mit einer definierten
Länge erzeugt werden, die als kennzeichnende Nukleotid-Domäne
(TAG) dient. Die Tagging-Enzym-Site (TES) ist so einzubauen, dass
der benötigte TAG auch nach der enzymatischen Spaltung
im Nukleinsäurekonstrukt bzw. in einer Konstruktvorstufe
enthalten ist. Bevorzugt liegt die Bindungsstelle für ein
Tagging-Enzym (TES) am distalen Ende zur PB-Sequenz des RAT, die
Einbindung der TES in ein Nukleinsäurekonstrukt bzw. in
eine entsprechende Konstruktvorstufe erfolgt somit bevorzugt in
der Domänenabfolge „PB-RAT-TES-Nukleinsäure”.
Das Produkt der späteren Spaltung des Nukleinsäurekonstrukts
mit dem TE ist daher ein Polynukleotid mit der Domänen-Abfolge
PB-RAT-TES-TAG. Alternativ kann aber auch zuerst der TAG mit Hilfe
des Tagging-Enzyms erzeugt werden und danach wird der RAT an einem
beliebigen Ende der TES-TAG-Domänenabfolge angebunden.
Wird z. B. EcoP15I als Tagging-Enzym verwendet, ist die Anwesenheit
zweier Kopf an Kopf orientierter Erkennungsstellen (Tagging-Enzym-Sites)
mit der Sequenz CAGCAG nötig, welche die Schnittstelle
des Tagging-Enzyms einschließen und bevorzugt in einem
Abstand von weniger 3000 Bp liegen. Die bevorzugte Domänen-Abfolge
ist daher im Falle der Verwendung eines Typ III Restriktionsenzyms,
wie EcoP15I, „PB-RAT-TES-Nukleinsäure-TES”.
Das Produkt der späteren Spaltung des Nukleinsäurekonstrukts
mit EcoP15I als TE sind daher ein Polynukleotid mit der Domänen-Abfolge
PB-RAT-TES-TAG, und ein Polynukleotid mit der Domänen- Abfolge
TES-Tag, von denen das PB-RAT-TES-TAG-Konstrukt bevorzugt für
die Charakterisierung der Nukleinsäure verwendetet wird. Ein
großer Vorteil bei der Verwendung von EcoP15I ist, dass
besonders lange TAGs mit 25–27 Basenpaaren erhalten werden.
-
In
einer anderen, bevorzugten Anwendungsform werden beide Enden des
zu charakterisierenden Nukleinsäuremoleküls mit
gleichen oder verschiedenen PB-RAT-TES-Konstrukten versehen. Die
Spaltung des Konstrukts mit dem TE resultiert dann in zwei Molekülen
mit der Domänen-Abfolge PB-RAT-TES-TAG, wobei die PB und
TES-Domänen gleiche oder unterschiedliche Sequenz haben
können. In diesem Fall können zwei PB-RAT-TES-TAG-Konstrukte
zur Charakterisierung des Nukleinsäuremoleküls
verwendet werden.
-
Nach
Schneiden mit dem entsprechenden Tagging-Enzym können dann
weitere Polynukleotiddomänen, wie z. B.: RATs und PBs,
an den erhaltenen TAG angebunden werden, so dass sich in den resultierenden Nukleinsäurekonstrukten,
die folgenden besonders bevorzugten Domänenabfolgen ergeben:
- a') PB-TES-TAG-RAT
- a'') PB-TAG-TES-RAT
- b') PB-RAT-TAG-TES
- b'') PB-RAT-TES-TAG
- c') PB-TAG-TES-RAT-PB'
- c'') PB-TES-TAG-RAT-PB'
- d') PB-RAT-TAG-TES-RAT
- d'') PB-RAT-TES-TAG-RAT
- e') PB-RAT-TAG-TES-RAT-PB'
- e'') PB-RAT-TES-TAG-RAT-PB'
- f) PB-RAT-(TES)m-TAG-TAG-(TES)m-RAT;
mit m = 0 oder 1 unabhängig
voneinander für jedes m, wobei mindestens ein m = 1 ist
- g') PB-RAT-TES-TAG-RAT-TAG
- g'') PB-RAT-TAG-TES-RAT-TAG
- k') PB-TES-TAG-RAT-TAG-RAT
- k'') PB-TAG-TES-RAT-TAG-RAT
- k''') PB-TAG-RAT-TES-TAG-RAT
- k'''') PB-TAG-RAT-TAG-TES-RAT
- l') PB-RAT-TES-TAG-RAT-TAG-PB'
- l'') PB-RAT-TAG-TES-RAT-TAG-PB'
- l''') PB-RAT-TAG-RAT-TES-TAG-PB'
- l'''') PB-RAT-TAG-RAT-TAG-TES-PB'
- m') PB-(RAT-(TES)m-TAG)n-PB';
mit
n = 3 bis 50, bevorzugt mit n = 3 bis 10 und m = 0 oder 1 unabhängig
voneinander für jedes m,
- n') PB-RAT-(TES)m-TAG-(TES)m-PB'-PB''-RAT-(TES)m-TAG-(TES)m-PB'';
mit m = 0 oder 1 für jedes m unabhängig voneinander,
wobei mindestens ein m = 1 ist,
- o') PB-RAT-(TES)m-TAG-(TES)m-PB'-PB''-RAT-(TES)m-TAG-(TES)m-PB'''-PB''''-RAT-(TES)m-TAG-(TES)m-PB''''';
mit
m = 0 oder 1 für jedes m unabhängig voneinander,
wobei mindestens ein m = 1 ist,
- p') PB-RAT-(TES)m-TAG-(TES)m-PB'-(PB-RAT-(TES)m-TAG-(TES)m-PB-(TES)m-TAG-(TES)m-RAT-PB'
mit
n = 0 bis 10 und mit m = 0 oder 1 für jedes m unabhängig
voneinander, wobei mindestens ein m = 1 ist,
- (PB,
PB', PB'', PB''', PB'''', PB''''' = Primerbindungsstellen, wobei
die Primerbindungsstellen bevorzugt unterschiedliche Sequenzen haben
aber auch die gleiche Sequenz besitzen können.)
-
Die
Herstellung der Nukleinsäurekonstrukte kann über
zirkuläre Nukleinsäurekonstruktvorstufen erfolgen,
wobei bevorzugt mindestens ein Ende einer Nukleinsäure
mit einem Marker und gegebenenfalls das andere Ende ebenfalls mit
einem Marker bzw. Adapter modifiziert werden und dann die Zirkularisierung
erfolgt. Bevorzugt besitzt mindestens einer der vorhandenen Marker
oder Adapter auch eine Tagging-Enzymbindungsstelle (TES), besonders
bevorzugt sind zwei TES vorhanden, insbesondere für das
Tagging-Enzym EcoP15I, das auf beiden Seiten des zirkularen Konstruktes
einen TAG abschneidet wodurch ein lineares Nukleinsäurekonstrukt
im Sinne der vorliegenden Erfindung entsteht, dass zwei TAGs an
beiden Enden enthält.
-
Weitere
bevorzugte Nukleinsäurekonstrukte, die z. B. aus zirkulären
Konstruktvorstufen erzeugt werden können und die insbesondere
für die gleichzeitige Quantifizierung beider Enden von
Nukleinsäuremolekülen von Interesse sind, weil
sie es erlauben, die Herkunft der TAGs vom gleichen Molekül
zu erkennen, sind
- q) TAG-TES-RAT-PB-RAT-TES
- r) TAG-TES-RAT-PB-PB'-RAT-TES
- s) PB''-TAG-TES-RAT-PB-RAT-TAG
- t) PB''-TAG-TES-RAT-PB-RAT-TAG-PB' oder
- u) PB''-TAG-TES-RAT-PB-PB'-RAT-TAG-PB''
- v) TAG-RAT-PB-RAT
- w) TAG-RAT-PB-PB'-RAT
- x) PB''-TAG-RAT-PB-RAT-TAG
- y) PB''-TAG-RAT-PB-RAT-TAG-PB'
- z) PB''-TAG-RAT-PB-PB'-RAT-TAG-PB'''
- aa) PB-TAG-RAT-TAG
- bb) PB-TAG-RAT-TAG-PB'
- (PB, PB', PB'', PB'''
= Primerbindungsstellen, wobei die Primerbindungsstellen bevorzugt
unterschiedliche Sequenzen haben aber auch die gleiche Sequenz besitzen
können.)
-
Alle
in der vorliegenden Erfindungsbeschreibung dargestellten Nukleinsäurekonstrukte
können neben den erfindungsgemäßen Domänenabfolgen
weitere Sequenzabschnitte, wie z. B. Linker, Restriktionssites,
Ligationsstellen etc. besitzen, die allerdings in der Regel nicht
explizit in der Domänenabfolge der Konstrukte genannt werden.
-
Die
Polynukleotiddomänen mit zufälliger Sequenz (RAT)
sind zur Markierung von kennzeichnenden Polynukleotiddomänen
(TAGs) geeignet. Unter einem „Marker” werden folglich
Polynukleotide verstanden, die eine Primerbindungsstelle und einen
RAT enthalten, aber keinen TAG. Zudem können Marker weitere
Oligonukleotiddomänen enthalten wie z. B. Tagging-Enzymbindungsstellen
(TES) und Linker- und Ligationsstellen (LS). Eine Ligationsstelle
ist das für eine Ligation vorgesehene Ende des Markers,
das sich distal zur PB befindet.
-
Für
die Herstellung der zur Amplifikation vorgesehenen Nukleinsäurekonstrukte
ist es weiterhin sinnvoll, neben den Markern auch bestimmte Oligonukleotiddomänen
in einem „Adapter” zusammenzufassen. Adapter im
Sinne der vorliegenden Erfindung sind immer mit einer Primerbindungsstelle
versehen und können weitere Oligonukleotiddomänen
insbesondere Tagging-Enzymbindungsstellen, Linker bzw. Ligationsstellen, aber
keine RATs oder TAGs enthalten.
-
Die
Marker und Adapter enthalten bevorzugt unterschiedliche Primerbindungsstellen,
die bei den hochparallelen Sequenzierverfahren nach den Herstellerangaben
bevorzugt verwendet werden sollen. Diese liegen an den distal zum
TAG gelegenen Enden der Marker oder Adapter.
-
Die
einzelnen Oligonukleotiddomänen, wie z. B. PB, TAG und
RAT, bzw. die Marker oder Adapter können mit den nach dem
Stand der Technik üblichen Verfahren zudem mit weiteren
bekannten Modifikationen versehen sein, die z. B.
- – das
Binden an eine feste Phase ermöglichen, etwa durch Biotinylierung
der Oligonukleotide und Bindung an eine mit Streptavidin versehene
feste Phase, oder „Fänger-Sequenzen” enthalten.
Als „Fänger-Nukleotidsequenzen” können
Sequenzen genutzt werden, die z. B. an einer festen Phase gebunden
sind und mit ihren korrespondierenden Gegensträngen, die
sich in Lösung befinden, hybridisieren können,
- – die Ligation an einer Seite eines Oligonukleotids
verhindern, wie z. B. Amino-C7 Modifikationen oder „Reverse
Nukleotide (Nukleotide, mit 3'-5-Orientierung anstatt 5'-3'-Orientierung”),
wobei das vor Ligation zu schützende Ende das distal zum
TAG gelegene Ende des Markers oder Adapters ist,
- – die Ligation an einer Seite eines Oligonukleotids
ermöglichen oder erleichtern, z. B. durch Phosphorylierung
des 5' Endes des entsprechenden Oligonukleotids, oder z. B. durch
die Erzeugung von überhängenden Restriktionsschnittstellen
(„sticky ends”),
- – die Hybridisierung erleichtern bzw. die Dehybridisierung
des Doppelstrangs erschweren, z. B. durch die Verwendung von „Locked
nucleotide acids”.
- – Restriktionsschnittstellen beinhalten
-
Diese
Modifikationen können in die einzelsträngigen
Oligonukleotide integriert werden. Adapter können mit komplementären
Oligonukleotiden zu doppelsträngigen Oligonukleotiden hybridisiert
werden. Marker können gegebenenfalls ebenso hergestellt
werden, bevorzugt wird der Marker jedoch durch den Einsatz einer Polymerase,
insbesondere durch das Klenow Fragment der DNA-Polymerase I wie
zuvor beschrieben doppelsträngig hergestellt.
-
Mit
Hilfe von Markern können Nukleinsäurefragmente
mit einer Sequenz, die für eine in der Probe vorkommenden
Nukleinsäure kennzeichnend ist (TAG), eindeutig gekennzeichnet
werden, d. h. jede RAT-TAG Kombination ist mit großer Wahrscheinlichkeit
einzigartig. Um eine solche eindeutige Kennzeichnung vorzunehmen,
sollte die Nukleinsäuredomäne mit zufälliger
Sequenz (RAT) bevorzugt lang genug sein, um im Verhältnis
zur Anzahl der in der Probe vorkommenden Nukleinsäuren,
einen Überschuss an Markern mit unterschiedlichen RATs
bereitstellen zu können. Bevorzugt werden RATs enthaltende
Marker mit mehr als der doppelten Menge bezogen auf die zu markierenden
Nukleinsäurefragmente oder Nukleinsäuren eingesetzt.
Im Einzellfall kann aber auch eine Markeranzahl ausreichen, die
der zu bestimmenden Nukleinsäureanzahl entspricht, insbesondere
wenn sich alle RATs garantiert in ihrer Sequenz unterscheiden. Bevorzugte
Sequenzlängen für die in den Nukleinsäurefragmenten
enthaltenen RATs sind zwischen 2 und 100 Nukleotiden, besser zwischen
4 und 50 Nukleotiden, besonders bevorzugte RATs besitzen eine Gesamtlänge
zwischen 4 und 15 Nukleotiden. Die gesamte zufällige Sequenz
kann dabei in einer Markerdomäne enthalten sein oder sich
auf mehrere Markerdomänen bzw. auf Domänen unterschiedlicher
Marker in einem Nukleinsäurekonstrukt aufteilen. Mit den
beschriebenen Gesamtlängen der Nukleinsäuredomänen
mit zufälliger Sequenz (RATs) lässt sich theoretisch
eine große Anzahl von Markern mit unterschiedlichen RATs
erzeugen, wobei das verwendete Markerensemble üblicherweise
nur einen kleinen Teil der sich aus der Sequenzlänge ergebenden
denkbaren RATs enthält, so dass die Wahrscheinlichkeit,
dass zufällig sequenzidentische RATs in zwei Markern auftreten,
sehr gering ist. Folglich kann die Sequenzlänge der RATs
der Anzahl der zu markierenden, kennzeichnenden Nukleinsäurefragmente
individuell angepasst werden. So werden z. B. für eine
Genexpressionsanalysen, bei der die in einer Gewebeprobe enthaltenen
mRNAs quantitativ bestimmt werden sollen, bevorzugt Markermischungen
mit über 102 Markern, besonders
bevorzugt zwischen 104 und 108 Markern
eingesetzt.
-
Selbst
wenn einzelne Marker tatsächlich identische RATs enthalten
sollten, verfälschen diese die quantitative Bestimmung
nur, wenn sie mit einem sequenzgleichen oder sequenzähnlichen
TAG verknüpft werden sollten. Da alle individuellen TAG-RAT-Kombination
für die individuellen, in der Probe vorkommenden und quantitativ
zu bestimmenden Nukleinsäuren in einer zur Amplifikation
vorbereiteten Mischung nur einmal vorhanden sein sollten, können
sequenzidentische Kombinationen einer kennzeichnenden Polynukleotiddomäne (TAG)
und einer Polynukleotiddomäne mit zufälliger Sequenz
(RAT) folglich als Kopien einer kennzeichnenden Polynukleotiddomäne
einer ursprünglich in der Probe vorhandenen Nukleinsäure
identifiziert werden.
-
Da
während der Amplifikation der Nukleinsäurekonstrukte
auch Polymerisationsfehler auftreten können bzw. auch die
Bestimmung der Nukleinsäuresequenz nicht frei von Fehlern
ist, ist es vorteilhaft auch sequenzähnliche RAT-TAG-Kombinationen
bei der Auswertung zu eliminieren. Was als „sequenzähnliche” Kombinationen
gilt, kann im Prinzip frei festgelegt werden.
-
Wie
häufig solche Fehler auftreten hängt von der Länge
der TAGs und RATs, den Amplifikationsbedingungen und der Sequenzierungsmethode
ab. Als „sequenzähnliche” Kopien werden
bevorzugt RAT-TAG-Sequenzen gesehen, die auf 10 Nukleotide maximal
eine (1) Abweichung aufweisen, bevorzugt werden als sequenzähnliche
Kopie RAT-TAG-Kombinationen definiert, die auf 15 oder 20 Nukleotide
nicht mehr als eine Abweichung besitzen. So sollten z. B. sequenzähnliche
RAT-TAG-Kombinationen mit einer Sequenzlänge von 40 Basenpaaren
maximal 4 Sequenzabweichungen besitzen sofern unter fehlertolerierenden
Bedingungen gearbeitet wird. Sofern Amplifikationsfehler und Sequenzierungsfehler
weitgehend eliminiert werden können, ist es vorteilhaft
die Fehlergrenze für „sequenzähnliche” RAT-TAG-Kombinationen
zu senken.
-
1 zeigt
ein Beispiel von vier RAT-TAG-Kombinationen mit einem gleichen TAG.
Die Kombinationen 1, 2 und 3 sind unterschiedlich, die Kombination
4 ist eine Kopie von 3. Der TAG kommt in der Probe somit dreimal
vor. Für eine Quantifizierung würde nur eine Kombination
gezählt werden, z. B. 3 während Kombination 4
aus dem Datensatz eliminiert wird.
-
Die
den TAG enthaltende Nukleinsäure liegt bevorzugt doppelsträngig,
z. B. als cDNA oder DNA, vor und wird im Anschluss an das oder die
doppelsträngigen Konstrukt(e) (Marker, Adapter) ligiert.
Für eine lineare Amplifikation von RNA, kann die zu amplifizierende
Nukleinsäure jedoch auch einzelsträngig vorliegen.
Einzelsträngige RNA kann mithilfe von RNA-Ligase z. B.
der T4 RNA-Ligase vor einer Amplifikation mit Markern versehen werden.
-
Im
Folgenden werden einige Strategien zur Herstellung der Nukleinsäurekonstrukte
aus doppelsträngiger DNA beschrieben. Aufgrund des modularen
Charakters der einzelnen Verfahrensschritte zur Herstellung der
Konstrukte können analog auch Nukleinsäurekonstrukte
mit anderen Domänenabfolgen erzeugt bzw. gleiche Nukleinsäurekonstrukte
mit einer alternativen Abfolge von Verfahrensschritten erhalten
werden.
-
Die
einzelnen Verfahrensschritte, die zur Herstellung der Nukleinsäurekonstrukte
vorteilhaft sind, sind
- – die Anbindung
von einzel- oder doppelsträngigen Oligonukleotiden, insbesondere
von Markern und Adaptern, oder der Nukleinsäuren an eine
feste Phase, sowie deren Abspaltung
- – die Ligation der einzelnen Marker, Adapter und der
Nukleinsäuren und
- – der Verdau von Nukleinsäuresträngen
mit einem Restriktions- und/oder Tagging-Enzym
-
In
einer bevorzugten Ausführungsform zur Erzeugung quantitativ
zu bestimmender, doppelsträngiger Nukleinsäurekonstrukte
enthaltend z. B. TAGs aus cDNA bzw. genomischer DNA, werden die
doppelsträngigen Nukleinsäuren mit einem Marker
oder Adapter versehen, der an eine feste Phase gebunden werden kann.
-
Das
Binden an eine feste Phase hat den Vorteil, dass z. B. nicht ligierte
oder nicht benötigte Nukleinsäuren nach einem
Restriktionsverdau entfernt werden können oder benötigte
Nukleinsäuren von der festen Phase abgenommen werden können.
Die Bindung der Nukleinsäuren an eine feste Phase ist für
manche Verfahren allerdings auch verzichtbar.
-
Bevorzugt
sind Marker oder Adapter hierzu biotinyliert und können
an eine Streptavidin-gekoppelte feste Phase gebunden werden. Die
zu untersuchenden Nukleinsäuren eines Gemischs können
mit solchen Markern oder Adaptern ligiert werden, die am entgegengesetzten
Ende des zur Ligation vorgesehenen Endes (Ligationsstelle = LS)
biotinyliert sind. Dies kann z. B. nach Verdau der zu quantifizierenden
DNA, mit einem Restriktionsenzym an eine Restriktionsschnittstelle
oder auch an glatte Enden der Nukleinsäure geschehen. Biotinylierte
Marker oder Adapter können bei cDNA bevorzugt auch durch
die Verwendung biotinylierter einzelsträngiger Oligonukleotide
geschehen, die am 3'-Ende eine Poly-T-Sequenz besitzen und durch
Erst- und Zweitstrangsynthese beginnend am 3' Ende der cDNA integriert
werden (als 3'-Ende der cDNA wird das dem 3'-Ende der mRNA entsprechende
Ende verstanden. Es ist durch eine Oligo-A/T-Domäne charakterisiert).
-
In
einer bevorzugten Ausführungsform erfolgt der Verdau der
Nukleinsäure (cDNA, DNA) mit einem oder mehreren häufig
schneidenden Restriktionsenzymen. Häufig schneidende Restriktionsenzyme
sind z. B. NlaIII, Hsp92II, FatI, BfaI, MaeI, XspI, HpyCH4IV, MaeII,
TaiI, TscI, AluI, TaqI, BfuCI, Bsp143I, BstENII, DpnII, Kzo9I, MboI,
NdeII, Sau3AI, BstKTI oder Csp6I. Diese Enzyme erzeugen Nukleinsäurefragmente
mit einer durchschnittlichen Länge von 200 bis 300 Basenpaaren.
Die quantitativ zu bestimmenden Nukleinsäuren des Gemischs
können vor oder nach diesem Verdau z. B. nach Ligation
mit biotinylierten Markern oder Adaptern an eine feste Phase gebunden
werden. Alternativ zum Verdau können die zu bestimmenden
Nukleinsäuren des Gemischs vor Binden an die feste Phase
durch Scheren zerkleinert werden.
-
Nicht
an die feste Phase gebundenen Fragmente können durch Waschen
entfernt werden.
-
Die
gebundenen Fragmente können bevorzugt durch Ligation erneut
mit einem Marker oder Adapter, der nicht biotinyliert sein sollte,
versehen werden. Wurden die quantitativ zu bestimmenden Nukleinsäuren
zuvor mit einem Restriktionsenzym verdaut, so können Marker
oder Adapter mit den der Restriktionsschnittstelle entsprechenden
Enden versehen werden und mit den verdauten, quantitativ zu bestimmenden
Nukleinsäuren ligiert werden. Das andere Ende der Adapter
oder Marker kann vor Ligation geschützt werden z. B. durch
den Einbau einer Amino C7-Modifikation im distal zur LS befindlichen
Ende des Markers oder Adapters. Nach mechanischem Scheren können
die quantitativ zu bestimmenden Nukleinsäuren nach Auffüllen
oder Entfernen von überstehenden Einzelstrangenden („sticky
ends”), z. B. mit dem Klenow Fragment, ebenfalls mit nicht-biotinylierten,
passenden Markern oder Adaptern versehen werden.
-
Die
quantitativ zu bestimmenden Nukleinsäuren des Gemischs
liegen hiernach bevorzugt in der Form:
PB-TAG-RAT-PB',
PB-RAT-TAG-RAT
oder
PB-RAT-TAG-RAT-PB'
vor und können z. B.
mit PCR amplifiziert und z. B. mit hochparallelen Sequenziermethoden
sequenziert werden.
-
Zur
quantitativen Analyse der Genexpression reicht es in der Regel aus,
die cDNA-Enden (Torres T. T. et al., Gene expression profiling
by massively parallel sequencing, Genome Res. 2008 18: 172–177)
als TAGs zu verwenden. Dazu werden mRNAs z. B. unter Verwendung
eines biotinylierten Poly-T-Primers (PB1 = Adapter) in eine cDNA
umgewandelt und an eine feste Phase gebunden. Danach erfolgt der
Verdau mit einem häufig schneidenden Restriktionsenzym
(Anchoring Enzyme). Im Anschluss erfolgt die Ligation mit einem PB'-RAT-Marker
enthaltend eine zweite Primerbindungsstelle (PB2), worin das distal
zur Ligationsstelle befindliche Ende vor Ligation geschützt
ist. Das erhaltene Nukleinsäurekonstrukt ist folglich PB2-RAT-TAG-PB1.
Die erhaltenen Nukleinsäurekonstrukte werden mittels PCR
amplifiziert und im Anschluss sequenziert.
-
Eine
weitere Möglichkeit für hochparallele Sequenzierverfahren
besonders geeignete Nukleinsäurekonstrukte zu erhalten,
ist die Verwendung von biotinylierten Markern oder Adaptern, deren
Bindung an eine feste Streptavidin-Phase und die Gewinnung einzelsträngiger
Konstrukte nach Denaturierung. Die Marker oder Adapter sind distal
zur Primerbindungsstelle 5'-posphoryliert und am Ende an dem die
Primerbindungsstelle liegt vor Ligation geschützt, z. B.
mit einer Amino-C7-Modifikation.
-
Die
für die Pyrosequenzierung besonders geeigneten Konstrukte
c, d und e werden dadurch erhalten, dass der TAG, der z. B. eine
cDNA bzw. ein genomisches DNA-Fragment sein kann, mit Markern und
Adaptern ligiert wird, z. B. über spezifische Restriktionsschnittstellen
oder glatte Enden (blunt-ends), wobei einer der Einzelstränge
des aus zwei Einzelsträngen aufgebauten Markers, z. B.
PB-RAT-LS oder Adapters, z. B. PB'-LS, biotinyliert ist. Nach einer
Ligation entstehen zusätzlich die unerwünschten
Nebenprodukte PB'-TAG-PB' sowie PB-RAT-TAG-RAT-PB. Diese sind nun
entweder an beiden Strängen biotinyliert oder überhaupt
nicht biotinyliert.
-
Nach
Binden an eine Streptavidin-Phase werden zunächst die ungebundenen
Fragmente durch Waschen entfernt. Denaturiert man nun die doppelsträngigen
Konstrukte, so bleiben die Fragmente mit zwei biotinylierten Adaptern
an der festen Phase. Lediglich diejenigen Nukleinsäurekonstrukte,
mit der gewünschten Formation gehen als Einzelstrang in
Lösung und können so gewonnen werden. Die einzelsträngigen
Konstrukte können mit Hilfe einer Polymerase wieder doppelsträngig
erzeugt werden. Dieses Verfahren ist vielseitig einsetzbar und kann
im Prinzip für alle doppelsträngigen DNA-Nukleotide
verwendet werden.
-
Gewinnung von TAGs durch Verwendung eines
Tagging Enzyms:
-
1) Gewinnung eines mit einem RAT versehenen
Tags einer cDNA:
-
In
einer weiteren Ausführungsform werden die quantitativ zu
bestimmenden Nukleinsäuren eines Gemischs wie zuvor beschrieben
mit Nukleinsäurekonstrukten versehen (Markern und Adaptern),
die eine Tagging-Enzym-Bindungsstelle (TES) enthalten und an einem
Ende an ein Biotin-Molekül gebunden sind (z. B. TES-RAT-PB-Biotin).
Damit lassen sich die Nukleinsäuren nun an eine feste Phase,
z. B. Streptavidin-gekoppelte magnetische Partikel ”magnetic
beads” oder ”beads”, binden. Nach dem
Verdau mit einem oder mehreren häufig schneidenden Restriktionsenzymen
oder Scheren kann das Konstrukt nachdem es an eine feste Phase gebunden
wurde mit einem Tagging-Enzym, wie z. B. BsmFI oder MmeI geschnitten
werden.
-
An
dieser Stelle sei erwähnt, dass Fragmente, die durch ein
Tagging-Enzym abgespalten werden eine gleiche Länge haben,
sofern die verwendeten Marker und Adapter ebenfalls von gleicher
Länge waren und bei allen Molekülen die gleiche
Abfolge von Domänen vorliegt, wie dies gemäß der
vorliegenden Erfindung bevorzugt der Fall ist. Die durch das Tagging-Enzym
abgespaltenen Nukleinsäurefragmente können somit
einfach anhand der Größe, z. B. elektrophoretisch
oder per HPLC, getrennt und isoliert werden. Auch nach einer Ligation
mit einem Marker oder Adapter von bestimmter Größe
können die Ligationsprodukte anhand der Größe isoliert
werden. Auch die entsprechenden spezifischen Amplifikationsprodukte
können so isoliert werden.
-
Sofern
ein TypIII-Enzym wie etwa EcoP15I als Tagging-Enzym verwendet wird,
muss vorher noch ein Adapter oder Marker enthaltend eine zweite
TES an das freie Ende der an die feste Phase fixierten Nukleinsäurestränge
ligiert werden. Nach dem Verdau mit dem Tagging-Enzym und dem Entfernen
der abgespaltenen, nicht an die feste Phase gebundenen Produkte
können etwaige überstehende Enden z. B. mit dem
Klenow Fragment, aufgefüllt bzw. mit einer Einzelstrang-spezifischen
Exonuklease abgespalten werden, damit die Tagging-Enzym-Schnittstelle
glatte Enden („blunt ends”) besitzt. Dann können
Marker oder Adapter an den fixierten Nukleinsäurestrang
gebunden werden. Alternativ dazu können mit „sticky
ends” versehene Adapter oder Marker verwendet werden, die
dem durch das Tagging-Enzym entstehenden Ende komplementär
sind.
-
Es
entstehen bevorzugt, je nach Positionierung des Markers oder Adapters
die Produkte
PB-TAG-TES-RAT-PB'
oder PB-RAT-TAG-TES-RAT-PB'
-
Nukleinsäurekonstrukte
können sowohl unter Verwendung einer festen Phase als auch
in Lösung hergestellt werden. In einer bevorzugten Ausführungsform
werden dazu die in einer Probe enthaltenen Nukleinsäuren
oder Nukleinsäurefragmente an beiden Enden mit Markern
oder Adaptern ligiert. Die Enden können vorher durch ein
Restriktionsenzym definiert werden und mit passenden Markern oder
Adaptern versehen werden. Das erhaltene Konstrukt weist die folgende
Domänenabfolge auf:
PB-Nukleinsäure-PB
oder:
PB-RAT-Nukleinsäure-RAT-PB
-
Verdaut
man dieses Konstrukt mit einem häufig schneidenden Enzym,
entstehen in vielen Fällen weitere Schnittstellen in der
Nukleinsäure. Diese können für die Ligation
eines weiteren Adapters oder Markers verwendet werden. Es entstehen
die Produkte:
PB-RAT-TAG-PB
oder
PB-TAG-RAT-PB
-
Werden
im ersten Schritt Adapater oder Marker eingesetzt, die Tagging-Enzym
Erkennungsstellen enthalten, entsteht:
PB-RAT-TES-Nukleinsäure-TES-RAT-PB'
oder:
PB-TES-Nukleinsäure-TES-PB'
-
Danach
können von den erhaltenen Nukleinsäuresträngen
nach Verdau mit dem Tagging-Enzym jeweils zwei Nukleinsäurefragmente
enthaltend einen TAG aus der Nukleinsäure abgespalten werden.
Bevorzugt werden an die Schnittstellen der Tagging-Enzyme ein Marker
oder Adapter angebunden. Es werden neben anderen folgende Nukleinsäurekonstrukte
entstehen, die anhand ihrer Größe mittels z. B.
Gelelektrophorese oder HPLC isoliert werden können:
PB-RAT-TES-TAG-PB'
und
PB'-RAT-TES-TAG-PB
oder:
PB-TES-TAG-RAT-PB'
und
PB'-TES-TAG-RAT-PB
-
Durch
das Entstehen jeweils zweier Nukleinsäurekonstrukte je
in der Probe enthaltener Nukleinsäure wird eine interne
Kontrolle bei der quantitativen Bestimmung der Nukleinsäuren
möglich.
-
Man
erkennt, dass die zur Amplifikation benötigten Nukleinsäurekonstrukte,
die die charakteristischen TAG-RAT-Kombinationen enthalten, auf
vielfältige Weise erzeugt werden können. Der Aufbau
der Nukleinsäurekonstrukte kann dabei in modularer Weise
erfolgen, so können z. B. die einzelnen Verfahrensschritte
zur Anbindung bzw. Erzeugung einzelner Polynukleotide mit den unterschiedlichen
funktionellen Domänen (TAG, RAT, PB, TES) einfach kombiniert
werden, um die gewünschten Nukleinsäurekonstrukte
zu erhalten. Dadurch ist das erfindungsgemäße
Verfahren vielfältig einsetzbar und nicht auf eine bestimmte
Prozessierung der in der Probe enthaltenen Nukleinsäuren
beschränkt.
-
Die
einzelnen, modular anwendbaren Verfahrensschritte werden im Folgenden
beispielhaft näher erläutert.
-
1. Vorbereitung einer RNA-haltigen Probe
zur Herstellung von cDNA-TAGs:
-
Mit
Hilfe eines handelsüblichen Kits z. B. mit Trizol reagent
(Invitrogen Corp., Carlsbad, USA) wird Gesamt-RNA aus einer biologischen
Probe gewonnen. Aus der Gesamt-RNA wird mit einem handelsüblichen
Kit, z. B. ”Oligtex-Midi-Kit” (Qiagen N. V., Venlo,
Niederlande) die mRNA isoliert. Die cDNA wird durch reverse Transkription
unter Verwendung eines 5'-biotinylierten Poly-T-Oligonukleotides,
z. B. mit dem „cDNA synthesis system”, (Invitrogen
Corp.), hergestellt. Das Produkt wird zu einer doppelsträngigen
DNA konvertiert („cDNA synthesis system”, Invitrogen
Corp.) und in einem geeigneten Puffer gelöst. In einer
besonders bevorzugten Variante des Verfahrens soll der verwendete
Poly-T-Oligonukleotid die Erkennungssequenz für EcoP15I
CAGCAG bzw. CTGCTG enthalten
z. B. 5'-Biotin-PB-CAGCAGTTTTTTTTTTTTTTTTT-3'
(SEQ ID No. 1).
-
2. Enzymatischer Verdau von in der Probe
vorhanden Nukleinsäuren:
-
Doppelsträngige
DNA wird in einer Reaktionslösung mit einem häufig
schneidenden Restriktionsenzym („Anchoring-Enzym”),
z. B. NlaIII, in gepufferter Lösung verdaut. Nach dem Verdau
wird die erhaltene DNA extrahiert, mit Alkohol präzipitiert
und in einem geeigneten Puffer aufgenommen. Hiernach wird die DNA-Lösung
mit Streptavidin-beschichteten Partikeln versetzt. Die Partikel
werden bei Raumtemperatur in geeignetem Puffer inkubiert, um eine
Bindung der biotinylierten cDNA mit den Streptavidin-beschichteten
Partikeln zu ermöglichen. Die an die Partikel gebundene
DNA wird gewaschen und in einem geeigneten Puffer aufgenommen.
-
3) Herstellung und Ligation von Polynukleotid-Domänen,
Adaptern und Markern:
-
Adapter
werden aus zwei komplementären einzelsträngigen
Oligonukleotiden zusammengesetzt. Die beiden einzelsträngigen
Oligonukleotide werden in einem geeigneten Puffer gelöst
und miteinander zu einem Doppelstrang hybridisiert. Der Marker enthaltend
den RAT wird ebenfalls zunächst einzelsträngig
synthetisiert und von dieser Matrize wie zuvor beschrieben mit Hilfe
des Klenow Fragments ein Doppelstrang synthetisiert. Adapter und
Marker sind vor einer ungewollten Ligation auf der distal zur LS
befindlichen Seite durch den Einbau von z. B. einer Amino-C7-Modifikation
der 3' Seite des entsprechenden Oligos geschützt, während
an der Ligationsstelle durch 5'-Phosphorylierung die Ligation ermöglicht
wird. Der doppelsträngige Marker oder Adapter kann nun
mit einer Ligase, z. B. T4-Ligase (Invitrogen Corp.) in einem geeigneten
Puffer kovalent mit einem 3'-Ende eines anderen Polynukleotids bzw.
einer Nukleinsäure aus der Probe oder eines Fragmentes davon,
das den TAG enthält und an eine feste Phase gebunden sein
kann, verknüpft werden.
-
Sofern
Marker und Adapter ligiert werden sollen, werden diese bevorzugt
in einer ausreichend großen Menge zugegeben, so dass alle
freien Enden der aufzubauenden Nukleinsäurestränge
auch mit den Polynukleotiden ligiert werden.
-
4) Schneiden mit dem Tagging Enzym:
-
In
einem geeigneten Puffer werden die mit einem eine TES enthaltenden
Adapter oder Marker versehenen, zu quantifizierenden Nukleotide
mit einem Tagging-Enzym, z. B. BsmFI, MmeI, EcoP15I, inkubiert.
-
Die
abgespaltenen Nukleinsäurefragmente werden entweder nach
Elektrophorese oder HPLC isoliert, oder sind (bei Einsatz entsprechender
Marker oder Adapter) an eine feste Phase gebunden. Sollen an die
Tagging-Enzym-Schnittstelle weitere Marker bzw. Adapter angebunden
werden und ist die Schnittstelle keine glatte Schnittstelle, kann
das überhängende Ende aufgefüllt bzw.
mit einer Exonuklease abgespalten werden. Dazu kann z. B. das Klenow-Fragment
der DNA-Polymerase verwendet werden.
-
5) Amplifikation:
-
Zur
Vervielfältigung der Nukleinsäurekonstrukte werden
bevorzugt PCR-basierte Amplifizierungsverfahren verwendet. Alternativ
können auch eindirektionale Amplifizierungs- oder Klonierungsverfahren
zur Vervielfältigung der Nukleinsäurekonstrukte
eingesetzt werden.
-
6) Sequenzierung:
-
Die
Sequenz individueller, durch Amplifikation erhaltener Nukleinsäurefragmente
in einer Mischung wird bevorzugt durch geeignete Sequenzierverfahren
bestimmt. Solche Verfahren werden kommerziell angeboten, z. B. „454”-Picoliter
Verfahren, mit dem GSFLX-System (Roche Diagnostics, Deutschland,),
Solexa-Verfahren, (Illumina Inc., San Diego USA); SOLid-Verfahren
(Applied Biosystems Inc, Foster City; USA); HeliScopeTM Single
Molecule Sequencer, (Helicos Corp., Cambridge, USA). Mit diesen
Methoden können heute schon bis zu mehreren Millionen Sequenzen
parallel sequenziert werden. Dabei kann eine Mischung aus amplifizierten
Nukleinsäurekonstrukten ohne weitere Auftrennung bzw. ohne
zwischengeschalteten Klonierungsschritt parallel sequenziert werden.
Allerdings ist auch möglich, die erhaltenen Nukleinsäurefragmente
zu Konkatemeren zusammenzufügen, die im Anschluss kloniert,
aufgearbeitet und mit herkömmlichen Verfahren (z. B. nach
Sanger) sequenziert werden können.
-
Da
die quantitative Auswertung der erzeugten Nukleinsäurekonstrukte
durch Sequenzierung erfolgt, sollte der zu sequenzierende Teil der
Konstrukte in einer bevorzugten Ausführungsform eine Länge
von 400 Nukleotiden nicht übersteigen. Bevorzugte Nukleinsäurekonstrukte
besitzen daher eine Länge zwischen 15 und 150 Basenpaaren,
besonders bevorzugt zwischen 25 und 75 Basenpaaren. Allerdings können
auch längere Sequenzen bis hin zu den gesamten Nukleinsäuresequenzen
sequenziert werden.
-
Kurze Beschreibung der Abbildungen, die
beispielhaft einzelne mögliche Ausführungsformen
der Erfindung verdeutlichen:
-
1 zeigt
ein Beispiel von vier RAT-TAG-Kombinationen mit einem gleichen TAG.
-
2 zeigt
schematisch die Herstellung von Nukleinsäurekonstrukten
aus mRNA zur quantitativen Untersuchung der Genexpression.
-
In 2,
Schritt 1.1 bis 1.3 wird die lineare Amplifikation unter Verwendung
eines T7-Promotors (PB') gezeigt. Dazu wird ein Marker mit der Domänenabfolge
PB'-PB-RAT-Poly-T, wobei PB' die Promotor-Sequenz für eine
T7- oder SP6-RNA-Polymerase enthält, mit dem Poly-A-Ende
der mRNAs in der Probe hybridisiert. Das freie 3'-Ende der Poly-T-Sequenz
dient dann als Startpunkt für eine reverse Transkription
(Erststrangsynthese: 2, Schritt 1.1). Durch Zweitstrangsynthese
z. B. unter Verwendung von Oligohexameren wird daraus eine doppelsträngige
cDNA hergestellt (Schritt 1.2). Aus der cDNA kann dann unter Verwendung
der T7-Polymerase eine lineare Amplifikation zur Herstellung von
antisense RNA (aRNA) erfolgen (Schritt 1.3). Die erhaltene aRNA
kann dann unter Verwendung von „random Hexamers” als
Primer durch reverse Transkription in den entsprechenden DNA-Erststrang
umgeschrieben werden (Schritt 1.4), es wird die entsprechende amplifizierte,
einzelsträngige cDNA erhalten. Mit Hilfe der Primerbindungsstelle
(PB) kann dann der entsprechende DNA-Erststrang amplifiziert werden
(Schritt 1.6.1), wobei auch biotinylierte Primerbindungsstellen
verwendet werden können (Schritt 1.6.2). Die erhaltenen
doppelsträngigen Konstrukte können dann z. B.
wie in 3 (Schritt 3–5) gezeigt weiter analysiert
werden.
-
In 2,
Schritte 2–4, wird eine Amplifikation von mRNA mit dem
sogenannten SMART-Verfahren gezeigt.
-
3 zeigt
schematisch die Herstellung von Nukleinsäurekonstrukten
aus genomischer DNA am Beispiel des Digital Karyotyping. Dazu wird
in einer Probe die vorliegende genomische DNA unter Verwendung eines
methylierungsinsensitiven Restriktionsenzyms verdaut (3,
Schritt 1), die gewonnenen Fragmente besitzen bevorzugt überhängende
Enden, so dass an die entsprechenden Restriktionsschnittstellen
der genomischen DNA Marker der Form Biotin-PB-RAT ligiert werden
können, welche passende Ligationssstellen distal zur Primerbindungsstelle
aufweisen (Schritt 2). Die erhaltenen Nukleinsäurekonstruktvorstufen
können dann mit einem weiteren Restriktionsenzym verdaut
werden (Schritt 3). Nach Anbindung der Marker-haltigen Fragmente
an eine Streptavidin-Matrix (z. B. Streptavidin-beschichtete magnetische
Partikel), kann dann ein Adapter enthaltend eine zweite Primerbindungsstelle
(PB') an die gebundenen Fragmente über die entsprechenden überhängenden
Enden („sticky ends”) ligiert werden. Die so erhaltenen
Nukleinsäurekonstrukte können dann amplifiziert
und sequenziert werden. Beim methylierungsspezifischen DK wird das
erste Enzym durch ein methylierungssensitives Enzym ersetzt.
-
In
einer alternativen Ausführungsform, die in 4,
Schritt 5–8 gezeigt wird, können auch Tagging-Enzym-Bindungsstellen
enthaltende Marker, die im vorliegenden Fall biotinyliert sind,
und Adapter für den Aufbau der Nukleinsäurekonstrukte
verwendet werden. Es werden dann die in Schritt 5 gezeigten Nukleinsäurekonstrukte
enthalten. Durch Zugabe des Tagging-Enzyms werden dann kurze TAGs
aus der Nukleinsäure geschnitten (Schritt 6). Sofern diese überstehende
Enden aufweisen werden die erhaltenen Fragmente, dann z. B. mit
dem Klenow-Fragment aufgefüllt. Nun können die
in Lösung befindlichen adapterhaltigen Fragmente mit Markern
zu dem entsprechenden Nukleinsäurekonstrukt über
dessen glatte Enden („blunt-ends”) ligiert (Schritt
7.1) und im Anschluss amplifiziert werden. Das amplifizierte Nukleinsäurekonstrukt
kann dann z. B. elektrophoretisch gereinigt und sequenziert werden.
Auch das an der festen Phase gebundene Fragment kann zu dem gewünschten
Nukleinsäurekonstrukt weiterverarbeitet werden, indem man
das glatte Ende mit einem Adapter enthaltend eine zweite Primerbindungsstelle
ligiert (Schritt 7.2). Das gebundene Nukleinsäurekonstrukt
kann direkt amplifiziert und im Anschluss sequenziert werden. Es
können aber auch die in Lösung befindlichen Fragmente
enthaltend den Adapter und einen TAG und die gebundenen Fragmente
enthaltend den Marker und einen TAG miteinander zu Ditags ligiert
werden (Schritt 6.2) bevor die Amplifizierung und Sequenzierung
des erhaltenen Nukleinsäurekonstruktes erfolgt.
-
Die
im Folgenden beschriebenen Anwendungen der Erfindung belegen die
vielfältigen Verwendungsmöglichkeiten der Erfindung.
Im Detail beschrieben werden:
- 1) RAT-Markierung
von Nukleinsäuren vor ihrer Vermehrung durch Lineare Amplifikation:
- 2) Konstrukte für die Quantifizierung von cDNA,
- 2.1.) Konstrukte für die Quantifizierung von 3-Enden
von cDNA,
- 2.2.) Konstrukte für die Quantifizierung von 5'-Enden
von cDNA,
- 2.3.) Konstrukte für die gleichzeitige Quantifizierung
von 5'- und 3'-Enden von cDNAs,
- 2.4.) Konstrukte für die gleichzeitige Quantifizierung
von 3'- und 5'-Enden der gleichen cDNA mit Hilfe einer Zirkularisierungsmethode,
- 3) Konstrukte für die Quantifizierung von cDNA, die
nicht aus Poly-A-haltiger RNA hergestellt wurde,
- 4) Konstrukte für die Quantifizierung von Fragmenten
genomischer DNA,
- 4.1.) Konstrukte für die Quantifizierung von zuvor
mit Bisulfit umgesetzter genomischer DNA,
- 4.2.) Konstrukte für die Quantifizierung beider Enden
von Fragmenten genomischer DNA mit Hilfe einer Zirkularisierungsmethode.
-
1) RAT-Markierung von Nukleinsäuren
vor ihrer Vermehrung durch lineare Amplifikation:
-
Ziel
der „linearen Amplifikation” ist es, Nukleinsäuren
so zu vermehren, z. B. um genügend Material für eine
Genexpressionsstudie zu erhalten, dass die verhältnismäßige
Zusammensetzung einer Nukleinsäure-Probe bewahrt bleibt.
Hierzu existieren verschiedene Methoden. So wird etwa zunächst,
z. B. aus einer mRNA, an die ein einzelsträngiger Marker
enthaltend einen RAT, gebunden wurde, antisense RNA (aRNA) mit Hilfe
der T7- oder SP6-RNA-Polymerase (
US
6,916,633 ) oder mit Hilfe eines RNA-Primers, der einen
T-7-Promotor
Dafforn et al., Biotechniques. 2004 Nov; 37
(5): 854–7 linear hergestellt. Jedoch treten auch
bei der „linearen Amplifikation” von RNA sequenzbedingte
Abweichungen der Kopienzahl auf (e. g.
Caretti et al. 2008, J.
Cellular Biochemistry 103: 556–563), die durch
Einbindung eines einzelsträngigen RAT erkannt werden können.
In einem alternativen Verfahren kann z. B. ein einzelsträngiger
Marker enthaltend einen RAT an das 5' Ende von in der Probe enthaltenen
mRNAs angebunden werden, Im Anschluss erfolgt dann die lineare Amplifikation
z. B. vom 3'-Ende aus mit Poly-T Primern unter Verwendung einer
reversen Transkriptase.
-
2) Konstrukte für die Quantifizierung
von cDNA
-
Die
lineare Amplifikation ist keine notwendige Voraussetzung für
die Quantifizierung von cDNAs, die aus mRNA mit einem 3'-Poly-A-Ende
hergestellt wurden. Sie bietet sich jedoch an, wenn die mRNA nur
in geringen Mengen vorhanden ist. Daher werden zunächst
Konstrukte beschrieben, welche die lineare Amplifikation der cDNA über
einen RNA-Schritt ermöglichen. Im Weiteren werden dann
Verfahren beschrieben, die von in genügend großen
Mengen vorliegenden Nukleinsäuren ausgehen, seien diese
durch Amplifikation erzeugt oder nicht. Danach werden beispielhaft
Verfahren beschrieben, welche die Quantifizierung von kennzeichnenden
Nukleinsäuredomänen (TAGs) aus Nukleinsäuren
unter Verwendung von RATs ermöglichen.
-
2.1. Konstrukte für die Quantifizierung
von 3'-Enden von cDNA
-
Zur
Amplifikation wird die mRNA zunächst mit Hilfe eines Oligo-dT-haltigen
Primers in cDNA umgewandelt. Für die spätere Amplifikation
mit einer Polymerase, wie z. B. der SP6-, T3- oder T7-RNA-Polymerase, enthält
dieser Primer auch die Promotorsequenz für die Polymerase.
Die spätere, doppelsträngige cDNA hat dann die
Domänenstruktur ”cDNA-Oligo-A/T-Promotor”.
Veränderungen der Nukleinsäure-Zusammensetzung können
erkannt werden, wenn zwischen dem Promotor und der zu amplifizierenden
DNA ein RAT integriert wird. Die resultierende Domänenstruktur
ist in diesem Fall
”cDNA-Oligo-A/T-RAT-Promotor”,
wobei
die T7-Promotor-Sequenz auch gleichzeitig als Primerbindungsstelle
dienen kann. Es kann allerdings auch eine separate Primerbindungsstelle
(PB) neben dem Promoter (Polymerasebindungsstelle) eingebaut werden,
so dass die folgende Domänenstruktur erhalten wird:
”cDNA-Oligo-A/T-RAT-PB-Promotor”.
-
Für
die Quantifizierung ohne vorhergehende direkte Amplifikation z.
B. mit Hilfe einer Polymerase, wie z. B. der SP6-, T3 oder T7-Polymerase
wird ein Konstrukt gewählt, das statt des jeweiligen Promotors
eine Primer-Bindungsstelle (PB) und/oder eine TES enthält.
Eine entsprechende Domänenstrukturen ist dann:
cDNA-Oligo-A/T-TES-RAT-PB
-
Die
beiden folgenden bevorzugten Verfahren können ebenfalls
verwendet werden, um TAGs zu quantifizieren, die von den 3'-Enden
einer cDNA gewonnen wurden, die den Poly-A-Teil enthalten.
-
Für
die Quantifizierung von cDNA-Enden in einem bevorzugten Verfahren
wird mRNA mit einem Poly-T enthaltenden Marker Poly-T-RAT-PB-Biotin
mittels Erst- und Zweitstrangsynthese in cDNA umgeschrieben. Die
cDNA wird danach mit einem oder mehreren häufig schneidenden
Enzymen (Anchoring Enzyme) verdaut. Die Marker-haltigen Fragmente
werden dann an eine Streptavidin-modifizierte Matrix wie z. B. magnetische
Partikel gebunden. Die nicht gebundenen Fragmente werden durch Waschen
entfernt. Es folgt die Ligation mit einem Adapter enthaltend eine
Ligationsstelle am distal zur Primerbindungsstelle gelegenen Ende,
die durch eine Amino-C7-Modifikation vor Ligation geschützt
ist, wobei die überhängenden Enden für
die Ligation genutzt werden. Nach Entfernen der nicht ligierten
Adapter können die erhaltenen Nukleinsäurekonstrukte
amplifiziert und sequenziert werden. Alternativ kann auch in dem
oben beschriebenen Verfahren anstelle des Adapters ein Marker verwendet
werden. In diesem Fall ist es nicht notwendig, die mRNA mit einem
RAT enthaltenden Poly-T-Oligonukleotid umzuschreiben.
-
Eines
der bevorzugten Verfahren zur quantitativen Untersuchung der Genexpression
wird als „SuperTAG” Verfahren bezeichnet. Dazu
wird mRNA unter Verwendung eines 3' biotinylierten Poly-T Oligonukleotids, mit
einer EcoP15I-Bindungsstelle (EcoP15ITES) vor der Poly-T Sequenz
in cDNA umgeschrieben. Danach erfolgt der Verdau mit einem häufig
schneidenden Restriktionsenzym (Anchoring Enzyme), z. B. mit NlaIII.
Die geschnittene cDNA wird durch die Biotin-Gruppe an Streptavidin-beschichtete
magnetische Partikel gebunden. Alternativ können die Oligo-dT
bereits vor der cDNA-Synthese an die Partikel gebunden sein oder
der Verdau mit dem Anchoring Enzyme erst nach Binden an die Partikel
stattfinden. Die nicht gebundenen Fragmente werden durch Waschen
entfernt.
-
Im
nächsten Schritt erfolgt die Ligation mit einem doppelsträngigen
PB'-EcoP15ITES Oligonukleotid (Adapter). Die erhaltenen Nukleinsäurestränge
werden dann mit EcoP15I inkubiert und die abgespaltenen Fragmente
nach einer Gelelektrophorese isoliert. Die Adapter-TAG Konstrukte
können nun mit einem Marker ligiert werden. Die erhaltenen
Nukleinsäurekonstrukte besitzen die folgende Domänenabfolge:
PB'-EcoP15ITES-TAG-RAT-PB.
-
Im
Anschluss erfolgen eine PCR-Amplifikation und die Sequenzierung
der amplifizierten Konstrukte.
-
2.2. Konstrukte für die Quantifizierung
von 5'-Enden von cDNA
-
Für
die genaue Quantifizierung der 5'-Enden von cDNAs können
RATs an der 5' CAP-Sequenz der mRNA angebracht werden, Die 5'-CAP-Sequenz
besteht aus einem Guanin-Nukleotid, das durch eine ungewöhnliche
5'- zu 5'-Triphosphat-Bindung an die mRNA gebunden ist. Zur Anbindung
eines RAT kann z. B. analog zur Herstellung von Voll-Längen-cDNA
verfahren werden (Clepet et al. Improved fulllength cDNA
production based on RNA tagging by T4 DNA-Ligase. Nucleic Acids Research,
2004, Vol. 32, No. 1 e6). Dabei werden RNAs z. B. mit „Alkaline
Phosphatase” behandelt. Transkripte mit intakter 5'-CAP-Sequenz
werden von diesen Enzymen nicht dephosphoryliert, während
gebrochene mRNA-Moleküle und nicht-codierende RNA, die
eine solche CAP-Sequenz nicht besitzen, dephosphoryliert werden
und statt der Phosphat-Gruppe mit einer 5'-OH Gruppe enden, an welche
die RNA-Polymerase keine RNA-Oligonukleotide anbinden kann. Im zweiten
Schritt wird dann die CAP-Sequenz enzymatisch entfernt, wobei die
5'-Phosphatgruppe frei wird, die dann für die Ligation
eines RNA-Oligonukleotids zur Verfügung steht. Dieses Oligonukleotid
bekannter Sequenz dient später als Primerbindungsstelle
(PB) für die Zweitstrang-Synthese der cDNA. Um in dieses
Konstrukt einen RAT einzufügen, sollte die Sequenz des
RNA-Oligonukleotids so gewählt werden, dass das spätere
RNA-Konstrukt die Domänenfolge 5'-PB-RAT-mRNA-3' besitzt.
Wahlweise kann in dieses Konstrukt eine (T7-Polymerase-)Promotorsequenz
eingefügt werden, die dann als Polymerasebindungsstelle
und gleichzeitig als Primer-Bindestelle (PB) dienen kann, Die entsprechende
Domänenstruktur ist dann
'5'-(T7)Promotor-RAT-mRNA-3'
-
Eine
andere Methode um das 5' Ende einer RNA mit einem Primer zu versehen,
ist die Verwendung des „Switch Mechanism At the 5'-end
of Reverse Transcript” (SMART, TAKARA, Seta Otsu, Japan).
Hierbei entsteht bei der Erststrang-Synthese der cDNA ein von der
Reversen Transkriptase gebildeter, aus mehreren (meist drei) Cytosin-Basen
bestehender Überhang auf der 3'-Seite des neu entstandenen
DNA-Strangs (siehe dazu auch 2, Schritte
2 bis 4).
-
Dieser
steht als Bindestelle für einen Oligonukleotid-Primer zur
Verfügung. Hier kann z. B., um den RAT einzufügen,
ein Oligonukleotid, das am 5'-Ende eine Primerbindestelle besitzt,
gefolgt von einem RAT der wiederum mit drei aufeinanderfolgenden
Guanin-Basen am 3'-Ende abschließt als Primer für
die Zweitstrangsynthese der cDNA verwendet werden.
-
Für
viele Zwecke reicht es aus, lediglich einen TAG vom 5'-Ende einer
cDNA zu gewinnen, der dann zur Quantifizierung der ursprünglichen
mRNA dienen kann. Dazu wird wie oben beschrieben ein Nukleinsäurekonstrukt
enthaltend zumindest eine PB (oder eine Promotorsequenz, wie z.
B. von SP6, T3 oder T7), einen RAT und eine TES an die nach der
Dephosphorylierung und Entfernung der CAP-site frei werdende 5'-Phosphatgruppe
gebunden. Das entsprechende einzelsträngige RNA-Konstrukt
hat dann bevorzugt die Form
5'-Biotin-PB/Promotor-RAT-TES-mRNA.
-
Gleichzeitig
kann an die Poly-A-Sequenz des 3'-Ende der mRNA ein DNA-Konstrukt,
das eine Poly-T-Sequenz enthält, durch „Wasserstoffbrückenbildung” zwischen
der Poly-A- und der Oligo-T-Sequenz des Konstrukts gebunden werden.
Dieses Konstrukt enthält zumindest eine Oligo-T-Domäne,
kann aber auch aus weiteren Domänen bestehen (siehe unten).
Ausgehend von diesem doppelsträngigen Ende erfolgt dann
die Reverse Transkription, an die sich die Zweitstrangsynthese anschließt.
Das entstehende, doppelsträngige Produkt hat dann die Domänenstruktur
5'-Biotin-PB/Promotor-RAT-TES-cDNA-Oligo-A/T-3'
und
kann über die Biotin-Gruppe an eine feste Phase gebunden
werden. Wenn die TES die Erkennungssequenz eines Typ-II-Restriktionsenzyms
handelt, kann das Produkt sofort damit geschnitten werden. Während der
nicht gebundene Teil der cDNA weggewaschen werden kann, bleibt an
die feste Phase ein Konstrukt mit der Domänen-Abfolge
5'-Biotin-PB/Promotor-RAT-TES-TAG.-3'
gebunden,
wobei der TAG, der in diesem Fall eine definierte Länge
hat, die cDNA charakterisiert.
-
Alternativ
dazu kann ein TAG auch im Sinne der Erfindung durch mechanische
Zerkleinerung der cDNA oder Behandlung mit einer unspezifischen
Endo- oder Exonuklease gewonnen werden. Er besitzt dann allerdings
nicht per Definition eine definierte Länge. In diesem Fall
entfällt die Notwendigkeit, eine TES-Domäne in
das Konstrukt einzuführen. Es reicht die Domänen-Abfolge
5'-Biotin-PB/Promotor-RAT-TAG,
um
die cDNA zu charakterisieren.
-
An
die nach Verdau oder Zerkleinerung frei werdenden 3'-Enden kann
eine weitere Primerbindungsstelle (PB), ein Adapter oder Marker
gebunden werden. Dieses Konstrukt, das im Falle der Verwendung eines Tagging-Enzyms
eine definierte Länge hat, kann dann durch Amplifikation,
ausgehend von den beiden darin enthaltenen PBs, vermehrt werden.
-
Wenn
es sich bei dem Tagging-Enzym um eine TypIII-Endonuklease wie etwa
EcoP15I handelt, wird an die Schnittstelle des Restriktionsenzyms
bzw. an das durch die unspezifische Endonuklease oder die mechanische
Zerkleinerung entstehende freie Ende, das distal zur Biotin-Gruppe
liegt, bevorzugt ein Konstrukt, das eine PB plus eine TES enthält
so angefügt, dass ein Konstrukt der Form
5'-Biotin-PB/Promotor-TAG-TES-PB-3'
entsteht.
Zusätzlich kann auch hier ein RAT eingefügt werden.
Das Konstrukt hat dann die Form:
5'-Biotin-PB/Promotor-TAG-TES-RAT-PB-3'
-
Solche
Konstrukte können mittels PCR amplifiziert, anhand ihrer
definierten Größe identifiziert und isoliert werden
(Gelektrophorese, HPLC).
-
In
einer besonders bevorzugten Ausführungsform des Herstellungsverfahrens
werden als feste Phase bevorzugt Streptavidin-beschichtete, magnetische
Partikel verwendet. Auch Streptavidin-beschichtete Reaktionsgefäße
sind eine bevorzugte Alternative. Das Partikel-gebundene Ende der
erzeugten Nukleinsäurestränge ist gegen eine Ligationsreaktion
zu schützten.
-
2.3.) Konstrukte für die gleichzeitige
Quantifizierung von 5'- und 3'-Enden von cDNAs Oben beschrieben
Konstrukte von der Form:
-
5'-Biotin-PB/T7-Promotor-RAT-TES-cDNA-Oligo-A/T-3'
oder andere, schon beschriebene Konstrukte erlauben es prinzipiell,
lediglich einen TAG von einem der cDNA-Enden zu gewinnen. In speziellen
Fällen wird jedoch die Gewinnung zweier TAGs vom 5'- und
3'-Ende der gleichen cDNA gewünscht, die damit als solche erkannt
werden können. Dazu wird bevorzugt ein zirkuläres
Produkt der Form
5'-PB-cDNA-Oligo-A/T-PB'-3'
hergestellt,
wobei PB und PB' bevorzugt nicht die gleiche Sequenz haben. Nachdem
PB und PB' an die Enden der cDNA gebunden wurden, können
die so mit bekannten Sequenzen versehenen cDNA-Enden durch Ligation
ihrer PB-Enden unter geeigneten Bedingungen zu einem zirkulären
Molekül umgestaltet werden. Diese zirkulären Moleküle
können jetzt durch PCR ausgehend von den PB-Domänen
vermehrt werden. Um die ursprüngliche Zusammensetzung der
cDNA-Population mit Hilfe von RATs ermitteln zu können,
kann mindestens ein Ende mit einem Marker versehen werden der eine
PB-Domäne enthält. Dies kann über die
CAP-Site und/oder das Poly-A-Ende erfolgen, wie oben beschrieben,
wobei vor der Zirkularisierung an das 5'-Ende der cDNA nach dem
oben beschriebenen Entfernung der CAP-Site ein Konstrukt der Form
5'-PB-RAT-cDNA-3'
gebildet
wird. Am 3'-Ende wird ein Konstrukt der Form
5'-cDNA-Oligo-A/T-PB'-3'
oder
5'-cDNA-Oligo-A/T-RAT'-PB'-3'
gebildet.
-
PB
und PB' können dabei sowohl komplementäre, überhängende
Einzelstrangenden haben, die sich besonders für eine Zirkularisation
eigenen, als auch glatte Enden besitzen. Die Ligation zur Zirkularisierung der
Moleküle erfolgt bevorzugt in genügend großer
Verdünnung, so dass die Wahrscheinlichkeit, dass ein Ende
des gleichen cDNA-Moleküls dem anderen Ende näher
ist als ein beliebiges Ende eines anderen Moleküls, ausreichend
groß ist. Aus den so zirkularisierten Molekülen
können dann entweder enzymatisch oder durch mechanische
Zerkleinerung Konstrukte gewonnen werden, die einen TAG von jedem
Ende des Moleküls enthalten. Sie haben dann die Form:
5'-TAG-RAT-PB-PB'-RAT'-TAG-3'
-
Durch
Anfügen zweier PBs an die Enden dieses Konstrukts entstehen
Konstrukte der Form
1) 5'-PB''-TAG-RAT-PB-PB'-RAT-TAG-PB'''-3',
oder,
je nachdem welches 3'-Konstrukt verwendet wurde
2) 5'-PB''-TAG-RAT-PB-PB'-TAG-PB'''-3',
das
ausgehend von PB'' und PB''' amplifiziert und dann sequenziert werden
kann, wobei PB'' und PB''' bevorzugt aber nicht notwendigerweise
ungleiche Sequenzen haben.
-
Um
Konstrukte definierter Länge zu erhalten, kann eine Größenselektion
z. B. über HPLC oder Gelelektrophorese erfolgen, oder es
können ein oder mehrere Tagging-Enzyme verwendet werden.
-
Für
die Verwendung von Typ-II-Enzymen wird das 5'-Ende der cDNA mit
einem Konstrukt der Form
5'-TES-(CAP-Site)-cDNA-3'
oder
5'-PB-TES-(CAP-Site)-cDNA-3'
versehen,
wobei die TES bevorzugt zusammen mit der PB Teil eines Adapters
ist.
-
3) Konstrukte für die Quantifizierung
von cDNA, die nicht aus Poly-A-haltiger RNA hergestellt wurden
-
Viele
RNA-Moleküle in eukaryotischen Zellen sowie nahezu alle
bakteriellen und viralen RNAs enthalten, anders als Protein-codierende
eukaryotische mRNAs, keine 3'-Poly-A-Sequenz. Um sie zu quantifizieren, werden
sie bevorzugt zunächst mit einem einzel- oder doppelsträngigen
RNA-Oligonukleotid bekannter Sequenz ligert, das später
als Primerbindestelle dienen kann. Einzelsträngige Oligonukleotide
können mit Hilfe von Einzelstrang-RNA-Ligasen, z. B. mit
der T4-RNA-Ligase dadurch gezielt an die 5'- oder an die 3'-Seite
einer einzelsträngigen Nukleinsäure ligiert werden,
indem z. B. ein Ende des Oligonukleotids vor Ligation geschützt
wird, während das 5'-Ende phosphoryliert werden kann.
-
Somit
kann ein einen RAT und eine PB enthaltendes Oligonukleotid (Marker
und Adapter) gezielt an beide Enden einer RNA ligiert werden.
-
So
können RATs z. B. an nicht-proteincodierende RNA ligiert
werden und diese im Anschluss daran in DNA umgeschrieben, amplifiziert
und sequenziert werden. Entsprechende Konstrukte haben die Domänenabfolge:
5'-PB-RAT-RNA-PB-Amino-C7-3',
oder
5'-PB-RNA-RAT-PB-Amino-C7-3',
wobei
alle Moleküle einzelsträngig sind, bzw. PBs auch
als doppelsträngige RNA vorliegen können. Alternativ zur
Ligation mittels RNA Ligasen kann die RNA mit Hilfe einer Poly(A)-Polymerase
künstlich mit einem Poly-A-Strang am 3' Ende der RNA versehen
werden.
-
Nach
Einfügen der Poly-A-Sequenz und Umwandlung in eine doppelsträngige
cDNA können auch solche RNAs mit den gleichen Konstrukten
wie oben für die mRNAs beschrieben, quantifiziert werden.
Da nicht für Proteine codierende RNAs in der Regel keine
CAP-Struktur besitzen, kann allerdings nicht schon verfahrenstechnisch
zwischen Voll-Längen-RNAs und gebrochenen Molekülen
unterschieden werden.
-
4) Konstrukte für die Quantifizierung
von Fragmenten genomischer DNA
-
4.1.) Konstrukte für die Quantifizierung
von Bereichen genomischer DNA: Chromatin-Immuno-Precipitation, Digitales
Karyotyping, Methylation-Spezific Digital Karyotyping, Metagenomics
-
Ein
Verfahren zur quantitativen Bestimmung von DNA-Proteinbindungen
basiert auf einer Vorbereitung der Probe durch Immuno-Präzipitation.
Solche Verfahren werden häufig für die Bestimmung
der Bindestellen für Transkriptionsfaktoren verwendet.
Dabei wird z. B. genomische DNA, die nicht von gebundenen Proteinen
befreit ist, enzymatisch mit einem Restriktionsenzym oder einer
unspezifisch schneidenden Endonuklease verdaut oder anderweitig
(z. B. durch Ultraschall) zerkleinert. Die DNA/Protein Komplexe
werden durch Immuno-Präzipitation mit einem Antikörper
gegen ein bestimmtes Protein (e. g. einen Transkriptionsfaktor)
ausgefällt. Die mitpräzipitierte, an das Protein
gebundene DNA wird von allen Proteinen befreit und mit oder ohne
Tagging Enzym in eine mittels RATs quantifizierbare Form gebracht.
Dazu werden Marker und gegebenenfalls Adapter mit den Enden der
präzipitierten DNA-Fragmente ligiert, die enthaltenen Nukleinsäurekonstrukte
werden amplifiziert und im Anschluss sequenziert. Als Ergebnis wird
die Menge an Kopien einer bestimmten genomischen DNA-Sequenz, z.
B. in einer Gewebeprobe, erhalten, an die oder in deren Nähe
ein Protein gebunden war.
-
Das „Digitale
Karyotypisieren” (DK) ermöglicht die Quantifizierung
von kurzen DNA-Abschnitten im Genom. Die Technik dient dazu, chromosomale
Veränderungen, Vervielfältigungen und Deletionen
zu untersuchen und die Anwesenheit von Fremd-DNA festzustellen.
Hierbei wird die zu untersuchende DNA zunächst mit einem
(methylierungsinsensitiven) Restriktionsenzym verdaut. Nun können
biotinylierte Marker oder Adapter ligiert werden. Die Probe wird
hiernach mit einem zweiten, häufig schneidenden (methylierungsinsensitiven)
Restriktionsenzym verdaut und an die entstehenden Schnittstellen
Marker oder Adapter ligiert. Die entstehenden Konstrukten müssen
mit mindestens einem Marker versehen sein und können so
amplifiziert und sequenziert werden.
-
Sind
Marker oder Adapter mit TES ausgestattet kann ein Tagging Enzym
verwendet werden und nach Binden an eine feste Phase entweder die
gebundene oder die nicht gebundene Marker-TAG bzw. Adapter-TAG Kombination
gereinigt werden und mit einem weiteren Marker oder Adapter versehen
werden, so dass je ein Marker mit einem Adapter (oder einem Marker)
einen TAG einschließt. Sind Marker und Adapter mit einer
TES, insbesondere für EcoP15I versehen wie dies in einer
bevorzugen Version vorgesehen ist, so können zudem gebundene
und nicht-gebundene Marker-TAG und Adapter-TAG Kombinationen miteinander
ligiert werden, so dass zwei TAGs von Marker und/oder Adapter eingeschlossen
werden.
-
Methylierungsspezifische
digitale Karyotypisierung (MSDK): Diese Technik dient dazu, den
Methylierungszustand einer genomischen DNA zu untersuchen. Hierzu
wird das bei DK verwendete erste Enzym mit einem methylierungssensitiven
Enzym ersetzt. Dieses kann nur nicht-methylierte Erkennungssequenzen schneiden.
Die restlichen Schritte sind analog zum DK. Je nach Methylierungszustand
entstehen so unterschiedliche TAGs aus einer Probe.
-
Im
Folgenden wird eine besonders bevorzugte Variante des DK beschrieben,
die den Einsatz des Tagging-Enzyms EcoP15I einschließt,
um Nukleinsäurekonstrukte zur quantitativen Bestimmung
von genomischer DNA gemäß dem erfindungsgemäßen
Verfahren herzustellen.
-
Zur
Analyse von genomischen DNA-Fragmenten durch DK, für Metagenomics-Anwendungen
bzw. nach Immuno-Präzipitation, wird in einer bevorzugten
Methode die DNA wie zuvor beschrieben zunächst mit einem
oder mehreren Restriktionsenzymen verdaut. Für die Analyse
von aus Immuno-präzipitiertem Material stammender DNA kann
diese auch z. B. durch Scherung oder Ultraschall mechanisch zerkleinert
werden.
-
Die
erhaltenen DNA-Fragmente werden hiernach mit einem biotinylierten
Oligonukleotid 1 (Adapter oder Marker) ligiert, das distal zum biotinylierten
Ende eine Schnittsequenz für ein Restriktionsenzym besitzt, wobei
nach dem Restriktionsverdau mit dem entsprechenden Enzym Ligationsstelle
(LS1) mit einem überhängenden Einzelstrangende
entsteht. Für eine Ligation mit mechanisch zerkleinerter
DNA werden Oligonukleotide (Marker oder Adapter) mit glatten Enden
verwendet. Die Enden der zerkleinerten DNA werden vor der Ligation
mit dem Klenow Fragment ebenfalls geglättet. Weiterhin
enthält der Adapter am biotinylierten Ende eine Primerbindungsstelle
(PB1). Für den Einsatz von EcoP15I als Tagging-Enzym muss
das Oligonukleotid 1 zudem die Sequenz 5'-CAGCAG'-3' (TES) vor der
Ligationsstelle tragen. Nach Binden an eine Streptavidin-modifizierte
feste Phase und Waschen zur Entfernung von ungebundenen Fragmenten
wird mit einem weiteren Enzym verdaut. Bevorzugt werden dazu Restriktionsenzyme,
die möglichst viele Restriktionsschnittstellen in der zu
analysierenden DNA aufweisen, wie z. B. NlaIII, DpnII, Taq1, FatI,
Sau3A, MboI etc. verwendet. An die neue Restriktionsschnittstelle
wird ein weiteres Oligonukleotid (Oligonukleotid 2) mit an die gebundene
DNA ligiert. Das Oligonukleotid 2 enthält eine weitere
Erkennungssequenz für das Restriktionsenzym EcoP15I (5'-CTGCTG-3'
(TES)) gefolgt von einer Restriktionsenzymschnittstelle, aus der
nach Restriktionsverdau eine Ligationsstelle (LS2) hervorgeht. Die
Ligation erfolgt mit den, durch den Verdau mit dem entsprechenden
häufig schneidenden Restriktionsenzym entstehenden Ligationsstellen
der DNA. Oligonukleotid 2 ist zudem am distal zur LS befindlichen
Ende vor Ligation geschützt, z. B. durch eine Amino-C7
Modifikation.
-
Durch
die beschriebenen Verfahrensschritte entsteht das folgende Produkt:
5'-CTGCTG-LS2-Nukleinsäure-LS1-CAGCAG-PB1-3'-(feste
Phase)
-
Nach
Verdau mit dem Tagging-Enzym EcoP15I entstehen 25–27 Bp
lange TAGs. Diese können nun mit einem weiteren Oligonukleotid
3 ligiert werden. Dieses Oligonukleotid hat den Aufbau RAT-PB2,
wobei eine Ligation nur über das freie Ende des RAT erfolgt,
da das freie Ende des PB2 vor einer Ligation, z. B. durch eine Amino-C7
Modifikation, geschützt ist. Nach Waschen der festen Phase
werden die gebundenen Nukleinsäurekonstrukte von der festen
Phase abgelöst, es entsteht folgendes zur Hochdurchsatz-Sequenzierung
besonders geeignete Konstrukt:
PB2-RAT-TAG-LS1-CAGCAG-PB1.
-
Alternativ
oder zusätzlich kann der RAT auch im PB1 enthaltenden Oligonukleotid
1 integriert werden, es entsteht das Produkt PB2-TAG-LS1-CAGCAG-RAT-PB1
bzw. PB2-RAT-TAG-LS1-CAGCAG-RAT-PB1.
-
Nach
der Herstellung des Zweitstrangs mit einer Polymerase kann durch
den Verdau mit einem für die Restriktionsschnittstelle
spezifischen Enzym ein Linker hergestellt werden, der die für
die Restriktionsschnittstelle typischen Basenüberhänge
hat und somit die Ligation mit einer Schnittstelle mit komplementären
Basenüberhängen ermöglicht. Alternativ
kann die Ligation auch mit Nukleinsäurefragmenten mit glatten
Schnittstellen erfolgen. So ist insbesondere die direkte Verknüpfung
eines RATs mit einem TAG ohne die Zwischenschaltung eines Linkers
möglich. Prinzipiell kann durch Einführung von
Restriktionsschnittstellen über eine Linkersequenz, die
zur Erzeugung von überhängenden Schnittstellen
dienen, der Einbau von Polynukleotiden in die Nukleinsäurekonstrukte
in der gewünschten Orientierung erreicht werden.
-
Der
Abbau kann mechanisch, z. B. mittels Scherkräften, physikalisch,
z. B. mittels Ultraschall oder bevorzugt durch enzymatischen Abbau
erfolgen.
-
4.2.) Konstrukte für die Quantifizierung
beider Enden von Fragmenten genomischer DNA mit Hilfe einer Zirkularisierungsmethode
-
Wie
bereits erwähnt, ist es oft gewünscht, von beiden
Enden eines Nukleinsäuremoleküls einer genomischen
DNA je einen TAG zu gewinnen, um beide Enden zu quantifizieren.
Zur Fragmentierung der genomischen DNA kann diese entweder mit Restriktionsenzymen,
unspezifischen Endo- oder Exonukleasen oder durch mechanische Zerkleinerung
in kleinere Fragmente beliebiger Größe zerlegt
werden. Nach Bindung dieser linearen Moleküle an die bereits
erwähnten Konstrukte der Form (1) TES-RAT-PB-RAT-TES oder
(2) TES-RAT-PB-PB'-RAT-TES können die Moleküle
zirkularisiert und danach amplifiziert werden, wenn die Fragmente
eine bestimmte Größe nicht überschreiten.
-
Diese
Reaktionen können an einer festen Phase oder bevorzugt
in Lösung stattfinden. Für die Bindung an eine
feste Phase bietet sich die Modifikation eines oder beider TES durch
eine Biotin-Gruppe an.
-
Die
Amplifikation des zirkulären Moleküls geht dabei
von den Primerbindungsstellen (PB) aus, wobei bei (1) die Primer
zumindest teilweise komplementär zueinander und zu je einem
Strang der PB sind. Bei (2) handelt es sich um zwei verschiedene
Primerbindungsstellen und die von den daran bindenden Primern ausgehende
Amplifikation erfolgt gegenläufig. In beiden Fällen
entstehen zirkuläre Moleküle, die nach dem Schnitt mit
dem TE die Domänen-Abfolge
TAG-TES-RAT-PB-RAT-TAG
bzw.
TAG-TES-RAT-PB-PB'-RAT-TAG
besitzen.
-
Es
ist oft sinnvoll (z. B. für eine gerichtete Sequenzierung
oder Klonierung), an eines oder beide Enden dieser Konstrukte eine
oder zwei weitere Domänen bestehend aus einem oder zwei
Adapter(n), ein oder zwei Linker(n) oder einer oder zwei Primer-Bindungsstelle(n)
zu binden, so dass dann z. B. Konstrukte mit der in s) bis v) dargestellten
Domänen-Folge entstehen:
- cc) PB''-TAG-TES-RAT-PB-RAT-TAG
- dd) PB''-TAG-TES-RAT-PB-RAT-TAG-PB''
- ee) PB''-TAG-TES-RAT-PB-PB'-RAT-TAG-PB''
und
- ff) PB''-TAG-TES-RAT-PB-PB'-RAT-TAG-PB'''
-
Dabei
können die Domänen PB'' und PB''' hier im Sinne
der Erfindung durch die oben erwähnten Domänen
(Adapter) ersetzt werden.
-
Ausführungsbeispiele:
-
Beispiel 1: Verwendung von RATs für
die Quantifizierung von mRNAs.
-
In
Folgenden wird die Verwendung der RATs für die Quantifizierung
von mRNAs in einem bevorzugten Verfahren beispielhaft beschrieben.
Dazu wird die mRNA zunächst in eine cDNA umgeschrieben.
Dann wird von praktisch jedem cDNA-Molekül ein TAG gewonnen,
der mit einem Marker enthaltend einen RAT versehen ist. Das erhaltene
Nukleinsäurekonstrukt wird dann amplifiziert und sequenziert.
-
cDNA-Synthese mit einem oligo-dT Primer:
-
Mit
Hilfe eines handelsüblichen Kits mit Trizol Reagenz (Invitrogen
Inc.) wird etwa 1 mg Gesamt-RNA aus einer biologischen Probe (einer
MVV Leukemiezelllinie) gewonnen. Aus der Gesamt-RNA werden mit einem
handelsüblichen Kit (”Oligtex-Midi-Kit”,
Qiagen N. V.) 5 μg mRNA isoliert. Die cDNA wird im Anschluss
mit dem „cDNA synthesis system”, (Invitrogen Corp.)
hergestellt, wobei das folgende, am 5' Ende biotinyliertes Oligonukleotid
verwendet wird, dieses enthält die Erkennungssequenz für
EcoP15I CAGCAG:
-
Das
Produkt wird dann zu einer doppelsträngigen DNA konvertiert
(cDNA synthesis system”, Invitrogen Corp.) und in 20 μl
LoTE Puffer (3 mM Tris-HCl, pH 7.5, 0.2 mM EDTA) gelöst.
-
Verdau mit dem Anchoring Enzym DpnII:
-
Die
doppelsträngige cDNA (20 μl) wird in einer 200 μl
Reaktionslösung mit 50 Units DpnII (New England BioLabs
Inc, Ipswich, UK; NEB) mitgelieferten Puffer bei 37°C für
90 Minuten verdaut, Nach dem Verdau wird die cDNA zur Entfernung
des Enzyms mit TE-equilibriertem Phenol/Chlorophorm/Isoamylalkohol (25:24:1,
pH = 8,0) extrahiert, mit Ethanol präzipitiert und in 100 μl
LoTE Puffer gelöst.
-
300 μl
Streptavidin-beschichtete magnetische Partikel (MP; Dynabeads M279,
Dynal Biotech GmbH, Hamburg, DE) werden mit 200 μl 1 × B&W Lösung
(5 mM Tris-HCl, pH 7.5, 0.5 mM EDTA, 1 M NaCl) gewaschen, wobei
nach Zugabe der B&W
Lösung der „Magnetic Particel Capturer (MPC; Promega
GmbH, Mannheim DE) benutzt wird, um die magnetischen Partikel an
der Gefäßwand zu halten und die B&W-Lösung
auszutauschen. Zur cDNA (100 μl) werden hiernach 100 μl
2 × B&W
Lösung (10 mM Tris-HCl, pH 7.5, 1 mM EDTA, 2 M NaCl) gegeben
und die 1 × B&W-Lösung
der MP mit der cDNA-Lösung ersetzt. Die MPs werden hiernach zur
Bindung der biotinylierten cDNA mit den Strepatvidin-MPs unter Rotation
für 30 Minuten bei Raumtemperatur inkubiert. Mit Hilfe
eines Magneten werden die MPs, an die die DpnII-verdaute cDNA gebunden
ist 2 × mit 200 μl B&W-Lösung gewaschen und in
200 μl LowTE rückgelöst.
-
Adapter-Ligation:
-
An
die gebundene DNA wird ein Adapter ligiert, der die Erkennungssequenz
für das Tagging-Enzym enthält. Dieser ist aus
den folgenden einzelsträngigen Oligonukleotiden A und B
zusammengesetzt: Oligonukleotid B enthält eine Amino-C7-Modifikation
am 3' Ende, um eine ungewollte Ligation an dieser Stelle zu verhindern
und ist am 5' Ende phosphoryliert, um die Ligation auf dieser Seite
zu ermöglichen. Der mit der Amino-C7-Modifikation geschützte
Teil des 5'-Endes des später doppelsträngigen
Linkers dient als Primer-Stelle für die spätere
Pyrosequenzier-Reaktion mit dem Solexa-Verfahren.
-
Dazu
werden die beiden Einzelstränge des Oligonukleotid-Adapters
in 0,2
mM Tris-EDTA in einer Konzentration von 100 μM gelöst,
und miteinander zu einem Doppelstrang hybridisiert, indem beide
Oligonukleotid-Lösungen im Verhältnis 1:1 gemischt,
auf 96°C erhitzt und danach langsam auf Raumtemperatur
abgekühlt werden. Der Linker enthält die Erkennungssequenz
für das Tagging-Enzym EcoP15I (CAGCAG). Es entsteht ein
doppelsträngiger Linker mit einem 5' GATC-Überhang,
der mit der DpnII Restriktionsschnittstelle ligiert werden kann.
-
Ligase-Reaktion:
-
Folgender
Ligationsansatz wird hergestellt:
6 μl 5 × Ligase
Buffer (Invitrogen, Corp.)
+ 5 μl Linker (100 μM)
+
17 μl H2O
= 28 μl
-
Das
LoTE des MP + cDNA-Ansatzes wird durch den 28 μl Ligations-Ansatz
ersetzt. Die MP werden vorsichtig gemischt, für 2 Minuten
auf 50°C erhitzt und 15 Minuten bei Raumtemperatur abgekühlt.
2 μl T4-Ligase (5 U/μl, Invitrogen, Corp.) werden
zu dem Ligationsansatz gegeben und die Probe bei 16°C für
2 Stunden inkubiert, alle 20 Minuten wir die Probe vorsichtig gemischt.
Nach der Ligationsreaktion werden die nicht-gebundenen Linker von
den MP durch 3-maliges waschen mit 300 μl 1 × B&W entfernt. Die
MPs werden in ein neues Gefäß überführt
und erneut 1× mit 300 μl 1 × B&W und anschließend
2× mit 1 × NEB 4-Puffer (New England Biolabs,
Inc., NEB) gewaschen und in 300 μl NEB4-Puffer aufgenommen.
-
Schneiden mit dem Tagging-Enzym:
-
Folgender
Reaktionsansatz wird vorbereitet:
10 μl 10 × Puffer
NEB 3
10 μl 10 mM ATP (NEB)
2 μl EcoP15I
(NEB)
1 μl 100 × BSA (NEB)
77 μl
H2O
= 100 μl
-
Die
300 μl NEB3-Puffer des MP + cDNA + Linker-Ansatzes wird
durch den 100 μl Reaktionsansatz ersetzt. Die Probe wird
bei 37°C eine Stunde bei mehrmaligem vorsichtigen Mischen
inkubiert. Mithilfe des MPC werden die MP an der Gefäßwand
festgehalten, während der Überstand abgenommen
und in ein neues Gefäß überführt
werden kann. Der Überstand enthält die Linker-TAGs
von 52 bp Länge (Linker + TAG). Die Linker-TAG-Fragmente
im 100 μl Überstand werden im Verhältnis
1 zu 1 mit Phenol/Chlorophorm/Isoamylalkohol (25:24:1, pH = 8,0)
Lösung extrahiert, mit 500 μl Ethanol + 67 μl
7.5 M NH4OAc + 2 μl Glycogen (NEB) präzipitiert.
Nach Inkubation bei –20°C für 8 h wird
die Probe 30 Minuten bei 4°C und 13.000 g zentrifugiert, zwei
mal mit 70%-igem Ethanol gewaschen, getrocknet und in 20 μl
LoTE Puffer gelöst.
-
Herstellung glatt-endender „blunting” der
Adapter-TAG Fragmente:
-
Durch
Schnitt mit EcoP15I entstehen Adapter-TAG-Fragmente mit überstehenden
5'-Enden. Um daran später einen RAT-enthaltenden Marker
mit glatten Enden anzuliegieren werden die Enden geglättet
(blunting). Die blunting-Reaktion findet in 50 μl 1 × NEBuffer
2 (New England Biolabs, Inc.) mit 33 μM dNTP, 5 units Polymerase
I, Large (Klenow) Fragment (New England Biolabs Inc.), bei 25°C
und mit einer 15 minütigen Inkubationszeit statt. Die Probe
wird hiernach mit LoTE auf 200 μl aufgefüllt und
mit Phenol/Chlorophorm/Isoamylalkohol (25:24:1, pH = 8,0) Lösung
extrahiert, mit 1000 μl Ethanol + 133 μl 7.5 M
NH4OAc + 2 μl Glycogen (NEB) präzipitiert und
in 10 μl LoTE gelöst.
-
Herstellung und Ligation mit dem RAT-enthaltenden
Marker:
-
Der einzelsträngige Marker mit
folgender Sequenz:
-
Phosphat
5' NNNNNNNNTCGTATGCCGTCTTCTGCTTG 3'Amino-C7 (= RAT-A), wobei (N)
8 den einzelsträngigen RAT darstellt
(SEQ ID No. 5) wird mit dem Primer mit folgender Sequenz
mithilfe des Klenow Fragments
in folgender Lösung für 30 Minuten bei 37°C,
inkubiert, und somit doppelsträngig hergestellt:
5 μl
RAT A (10 μM)
5 μl RAT B (10 μM)
1 μl
dNTPs (10 mM each)
5 μl 10 × NEBuffer 2 (New
England Biolabs Inc.)
1 μl Klenow Fragment (New England
Biolabs Inc.)
+ 33 μl H
2O
=
50 μl
-
Der
doppelsträngige, den RAT-enthaltende Marker wird mittels
Phenol-Chlorophorm gereinigt, mit Ethanol präzipitiert
gewaschen und nach Trocknen in 50 μl H2O aufgenommen.
-
Die
Ligation mit dem Adaper-TAG-Konstrukt findet unter folgenden Bedingungen
statt:
10 μl TAG-Lösung in LoTE
1 μl
0,1 mM Marker
4 μl 5 × Ligation Buffer (Invitrogen,
Inc.)
2 μl T4-Ligase (Invitrogen, Inc.)
3 μl
H2O
= 20 μl
-
Der
Ansatz wird bei 16°C für 2 Stunden inkubiert.
Die Probe wird hiernach auf 200 μl mit LoTE aufgefüllt
und mit Phenol/Chlorophorm/Isoamylalkohol (25:24:1, pH = 8,0) Lösung
extrahiert, mit 1000 μl Ethanol + 133 μl 7.5 M
NH4OAc + 2 μl Glykogen (NEB) präzipitiert und
in 10 μl LoTE gelöst.
-
PCR-Amplifikation:
-
Zunächst
wird mit verschiedenen Verdünnungen der Linker-TAG-RAT-Ligationsansatz
eine PCR mit 25 Zyklen durchgeführt, um die am besten für
die Amplifikation geeignete Konzentration zu ermitteln. Die PCR-Reaktionsansätze
zu je 20 μl werden für zur initialen Denaturierung
der Templat-DNA für 2 Minuten bei 98°C inkubiert,
es folgen 25 Zyklen mit 98°C für 15 Sekunden,
gefolgt von 15 Sekunden bei 60°C und abschließend
15 Sekunden bei 72°C. Als Polymerase wird die Phusion-Polymerase
(Finzymes, Finnland) benutzt.
-
Als
Primer wurden verwendet
-
-
Die
PCR-Produkte werden auf ein 8%iges Polyacrylamidgel aufgetragen.
Nach Färben mit Ethidiumbromid und Visualisieren unter
UV-Licht wird eine 79 Bp Marker-Adapter-TAG Bande im Gel sichtbar.
Danach wird für präparative Zwecke ein 200 μl
PCR-Ansatz mit derjenigen Verdünnung durchgeführt,
welche die beste Amplifikation ergab.
-
Reinigung der Linker-TAG-RAT Fragmente:
-
Die
Produkte der präparativen PCR werden erneut auf ein 8%iges
Polyacrylamidgel aufgetragen und das Gelstück mit der 79
Basenpaar (Bp) Bande mit einem Skalpell herausgeschnitten. In einem
1,5 ml Eppendorf-Gefäß wird das Gelstück
mit einem Pistill zerkleinert und in 500 μl einer Elutionslösung
(0,5% NH4OAc, 2 mM EDTA 0,1% SDS) über Nacht bei 37°C
inkubiert. Das eluierte RAT-Linker-TAG-Konstrukt wird anschließend
mit Ethanol aus der Elutionslösung gefällt, 2× mit
70% Ethanol gewaschen, getrocknet und in 10 μl LoTE rückgelöst.
-
Die
Konzentration und Qualität des PCR Produktes wird mit einer
Gelelektrophorese bestimmt. Zum Test wird ein Aliquot des gereinigten
RAT-Linker-TAG-Konstrukts in den pGEM
®-T
Easy Vektor (Promega) ligiert, in den E. coli-Stamm DH5alpha transformiert,
weiße-Kolonien selektiert und 5–10 RAT-Linker-TAG-Konstrukte
enthaltende Plasmide mit dem Sanger-Verfahren sequenziert. Sieben
der dabei erhaltenen, typischen Sequenzen mit unterschiedlichen
PB-RAT-TAG-LS-TES-PB'-Konstrukten sind unten aufgelistet. Jeder
TAG ist eindeutig mit einem RAT markiert. Die RAT-Domänen
der Konstrukte sind dabei fett markiert, die TAG-Domänen
kursiv dargestellt. Klon
1
Klon
2
Klon
3
Klon
4
Klon
5
Klon
6
Klon
7
-
Mit
Hilfe einer BLAST-Recherche mit dem RAT-TAG Konstrukt in GenBank
konnten die einzelnen TAGs jeweils einem bestimmten humanen Gen
zugeordnet werden (Tabelle 1): Tabelle
1: Tabellarische Zusammenstellung der Ergebnisse der BLAST-Recherche
-
Es folgt ein
Sequenzprotokoll nach WIPO St. 25.
Dieses kann von der
amtlichen Veröffentlichungsplattform des DPMA heruntergeladen
werden.
-
ZITATE ENTHALTEN IN DER BESCHREIBUNG
-
Diese Liste
der vom Anmelder aufgeführten Dokumente wurde automatisiert
erzeugt und ist ausschließlich zur besseren Information
des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen
Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt
keinerlei Haftung für etwaige Fehler oder Auslassungen.
-
Zitierte Patentliteratur
-
- - US 5695937 [0006]
- - US 6916633 [0085]
-
Zitierte Nicht-Patentliteratur
-
- - S. M. Wang
(2007) Understanding SAGE data, Trends in Genetics 23: 42–50 [0006]
- - SAGE, V. E. Velculescu et al., Serial analysis of gene expression,
Science 270 (1995), pp. 484–487 [0006]
- - Nielsen KL, Høgh AL, Emmersen J., Nucleic Acids Res.
2006; 34(19): e133. DeepSAGE-digital transcriptomics with high sensitivity,
simple experimental protocol and multiplexing of samples) [0006]
- - S. Saha et al., Using the transcriptome to annotate the genome,
Nat. Biotechnol. 20 (2002), pp. 508–512 [0006]
- - Emmersen, J. et al., BMC Bioinformatics 2007, 8: 92 [0006]
- - H. Matsumura et al., Gene expression analysis of plant host-pathogen
interactions by SuperSAGE, Proc. Natl. Acad. Sci. U. S. A. 100 (2003),
pp. 15718–15723 [0006]
- - CAGE, T. Shiraki et al., Cap analysis gene expression for
high-throughput analysis of transcriptional starting point and identification
of promoter usage, Proc. Natl. Acad. Sci. U. S. A. 100 (2003), pp.
15776–15781) [0006]
- - GIS, C. L. Wei et al., 5' Long serial analysis of gene expression
(LongSAGE) and 3' LongSAGE for transcriptome characterization and
genome annotation, Proc. Natl. Acad. Sci. U. S. A. 101 (2004), pp. 11701–11706 [0006]
- - T. L. Wang et al., Digital karyotyping, Proc. Natl. Acad.
Sci. U. S. A. 99 (2002), pp. 16156–16161 [0006]
- - J. T. Park et al., Notch3 gene amplification in ovarian cancer,
Cancer Res. 66 (2006), pp. 6312–6318 [0006]
- - Min Hu et al., Methylation-specific digital karyotyping Nature
Protocols 1, – 1621–1636 (2006) [0006]
- - C. L. Wei et al., A global map of p53 transcription-factor
binding sites in the human genome, Cell. 124 (2006), pp. 207–219 [0006]
- - Krause et al., Phylogenetic classification of short environmental
DNA fragments, Nucleic Acids Res. 2008 April; 36(7): 2230–2239 [0006]
- - Torres T. T. et al., Gene expression profiling by massively
parallel sequencing, Genome Res. 2008 18: 172–177 [0054]
- - Dafforn et al., Biotechniques. 2004 Nov; 37 (5): 854–7 [0085]
- - Caretti et al. 2008, J. Cellular Biochemistry 103: 556–563 [0085]
- - Clepet et al. Improved fulllength cDNA production based on
RNA tagging by T4 DNA-Ligase. Nucleic Acids Research, 2004, Vol.
32, No. 1 e6 [0094]