Die
Sequenzierung des aus ca. 3 × 109 Basen bestehenden humanen Genoms oder des
Genoms anderer Organismen sowie die Bestimmung und der Vergleich
individueller Sequenzvarianten erfordert die Bereitstellung von
Sequenziermethoden, die einerseits schnell sind und andererseits
routinemäßig und
mit geringen Kosten eingesetzt werden können. Obwohl große Anstrengungen
unternommen worden sind, um gängige
Sequenziermethoden, z.B. die enzymatische Kettenabbruchmethode nach Sanger
et al. (Proc. Natl. Acad. Sci. USA 74 (1977) 5463), zu beschleunigen,
insbesondere durch Automatisierung (Adams et al., Automated DNA
Sequencing and Analysis (1994), New York, Academic Press), können derzeit
maximal nur 2.000 Basen pro Tag mit einem Sequenziergerät bestimmt
werden.
Während der
letzten Jahre sind neue Ansätze
zur Überwindung
der Beschränkungen
konventioneller Sequenzierverfahren entwickelt worden, u.a. die
Sequenzierung durch Rastertunnelmikroskopie (Lindsay und Phillip,
Gen. Anal. Tech. Appl. 8 (1991), 8-13), durch hochparallelisierte
Kapillarelektrophorese (Huang et al., Anal. Chem. 64 (1992), 2149-2154; Kambara
und Takahashi, Nature 361 (1993), 565-566), durch Oligonukleotidhybridisierung
(Drmanac et al., Genomics 4 (1989), 114-128; Khrapko et al., FEBS
Let. 256 (1989), 118-122; Maskos und Southern, Nucleic Acids Res.
20 (1992), 1675-1678 und 1679-1684) sowie durch Matrix-unterstützte Laser-Desorptions/Ionisierungs-Massenspektroskopie (Hillenkamp
et al., Anal. Chem. 63 (1991), 1193A-1203A).
Ein
weiterer Ansatz ist die Einzelmolekülsequenzierung (Dörre et al.,
Bioimaging 5 (1997), 139-152), bei der die Sequenz von Nukleinsäuren durch
fortschreitenden enzymatischen Abbau von fluoreszenzmarkierten einzelsträngigen DNA-Molekülen und
Nachweis der sequenziell freigesetzten Monomermoleküle in einem
Mikrostrukturkanal erfolgt. Der Vorteil dieses Verfahrens besteht
darin, dass nur ein einziges Molekül der Zielnukleinsäure für die Durchführung einer
Sequenzbestimmung ausreicht.
Obwohl
durch Anwendung der oben genannten Methoden bereits erhebliche Fortschritte
erzielt wurden, besteht ein großer
Bedarf nach weiteren Verbesserungen. Die der vorliegenden Erfindung
zugrunde liegende Aufgabe bestand somit darin, ein Verfahren zur
Sequenzierung von Nukleinsäuren
bereitzustellen, das eine weitere Verbesserung gegenüber dem
Stand der Technik darstellt und das eine parallele Bestimmung einzelner
Nukleinsäuremoleküle in einem
Multiplexformat ermöglicht.
In
PCT/EP01/07462 wird ein Multiplex-Sequenzierungsverfahren vorgeschlagen,
wobei Nukleinsäuremoleküle, die
mehrere Fluoreszenzmarkierungsgruppen tragen, in immobilisierter
Form auf einem Träger
bereitgestellt werden, und die Basenfolge mehrere Nukelinsäuremoleküle gleichzeitig
aufgrund der bei Abspaltung von Nukleotidbausteinen hervorgerufenen
zeitabhängigen Änderung
der Fluoreszenz der Nukleinsäuremoleküle oder/und
der abgespaltenen Nukleotidbausteine bestimmt wird. Gemäß WO 2003/052137
erfolgt die Sequenzbestimmung durch Einstrahlen von Licht in den
Träger
und Erzeugen eines evaneszenten Anregungsfeldes durch interne Reflexion
an der Trägeroberfläche im Bereich
der immobilisierten Nukleinsäuremoleküle.
Gegenstand
der vorliegenden Anmeldung ist ein Verfahren zur Sequenzierung von
Nukleinsäuren, umfassend
die Schritte:
- (a) Bereitstellen eines Trägers mit einer Vielzahl von
darauf immobilisierten, Nukleinsäure-abbauenden
Enzymmolekülen,
- (b) Inkontaktbringen des Trägers
mit freien Nukleinsäuremolekülen, die
mehrere Fluoreszenzmarkierungsgruppen tragen,
- (c) fortschreitendes Abspalten einzelner Nukleotidbausteine
von den freien Nukleinsäuremolekülen durch
die immobilisierten Enzymmoleküle, und
- (d) gleichzeitiges Bestimmen der Basenfolge mehrerer Nukleinsäuremoleküle aufgrund
der bei Abspaltung von Nukleotidbausteinen hervorgerufenen zeitabhängigen Änderung
der Fluoreszenz der Nukleinsäuremoleküle oder/und
der abgespaltenen Nukleotidbausteine.
Das
erfindungsgemäße Verfahren
ist eine trägergestützte Multiplex-Sequenziermethode,
bei der eine Vielzahl von freien Nukleinsäuremolekülen parallel untersucht werden
kann. Dies wird durch Bereitstellung eines Trägers mit mehreren darauf immobilisierten
Nukleinsäure-abbauenden
Enzymmolekülen
und parallele Fluoreszenzbestimmung mehrerer Abbaureaktionen erreicht.
Das Verfahren wird vorzugsweise als parallele Hochdurchsatz-Einzelmolekülanalyse
durchgeführt.
Der
für das
Verfahren verwendete Träger kann
ein beliebiger planarer oder strukturierter Träger sein, der zur Immobilisierung
von Enzymmolekülen
geeignet ist. Beispiele für
geeignete Trägermaterialien
sind Glas, Quarz, Kunststoff, Metalle, Halbmetalle, wie etwa Silicium,
Metalloxide, wie etwa Siliciumdioxide, oder diese Materialien enthaltende
Verbundstoffe. Der Träger
kann zumindest im Bereich der immobilisierten Enzymmoleküle eine
ausreichende optische Transparenz und geeignete Oberflächenbeschaffenheit
für die
Einstrahlung von Fluoreszenzanregungslicht oder/und die Rückstrahlung
von Fluoreszenzemissionslicht durch den Träger hindurch oder für einen
Evaneszenz-basierenden Nachweis von Fluoreszenz aufweisen. Auch
die Gestaltung des Trägers
kann grundsätzlich
beliebig sein, sofern ein Reaktionsraum gebildet werden kann, welcher
das fortschreitende Abspalten einzelner Nukleotidbausteine von den
in Kontakt mit dem Träger
gebrachten Nukleinsäuren
in einem flüssigen
Reaktionsgemisch ermöglicht.
Die
Bindung der Enzymmoleküle
an den Träger
kann durch kovalente oder nicht kovalente Wechselwirkungen erfolgen.
Beispielsweise kann die Bindung der Polypeptide an den Träger durch
hochaffine Wechselwirkungen zwischen den Partnern eines spezifischen
Bindepaares, z.B. Biotin/Streptavidin oder Avidin, Hapten/Anti-Hapten-Antikörper, Zucker/Lectin
etc., vermittelt werden. So können
biotinylierte Enzymmoleküle
an Streptavidin-beschichtete Träger
gekoppelt werden. Alternativ können
die Enzymmoleküle
auch adsorptiv an den Träger
gebunden werden. So kann eine Bindung von durch Einbau von Alkanthiolgruppen
modifizierten Enzymmolekülen
an metallische Träger,
z.B. Goldträger,
erfolgen. Noch eine weitere Alternative ist die kovalente Immobilisierung,
wobei die Bindung der Enzymmoleküle über reaktive
Silangruppen auf einer Silika-Oberfläche vermittelt werden kann.
An
einen Träger
werden mehrere Enzymmoleküle
gebunden. Die auf dem Träger
immobilisierten Enzymmoleküle
und die damit in Kontakt befindliche Probenflüssigkeit, die die abzubauenden
Nukleinsäuremoleküle enthält, definieren
einen oder mehrere Reaktionsräume.
Vorzugsweise werden mindestens 100, besonders bevorzugt mindestens
1.000 und besonders bevorzugt mindestens 10.000 und bis zu mehr
als 106 Enzymmoleküle
an den Träger
gebunden. Die Bindung der Enzymmoleküle an den Träger erfolgt
vorzugsweise so, dass eine verdünnte Enzymschicht
auf dem Träger
entsteht, vorzugsweise mit einer Anzahl von 0,01 bis 2, vorzugsweise
0,1 bis 1 Enzymmolekülen/μm2 Trägeroberfläche. Das Aufbringen
der Enzymmoleküle
kann statistisch erfolgen, z.B. durch Inkontaktbringen einer verdünnten Lösung biotinylierter
Enzymmoleküle
mit einem flächig
Streptavidin-beschichteten Träger.
Andererseits können
die Enzymmoleküle
auch an spezifische Bereiche der Trägeroberfläche gebunden werden bzw. durch
Inkontaktbringen einer verdünnten
Lösung
von biotinylierten Enzymmolekülen
mit einem strukturierten Träger,
der nur in bestimmten Bereichen eine Streptavidinbeschichtung aufweist.
Die zu sequenzierenden Nukleinsäuremoleküle können in
einzelsträngiger
oder in doppelsträngiger Form
vorliegen. Sie haben eine Länge
von vorzugsweise 50 bis 2.000 Nukleotide, besonders bevorzugt 200
bis 1.000 Nukleotide. Die zu sequenzierenden Nukleinsäuremoleküle, z.B.
DNA-Moleküle
oder RNA-Moleküle, enthalten
mehrere Fluoreszenzmarkierungsgruppen, wobei vorzugsweise mindestens
50 %, besonders bevorzugt mindestens 70 % und am meisten bevorzugt
im wesentlichen alle, z.B. mindestens 90 %, der Nukleotidbausteine
von einem oder mehreren, z.B. zwei, drei oder vier Basentypen eine
Fluoreszenzmarkierungsgruppe tragen, wobei jeder Basentyp günstigerweise
eine unterschiedliche Fluoreszenzmarkierungsgruppe trägt. Eine
vollständige
Markierung aller Nukleotidbausteine eines Basentyps ist nicht erforderlich,
da eventuelle Lücken
bei der Sequenzbestimmung an einen Nukleinsäuremolekül durch parallele Mehrfachbestimmungen
ergänzt
werden können.
Derart
markierte Nukleinsäuren
können durch
enzymatische Primerextension an einer Nukleinsäurematrize unter Verwendung
einer geeigneten Polymerase, z.B. einer DNA-Polymerase, wie etwa Taq-Polymerase, einer
thermostabilen DNA-Polymerase von Thermococcus gorgonarius oder
anderen thermostabilen Organismen (Hopfner et al., PNAS USA 96 (1999),
3600-3605) oder einer mutierten Taq-Polymerase (Pate) und Loeb,
PNAS USA 97 (2000), 5095-5100) unter Verwendung fluoreszenzmarkierter
Nukleotidbausteine erzeugt werden. Bevorzugt sind Polymerasen ohne
Exonuklease-Aktivität,
wie etwa Vent exo- oder Tgo exo. Besonders
bevorzugte Methoden zum Einbau von Fluoreszenzmarkierungsgruppen
sind bei Tasara et al. (Nucleic Acids Res. 31 (2003), 2636-2646)
oder Giller et al. (Nucleic Acids Res. 31 (2003), 2630-2635) beschrieben.
Die
markierten Nukleinsäuremoleküle können auch
durch Amplifikationsreaktionen, z.B. PCR, hergestellt werden. So
entstehen bei einer asymmetrischen PCR Amplifikationsprodukte, bei
denen nur einziger Strang Fluroeszenzmarkierungen enthält. Derartige
asymmetrische Amplifikationsprodukte können in doppelsträngiger Form
sequenziert werden. Durch symmetrische PCR werden Nukleinsäurefragmente
hergestellt, bei denen beide Stränge
fluoreszenzmarkiert sind. Diese beiden fluoreszenzmarkierten Stränge können separiert
und getrennt in einzelsträngiger
Form mit den immobilisierten Enzymmolekülen in Kontakt gebracht werden,
so dass die Sequenz eines oder beider Komplementärstränge separat bestimmt werden
kann. Alternativ kann einer der beiden Stränge am 3'-Ende derart modifiziert werden, z.B.
durch Einbau einer PNA-Klammer, dass eine Abspaltung von Monomerbausteinen
nicht mehr möglich
ist. In diesem Fall ist eine Doppelstrangsequenzierung möglich.
Vorzugsweise
tragen im Wesentlichen alle Nukleotidbausteine von mindestens zwei
Basentypen, beispielsweise zwei, drei oder vier Basentypen, eine
Fluoreszenzmarkierung, wobei jeder Basentyp günstigerweise eine unterschiedliche
Fluoreszenzmarkierungsgruppe trägt.
Wenn die Nukleinsäuremoleküle nicht
vollständig
markiert sind, so kann durch parallele Sequenzierung von mehreren
Molekülen dennoch
die Sequenz vollständig
bestimmt werden.
Die
Nukleinsäurematrize,
deren Sequenz bestimmt werden soll, kann beispielsweise aus DNA-Matrizen,
wie genomischen DNA-Fragmenten, cDNA-Molekülen, Plasmiden etc., aber auch
aus RNA-Matrizen, wie mRNA-Molekülen, ausgewählt werden.
Die
Fluoreszenzmarkierungsgruppen können
aus bekannten, zur Markierung von Biopolymeren, z.B. Nukleinsäuren, verwendeten
Fluoreszenzmarkierungsgruppen, wie etwa Fluoresceinen, Rhodaminen,
Oxazinen, z.B. Evoblue oder Gnothis Blue, Phycoerythrin, Cy3, Cy5,
IR-Farbstoffen oder
Derivaten davon etc., ausgewählt
werden.
Das
erfindungsgemäße Verfahren
beruht darauf, dass in Nukleinsäurestränge eingebaute
Fluoreszenzmarkierungsgruppen Wechselwirkungen mit benachbarten
Gruppen, beispielsweise mit chemischen Gruppen der Nukleinsäuren, insbesondere Nukleobasen,
wie etwa G, oder/und benachbarten Fluoreszenzmarkierungsgruppen
eingehen, die zu einer Änderung
der Fluoreszenz, insbesondere der Fluoreszenzintensität gegenüber den
Fluoreszenzmarkierungsgruppen in "isolierter" Form aufgrund von Quench- oder/und
Energietransfer-Vorgängen, führen. Durch
das Abspalten einzelner Nukleotidbausteine verändert sich die Gesamtfluoreszenz,
z.B. die Fluoreszenzintensität
eines immobilisierten Nukleinsäurestranges
abhängig
von der Abspaltung einzelner Nukleotidbausteine, d.h. abhängig von
der Zeit. Diese zeitliche Änderung
der Fluoreszenz kann parallel für
eine Vielzahl von Nukleinsäuremolekülen erfasst
und mit der Basenfolge der einzelnen Nukleinsäurestränge korreliert werden. Vorzugsweise
werden solche Fluoreszenzmarkierungsgruppen verwendet, die, wenn
sie in den Nukleinsäurestrang
eingebaut sind, zumindest teilweise gequencht sind, so dass nach
Abspaltung des die Markierungsgruppe enthaltenden Nukleotidbausteins
oder eines benachbarten Bausteins, der ein Quenchen verursacht,
die Fluoreszenzintensität
erhöht
wird.
Die
Sequenzierungsreaktion des erfindungsgemäßen Verfahrens umfasst das
fortschreitende Abspalten einzelner Nukleotidbausteine von den zu sequenzierenden
Nukleinsäuremolekülen durch
immobilisierte Nukleinsäure-abbauende
Enzymmoleküle.
Vorzugsweise werden als Enzymmoleküle Exonukleasen verwendet,
wobei Einzelstrang- bzw. Doppelstrang-Exonukleasen, die in 5'→3'-Richtung oder 3'→5'-Richtung abbauen,
eingesetzt werden können. Besonders
bevorzugt werden als Exonukleasen T7 DNA-Polymerase, E.coli Exonuklease
I oder E.coli Exonuklease III verwendet.
Während der
fortschreitenden Abspaltung einzelner Nukleotidbausteine kann eine Änderung der
Fluoreszenzintensität
des Nukleinsäurestrangs oder/und
des abgespaltenen Nukleotidbausteins aufgrund von Quench- oder Energietransfervorgängen gemessen
werden. Diese zeitliche Änderung
der Fluoreszenzintensität
ist von der Basenfolge des untersuchten Nukleinsäurestrangs abhängig und
kann daher mit der Sequenz korreliert werden. Zur vollständigen Sequenzbestimmung
eines Nukleinsäurestrangs werden üblicherweise
mehrere – an
unterschiedlichen Basen, z.B. A, G, C und T bzw. Kombinationen von
zwei verschiedenen Basen – markierte
Nukleinsäurestränge vorzugsweise
durch enzymatische Primerextension, wie zuvor beschrieben, erzeugt
und sequenziert. Gegebenenfalls kann an den zu untersuchenden Nukleinsäurestrang
noch ein "Sequenzidentifikator", d.h. eine markierte
Nukleinsäure
bekannter Sequenz, angefügt
werden, z.B. durch enzymatische Reaktion mit Ligase oder/und Terminaler Transferase,
so dass zu Beginn der Sequenzierung zunächst ein bekanntes Fluoreszenzmuster
und anschließend
erst das der unbekannten, zu untersuchenden Sequenz entsprechende
Fluoreszenzmuster erhalten wird.
Um
die Entfernung abgespaltener Nukleotidbausteine von den Nukleotidsträngen zu
beschleunigen, wird im Reaktionsraum vorzugsweise ein Konvektionsfluss
vom Träger
weg erzeugt. Die Flussgeschwindigkeit kann dabei im Bereich von
1 bis 10 mm/s liegen.
Die
Detektion umfasst ein Einstrahlen von Licht in den Träger, vorzugsweise
mittels eines Lasers, um eine Anregung der Fluoreszenzmarkierungsgruppen
zu bewirken. Dabei können
ein oder mehrere Laserstrahlen, z.B. ein aufgeweiteter Laserstrahl,
mit einem Querschnitt von ca. 1-20 mm oder/und multiple Laserstrahlen
verwendet werden. Die Detektion umfasst vorzugsweise eine Mehrpunkt-Fluoreszenzanregung
durch Laser, z.B. eine Punktmatrix von Laserpunkten erzeugt durch
eine Diffraktionsoptik oder einen Quanten-Well-Laser.
Alternativ
kann auch eine Detektion der Fluoreszenz durch Einstrahlen von Licht
in den Träger und
Erzeugen eines evaneszenten Anregungsfeldes durch interne Reflexion
an der Trägeroberfläche im Bereich
der immobilisierten Enzymmoleküle
erfolgen. Durch interne Reflexion an einer oder mehreren Positionen
der Trägeroberfläche im Bereich
von immobilisierten Nukleinsäuremolekülen wird
ein evaneszentes Anregungsfeld erzeugt, das eine Anregung der Fluoreszenzmarkierungsgruppen
der zu sequenzierenden Nukleinsäuremoleküle bewirkt.
Vorzugsweise ist die Reflexion an der Trägeroberfläche eine totale interne Reflexion.
Die
Fluoreszenzemission mehrerer Nukleinsäurestränge kann parallel unter Verwendung
einer Detektormatrix nachgewiesen werden, die beispielsweise eine
elektronische Detektormatrix, z.B. eine CCD-Kamera, eine CMOS-Detektormatrix, z.B.
eine CMOS-Kamera oder eine Avalanche-Fotodiodenmatrix, umfasst. Die Detektion
kann derart erfolgen, dass Fluoreszenzanregung und Detektion an
allen untersuchten Nukleinsäuresträngen parallel
erfolgt. Alternativ dazu kann in mehreren Schritten jeweils ein
Teil der Nukleinsäurestränge untersucht
werden. Vorzugsweise erfolgt der Nachweis an Fluoreszenzlicht, das
im Wesentlichen orthogonal von der Trägeroberfläche durch den Reaktionsraum
oder durch den Trägerkörper abgestrahlt
wird.
Beispielsweise
kann die Detektion mittels konfokaler Einzelmoleküldetektion,
wie etwa durch Fluoreszenzkorrelationsspektroskopie, erfolgen, wobei
ein sehr kleines, vorzugsweise konfokales Volumenelement, beispielsweise
0,1 × 10-15 bis 20 × 10-12 I
dem Anregungslicht eines Lasers ausgesetzt wird, das die in diesem
Messvolumen befindlichen Rezeptoren zur Emission von Fluoreszenzlicht
anregt, wobei das emittierte Fluoreszenzlicht aus dem Messvolumen
mittels eines Fotodetektors gemessen wird, und eine Korrelation
zwischen der zeitlichen Veränderung
der gemessenen Emission und der Konzentration des Analyten erstellt
wird, so dass bei entsprechend starker Verdünnung einzelne Moleküle in dem Messvolumen
identifiziert werden können.
Auf Einzelheiten zur Verfahrensdurchführung und apparative Details
zu den für
die Detektion verwendeten Vorrichtungen wird auf die Offenbarung
des europäischen
Patentes 0 679 251 verwiesen. Die konfokale Einzelmolekülbestimmung
ist weiterhin bei Rigler und Mets (Soc. Photo-Opt. Instrum. Eng.
1921 (1993), 239 ff.) und Mets und Rigler (J. Fluoresc. 4 (1994)
259-264) beschrieben.
Alternativ
bzw. zusätzlich
kann die Detektion auch durch eine zeitaufgelöste Abklingmessung, ein so
genanntes Time Gating erfolgen, wie beispielsweise von Rigler et
al., "Picosecond
Single Photon Fluorescence Spetroscopy of Nucleic Acids", in: "Ultrafast Phenomenes", D.H. Auston, Ed.,
Springer 1984, beschrieben. Dabei erfolgt die Anregung der Fluoreszenzmoleküle innerhalb
eines Messvolumens und anschließend – vorzugsweise
in einem zeitlichen Abstand von ≥100
ps – das Öffnen eines
Detektionsintervalls am Fotodetektor. Auf diese Weise können durch
Raman-Effekte erzeugte Hintergrundsignale ausreichend gering gehalten
werden, um eine im Wesentlichen störungsfreie Detektion zu ermöglichen.
Noch
ein weiterer Gegenstand der Erfindung ist eine Vorrichtung zur Sequenzierung
von Nukleinsäuren,
umfassend,
- (a) einen Träger, umfassend eine Vielzahl
von darauf immobilisierten Enzymmolekülen,
- (b) Mittel zur Zufuhr von freien Nukleinsäuremolekülen, die mehrere Fluoreszenzmarkierungsgruppen
tragen, zum Träger,
- (c) einen Reaktionsraum zum fortschreitenden Abspalten einzelner
Nukleotidbausteine von den Nukleinsäuremolekülen und
- (d) Mittel zum gleichzeitigen Bestimmen der Basenfolge mehrerer
Nukleinsäuremoleküle aufgrund
der bei Abspaltung von Nukleotidbausteinen hervorgerufenen zeitabhängigen Änderung der
Fluoreszenz der Nukleinsäuremoleküle oder/und
der abgespaltenen Nukleotidbausteine.
Die
Vorrichtung ist vorzugsweise eine zur Einzelmolekülbestimmung
geeignete Mikro- oder Nanostruktur, z.B. eine zumindest teilweise
transparente Struktur mit Kanälen
oder/und Vertiefungen. Eine bevorzugte Nanostruktur ist in PCT/EP02/02582
beschrieben.
Das
erfindungsgemäße Verfahren
und die erfindungsgemäße Vorrichtung können beispielsweise
für die
Analyse von Genomen und Transkriptomen bzw. für differenzielle Analysen,
z.B. Untersuchungen bezüglich
des Unterschieds im Genom bzw. Transkriptom einzelner Spezies oder
Organismen innerhalb einer Spezies, eingesetzt werden.