Verwendung von Oxazin-Farbstoffen als Markierungsgruppen für die Einzelmolekülanalyse
Beschreibung
Die Erfindung betrifft die Verwendung von Oxazin-Farbstoffen als Markierungsgruppen für die Einzelmolekülanalyse, insbesondere für die Einzelmolekul-Sequenzierung von Nukleinsäuren. Weiterhin werden neue Oxazin-Verbindungen offenbart.
Oxazin-Farbstoffe und ihre Verwendung als Fluoreszenzmarker sind bekannt (siehe z.B. EP-A-0 747 447 oder Bioforum 1 -2 (2001 ), 32-34) . Eine Verwendung dieser Fluoreszenzfarbstoffe für die Einzelmolekül- Sequenzierung wird bisher nicht vorgeschlagen.
Gegenstand der vorliegenden Erfindung ist daher die Verwendung von Verbindungen der allgemeinen Formeln (I) oder (II)
oder Salzen oder Additionsverbindungen davon, worin jedes R
1 unabhängig aus Wasserstoff, Alkyl, Alkoxy oder Polyoxyhydrocarbyl ausgewählt ist, worin Alkyl oder Alkoxy gegebenenfalls substituiert ist durch eine oder mehrere Gruppen, wie etwa Hydroxyl, Sulfonyl, Carboxyl, Halogen, NO
2, Amino, Alkoxycarbonyl oder/und Aminocarbonyl, worin jedes R
2 unabhängig aus Wasserstoff, Sulfonyl (SO
3H oder SO
3 θ) Carboxyl, Hydroxyl, H alogen , NO
2, Alkyl , Al koxy oder Polyoxyhydrocarbonyl ausgewählt ist, worin Alkyl oder Alkoxy gegebenenfalls substituiert ist durch Hydroxyl, Sulfonyl, Carboxyl, Halogen, NO
2, Amino, Alkoxycarbonyl oder/und Aminocarbonyl, worin ein R
2 mit einem benachbarten R
1 einen fünf- oder sechsgliedrigen gesättigten oder ungesättigten heterocyclischen Ring bilden kann, und worin mindestens ein Rest R
1 oder R
2 eine zur Kopplung fähige Gruppe darstellt oder an ein Biomolekül gekoppelt ist, als Fluoreszenz- Markierungsgruppen für die Einzelmolekülanalyse.
In den Resten R2 der Verbindungen (I) oder (II) enthalten die Alkyl- und Alkoxy-Gruppen vorzugsweise 1 -7, besonders bevorzugt 1 -4 und am meisten bevorzugt 1 -3 Kohlenstoff atome, wobei die Gruppen verzweigt oder geradkettig sein können. Unter dem Begriff "Polyhydroxycarbyl- Einheiten" sind polymere oder oligomere organische Gruppen zu verstehen, die über O-Gruppen miteinander verknüpft sind. Besonders bevorzugt sind die Polyethylenoxy-Gruppen mit 2-4 Ethylenoxideinheiten. Besonders bevorzugt sind die Reste R2 Wasserstoff, Sulfonyl, Carboxyl, Hydroxyl, NO2 oder/und Halogen (F, Cl, Br oder I).
In den Resten R1 sind die Alkyl-, Alkoxy- und Polyoxyhydrocarbylgruppen wie für die Reste R2 definiert. Besonders bevorzugt ist, wenn mindestens ein Rest R1 zumindest einen Substituenten ausgewählt aus Sulfonyl, Carboxyl oder/und Hydroxyl enthält. Besonders bevorzugt enthalten mindestens zwei Reste R1 derartige Substituenten, am meisten bevorzugt
enthalten mindestens zwei der Reste R1 Sulfonylgruppen. Bevorzugte Beispiele der Verbindungen (I) sind in Figur 1 dargestellt.
Mindestens einer der Reste R1 und R2 enthält eine zur Kopplung fähige Gruppe oder ist an ein Biomolekül, z.B. ein Protein, ein Peptid, ein
Saccharid, ein Nukleinsäure, z.B. eine DNA oder RNA oder ein Nukleotid, insbesondere an ein Nukleosidtriphosphat gekoppelt. Besonders bevorzugt ist die zur Kopplung fähige Gruppe eine Carboxylgruppe, die durch
Derivatisierung beispielsweise zu einem Aktivester, wie etwa einem N- Hydroxysuccjnimidester oder zu einem gemischten Anhydrid aktiviert werden kann und mit einer Aminogruppe auf einem Biomolekül, z.B. mit einer Aminogruppe auf einer Nukleobase unter Bildung eines Amids reagieren kann. Eine weitere geeignete Markierungsgruppe ist eine
Isothiocγanatgruppe, die mit einer Aminogruppe auf einem Biomolekül zu einem Thioharnstoff reagieren kann. Andere geeignete zur Kopplung fähige
Gruppen sind dem Fachmann bekannt.
Die Verbindungen der Formel (I) oder (II) sind insbesondere für die Einzelmolekülanalyse mittels konfokaler Detektion, wie etwa durch Fluoreszenz-Korrelationsspektroskopie (FCS), geeignet. Dabei wird ein sehr kleines, vorzugsweise konfokales Volumenelement, beispielsweise 0, 1 x 10"15 bis 20 x 10"12 I einer Probe einem Anregungslicht einer Lichtquelle, beispielsweise eines Lasers, ausgesetzt, so dass die in diesem Messvolumen befindlichen Moleküle des Fluoreszenzfarbstoffs zur Emission von Fluoreszenz angeregt werden, wobei das emittierte Fluoreszenzlicht aus dem Messvolumen mittels eines Photodetektors gemessen wird, so dass bei entsprechend starker Verdünnung einzelne Moleküle in dem Messvolumen identifiziert werden können. Auf Einzelheiten zur Verfahrensdurchführung und apparative Details zu den für die Detektion verwendeten Vorrichtungen wird auf die Offenbarung des europäischen Patents 0 679 251 verwiesen.
Als besonders geeignet haben sich die Verbindungen (I) oder (II) bei der Einzelmolekülsequenzierung von Nukleinsäuren erwiesen. Verfahren zur Einzelmolekülsequenzierung sind beispielsweise in Dörre et al. (Bioimaging 5 ( 1 997), 1 39-1 52) und in WO 02/02225 beschrieben. Auf die Offenbarung dieser Dokumente hinsichtlich der Verfahrensführuήg und der apparativen Details wird hiermit Bezug genommen.
Zur Verwendung in einem Einzelmolekül-Sequenzierungsverfahren werden die erfindungsgemäßen Markierungsgruppen vorzugsweise an ein Nukleosidtriphosphat, z.B. ein Deoxyribonukleosidtriphosphat oder Ribonukleosidtriphosphat, gekoppelt. Die Kopplung erfolgt vorzugsweise über einen Linker an die Nukleobase, den Zucker oder eine Phosphatgruppe, besonders bevorzugt an eine Aminogruppe der Nukleobase. Der Linker ist vorzugsweise ein flexibles Molekül mit einer Kettenlänge von 2-30 Atomen, welches neben CH2-Gruppen auch Heteroatome, wie etwa Stickstoff oder Sauerstoff, enthalten kann, beispielsweise als Carbonyl-, Aminocarbonyl- oder Hydroxyl-substituierte CH-Gruppen. Derartig aufgebaute Linkermoleküle erhöhen vorteilhaft die Wasserlöslichkeit der markierten Nukleotide bzw. können Ort weiterer Derivatisierung sein. Die Linker können entweder in dem Fachmann bekannter Weise nukleotidseitig oder aber farbstoffseitig angekoppelt werden. In der Regel sind es daher primär bifunktionelle Moleküle.
Die mit den Verbindungen (I) oder (II) markierten Nukleosidtriphosphate werden enzymatisch in die zu sequenzierenden Nukleinsäuremoleküle eingeb aut. Ü berraschenderweise wu rde festg estel lt, d ass Nukleosidtriphosphate, die eine erfindungsgemäße Oxazingruppe tragen, mit hoher Effizienz in Nukleinsäurestränge eingebaut werden können und die resultierenden hochmarkierten Nukleinsäurestränge gut sequenzierbar sind.
Die nichtradioaktive Nukleinsäure-Markierung und -Detektion hat in den letzten ca. 1 5 Jahren eine stürmische Entwicklung erfahren (siehe z.B. "Nonradioactive Labeling and Detection of Biomolecules" (Kessler, C, Hrsg.), Springer Verlag Berlin, Heidelberg 1 992).
Während sich aber gängige Nachweisverfahren mit einer Markierung jeder 20-30 Nukleobase begnügen, sind die Anforderungen der Einzelmolekülanalyse ungleich höher, d.h. es muss jede Base der Sequenz mit einer Signalgruppe markiert werden.
Es hat sich in früheren Arbeiten gezeigt, dass der hochdichte Einbau von Farbstoffmolekülen eine neusynthetisierte Nukleinsäure mit relativ hydrophoben Eigenschaften liefert, was bei der weiteren Versuchsführung Probleme machen kann. Es war daher auch eine Aufgabe der Erfindung, durch geeignete Substitution der Farbstoffe die Wasserlöslichkeit derselben zu erhöhren. Zwar ist eine solche Vorgehensweise bekannt, die Erkenntnis aber, dass dadurch die Polymerase-Akzeptanz der markierten Nukleosidtriphosphate bzw. das Polymerisationsverhalten der Polymerase im Sinne einer höheren Einbau- und Polymerisationsrate positiv beeinflusst werden, ist neu und überraschend.
Zusammenfassend kann gesagt werden, dass insbesondere eine Kombination von wasserlöslichen Linkermolekülen mit hydrophilen Oxazin- Farbstoffen und ihre Konjugation mit Nukleosidtriphosphaten zu der Lösung des Problems beitragen.
Die zu sequenzierenden Nukleinsäuremoleküle, z.B. DNA-Moleküle oder RNA-Moleküle, können in einzelsträngiger Form oder doppelsträngiger Form eingesetzt werden. Bei doppelsträngigen Molekülen muss sichergestellt sein, dass markierte Nukleotidbausteine nur von einem einzigen Strang abgespalten werden können. Bei den zu sequenzierenden Nukleinsäuresträngen tragen im Wesentlichen alle, z.B. mindestens 90 %,
vorzugsweise mindestens 95 %, aller Nukleotidbausteine von mindestens einem Basentyp eine Fluoreszenz-Markierungsgruppe. Vorzugsweise tragen im Wesentlichen alle Nukleotidbausteine von mindestens 2 Basentypen, beispielsweise 2, 3 oder 4 Basentypen, eine Fluoreszenzmarkierung, wobei jeder Basentyp günstigerweise eine unterschiedliche Fluoreszenz- Markierungsgruppe trägt. Die markierten Nukleinsäuren können durch enzymatische Primer-Extension an einer Nukleinsäurematrize und Verwendung einer geeigneten Polymerase, z.B. einer DNA-Polymerase, wie etwa einer DNA-Polymerase von Thermococcus gorgonarius oder anderen thermostabilen Organismen (Hopfer et al., PNAS USA 96 (1 999), 3600- 3605) oder einer modifizierten Taq-Polymerase (Patel und Loeb, PNAS USA 97 (2000), 5095-5100) unter Verwendung von mit den Verbindungen (I) oder (II) markierten Nukleotidbausteinen erzeugt werden. Alternativ können die markierten Nukleinsäurestränge auch durch Amplifikationsreaktionen, z.B. PCR, hergestellt werden.
Ein weiterer Gegenstand der Erfindung ist somit ein Verfahren zur Sequenzierung von Nukleinsäuren, umfassend die Schritte:
(a) Bereitstellen eines Trägerpartikels mit einem darauf immobilisierten Nukleinsäuremolekül, wobei im Wesentlichen alle Nukleotidbausteine von mindestens einem Basentyp in mindestens einem Strang des Nukleinsäuremoleküls als Fluoreszenzmarkierung eine Verbindung (I) oder (II) enthalten,
(b) Einbringen des Trägerpartikels in eine Sequenziervorrichtung, (c) Festhalten des Trägerpartikels in der Sequenziervorrichtung,
(d) fortschreitendes Abspalten einzelner Nukleotidbausteine durch von dem immobilisierten Nukleinsäuremolekül und
(e) Bestimmen der Basenfolge des Nukleinsäuremoleküls aufgrund der Abfolge der abgespalteten Nukleotidbausteine.
Bei diesem Verfahren wird ein einzelnes, auf einem Trägerpartikel immoblisiertes Molekül untersucht. Die Partikelgröße liegt vorzugsweise im
Bereich von 0,5-10 μm und besonders bevorzugt von 1 -3 μm. Beispiele für geeignete Materialien von Trägerpartikeln sind Kunststoffe, Glas, Quarz, Metalle oder Halbmetalle, Metalloxide oder Verbundmaterialien, die mehrere der zuvor genannten Komponenten enthalten. Besonders bevorzugt werden optisch transparente Trägerpartikel, beispielsweise aus Kunststoffen, oder Partikel mit einem Kunststoffkern oder einer Siliciumdioxidhülle eingesetzt.
Die Nukleinsäuremoleküle werden vorzugsweise über ihre 5'-Enden auf dem Trägerpartikel immobilisiert. Die Bindung an den Träger kann nach bekannten . Methoden über kovalente oder nichtkovalente Wechselwirkungen erfolgen.
Für das Verfahren werden Trägerpartikel verwendet, an die nur ein einziges Nukleinsäuremolekül gebunden ist. Derartige Trägerpartikel können dadurch erzeugt werden, dass die zur Sequenzierung vorgesehenen Nukleinsäuremoleküle in einem molaren Verhältnis von vorzugsweise 1:5 bis 1:20 mit den Trägerpartikeln unter Bedingungen in Kontakt gebracht, bei denen eine Immobilisierung der Nukleinsäuremoleküle an den Träger stattfindet. Die resultierenden Trägerpartikel werden dann, z.B. anhand der auf d en Nu klei nsäuremolekülen enth altenen Fluoreszenzmarkierungsgruppen, sortiert und von Partikeln, an die kein Nukleinsäuremolekül gebunden ist, abgetrennt.
Die beladenen Trägerpartikel werden in eine Sequenziervorrichtung eingebracht, die vorzugsweise einen Mikrokanal enthält. Mit Hilfe eines Einfanglasers, z.B. eines IR-Lasers, kann das Trägerpartikel in einer Kapillare oder einem Mikrokanal festgehalten werden (Ashkin et al., Nature 330 (1987), 24-31; Chu, Science 235 (1991), 861-866).
Die Sequenzierungsreaktion umfasst das fortschreitende Abspalten einzelner Nukleotidbausteine von den immobilisierten Nukleinsäuremolekülen. Vorzugsweise erfolgt eine enzymatische
Abspaltung unter Verwendung einer Exonuklease, wobei Einzelstrang- bzw. Doppelstrang-Exonukleasen, die in 5'→3'-Richtung oder 3'→5'-Richtung abbauen - je nach Art der Immobilisierung der Nukleinsäurestränge auf dem Träger - eingesetzt werden können. Besonders bevorzugt werden als Exonukleasen T7 DNA-Polymerase, E.coli Exonuklease I oder E.coli Exonuklease III verwendet.
Die Auswertung erfolgt - wie zuvor beschrieben - vorzugsweise mit konfokaler Einzelmolekül-Detektion. Alternativ bzw. zusätzlich kann die Detektion auch durch eine zeitaufgelöste Abklingmessung, ein sogenanntes Time-Gating, erfolgen. Für Einzelheiten wird auf WO 02/02225 Bezug genommen.
Noch ein weiterer Gegenstand der Erfindung sind neue Verbindungen der allgemeinen Formeln (I) oder (II)
2 V-
worin jedes R
1 unabhängig aus Wasserstoff, Alkyl, Alkoxy oder Polyoxyhydrocarbyl ausgewählt ist, worin Alkyl oder Alkoxy gegebenenfalls substituiert ist durch eine oder mehrere Gruppen, wie etwa Hydroxyl, Sulfonyl, Carboxyl, Halogen, NO
2, Amino, Alkoxycarbonyl oder/und Aminocarbonyl oder Salzen oder Additionsverbindungen davon, worin jedes R
2 unabhängig aus Wasserstoff, Sulfonyl (SO
3H oder SO
3 e) Carboxyl , Hyd roxyl, Halogen , NO
2, Alkyl, Alkoxy oder Polyoxyhydrocarbonyl ausgewählt ist, worin Alkyl oder Alkoxy gegebenenfalls substituiert ist durch Hydroxyl, Sulfonyl, Carboxyl, Halogen, NO
2, Amino, Alkoxycarbonyl oder/und Aminocarbonyl, worin ein R
2 mit einem benachbarten R
1 einen fünf- oder sechsgliedrigen gesättigten oder ungesättigten heterocyclischen Ring bilden kann, und worin mindestens ein Rest R
1 oder R
2 eine zur Kopplung fähige Gruppe darstellt oder an ein Biomolekül gekoppelt ist mit der Maßgabe, dass mindestens zwei Reste R
1 oder/und R
2 durch Sulfonyl, Carboxyl oder/und Hydroxyl substituiert sind.
Besonders bevorzugt sind Verbindungen der allgemeinen Formel (la)
oder Salze oder Additionsverbindungen davon, worin R1 und R2 wie zuvor definiert sind und R1 a eine gegebenenfalls substituierte Alkylgruppe ist, die eine zur Kopplung fähige Carboxyl- oder
aktivierte Carboxylgruppe trägt, oder über die Carboxylgruppe an ein Bindemolekül gekoppelt ist.
Bei den Verbindungen (la) enthält vorzugsweise mindestens einer der Reste R1 eine Sulfonylgruppe und R1a ist eine durch Aminocarboxyl substituierte Alkylgruppe, die einen Carboxyterminus trägt. Eine besonders bevorzugte Ausführungsform der Verbindungen (la) ist in Figur 2 dargestellt.
Weiterhin soll die Erfindung durch die folgenden Figuren und Beispiele erläutert werden.
Figur 1 zeigt bevorzugte Beispiele für erfindungsgemäße Verbindungen (I) oder (II).
Figur 2 zeigt ein besonders bevorzugtes Beispiel für die erfindungsgemäße Verbindung (la).
Beispiele
Beispiel 1: N,N-Di-(3-sulfopropyI)-m-aminophenol-IMa2-Salz
100 mmol 3-Aminophenol und 250 mmol Propansulfon werden in 150 ml Dimethylf ormamid gelöst. Dazu gibt man 250 mmol Natriumhydrogencarbonat und erhitzt die Mischung während 2 h auf 100 °C. Man lässt auf Raumtemperatur abkühlen und zieht das Lösungsmittel im Hochvakuum ab. Der Rückstand wird in Aceton auf geschlämmt, filtriert und der Filterrückstand mit Aceton und Diethylether mehrfach gewaschen. Man trocknet anschließend im Hochvakuum. Das Rohprodukt enthält noch etwa 10 Gew.-% NaHCO3 und wird ohne weitere Reinigung in die Phenoxazin-Synthese (Beispiel 4) eingesetzt.
Beispiel 2: N-Carboxyethyl-N-methyl-anilin
1 00 mmol N-Methylanilin und 1 20 mmol Acrylsäure werden in 100 ml Eisessig gelöst undmit ca. 0,3 mmol Hydrochinon (als Katalysator) versetzt. Das Reaktonsgemisch wird zum Rückfluss erhitzt und der Reaktionsverlauf mittels Dünnschichtchromatographie (DC) verfolgt. Nach ca. 5-6 h ist in der Regel kein Edukt mehr nachweisbar. Das Lösungsmittel wird daraufhin in Vakuum abdestilliert und der dunkelgelbe Rückstand im Hochvakuum gut getrocknet.
Beispiel 3: 4-Nitroso-N-carboxyethyl-N-methyl-anilin
Der Rückstand aus Beispiel 2 wird ohne weitere Reinigung in ca. 50 ml halbkonzentrierter Salzsäure aufgenommen und im Eisbad auf 0 °C gekühlt. Dazu wird langsam eine Lösung von 100 mmol Na-nitrit in ca. 25 ml H2O zugetropft; die Reaktionstemperatur soll dabei nicht über 5 °C ansteigen. Nach beendeter Zugabe wird 2 h nachgerührt, wobei die Nitrosoverbindung abgeschieden wird. Der Niederschlag wird abgesaugt, mit Ether gewaschen und im Hochvakuum getrocknet.
Beispiel 4: 3-[N,N-Di-(3-sulfopropyl-)amino]-7-(N-carboxyethyl-N-methyl- amino)-phenoxazin
50 mmol 4-Nitroso-N-carboxethyl-N-methylanilin aus Beispiel 3 und 60 mmol N,N-Di(3-sulfopropyl)-m-aminophenol-Na2-Salz werden in 1 00 ml Eisessig gelöst und während 20 min in einem auf 1 60 °C vorgeheizten Ölbad zum Sieden erhitzt. Nach dem Abkühlen wird das Lösungsmittel abdestilliert, restliche Spuren Essigsäure durch dreimalige azeotrope Destillation mit H2O entfernt. Man löst den Rückstand in einem Gemisch aus Wasser und Ethanol (3: 1 ) und zieht auf Kieselgel (Normalphase 60-22 μm) auf. Das trockene Adsorbens wird anschließend auf eine Kieselgel- Säule gegeben und zunächst mit Ethanol eluiert (Abtrennung weniger
polarer Verbindungen). Danach wird sukzessiv mehr Wasser zum Elutionsmittel gegeben, um den Farbstoff zu desorbieren. Die entsprechenden Fraktionen werden vereinigt und das Lösungsmittel abdestilliert. Man löst den Rückstand in H2O und chromatografiert ein zweites Mal an einer Reversed Phase (RP)-Säule (H2O-Methanol 9: 1 ) . Die vereinigten Fraktionen werden zur Trockene eingedampft, der Rückstand in Methanol unter Zusatz von wenig H2O gelöst, die Lösung filtriert und erneut eingedampft. Nach Trocknung im Hochvakuum werden ca. 1 5-20 % d.Th. an reinem Farbstoff erhalten.
Beispiel 5: {3-[N,N-Di-(3-sulfopropyl-)amino]-7-(N-carboxyethyl-N-methyl- amino)-phenoxazin}-[5-(3-aminoallyl)-2'-desoxy-uridin-5'- triphosphat]
2,5 mg (4,4 μmol) des Farbstoffes aus Beispiel 4 werden in 200 μl Dimethylsulfoxid gelöst und 2 μl Diisopropylethylamin sowie 2 mg (6,6 μmol) N,N,N',N'-Tetramethyl-succinimido-uronium-tetrafluorborat (TSTU) zugegeben. Das Reaktionsgemisch wird 10 min bei Raumtemperatur gerührt, dann eine Lösung von 5 μmol 5-(3-Aminoallyl)-dUTP (kommerziell erhältlich) in 500 μl H2O in zwei Portionen innerhalb ca. 5 min zugefügt. Nach einer weiteren Reaktionszeit von 10 min wird die Lösung filtriert und das Filtrat auf eine Sepharose "HighLoad 1.6/10"-Säule (Pharmacia) gegeben. Man chromatografiert mit einem Gradient aus Puffer A (H2O/Acetonitril) und Puffer B ( 1 ,5 M LiCI) . Die Produktfraktionen werden vereinigt, auf ein Gesamtvolumen von ca. 3 ml konzentriert und in 50 ml eines Gemisches von Aceton/H2O (3: 1 ) gewaschen und im Vakuum getrocknet. Der Rückstand wird in 1 ml Na-phosphatpuffer, 20 mM/l, pH 7,2 aufgenommen und bei -20 °C aufbewahrt.
Ausbeute: 1 , 1 μmol entspr. ca 25 % d. Th.
UV/VIS-Spektrum (0, 1 M Phosphatpuffer, pH 7,0): Λmax655 nm
Beispiel 6: {3-[N,N-Di-{3-sulfopropyl-)amino]-7-(N-carboxyethyl-N-methyl- aminq)-phenoxazin}-[7-(3-aminopropyn-1 -yl)-7-desaza-2'- desoxy-guanosin-5'-triphosphat]
Die Verbindung wurde analog Beispiel 5 hergestellt, indem als Nukleotid 5 μmol 7-(3-Aminopropyn-1 -yl)-7-desaza-2'-desoxy-guanosin-5'-triphosphat (kommerziell erhältlich) in die Reaktion eingesetzt wurden. Die Aufarbeitung und Chromatografie erfolgte wie unter Beispiel 5 beschrieben.
Ausbeute: 0,3 μmol entspr. ca 20 % d. Th.
UV/VIS-Spektrum (0, 1 M Phosphatpuffer, pH 7,0): Λmax655 nm