-
Gebiet der
Erfindung
-
Diese
Erfindung bezieht sich auf Sequenzieren von Farbstoffterminatornucleinsäure und
Reagenzien für
ein derartiges Sequenzieren.
-
Hintergrund
der Erfindung
-
Das
Folgende ist eine Diskussion der relevanten Technik, von der keine
als Stand der Technik für
die beigefügten
Ansprüche
anerkannt wird.
-
Sequenzreaktionsprodukte
müssen
markiert werden. Dies kann ausgeführt werden unter Verwendung von
markierten Primern, markierten Nucleotiden (üblicherweise radioaktive dNTPs)
oder markierten ddNTP-Terminatoren. Die Verwendung von markierten
Terminatoren besitzt den Vorteil, dass False-Stops undetektierbar
bleiben.
-
DNA-Sequenzbänder besitzen
nicht notwendigerweise einheitliche Intensitäten. Es ist nützlich, Bandintensitäts-Variabilität numerisch
auszudrücken.
Dies kann ausgeführt
werden durch Angeben des Verhältnisses
der maximalen zur minimalen Intensität von benachbarten Bändern (innerhalb
eines Fensters von vielleicht 40 Basen), in einer DNA-Sequenz, oder
mit einer Normierung und Korrektur eines systematischen „Drifts" in der Intensität durch
Angeben des quadratischen Mittelwerts von Bandintensitäten (typischerweise Peak-Höhen) (Fuller,
C.W., Comments 16 (3):1–8,
1989). Es ist vorteilhaft, Einheitlichkeit von Bandintensitäten zu haben,
da die Sequenzgenauigkeit und Read-Length mit Bändern einer einheitlicheren
Intensität
verbessert wird.
-
Zum
genauen Lesen muss die Mobilität
eines beliebigen gegebenen Sequenzreaktionsproduktes durch das Elektrophoresegel
mit einer Geschwindigkeit wandern, die proportional nur zu seiner
Länge ist.
Produkte, die schneller oder langsamer als normal für eine gegebenen
Länge wandern,
werden zu Sequenzungenauigkeiten oder Fehlern führen, die als „Kompressionen" bekannt sind.
-
Anormale
Wanderungsgeschwindkeit kann durch Sekundärstruktur der DNA verursacht
werden und ist offenbar die Ursache für die meisten „Kompressions"-Artefakte, die in Radioaktivmarkierungs-
(und anderen) Sequenzierungsexperimenten bei GC-reichen Bereichen
gesehen werden. Diese können
oft durch die Verwendung von Analoga von dGTP, wie 7-deaza-dGTP
oder dITP aufgelöst
werden. Andere kompressionsartige Artefakte werden beobachtet, wenn
einige mit Farbstoff markierte ddNTPs für das Sequenzieren verwendet
werden. Mehrere Beispiele davon können in Lee, L.G., Connell,
C.R., Woo, S.L., Cheng, R.D., McArdle, B.F., Fuller, C.W., Halloran,
N.C., und Wilson, R.K., Nucleic Acids Res., 20:2471-2483, 1992 gesehen
werden (siehe 4g, 4h und 6h unter Verwenden von ddCTP, das mit Tetramethylbodipy
und TMR markiert ist, oder ddGTP, das mit Bifluor markiert ist).
Diese kompressionsartigen Artefakte werden erzeugt, sogar in Sequenzen,
die kompressionsfrei sind, wenn sie radioaktiv oder mit Farbstoffmarkierten
Primern sequenziert werden. Diese Artefakte können manchmal durch Substituieren
von dITP durch dGTP oder alpha-Thio-dNTPs durch normale Thio-dNTPS eliminiert
werden (Lee, L.G. et al, Nucleic Acids Res., 20-2471-2483, 1992;
US-Patent Nr. 5,187,085). Ähnliche
Artefakte, die mit den Fluoresceinfarbstoffmarkierten ddNTPs gesehen
werden, die durch Applied Biosystems für Farbstoff-Terminator-Sequenzieren mit T7 DNA-Polymerase
verkauft wird, werden durch Substituieren von alpha-Thio-dNTPs durch
normale dNTPs aufgelöst
(Lee, L.G. et al., Nucleic Acids Res., 20:2471-2483, 1992; US-Patent
5,187,085).
-
Proben,
J.M., Trainor, G.L., Dam, R.J., Hobbs, F.W., Robertson, C.W., Zagursky,
R.J., Cocuzza, A.J., Jensen, M.A. und Baumeister, K., Science 238:336-41
(1987) führten
ein Sequenzieren unter Verwenden von Terminatoren aus, die mit substituierten
Succinyl-Fluoresceinen markiert waren, mit Linkern einer Länge von 10
Atomen, zusammen mit dATP, dCTP, dTTP, 7-deaza-dGTP und AMV-Reverse-Transkriptase und
einem Fluoreszenz-detektierenden Instrument. Von 6 dieser
Veröffentlichung
ist klar, dass Gesamtbandintensitäten mehr als zehnfach variierten,
viel mehr als die besten verfügbaren
gegenwärtigen
Verfahren, mit Farbstoff-Primern oder radioaktiven Markern.
-
US-Patent
Nr. 5,558,991 (Trainor, G.I.) bezieht sich auf DNA-Sequenzieren
und auf ein Verfahren zur DNA-Sequenzanalyse unter Verwenden des
Sanger-Ketten-Terminations-Verfahrens,
wodurch der Kettenterminator einen Reporter trägt. Bevorzugte Reporter sind
Fluoreszenz-Farbstoffe, die auf dem Xanthen-Chromophor basieren.
-
Didesoxy-NTP-Terminatoren,
die dieselbe grundlegende Struktur wie die Prober-et-al-Terminatoren (1987)
besitzen, aber vier Rhodamin-Farbstoffe, die anstelle der Succinyl-Fluoresceine
verwendet werden, und Linker von 5 Atomen in der Länge besitzen,
wurden zum Sequenzieren mit Taq-Polymerase verwendet. Um diese Terminatoren
zu verwenden, wird dITP anstelle von dGTP oder 7-deaza-dGTP verwendet,
um schwerwiegende „Kompressions"-Artefakte zu eliminieren.
Dieses Verfahren wurde ausgeführt,
unter Verwenden einer klonierten Taq-DNA-Polymerase (Bergot, WO
9105060; Parker, L.T., Deng, Q., Zakeri, H., Carlson, C., Nickerson,
D.A., Kwok, P.Y., Biotechinques 19(1):116-121, 1995) und mit einem
Mutanten der Taq-Polymerase (D49G, AmpliTaq CS), dem eine 5'-3'-Exonuclease-Aktivität fehlt.
Jedoch variieren die Bandintensitäten um soviel wie das Zwanzigfache,
was die Genauigkeit und die Read-Length, die mit dem Verfahren möglich ist,
begrenzt (Parker, L.T., Deng, Q., Spurgeon, S., Kwok, P.Y., Nickerson,
D.A., Biotechniques 21(4):694-699, 1996).
-
Lee,
L.G., Connell, C.R:, Woo, S.L., Cheng, R.D., McArdle, B.F., Fuller,
C.W., Hallorand, N.D. und Wilson, R.K., Nucleic Acids Res., 20:2471,
1992) beschreiben Sequenzieren mit einem Satz von ddNTP-Terminatoren
und T7-DNA-Polymerase. Alle besitzen fluoresceinartige Farbstoffe,
die an die ddNTPs auf im wesentlichen dieselbe Weise wie die für Tag-Sequenzieren
verwendeten Rhodamin-Terminatoren gekoppelt sind. Diese werden mit
modifizierter T7-DNA-Polymerase (SequenaseTM Version
2.0) und alpha-Thio-dNTP modifiziert. Die Thio-dNTPs werden verwendet,
um „Kompressions"-Artefakte aufzulösen, wie
dITP für
die Taq-Farbstoff-Terminator-Verfahren
verwendet wird. Die Ergebnisse mit diesem System sind derart, dass
die Bänder
in der Intensität
ungefähr
um das Zehnfache variieren.
-
Wayne
Barnes hat ein Protokoll für
Farbstoff-Terminator-Sequenzieren mit FY-modifizierten Polymerasen und Mn2+ veröffentlicht
(Scientech Corp. St. Louis, MO). Die Bänder sind mit diesem Verfahren
einheitlicher und variieren ungefähr höchstens um das 4.5-fache.
-
Fluorescein-12
ddNTPs, die eine Linkerlänge
von 12 Atomen besitzen, und Biotin-11 ddNTPs, die eine Linkerlänge von
11 Atomen besitzen, sind erhältlich
(Dupont NEN, Wilmington, DE). Diese markierten ddNTPs werden als
nützlich
in Sequenzierrektionen beschrieben.
-
ABI
PRISM offenbaren Dichlorrhodamin-Farbstoffe, die an Terminatoren
durch Propargyl/Ethylenoxid/Amino („EO") -Linker mit acht Atome in der Länge zum
Sequenzieren gebunden sind (Rosenblum, B.B., Lee, L.G. Spurgeon,
S.L., Khan, S.H., Menchen, S.M., Heiner C.R. und Chen, S.M., Nucleic
Acids Res. 25(22):4500-4504,
1997).
-
Cyanin-Farbstoffe
wurden in Farbstoff-Terminatoren zum Sequenzieren genutzt (Lee et
al., Nucleic Acids Res., 20(10):2471, 1992).
-
Zusammenfassung
der Erfindung
-
Die
vorliegende Erfindung stellt neue, Didesoxy-Farbstoff-markierte
Terminatoren bereit, die in einer Anzahl von biologischen Prozessen
nützlich
sind, umfassend das Bereitstellen von einheitlichen Bandintensitäten und
die Auflösung
von Farbstoffinduzierten „Kompressions"–Artefakten beim DNA-Sequenzieren.
Die Didesoxy-Farbstoff-markierten
Terminatoren der vorliegenden Erfindung sind besonders gut für die Verwendung mit
DNA-Polymerasen geeignet, die thermostabil sind, oder die eine veränderte dNMP-Bindungsstelle
enthalten (Tabor et al., US-Patent Nr. 5,614,365). Die Verwendung
der Terminatoren der vorliegenden Erfindung zum Sequenzieren erfordert
nicht die Verwendung von Nucleotid-Analoga wie dITP oder alpha-Thio-Nucleotide, um die
durch Farbstoff induzierten „Kompressions"-Artefakte zu eliminieren.
Der Anmelder hat überraschenderweise
herausgefunden, dass es eine starke Korrelation zwischen der Länge des
Links zwischen dem Farbstoffmolekül und dem Nucleotid und der
Band-Einheitlichkeit gibt, aber eine geringe Korrelation zwischen
der Art des Farbstoffs (oder anderen Parametern) und der Band-Einheitlichkeit.
Farbstoff-Terminatoren mit Linkern von 10 oder mehr Atomen (erweitete
Linker) bis zu 25 Atomen (10, 11, 12... 25) erzeugen, wenn sie in
Sequenzier-Reaktion verwendet wurden, Bänder einer beträchtlich
verbesserten Einheitlichkeit in Sequenzer-Gelen im Vergleich zu
den Farbstoff-Terminatoren mit Linkern von weniger als 10 Atomen.
-
Die
Farbstoff-Terminatoren der vorliegenden Erfindung mit erweiterten
Linkern werden typischerweise in Gruppen von vier (ATGC) mit oder
ohne eine thermostabile DNA-Polyermase geliefert und sind besonders nützlich in
einem Verfahren der Sequenz-Analyse.
-
In
einem ersten Aspekt bietet die Erfindung ein Kit zum Sequenzieren
von DNA, umfassend ein erstes, zweites, drittes und viertes Farbstoff-Terminator-Molekül, wobei
jedes der Farbstoff-Terminator-Moleküle unterschiedlich ist und
jedes eine Verbindung der Formel (I) umfasst:
wobei A ein Cynaninfarbstoff
ist der Struktur
ist und die gekrümmten Linien
Kohlenstoffatome repräsentieren,
die für
die Formulierung von Cyaninfarbstoffen nötig sind, X und Y aus der Gruppe
ausgewählt
sind, die aus O, S und CH
3-C-CH
3 besteht,
m eine ganze Zahl ist, ausgewählt
aus der Gruppe, die aus 1, 2, 3 und 4 besteht, R
1,
R
2, R
3, R
4, R
5, R
6 und
R
7 unabhängig aus
der Gruppe ausgewählt
sind, die besteht aus H, OH, CO
2H, Sulfonsäure- oder
Sulfonatgruppen, Estern, Amiden, Ethern, Alkyl- oder Arylgruppen
und B, und ein R
1, R
2,
R
3, R
4, R
5, R
6 und R
7 für
B steht; mit der Maßgabe,
dass mindestens einer der Substituenten R
1,
R
2, R
3, R
4, R
5, R
6 oder
R
7 für
eine Sulfonsäure-
oder Sulfonatgruppe steht;
B für einen Linker von mindestens
10 Atomen in der Länge
steht, wobei die Atome aus der Gruppe ausgewählt sind, die besteht aus Kohlenstoff,
Stickstoff, Sauerstoff, substituierten Kohlenstoff und Schwefel,
und der Linker an einem Ende an A und an dem anderen Ende an C gebunden
ist;
C für
ein Didesoxynucleotid steht, das aus der Gruppe ausgewählt ist,
die besteht aus
und wobei
der Linker an das Didesoxynucleotid an Position 7 für ddA und
ddG und an Position 5 für
ddC und ddT kovalent gebunden ist und wobei R für ein Triphosphat steht; und
eine thermostabile DNA-Polymerase.
-
Mit „Linker" ist eine Kette von
mindestens 10 Atomen gemeint, die Kohlenstoff, Stickstoff und Sauerstoff
umfasst und das Farbstoffmolekül
mit dem Didesoxynucleotid verbindet. Die Kette kann auch substituierten
Kohlenstoff oder Schwefel enthalten. Die Verbindung erfolgt typischerweise
an der Einheit der aromatischen Base des Nucleotids. Die ersten
zwei Atome des Linkers, der an die Base gebunden ist, sind typischerweise
mit in einer Dreifach-Bindung verknüpft.
-
Mit „substituierten
Kohlenstoff" ist
gemeint, dass ein oder mehrere Wasserstoffe durch einen Ersatzgruppe
wie, aber nicht beschränkt,
auf Hydroxyl, Cyano, Alkoxy, Sauerstoff, Schwefel, Nitroxy, Halogen, -N(CH3)2, Amino und -SH
ersetzt sind.
-
Mit „thermostabiler
DNA-Polyermase" ist
gemeint, dass eine DNA-Poylmerase eine Halbwertszeit von weniger
als 5 Minuten bei 90°C
besitzt. Derartige Polymerasen umfassen, sind aber nicht beschränkt auf DNA-Polymerasen,
die von Thermus aquaticus, Thermus thermophilus, Thermus flavus,
Thermococcus littoralis, Pyrococcus furiosus, Thermotoga maritima,
und Thermotoga neapolitana codiert werden.
-
In
einer bevorzugten Ausführungsform
weist die thermostabile DNA-Polymerase eine veränderte dNMP-Bindungsstelle
auf, damit der Einbau von Didesoxynucleotiden relativ zu der natürlichen
Polymerase verbessert ist. Eine DNA-Polymerase mit einer veränderten
dNMP-Bindungsstelle diskriminiert nicht beträchtlich zwischen Didesoxynucleotiden
und Desoxynucleotiden. Die Chance, ein Didesoxynucleotid einzubauen, ist
annähernd
dieselbe, wie jene eines Desoxynucleotids, oder mindestens 1/10
des Wirkungsgrades eines Desoxynucleotids.
-
In
einem zweiten Aspekt bietet die Erfindung eine Verbindung der Formel
(I):
wobei A ein Cyaninfarbstoff
der Struktur
ist und die gekrümmten Linien
Kohlenstoffatome repräsentieren,
die für
die Formulierung von Cynaninfarbstoffen nötig sind, X und Y aus der Gruppe
ausgewählt
sind, die aus O, S und CH
3-C-CH
3 besteht,
m eine ganze Zahl ist, ausgewählt
aus der Gruppe, die aus 1, 2, 3 und 4 besteht, R
1,
R
2, R
3, R
4, R
5, R
6 und
R
7 unabhängig aus
der Gruppe ausgewählt
sind, die besteht aus H, OH, CO
2H, Sulfonsäure- oder
Sulfonatgruppen, Estern, Amiden, Ethern, Alkyl- oder Arylgruppen
und B, und ein R
1, R
2,
R
3, R
4, R
5, R
6 oder R
7 für
B steht; mit der Maßgabe,
dass mindestens einer der Substituenten R
1,
R
2, R
3, R
4, R
5, R
6 oder
R
7 für
eine Sulfonsäure-
oder Sulfonatgruppe steht;
B für einen Linker von mindestens
10 Atomen in der Länge
steht, wobei die Atome aus der Gruppe ausgewählt sind, die besteht aus Kohlenstoff,
Stickstoff, Sauerstoff, substituierten Kohlenstoff und Schwefel,
und der Linker an einem Ende an A und an dem anderen Ende an C gebunden
ist;
C für
ein Didesoxynucleotid steht, das aus der Gruppe ausgewählt ist,
die besteht aus
und wobei
der Linker an das Didesoxynucleotid an Position 7 für die Purine
(ddG, ddA) und an Position 5 für die
Pyrimidine (ddT, ddC) kovalent gebunden ist, und wobei r für ein Mono-
oder Triphosphat steht.
-
Der
Begriff „Sulfonsäure- oder
Sulfonatgruppen" bezieht
sich auf SO3H-Gruppen oder Salze davon.
-
Der
Begriff „Ester" bezieht sich auf
eine chemische Einheit mit der Formel -(R)n-COOR',
wobei R und R' unabhängig aus
der Gruppe ausgewählt
sind, die aus gesättigten
oder ungesättigten
Alkyl und fünf-gliedrigen
oder sechs-gliedrigen Aryl- oder
Heteroaryleinheiten besteht, und wobei n für 0 oder 1 steht.
-
Der
Begriff „Amid" bezieht sich auf
einen chemischen Substituenten der Formel -NHCOR, wobei R aus der
Gruppe ausgewählt
ist, die besteht aus Wasserstoff, Alkyl, Hydroxyl und fünf-gliedrigen
oder sechs-gliedrigen Aryl- oder Heteroaryl-Ringeinheiten, wobei der Ring gegebenenfalls
mit einem oder mehreren Substituenten substituiert ist, die unabhängig aus
der Gruppe ausgewählt
sind, die besteht aus Alkyl, Halogen, Trihalomethyl, Carboxylat,
Nitro oder Ester.
-
Der
Begriff „Ether" bezieht sich auf
eine chemische Einheit der Formel R-O-R', wobei R und R' unabhängig ausgewählt sind aus der Gruppe, die
besteht aus gesättigten
oder ungesättigten
Alkyl und fünf-gliedrigen
oder sechs-gliedrigen Aryl- oder Heteroaryleinheiten.
-
Der
Begriff „Alkyl" bezieht sich auf
einen geradkettigen oder verzweigten aliphatischen Kohlenwasserstoff.
Die Alkylgruppe steht bevorzugt für 1–10 Kohlenstoffe, bevorzugter
ein Niederalkyl von 1 bis 7 Kohlenstoffen und am meisten bevorzugt
1 bis 4 Kohlenstoffe. Typische Alkygruppen umfassen Methyl, Ethyl,
Propyl, Isopropyl, Butyl, Isobutyl, Tertiärbutyl, Pentyl, Hexyl und dergleichen.
Die Alkylgruppe kann substituiert sein und einige typische Alkylsubstituenten
umfassen Hydroxyl, Cyano, Alkoxy, Sauerstoff, Schwefel, Nitroxy,
Halogen, -N(CH3)2,
Amino und -SH.
-
Der
Begriff „Aryl" bezieht sich auf
eine aromatische Gruppe, die mindestens einen Ring besitzt, der
ein konjugiertes pi-Elektronen-System besitzt und sowohl carbozyklische
Aryl- (z.B. Phenyl) und heterozyklische Arylgruppen (z.B. Pyridin)
umfasst. Der Begriff „carbozyklisch" bezieht sich auf
eine Verbindung, die eine oder mehrere kovalent geschlossene Ringstrukturen
enthält,
und dass die Atome, die das Rückgrad
des Ringes bilden, alle Kohlenstoffatome sind. Der Begriff unterscheidet
daher carbozyklische von heterozyklischen Ringen, in denen das Ring-Rückgrad mindestens
1 Atom enthält,
das sich von Kohlenstoff unterscheidet. Der Begriff „Heteroaryl" bezieht sich auf
eine Arylgruppe, die mindestens einen heterozyklischen Ring enthält.
-
In
einer bevorzugten Ausführungsform
ist der Linker aus der Gruppe ausgewählt, die besteht aus:
-C≡C-CH2-NH-CO-(CH2)5-NH-CO-,
-C≡C-CH2-NH-CO-(CH2)9-NH-SO2-,
-C≡C-CH2-NH-CO-(CH2)10-NH-CO-,
-C≡C-CH2-NH-CO-(CH2)5-,
-C≡C-CH2-NH-CO-(CH2)5-NH-CO-(CH2)5, und
-C≡C-CH2-NH-CO-(CH2)5-NH-CO-(CH2)10-NH-CO-.
-
In
bevorzugten Ausführungsformen
sind die Didesoxy-Farbstoff-Terminatoren eine Verbindung der Formel
(II):
eine Verbindung
der Formel (III):
eine Verbindung der Formel
(IV):
eine Verbindung der Formel
(V):
-
Die
Cy5.5-ddGTP- und -ddCTP-Verbindungen besitzen einen Linker von 10
Atomen in der Länge.
Die Cy5.5-ddCTP- und -ddTTP-Verbindungen besitzen einen Linker von
17 Atomen in der Länge.
-
In
einem dritten Aspekt bietet die Erfindung eine Desoxyribonucleinsäure-Sequenz,
die die Verbindung der Formel I, II, III, IV oder V enthält.
-
In
einer bevorzugten Ausführungsform
bietet die Erfindung ein Kit zum DNA-Sequenzieren, umfassend Verbindungen
der Formel II, III, IV und V.
-
In
einer weiteren bevorzugten Ausführungsform
weist das Kit weiter eine stabile DNA-Polymerase auf; die thermostabile
DNA-Polymerase besitzt eine veränderte
dNMP-Bindungsstelle, damit der Einbau von Didesoxynucleotiden relativ
zur natürlichen
Polymerase verbessert ist.
-
Der
Anmelder hat überraschender
Weise gefunden, dass ein Parameter, der am stärksten mit der Bandeinheitlichkeit
korreliert, die Länge
des Linkers zwischen dem Farbstoff und dem ddNTP ist. Der Anmelder
fand, das durch Erweitern der Linkerlänge zwischen dem Farbstoff
und dem Nucleotid für
eine beliebige Farbstoff:ddNTP-Kombination auf mindestens 10 Atome,
die Bandeinheitlichkeit wesentlich verbessert ist und es keine durch
Farbstoff induzierte Kompressions-Artefakte gibt.
-
Daher
bietet in einem vierten Aspekt die Erfindung ein Verfahren zum Bestimmen
der Nucleotidbasen-Sequenz eines DNA-Moleküls, umfassend die Schritte
des Inkubierens eines DNA-Moleküls,
das mit einem Primer-Molekül
assoziiert wurde, das fähig
ist, an das DNA-Molekül
zu hybridisieren, in einem Gefäß, das eine
thermostabile DNA-Polymerase, einen eines Satzes von vier Farbstoff-Terminatoren
enthält,
wobei jeder der Farbstoff-Terminatoren eine Verbindung der Formel
(I) enthält:
wobei A ein Cyaninfarbstoff
der Struktur
ist und die gekrümmten Linien
Kohlenstoffatome repräsentieren,
die für
die Formulierung von Cyaninfarbstoffen nötig sind, X und Y aus der Gruppe
ausgewählt
sind, die aus O, S und CH
3-C-CH
3 besteht,
m eine ganze Zahl ist, ausgewählt
aus der Gruppe, die aus 1, 2, 3 und 4 besteht, R
1,
R
2, R
3, R
4, R
5, R
6 und
R
7 unabhängig aus
der Gruppe ausgewählt
sind, die besteht aus H, OH, CO
2H, Sulfonsäure- oder Sulfonatgruppen,
Estern, Amiden, Ethern, Alkyl- oder Arylgruppen und B, und ein R
1, R
2, R
3,
R
4, R
5, R
6 oder R
7 für B steht;
mit der Maßgabe,
dass mindestens einer der Substituenten R
1,
R
2, R
3, R
4, R
5, R
6 oder
R
7 für
eine Sulfonsäure-
oder Sulfonatgruppe steht;
B für einen Linker von mindestens
10 Atomen in der Länge
steht, wobei die Atome aus der Gruppe ausgewählt sind, die besteht aus Kohlenstoff,
Stickstoff, Sauerstoff, substituiertem Kohlenstoff und Schwefel,
und der Linker an einem Ende an A und an dem anderen Ende an C gebunden
ist;
C für
ein Didesoxynucleotid steht, das aus der Gruppe ausgewählt ist,
die besteht aus
und wobei
der Linker an das Didesoxynucleotid an Position 7 für ddA und
ddG und an Position 5 für
ddC und ddT kovalent gebunden ist und wobei R für ein Triphosphat steht; und
Auftrennen von DNA-Produkten der Inkubationsreaktion nach der Größe, wodurch
mindestens ein Teil der Nucleotidbasensequenz des DNA-Moleküls bestimmt
werden kann.
-
In
bevorzugten Ausführungsformen
ist der Farbstoff-Terminator eine Verbindung der Formel II, III,
IV oder V; die thermostabile DNA-Polymerase besitzt eine veränderte dNMP-Bindungsstelle.
-
Andere
Merkmale und Zweckmäßigkeiten
der Erfindung ergeben sich aus der folgenden Beschreibung von deren
bevorzugten Ausführungsformen
und aus den Ansprüchen.
-
Alle
Artikel, Publikationen und Patente, die in dieser Anmeldung zitiert
werden, sind hierdurch durch Bezugnahme in Ihrer Gesamtheit enthalten.
-
Kurze Beschreibung
der Figuren
-
1 präsentiert
DNA-Sequenzdaten, die unter Verwenden von M13mp18, das ein 115bp-SauAl-Fragment
von Lambda, eingefügt
an der BamHI-Stelle enthält,
und Cy5.5-ddGTP-, -ddATP-, -ddTTP-, und -ddCTP-Farbstoff-Terminatoren
erzeugt wurden.
-
2 ist
ein Diagramm der Bandintensitäts-Variabilität (rms)
vs Linkerlänge
(Atome).
-
Beschreibung
der bevorzugten Ausführungsformen
-
Die
folgenden Beispiele sind angegeben zum weiteren Veranschaulichen
verschiedener Aspekte und Ausführungsformen
der vorliegenden Erfindung und sind auf keine Weise als den Umfang
beschränkend
beabsichtigt.
-
Beispiel 1: Synthese von
Didesoxy-Farbstoff-Terminatoren – Cy5.5-Didesoxynucleosid-Triphosphate
-
Farbstoffterminatoren,
markiert mit Cy5.5, wurden aus Propargylaminodidesoxynucleotiden
hergestellt (Prober, J.M., Trainor, G.L., Dam, R.J., Hobbs, F.W.,
Robertson, C.W., Zagursky, R.J., Cocuzza, A.J., Jensen, M.A. und
Baumeister, K., Science 238:336-41 (1987); US-Patent Nr. 5,242,796,
5,306,618 und 5,332,666) und „CyDye
Fluorolink Cy5.5. Mono Reactive Dye" -Produkt PA25501 (Amersham Life Science),
um die Verbindungen II, III, IV und V zu erzeugen. Im Falle von
ddG und ddA wurde das Propargylaminonucleotid direkt mit dem N-Hydroxysuccinimidyl-Ester
des Cy5.5-Farbstoffs umgesetzt. Im Falle von ddC und ddT wurde eine längerer Linker
durch Umsetzen des Propargylaminonucleotids mit dem N-Hydroxysuccinimidyl-Ester
der N-Trifluoracetyl-6-Aminocapronsäure gefolgt von Hydrolyse in
wässrigem
Ammoniak der Trifluoracetylgruppe konstruiert. Die resultierende
Verbindung wurde dann mit dem N-Hydroxysuccinimidyl-Ester des Cy5.5-Farbstoffs
umgesetzt, um den 17-Atom-Linker zwischen dem Cy5.5-Farbstoff und
der Pyrimidinbase zu ergeben.
-
Zusätzlich zu
Cy5.5-Farbstoffen, würden
jene Fachleute wissen, wie andere Farbstoffe identifiziert und genutzt
werden, einschließlich
andere Cyaninfarbstoffe, mit den geeigneten optischen Eigenschaften.
Auch ist die Konstruktion und das Binden verschiedener Linker in
der Technik gut bekannt. Geeignete Reagenzien für die Linker-Konstruktion umfassen
eine oder mehrere Verbindungen, bestehend aus aktivierten Formen
von Amino-geschützten
Alkyl- oder Arylaminosäuren,
wie Verbindungen der Formel R-NH-(CH2)n-CO2R' oder R-NH-(CH2)nX(CH2)m-CO2R', wobei R eine säure- oder
basenlabile Schutzgruppe ist, R' ein
reaktives Ester oder eine Anhydridgruppe, X für Aryl, O, S, oder NH steht,
und wobei n und m 0–12
betragen. Andere Linker, die durch N- oder O- oder S-Alkylierung
konstruiert werden, sind auch geeignet. Die genaue Linkerlänge, von mindestens
10 Atomen, für
einen speziellen Farbstoff und die Didesoxynucleotid-Kombination
kann empirisch durch Überwachen
der Bandeinheitlichkeit beim DNA-Sequenzieren wie beschrieben bestimmt
werden (siehe Beispiel 3).
-
Beispiel 2: Farbstoff-Terminator-Cycle-Sequenzieren
-
DNA-Cycle-Sequenzieren
wurde ausgeführt
unter Verwenden von Thermo SequenaseTM-DNA-Polymerase
(Amersham, Cleveland, OH) und Cy5.5-Didesoxy-Farbstoff-Terminatoren unter Verwenden
des folgenden Cycle-Sequenzierprotokolls:
- 1.
Eine Grundmischung wurde hergestellt, die aus dem folgenden bestand: 10X-Reaktionspuffer:
150mM
Tris-HCl pH 9,5
35mM MgCl2
Polymerase:
Thermo Sequenase TM-DNA-Polymerase, 10U/μl, 0,0017U/μl, anorganische
Thermoplasma-Acidophilum-Pyrophosphatase: 20mM Tris-HCl, pH 8,5,
1mM DTT, 0,1mM EDTA, 0,5% Tween-20, 0,5% Nonidet P-40 und 50% Glycerol.
- 2. Vier Mikrozentrifugenröhrchen
wurden markiert und 2μl
Lösung
von Cy5.5-markiertem
ddG, ddA, ddT, ddC wurde in jedes Röhrchen gegeben.
25:1
ddG-Mischung, 300μM
jeweils von dGTP, dATP, dTTP & dCTP,
12uM Cy5.5-ddGTP
25:1 ddA-Mischung, 300μM jeweils von dGTP, dATP, dTTP & dCTP, 12μM Cy5.5-ddATP
25:1
ddT-Mischung, 300μM
jeweils von dGTP, dATP, dTTP & dCTP,
12μM Cy5.5-ddTTP
25:1
ddC-Mischung, 300μM
jeweils von dGTP, dATP, dTTP & dCTP,
12μM Cy5.5-ddCTP
- 3. Sechs μl
der Grundmischung (aus Schritt 1) wurde in jede der vier Röhrchen vom
oben angegebenen Schritt 2 aliquotiert. Cycling wurde wie folgt
ausgeführt:
95°C (30s),
45–55°C (30s) und
72°C (60s)
für 35 Zyklen,
dann bei 72°C
5–7 Minuten
lang inkubiert.
- 4. Ein μl
von 8M Ammoniumacetat wurde zu jedem Röhrchen gegeben. Dann wurden
27μl (annähernd dreimal
das Reaktionsvolumen) von im Kühlschrank
gekühltem
100%-igen Ethanol zugegeben. Die Mischung wurde gemischt und auf
Eis 20 Minuten lang angeordnet, um die DNA zu präzipitieren.
- 5. Die Mischung wurde dann in einer Mikrozentrifuge (~12.000
Upm) 20–30
Minuten lang entweder bei Raumtemperatur oder 4°C zentrifugiert. Der Überstand
wurde entfernt und dann wurden 200μl 70%-iger Ethanol zugegeben,
um das DNA-Pellet zu waschen.
- 6. Die Mischung wurde wieder 5 Minuten lang zentrifugiert, der Überstand
entfernt und das Pellet getrocknet (in einer Vakuum-Zentrifuge),
2–3 Minuten
lang.
- 7. Jedes Pellet wurde in 6μl
Formamide Loading Dye (Amersham, Cleveland, OH) resuspendiert, kräftig verwirbelt
(10–20s),
um sicher zu stellen, dass die gesamte DNA aufgelöst war.
Die Mischung wurde kurz zentrifugiert, um die Probe am Boden des
Röhrchens
zu sammeln.
- 8. Proben wurden auf 70°C
2–3 Minuten
lang erwärmt,
um die DNA zu denaturieren, dann auf Eis angeordnet.
- 9. Dann wurden 1,5–2μl des Volumens
auf eine Spur des Sequenziergels geladen und man lies das Gel auf dem
MICRO Gene Blaster-Instrument (VGI) laufen.
-
Die
Template-DNA war für
diese Sequenz M13mp18, die ein 115bp-Sau3Al-Fragment vom Bakteriophagen Lambda,
eingesetzt an der BamHI-Stelle, enthielt (Produkt-Nummer
US 70171 Amersham). Der Primer
ist der –40-Forward
23-mer-Universalprimer
(5'-GTTTTCCCAGTCACGACGTTGTA-3')(SEQ. ID-Nr. 1). Die
Ergebnisse sind in
1 gezeigt.
-
Beispiel 3: Korrelation
der Linkerlänge
und der Bandintensitäts-Variabilität
-
Sequenzierreaktionen
wurden wie in Beispiel 2 beschrieben mit verschiedenen Farbstoffmolekülen, die
an Didesoxynucleotiden mit Linkern verschiedener Längen gebunden
waren, ausgeführt
(siehe Tabelle 1). Die markierten DNA-Produkte wurden dann auf Denaturierungs-Polyacrylamidgelen
getrennt und die markierten Produkte wurden durch Fluoreszenz detektiert.
Die Intensität
der Bänder
wird als die Höhe
der Peaks in einem Diagramm der Fluoreszenz (in willkürlichen
Einheiten) gegen die Zeit genommen. Typischerweise können systematische
Variationen in den Peakhöhen
in Diagrammen von Peakhöhen,
die sequentiell geplottet werden, gesehen werden. Diese systematischen
Variationen in den Peakhöhen
können
durch Fitten nach der Methode der kleinsten Quadrate als eine Polynominalfunktion
zweiter Ordnung modelliert werden. Dividieren der Peakhöhe für jedes
Band durch den Wert der als Kurve gefitteten Polynominalfunktion,
ergibt eine normierte Bandintensität für jeden Peak. Die Variation
in diesen Bandintensitäten
kann als die Quadratwurzel der Varianz
![Figure 00210001](https://patentimages.storage.googleapis.com/a4/28/91/a0cbdda1900e21/00210001.png)
der normierten Peakhöhen ausgedrückt werden,
die typischerweise Werte zwischen 0 und 1 besitzt, wobei mehr Variabilität durch
höhere
Zahlen repräsentiert
ist (Fuller, C.W., Comments 16(3):1-8. 1989). Dieser Wert ist numerisch
gleich dem quadratischen Mittelwert (RMS), wenn 1,0 von den normierten
Peakhöhen
subtrahiert wird. Diese Werte sind in Tabelle 1 angegeben und in
2 graphisch
dargestellt. Die Variabilität
der Bandintensitäten
ist beträchtlich
verringert, wenn Linker von 10 oder mehr Atomen in der Länge verwendet wurden,
was zu Sequenzdaten führte,
die leichter genau zu interpretieren waren. Tabelle
1
- a Abkürzungen
für Farbstoffe:
Fl, Carboxyfluorescein; R110, Rhodamin, 110; R6G, Rhodamin 6G; ROX,
Rhodamin X; TMR, Tetramethylrhodamin; TXR, Texas Red (Molecular
Probes). Die Farbstoffe Cy3, Cy3.5, Cy5 und Cy5.5 waren von Amersham
Life Science, Cleveland, OH.
- b Die Linkerlänge ist die Anzahl von Atomen
zwischen der Ringstruktur der Nucleosidbase (A, C, G oder T) und der
Ringstruktur des Farbstoffs.
Linkerstrukturen
- c-C≡C-CH2-NH-CO
- d-C≡C-CH2-NH-SO2-
- e-C≡C-CH2-NH-CS-NH
- f-C≡C-CH2-NH-CO-(CH2)5-NH-CO-
- g-C≡C-CH2-NH-CO-(CH2)9-NH-SO2
- h-C≡C-CH2-NH-CO-(CH2)10-NH-CO
- i-C≡C-CH2-NH-CO-(CH2)5
- j-C≡C-CH2-NH-CO-(-CH2)5-NH-CO-(CH2)5-
- k-C≡C-CH2-NH-CO-(-CH2)5-NH-CO-(CH2)10-NH-CO-