-
Doppelstrangiger Vektor und ihn verwendendes Verfahren.
-
Die Sequenzanalyse von recht großen DNS-tIolekUlen ist seit der Entwicklung
der Maxam-Gilbert- und Sanger-Coulson-Methoden möglich geworden. Diese Methoden
beruhen auf drei Hauptprinzipien: (1) Die Verwendung eines markierten Nucleosidtriphosphats
in vitro zur radioaktiven Markierung des Polynucleotids an seinen 5'- oder 3'-Enden
oder dazwischen; (2) Die Anwendung einer synthetisierenden oder abbauenden Technik
auf das zu sequenzierende Polynucleotid zur Bildung von vier oder mehr Gruppen von
Fragmenten mit einem fixierten gemeinsamen Ende; (3) Die Anwendung einer denaturierenden
Polyacrylamidgelelektrophorese, um innerhalb der Gruppen Moleküle entsprechend ihrer
Länge zu sortieren und abzubilden.
-
Die Nucleotidsequenz kann danach durch gegenseitigen Vergleich der
verschiedenen Fraktionierungsmuster der vier Gruppen als Ergebnis einer Autoradiographie
des Polyacrylamidgels gelesen werdefl.Jede individuelle Analyse kann die Sequenz
eines DNS-Segments von 200 bis 500 Nucleotiden liefern. Diese individuellen Segmente
werden danach durch Untersuchung überlappender Strecken bzw. Bereiche klassiert.
-
Eine Sequenzanalyse in großem Maßstab hängt in erster Linie von der
Leichtigkeit der herstellung der Fragmente ab, die in geeigneter Form vor den basenspezifischen
Reaktionen analysiert werden. Bei der Sanger-Coulson-Methode ist dieses Problem
in glänzender Weise dadurch gelost worden, indem man statistische DNS-Fragmente
in sich von Dakteriophagen M13 ableitenden Vektoren an einer Insertionsstelle in
Nachbarschaft zu einer fUr den Vektor spezifischen Sequenz subkloniert, von der
Sequenzierungsreationen ausgehen (Primerinitiierte Reparatursynthesen in Gegenwart
von Dideoxytriphosphaten). Die einstrangige DNS-Matritze kann durcheinfache Manipulationen
isoliert wen.
-
Demgegenüber erfordert die Maxam-Gilbert-Methode ein oder mehrere
Gelabtrennungsstuffen und fragmentspezifische enzymatische Reaktionen zur pinftShrung
und Abtrennung der radioaktiven Markierung. Daher hängt die Strategie oft von einer
bereits vorliegenden Restriktionsspaltstellenübersicht ab, um die Anzahl der einzelnen
Analysen zu reduzieren.
-
Es sind Plasmidsubklonierungsstrategien ähnlich dem M13-System in
verschiedenen Laboratorien entwickelt worden. Sie zielen auf die Verwendung einer
chemischen Degradationssequenzierung einzelner rekombinanter Subklone eines DNS-Moleküls
ab, das sequenziert werden soll. Das Grundmerkmal dieser Sequenzierungsvektore besteht
darin, daß zwei Restriktionsspaltungsstellen in Nachbarschaft zur Subklonierungsstelle
vorliegen (Insertionsstelle). Die Stelle in größerer Nachbarschaft zur Einfügung
dient für die Markierungsreaktion, während die andere Stelle eine Trennung der Markierung
erlaubt. So werden zwei markierte Fragmente gebildet. Das kleinere Fragment wird
nicht entfernt und verursacht eine nicht lesbare Sequenz im unteren Bereich des
Sequenzierungsgels. Dieser Verlust an Sequenzinformation betragt weniger als 30
Nucleotide bei allen Verfahren, die bisher bekannt geworden sind. Alle diese Verfahren
umfassen noc mindestens zwei Restriktionen und eine Markierungsreaktion.
-
Aufgabe der Erfindung ist es, zu sequenzierende Fremd-DNS oder Fragmente
von zu sequenzierender Fremd-DNS in einen doppelstrangigen Vektor einzubauen, der
auf einfache Weise einzelmarkiert werden kann. Es soll also nur ein Strang des Vektors
markiert werden.
-
Erfindungsgemäß wird dazu ein doppelstrangiger Vektor mit - einer
im Vektor nur einmal vorkommenden Insertionsstelle (a) fUr Fremd-DNS und - einer
im Vektor nur einmal vorkommenden Markierungsstelle (b) vorgesehen, die einzelmarkiert
werden kann. Vorzugsweise handelt es sich um eine Markirungsstelle des folgenden
Typs:
(i) - X 3 YX+ -- X+Y+ 5'X - oder - X 3' YZ -- X+ Y+ 5' Z+
- oder (ii) - X M Z 3' N+X+ -- X+M+5' Z+N X - oder -XM Z3' N+Y -- X+M+5, Z+N Y+
- oder (iii) - X M 3' N X+ -- X+M+5' N+X - oder - M X 3' X+N -- M+X+5, X N+ - oder
- X M N Y+ -- X+M+5, N+Y - oder - M X 3' Y+N -- M+X+5' Y N+ -wobei
M
und N jeweils eine einzige Base aus der Gruppe Adenosin, Cytidin, Guanosin und Tymidin
darstellen, M+ und N+ die zu M und N komplementären Basen darstellen, M nicht gleich
N ist, X, Y und Z jeweils ein oder mehrere Basen aus der Gruppe Adenosin, Cytidin'
Guanosin und Tymidin bedeuten, X+, Y+ und die zu X, Y und Z komplementären Basen
bedeuten, die durch X, Y und Z wiedergegebenen Basen bzw. Basenkombinationen untereinander
nicht identisch sind und für Typ (i) Y nicht gleich Y+ist.
-
Bei dem doppelstrangigen Vektor handelt es sich um klonierbare ringförmige
DNS.
-
Vorzugsweise liegen die Insertionsstelle (a) und die ;tarkierungsstelle
(b) unmittelbar nebeneinander oder bis zu 1000, vorzugsweise bis zu 100 und insbesondere
bis zu 10 Basenpaare auseinander. Bei der Insertionsstelle (a) kann es sich um eine
solche zum Einsetzen von Fremd-DNS mit vorstehenden Enden (protruding ends) oder
stumpfen Enden (blunt ends) handeln.
-
Zur Sequenzierung von Fremd-DNS geht man nun so vor, daß man - zu
sequenzierende Fremd-DNS in die Insertionsstelle (a) des Vektors einbaut, - den
gebildeten Hybridvektor kloniert, - die Markierungsstelle (b) des klonierten Hybridvektors
schneidet, - die gebildeten Enden des geöffneten Hybridvektors in Gegenwart von
DNS-Polymerase und eines oder mehrerer der Triphosphate dGTP, dTTP, dCTP und dATP
ergänzt, wobei eines bzw. das eine der Triphosphate (beispielsweise radioaktiv)
markiert ist, und dadurch den Hybridvektor einzelmarkiert und - den markierten geöffneten
Hybridvektor in an sich bekannter Weise basenspezifisch abbaut und die Abbauprodukte
in an sich bekannter Weise analysiert.
-
Natürlich kann man in das erfindungsgemäße Verfahren als Fremd-DNS
sich Uberlappende DNS-Fragmente einsetzen, die man durch statistisches Zerkleinern
eines größeren DNS-Mol;eküls gewonnen hat.
-
Im erfindungsgemäßen Vektor erfUllt die Insertionsstelle (a) eine
andere Funktion als die Markierungsstelle (b).
-
Während die Insertionsstelle (a) zu sequenzierende Fremd-DNS aufnehmen
soll, soll die Markierungsstelle (b) dazu dienen, den geöffneten Hybridvektor einzelzumarkieren.
-
Die erfindungsgemäße Einzelmarkierung des Hybridvektors wird durch
das folgende Beispiel schematisch näher erläutert.
-
Markierungsstelle
- TCAAA - Schneiden - T TTCAAA - |
- AAAGT T - - AAAGTT T - |
Ergänzung mit dGTP, dCTP, dATP - T TTCAAA - |
> - AAAGTT T - |
Ergänzung mit dGTP, dTTP, dCTP - TTTC TTCAAA - |
> - AAAGTT GTTT - |
Ergänzung mit dGTP, dTTP, dCTP TTTC TTCAAA - |
F |
- AAAGTT GTTT - |
Ergänzung mit dGTP, dTTP, dATP - TTT TTCAAA - |
- AAAGTT AAGTTT - |
Ergänzung mit dTTP, dCTP, dATP - TTTCAA TTCAAA - |
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ - AAAGTT TTT - |
Anmerkungen: G = Guanosin, T = Tymidin, C = Cytidin, A = Adenosin;
* = Markierung Aus dem gewählten Beispiel ergibt sich, daß der Fachmann aufgrund
der ihm bekannten Art der Markierungsstelle vorhersehen kann, mit welchem markierten
Triphosphat bzw. mit welcher Kombination von Triphosphaten und mit welchem innerhalb
der Kombination markierten Triphosphat er bei der gegebenen Markierungsstelle eine
Einzelmarkierung erzielen kann. Im gewählten Fall ist das mit den Triphosphatmischungen
dGTP, * * dTTP und dC TP oder dG TP, dTTP und dCTP der Fall.
-
Gemäß einer weiteren Ausführungsform der Erfindung wird ein doppelstrangiger
Vektor mit - einer im Vektor nur einmal vorkommenden Insertionsstelle (a) fUr Fremd-DNS,
- einer im Vektor nur einmal vorkommenden einzelmarkierbaren Markierungsstelle (b)
beispielsweise des vorstehend angegebenen Typs (i), (ii) oder (iii) und - einer
zusätzlichen im Vektor nur einmal vorkommenden Insertionsstelle (c) für Fremd-DNS
vorgesehen, wobei die eine der beiden Insertionsstellen (a) und (c) beim Schneiden
vorstehende Enden und die andere Insertionsstelle stumpfe Enden liefert.
-
Vorzugsweise liegen die beiden Insertionsstellen (a) und (c) auf derselben
Seite der Markierungsstelle (b) in deren Nachbarschaft. Die Insertionsstellen (a)
und (c) liegen vorzugsweise unmittelbar nebeneinander oder bis zu 1000, vorzugsweise
bis zu 100 und insbesondere bis zu 10 Basenpaare auseinander.
-
Ein Beispiel fUr einen derartigen Vektor stellt pCSV03 dar, der nachstehend
noch näher erläutert wird.
-
Bei dieser Ausführungsform der Erfindung geht man zur Sequenzierung
von Fremd-DNS so vor, daß man - beide Enden der zu sequenzierenden Fremd-DNS mit
einer Insertionsstelle versieht, die einer der beiden Insertionsstellen (a) oder
(c) des Vektors entspricht, - die derart ausgebildete Fremd-DNS unter Bildung von
Fragmenten zerkleinert, die gegen das beim Schneiden der Insertionsstellen (a) und
(c) des Vektors anfallende DNS-Fragment ausgetauscht werden können, - die Fremd-DNS
gegen das zwischen den beiden Insertionsstellen (a) und (c) des Vektors herausgeschnittene
DNS-Fragment austauscht, - den gebildeten Hybridvektor kloniert, - die Markierungsstelle
(b) des klonierten Hybridvektors schneidet, - die gebildeten Enden des geöffneten
Hybridvektors in Gegenwart von DNS-Polymerase und eines oder mehrerer der Triphosphate
dGTP, dTTP, dCTP und dATP ergänzt, wobei eines bzw. das eine der Triphosphate (beispielsweise
radioaktiv) markiert ist, und den Hybridvektor einzelmarkiert und - den markierten
geöffneten Hybridvektor in an sich bekannter Weise basenspezifisch abbaut und die
Abbauprodukte in an sich bekannter Weise analysiert.
-
Die Maßnahme, beide Enden der zu sequenzierenden Fremd-DNS mit einer
Insertionsstelle zu versehen, die einer Insertionsstelle (a) oder (c) (vorzugsweise
für vorstehende Enden) des Vektors entspricht, kann man auch so ausdrücken, daß
man die beiden Enden der zu sequenzierenden Fremd-DNS mit einem Linker versieht.
-
Gemäß einer weiteren Ausführungsform der Erfindung wird ein doppelstrangiger
Vektor mit - einer im Vektor nur einmal vorkommenden Insertionsstelle (a) für Fremd-DNS,
-
einer im Vektor nur einmal vorkommenden einzelmarkierbaren Markierungsstelle (b)
beispielsweise des vorstehend angegebenen Typs (i), (ii) oder (iii) und - einer
zusätzlichen im Vektor nur einmal vorkommenden Markierungsstelle vom Typ der ersten
Markierungsstelle (b) vorgesehen.
-
Vorzugsweise flankieren die beiden Markierungsstellen (b) und (d)
die Insertionsstelle (a) und sind in ihrer Nachbarschaft angeordnet. Vorzugsweise
liegen die beiden Markierungsstellen (b) und (d) unmittelbar neben der Insertionsstelle
(a) oder bis zu 1000, vorzugsweise bis zu 100 und insbesondere bis zu 10 Basenpaare
von ihr entfernt.
-
Wie bereits gesagt, sollen beide Markierungsstellen (b) und (d) nur
einmal im Vektor vorkommen. Es ist jedoch vorteilhaft, wenn sie von demselben Restriktionsenzym
geschnitten werden können. Bei der Insertionsstelle (a) kann es sich um eine solche
zum Einsetzen von Fremd-DNS mit vorstehenden Enden oder stumpfen Enden handeln.
-
Zur Sequenzierung von Fremd-DNS mit einem Vektor dieser Ausführungsform
geht man nun so vor, daß man - zu sequenzierende Fremd-DNS in die Insertionsstelle
(a) des Vektors einbaut, - den gebildeten Hybridvektor kloniert, - die beiden Markierungsstellen
(b) und (d) des klonierten Hybridvektors schneidet, - die beiden Enden des Schnittfragmentes
mit der eingebauten Fremd-DNS in Gegenwart von DNS-Polymerase und eines oder mehrerer
der Triphosphate dGTP, dTTP, dCTP und dATP ergänzt, wobei eines bzw. das eine der
Triphosphate markiert ist, und einmal nur das eine Ende des Schnittfragmentes und
einmal nur dessen anderes Ende einzelmarkiert und
- das markierte
Schnittfragment in an sich bekannter Weise basenspezifisch abbaut und die Abbauprodukte
in an sich bekannter Weise analysiert.
-
Die erfindungsgemäße Einzelmarkierung des Schnittfragmentes mit der
eingebauten Fremd-DNS wird durch das folgende Beispiel schematisch näher erläutert.
-
GCGAC - Fremd-DNS - GTCG GCTG - - CAGCT Ergänzung mit
* * |
dATP, dGTP GCGAC - Fremd-DNS - GTCGA |
# |
GCTG - - CAGCT |
Ergänzung mit |
dCTP, dGTP GCGAC - Fremd-DNS- GTCG |
CGCTG - - CAGCT |
Aus dem gewählten Beispiel ergibt sich, daß der Fachmann aufgrund der ihm bekannten
Art der Markierungsstellen (b) und (d) vorhersehen kann, mit welchem markierten
Triphosphat bzw. mit welcher Kombination von Triphosphaten und mit welchem innerhalb
der Kombination markierten Triphosphat er bei einer der beiden Markierungsstellen
eine Einzelmarkierung erzielen kann. Das Beispiel zeigt, daß man entweder die eine
oder die andere Markierungsstelle einzelmarkieren kann. Dementsprechend kann man
bei dieser Ausführungsform der Erfindung beide Stränge der Fremd-DNS sequenzieren.
Dabei kann man die beiden Stränge vollständig sequenzieren, wodurch man die Sicherheit
der Sequenzanalyse erhöhen kann. Man kann jedoch die beiden Stränge auch nur bis
zu einem ihnen gemeinsamen Uberlappungsbereich sequenzieren; dieses Vorgehen ist
besonders bei der Sequenzierung von sehr langen Fremd-DNS-Strängen vorteilhaft.
-
Zur Herstellung der erfindungsgemäßen Vektoren muß der Fachmann DNS-Moleküle
sequenzieren, schneiden und verknüpfen können. Auf die dem Fachmann zur Verfügung
stehenden Sequenzierungsmethoden wurde bereits einleitend eingegangen. Zum Schneiden
und Verknüpfen von DNS-MolekUlen sei auf das deutsche Patent P 28 14 039.8 und die
darin zitierte Literatur hingewiesen. Sowohl die Insertionsstellen (a) und (c) als
auch die Markierungsstellen (b) und (d) der erfindungsgemäßen Vektoren können durch
Restriktionsendonukleasen bzw. Restriktionsenzyme geschnitten werden. Der Fachmann
ist auch mit dem statistischen Zerkleinern größerer DNS-Moleküle zu kleineren Fragmenten
vertraut, der physikalisch (z.B. mit Ultraschall) oder chemisch (z.B. enzymatisch)
erfolgen kann.
-
Erfindungsgemäß wird also eine Reihe neuer Sequenzierungsvektoren
vorgesehen, die die Anzahl der Herstellungsstufen vor den basenspezifischen Abbaureaktionen
auf eine einzige Restriktion und eine Auffüll-Markierungsreaktion vereinfachen.
Nach dieser Methode wird kein überlappender unlesbarer Bereich gebildet. Ferner
führt das erfindungsgemäße Subklonierungsprotokoll praktisch zu keinen Hintergrund-
oder Untergrundklonen. Ein Prototyp für geeignete Sequenzierungsplasmide wird nachstehend
näher erläutert und mit pCSV03 bezeichnet.
-
Herstellung von pCSV03 pGV001 ist ein 1882bp-Derivat von pBR327; es
wird durch Spalten von pBR327 mit HindIII und AvaI, Auffüllen der vorstehenden Enden
und Selbstverknüpfung der stumpfen Enden gebildet. pGV001 trägt einen Replikationsursprung
und das ß-Laktamasegen. Die Einzel-EcoRI-, -ClaI- und -HindIII-Stellen liegen hinter
diesen Bereichen. pCSV03 wurde durch Einführen eines chemisch synthetisierten DNS-Fragments
(10 bp ds) in die aufgefüllte ClaI-Stelle von pGV001 gebildet.
-
ClaI pCSV03 enthält Einzelspaltstellen für EcoRI, SmaI, EcaI (= BstEII)
und HindIII.
-
Eine Spaltung mit EcaI (= BstEII) liefert ein linearisiertes Vektormolehül
mit zwei unterschiedlichen vorstehenden 5'-Enden.
-
3' 5' #C C C G G P G T C A C C# #G G G C C C A G T G P G# 5' 3'
Eine
Auffüllreaktion in Gegenwart von dGTP, dTTP und alpha32P-dCTP markiert nur das linke
Ende. Da dATP in der Reaktionsmischung fehlt, kann das rechte Ende nicht markiert
werden.
-
pCSV03 zeigt für eine Subklonierungs-Sequenzierung folgende Merkmale:
(1) Eine EcaI- bzw. BstEII-Spaltstelle, die mit einer einzigen Auffüllreaktion einzelmarkiert
werden kann.
-
(2) Eine SmaI-Spaltstelle, die die EcaI-Stelle überlappt. SmaI kann
als Insertionsstelle mit stumpfem Ende verwendet werden. Jedes Fragment'das an dieser
Stelle eingeführt wird, grenzt an EcaI an, so daß es leicht auf dieser Seite einzelmarkiert
werden kann.
-
(3) EcoRI-Stelle 23bp entfernt von SmaI-Stelle, enXgegengesetzt zu
EcaI.
-
Der Vektor kann zweifach mit EcoRI und SmaI gespalten und für orientierendes
Subklonieren von nach Größe fraktionierten DNS-Fragmenten verwendet werden und ein
progressives Sequenzieren ermöglichen; vgl. wie folgt.
-
(4) Ein kleiner (1894bp) phosphatasebehandelter und mit SmaI-linearisierter
Vektor kann leicht präparativ auf einem niedrigschmelzenden Agarosegel (2 °h) gereinigt
werden. Ein auf diese Weise gereinigter Vektor liefert weniger als 1 % Untergrundklone-
infolge Eigenverkntipfung.
-
(5) Die Transformationsselektion beruht auf dem Ampicillinresistenzgen.
-
Subklonieren in pCSV03 Statistisches Subklonieren (Shotgun-Subklonieren):
Fragmente mit stumpfem Ende aus Restriktionen,
mit DNase oder beschallte DMS.
-
Mit SmaI gespaltener dephosphorylierter Vektor.
-
Lizationsreaktion Transformation.
-
Orientiertes Subklonieren: Verknüpfen von EcoRI-Linkern mit dem zu
sequenzierenden DNS-Molekül Beschallen von DNS oder Behandeln mit DNase Spalten
mit EcoRI Fraktionieren auf einem niedrigschmelzenden Agarosegel (2 %) Verknüpfen
von Größenfraktionen mit einem mit EcoRI-SmaI behandelten pCSV03 Transformieren
einzelner Fraktionen.
-
Nur Fragmente mit einem ursprünglichen Ende können mit dem Vektor
verknüpft werden, da sie allein ein klebriges EcoRI-Ende an einer Seite tragen.
Die entzegengesetzte Seite (das stumpfe Ende) grenzt an EcaI an. Daher bilden verschiedene
Gelfraktionen eine Gruppe überlappender Sequenzen.
-
EcoRI Ec Ursprüngliches DNS-Fragment In Rekombinationssubklonen enthaltenes
Fragment
Dicke Pfeile geben nacheinander sequenzierte Segmente wieder.
-
Anmerkung: Ein DNS-MolekUl, das ein oder mehrere EcoRI-Stellen enthält,
kann ohne Zugabe von EcoRI-Linkern verwendet werden.
-
Das Molekül wird vor seiner Beschallung zirkularisiert. Eine EcoRI-Spaltung
muß der Beschallung folgen.
-
Sequenzieren von Rekombinationssubklonen von pCSV03 1. Man picke Kolonien
heraus und lasse über Nacht 1-ml-Kulturen wachsen.
-
2. Man zentrifugiere die Zellen, lysiere (z.B. gemäß der Erhitzungsarbeitsweise
von Quigley und Holmes) und kläre.
-
3. Man fälle die Rekombinations-DNSen.
-
4. Man spalte mit BstEII, einem im Handel erhältlichen Enzym.
-
5. Man fülle mit Klenow-Polymerase und dGTP, dTTP und alpha32P-dCTP
auf.
-
6. Man zentrifugiere rasch durch Sephadex G50 (1 ml).
-
7. Man leite chemische Abbaureaktionen ein.
-
erstellun von oCSV31 Zur Herstellung von pCSV31 wird oCSV03 mit dem
Restriktionsenzym SrnaI geschnitten. In die Schnittstelle wird ein chemischsynthetisiertes
doppelstrangiges DNS-Fragment (20 bp) folgender Sequenz eingesetzt: TGACTAAGTCGACTCAGTCA
ACTGATTCAGCTGASTCAGT Die beiden Markierungsstellen (b) und (d) unterscheiden sich
durch unterschiedliche überstehende Enden. pCSV31 ist also durch folgende Merkmale
gekennzeichnet: (1) eine SalI-Spaltstelle als erste Insertionsstelle (a).
-
(2) Eine Tth111I-Spaltstelle als Markierungsstelle (b).
-
(3) Eine Tthl11I-Spaltstelle als Markierungsstelle (d), (4) wobei
sich (b) und (d) in ihrer Sequenz unterscheiden.
-
(5) Eine EcoRI-Spaltstelle als Insertionsstelle (c).
-
(6) Das Ampicillinresistenzqen.
-
(7) Eine Länge von weniger als 2.000 Basenpaaren.
-
pBR327 hinterlegt am 22 April 1983 als DSM 2629; Gene, 9 (1980) 287-305
bP Basenpaar(e) ds doppelstrdngig dGTP Desoxyguanosintriphosphat dTTP Desoxytymidintriphosphat
dCTP Desoxycytidintriphosphat dATP Desoxyadenosintriphosphat Im ganzen Text soll
der Ausdruck "Base" für A (Adenosin), C (Cytidin), G (Guanosin) und T (Thymidin)
heißen: "Nukleosid".