-
Diese
Anmeldung ist eine Teilanmeldung der Europäischen Anmeldung Nr. 90904029.7,
die hierin als die Stammanmeldung bezeichnet wird.
-
Das
Gebiet dieser Erfindung ist die In-vitro-Amplifikation von Nucleinsäuren. Insbesondere
betrifft diese Erfindung neue Verfahren zum Klonieren und Replizieren
von Nucleinsäuren
im Laufe des Sequenzierens und physischen Kartierens. Die Erfindung
betrifft auch wirksame Verfahren zum physischen Kartieren von hochkomplexen
und langen Genomen.
-
Die
Fähigkeit,
genomische DNA zu kartieren und zu sequenzieren, hat wichtige Anwendungsbereiche auf
dem Gebiet biologischer und medizinischer Wissenschaften. Die Lokalisierung
von menschlichen Genen, die für
seltene Erkrankungen verantwortlich sind, ist ein wichtiger Ausgangspunkt
für Genisolation
und Genklonierung sowie die Identifikation relevanter Genprodukte
und -mutationen, was schließlich
zu einem besseren Verständnis
der molekularen Basis einer Erkrankung führt. Durch Identifizieren der
Gene oder Regionen menschlicher chromosomaler DNA, die in genetisch
vererbliche Formen von Krebs, Alzheimer-Krankheit und anderen Erkrankungen
eingebunden sind, können
neue Diagnose- und Behandlungsverfahren entwickelt werden.
-
Kartieren
eines Genoms bezieht sich auf das genaue Festlegen der Anordnung
von Genen und anderen Eigenschaften von Interesse an bestimmten
Chromosomen. Sequenzieren bezieht sich auf das Bestimmen der Anordnung
von Nucleotiden auf den Chromosomen. Die zwei Hauptarten an Genomkarten
sind Karten genetischer Bindung und physische Karten. Genetische
Bindungskarten werden im Allgemeinen durch Untersuchen der Häufigkeit,
mit der zwei verschiedene Züge
gemeinsam vererbt werden oder aneinander gebunden sind, erstellt.
Physische Karten werden hauptsächlich
von chemischen Messungen abgeleitet, die an DNA-Molekülen angestellt
werden, die das Genom umfassen. Demgemäß können physische Karten mehrere verschiedene
Arten aufweisen und umfassen Restriktionskarten sowie Karten mit
geringerer Auflösung,
die durch In-situ-Hybridisierung erhalten werden. Alle diese Karten
teilen ein gemeinsames Ziel: Informationen über Gene gemäß ihren
relativen Positionen entlang eines Chromosoms in eine systematische
lineare Anordnung zu bringen.
-
Restriktionskarten
basieren auf Stellen in DNA, die durch spezielle, als Restriktionsenzyme
bezeichnete Proteine geschnitten werden. Jedes Enzym erkennt eine
spezifische kurze Sequenz von Nucleotiden, bezeichnet als "Erkennungssequenz", und schneidet jeden
Strang der DNA an einem bestimmten Punkt, der als "Spaltungsstelle" oder "Restriktionsstelle" bezeichnet wird
und innerhalb der Erkrennungssequenz oder in einem bestimmten Abstand
von ihr entfernt liegt. Da zahlreiche verschiedene Nucleotidsequenzen
durch das eine oder andere Restriktionsenzym erkannt werden und
diese Sequenzen im Allgemeinen nach dem Zufallsprinzip über ein
Genom verstreut sind, kann durch präzises Bestimmen der relativen
Anordnungen verschiedener Restriktionsstellen eine physische Karte
konstruiert werden.
-
Das
Genom der Bakterie E. coli umfasst etwa 4,7 Millionen Basenpaare.
Das kleinste menschliche Chromosom weist die zehnfache Größe auf,
wobei das komplette (haploide) menschliche Genom etwa 3 Milliarden
Basenpaare umfasst. Aufgrund der großen Größe der meisten Genome sind
die Restriktionsenzyme, die zum Restriktionskartieren von besonders
großem
Wert sind, jene, die Erkennungsstellen aufweisen, die relativ selten
auftreten oder die sonst über
das Genom hinweg durch große
Abstände
voneinander getrennt sind, sodass das Genom in relativ große DNA-Fragmente geschnitten
werden kann, die vorzugsweise 100.000 bis 2 Millionen oder mehr
Basenpaare lang sind. Die Fragmente von DNA, die bei Verdau eines
DNA-Substrats mit
einem Restriktionsenzym produziert werden, werden als "Restriktionsfragmente" bezeichnet. Im Allgemeinen
ist es umso leichter, sie korrekt in einer physischen Karte zu ordnen,
je geringer die Anzahl an gebildeten genomischen Restriktionsfragmenten
ist.
-
Das
größte Genom,
das mit Restriktionsenzymen kartiert wurde, die DNA wenig häufig spaltet,
ist das einzige Chromosom von E. coli. Smith et al., Science 236,
1448–1453
(1987). Der in diesem Fall verwendete Ansatz war, intakte chromosomale
E.-coli-DNA mit
dem Restriktionsenzym Notl zu verdauen, das innerhalb einer acht
Nuc leotide langen Erkennungssequenz schneidet, wodurch DNA-Fragmente
im Bereich von 15.000 Basenpaaren bis zu 1 Million Basenpaaren produziert
wurden. Der Großteil
der erforderlichen Information, um die DNA-Restriktionsfragmente
zu ordnen, stammte aus Hybridisierungsstudien unter Verwendung von
markierten Sonden, die E.-coli-Genen entsprachen, welche davor kloniert
und charakterisiert worden waren.
-
Somit
bindet der erste Schritt hin zum Konstruieren einer physischen Karte
eines Genoms im Allgemeinen das Isolieren und Klonieren einzelner
genomischer DNA-Fragmente
ein. Theoretisch ermöglichen empfindliche
DNA-Sonden-Technologien, physische Karten zu erstellen und dabei
nur einen geringen Bruchteil des Genoms, das kartiert wird, zu klonieren.
In der Praxis ist solch ein Ansatz jedoch nur für die gröbsten Ausführungen physischen Kartierens
geeignet. Bei höheren
Auflösungen
wird physisches Kartieren meistens durch Analysieren einer Sammlung
sich überlappender
DNA-Klone durchgeführt,
die das gesamte Genom abdecken. Physisches Kartieren würde das
Ordnen der einzelnen DNA-Klone gemäß ihren Positionen im ursprünglichen
Genom einbinden. Die einzelnen Klone sind besonders nützlich,
da sie eine unerschöpfliche Quelle
der DNA aus jeder genomischen Region bereitstellen. Dass man eine
Sammlung an genomischen DNA-Klonen zur Verfügung hat, ist auch eine grundlegende
Bedingung, um die Nucleotidsequenz des Genoms zu bestimmen, da die
Klone die tatsächlichen
DNA-Fragmente bereitstellen, die gereinigt und zum Sequenzieren
vorbereitet werden.
-
Die
prinzipielle Einschränkung
bei der Konstruktion einer hoch aufgelösten physischen Karte eines Genoms
aus einer geordneten Sammlung von DNA-Klonen ist der zentrale Fehler
vorhandener Verfahren zur Bereitstellung eines Mittels zum Klonieren
sehr großer
DNA-Fragmente. Bei der Verwendung von herkömmlichen DNA-Rekombinationsverfahren
liegt beispielsweise die Größe des größten DNA-Fragments, das durch Klonieren
in einer bakteriellen Wirtszelle vermehrt werden kann, bei etwa
50.000 Basenpaaren oder weniger. Dieses Resultat wird typischerweise
durch Spleißen
des DNA-Fragments in ein Cosmid erreicht, d.h. in einen modifizierten
Bakteriophagen-λ-Vektor,
der spezifisch entworfen ist, um DNA-Inserts im Bereich von 40.000
bis 50.000 Basenpaaren Länge
zu beherbergen.
-
Es
gibt zwei wesentliche Nachteile an diesem Cosmid-Kloniersystem zur
Erstellung einer physischen Karte eines Genoms. Erstens müssen sehr
viele Cosmidklone konstruiert werden, um ein vollständiges Set von
sich gegenseitig überlappenden
DNA-Fragmenten des
gesamten Genoms zu bilden. Im Fall des haploiden menschlichen Genoms
beispielsweise wurde geschätzt,
dass für
eine hoch auflösende
physische Karte zwischen 75.000 und 375.000 verschiedener Cosmidklone
erforderlich sein würden.
Pines, "Mapping
the Human" (Howard
Hughes Medical Institute, Bethesda, MD (1987)). Zweitens sind Cosmidklone
dafür bekannt,
dass sie häufig
Deletionen akkumulieren, was möglicherweise
von der Selektion einer kürzeren
Größe zur rascheren Replikation
und/oder von Unausgeglichenheiten im Metabolismus, verursacht durch
die gesteigerte Dosierung eines bestimmten Gens am Cosmid, das das
Wachstum der bakteriellen Wirtszellen beeinflusst, herrührt. Daher
sind Cosmidklone, insbesondere jene, die wesentliche Gene enthalten, üblicherweise
schwierig zu erhalten.
-
Erst
jüngst
wurde ein Verfahren zum Klonieren großer Fragmente exogener DNA
in Hefe mittels künstlicher
Chromosomenvektoren beschrieben. Burke et al., Science 236, 806–812 (1987).
Die Verwendung dieses "künstliche
Hefechromosom"-
(YAC, yeast artificial chromosome) Kloniersystems bietet darin einen
signifikanten Vorteil gegenüber
dem Cosmid-Kloniersystem, nämlich
dass genomische DNA-Fragmente, die im Bereich bis zu mehreren hunderttausend
Basenpaaren liegen, erfolgreich vermehrt werden können. Es
gibt jedoch für
die Verwendung des YAC-Kloniersystems
einige Einschränkungen,
insbesondere dann, wenn es zur Genomkartierung eingesetzt wird.
Beispielsweise sind bei YAC-Klonieren sowohl die Anzahl an klonierten
Molekülen
pro Hefezelle als auch die Anzahl an Hefezellen pro Kolonie sehr
viel geringer als bei Cosmid-Klonieren in Bakterien, wodurch die
Mengen an klonierter DNA, die dann zur Analyse vorhanden ist, eingeschränkt werden.
Darüber
hinaus können,
wie auch bei jedem In-vivo-Klonierverfahren, die in YAC-Vektoren
klonierten DNA-Fragmente Neuanordnungen oder Deletionen in der Wirtszelle
erfahren, die es schwierig machen können, eine Serie an Klonen
zu erhalten, die das gesamte Genom darstellen.
-
Ein
Ziel der vorliegenden Erfindung ist daher, ein Verfahren zum wirksamen
Klonieren großer
Fragmente genomischer DNA bereitzustellen, das die Probleme umgeht,
die die bestehenden In-vivo-Klonierverfahren mit sich bringen. Ein
weiteres Ziel der vorliegenden Erfindung ist, ein Verfahren zur
Amplifikation einer erwünschten
Nucleinsäuresequenz,
wie z.B. jener, die in einem klonierten genomischen DNA-Fragment vorhanden
ist, bereitzustellen und dadurch ausreichende Mengen an Sequenz
zur physikalischen oder chemischen Analyse herzustellen. Die Möglichkeit,
dieses Verfahren in vitro durchzuführen, macht es im Allgemeinen
zum Amplifizieren von Nucleinsäuren
aus jeder beliebigen Quelle nützlich,
ohne mit den Problemen von Selektivität, Neuanordnungen und Deletionen
konfrontiert zu sein, die aus der Vermehrung einer exogenen Nucleinsäuresequenz
in einer Wirtszelle resultieren können. Zugleich ist das Verfahren
durch die Fähigkeit, Nucleinsäuresequenzen
in einem Bereich von bis zu mehreren hunderttausend Basenpaaren
oder mehr effizient zu amplifizieren, für Anwendungen wie das Konstruieren
einer hoch auflösenden
physischen Karte eines komplexen Genoms oder das Isolieren von intakten,
medizinisch oder biologisch wichtigen Genen oder Genclustern ideal
geeignet.
-
Die 1a–1b (hiernach
als 1 bezeichnet) zeigen 64 Oligonucleotidlinker
mit Sequenzen mit kohäsiven
Enden, die komplementär
zu jedem der möglichen
kohäsiven
Enden der Restriktionsfragmente sind, die aus dem Verdau eines genomischen
DNA-Substrats mit der Restriktions-Endonuclease Sfi I resultieren.
-
Die
vorliegende Erfindung betrifft verbesserte Verfahren zum Klonieren
genomischer DNA und zum Kartieren genomischer DNA-Restriktionsfragmente.
Diese Verfahren können
in Verbindung mit oder unabhängig
von dem Verfahren zur DNA-Amplifikation
verwendet werden, das in der Stammanmeldung beschrieben wird und
das die Synthese neuer replizierbarer DNAs, die einen Bakteriophagen-phi29-Replikationsursprung und
genomische DNA, die heterolog zu phi29 ist, umfassen, erfordert.
-
Das
Verfahren zum Klonieren genomischer DNA umfasst die folgenden Schritte:
- (a) Verdauen genomischer DNA mit einem Restriktionsenzym,
das mehrere verschiedene Sequenzen mit kohäsiven Enden erzeugt;
- (b) Kontaktieren der verdauten genomischen DNA mit einem Linker,
wobei der Linker eine Reporternucleotidsequenz und eine Sequenz
mit kohäsivem
Ende umfasst, die komplementär
zu einer Sequenz mit kohäsivem
Ende ist, die durch das Restriktionsenzym in Schritt (a) erzeugt
wurde, unter Bedingungen, unter denen ein Linker an ein Restriktionsfragment
von genomischer DNA gebunden wird; und
- (c) Amplifizieren des Produkts aus Schritt (b).
-
Das
Verfahren zum Kartieren genomischer DNA-Restriktionsfragmente umfasst
die folgenden Schritte:
- (a) Verdauen von genomischer
DNA mit einem Restriktionsenzym, das mehrere verschiedene Sequenzen mit
kohäsiven
Enden erzeugt;
- (b) Amplifizieren der Restriktionsfragmentprodukte aus Schritt
(a);
- (c) Bestimmen der Sequenz des kohäsiven Endes der einzelnen Restriktionsfragmente;
und in Übereinstimmung
damit
- (d) vergleichendes Anordnen der Restriktionsfragmente in einer
physischen Karte.
-
Das
Verfahren zur Amplifikation einer Nucleinsäuresequenz, beschrieben und
beansprucht in der Stammanmeldung, das mit den Verfahren der vorliegenden
Anmeldung verwendet werden kann, umfasst die folgenden Schritte:
- (a) Synthetisieren einer doppelsträngigen Nucleinsäure, eines
Bakteriophagen-phi29-Replikationsursprungs
und einer Nucleotidsequenz, die zu phi29 heterolog ist; und
- (b) Synthetisieren von DNA aus dieser doppelsträngigen Nucleinsäure unter
der Steuerung des Replikationsursprungs.
-
Die
Vorteile, die im Vergleich mit den auf dem Gebiet der Erfindung
bereits bekannten Verfahren unter Verwendung der Verfahren der vorliegenden
Erfindung zum Klonieren von genomischer DNA und zum Kartieren genomischer
DNA-Restriktionsfragmente
erzielt werden, sind, dass die vorliegende Erfindung das Klonieren
und Kartieren von genomischer DNA von praktisch jeder Länge ermöglicht, ohne
auf die mühsamen
und fehleranfälligen
Schritte des Insertierens der genomischen DNA in spezialisierte
Vektoren und des Replizierens dieser in vivo zurückgreifen zu müssen und
ohne die Nucleotidsequenz oder die genetische Organisation irgendeines
Teils der genomischen DNA vorher kennen zu müssen.
-
Der
Vorteil, der durch das Verfahren zur Amplifikation einer heterologen
DNA unter der Steuerung eines Bakteriophagen-phi29-Replikationsursprungs
gewonnen wird, ist, dass die In-vitro-Synthese von DNA-Produkten
in Gegenwart von phi29-DNA-Polymerase
und Desoxyribonucleosidtriphosphaten kontinuierlich stattfindet,
wobei als eine Matrize DNA von bis zu 100.000 Basenpaaren oder mehr
in der Länge
verwendet werden. Das Verfahren der vorliegenden Erfindung vermeidet
daher die zahlreichen, sehr genauen Primerhybridisierungsreaktionen,
die das Polymerasekettenreaktions- (PCR-) Verfahren von Mullis et
al., US-Patent Nr. 4.683.195, erfordert, das auf dem Gebiet der
Erfindung durchwegs bekannt ist, sowie die mit dem PCR-Verfahren einhergehenden
Einschränkungen,
wenn es zur Amplifikation von längeren
DNA-Substraten eingesetzt wird.
-
Die
Bezeichnung "genomische
DNA" wie hierin
verwendet bezieht sich auf jede beliebige DNA, die eine Sequenz
umfasst, die normalerweise im Genom einer prokaryotischen oder eukaryotischen
Zelle oder eines Virus vorhanden ist. Die genomische DNA einer eukaryotischen
Zelle umfasst beispielsweise nukleare und extranukleare chromosomale
DNA, wie jene, die in Mitochondrien und Chloroplasten vorhanden
ist. Unter die Bezeichnung "genomische
DNA" fällt auch
cDNA, die aus einer Messenger-RNA oder aus dem RNA-Genom eines Virus
gewonnen wurde. Verfahren zur Extraktion und/oder Reinigung von
genomischen DNA wurden beispielsweise von Gross-Bellard et al.,
Eur. J. Biochem. 36, 32–38
(1978); Smith et al., Meth. Enzymol. 151, 461–489 (1987); und Moon et al.,
Nuc. Acids Res. 15, 611–630
(1987), beschrieben. Verfahren zur Herstellung von cDNA sind auf
dem Gebiet der Erfindung bekannt. Siehe z.B. Maniatis et al., Molecular
Cloning: A Laboratory Manual (New York, Cold Spring Harbor Laboratory
(1982)).
-
Die
Bestimmung "heterolog", wie hierin in Bezug
auf eine Nucleinsäuresequenz
verwendet, bezeichnet eine Nucleinsäuresequenz, die üblicherweise
nicht unter der Steuerung eines Bakteriophagen-phi29-Replikationsursprungs
repliziert wird. Typischerweise umfasst die heterologe Nucleinsäuresequenz
eine DNA-Sequenz, die im nuklearen oder extranuklearen Genom eines
prokaryotischen oder eukaryotischen Organismus vorhanden ist, oder
das Genom eines Virus, das nicht Bakteriophage phi29 ist. Die heterologe
Nucleinsäuresequenz
kann durch jedes geeignete Verfahren hergestellt werden, wie z.B.
mittels Gewinnung aus einer natürlich
vorkommenden Nucleinsäure
unter Verwendung eines Restriktionsenzyms oder mittels In-vitro-Synthese, einschließlich beispielsweise
der Synthese einer komplementären
DNA (cDNA) aus einer RNA.
-
Die
Bezeichnung "Reportersequenz" wie hierin verwendet
bezieht sich auf jede beliebige Nucleinsäuresequenz, durch die es möglich ist,
entweder direkt oder indirekt ein anderes Nucleinsäuremolekül zu identifizieren,
mit dem die Reportersequenz assoziiert ist. Die Reportersequenz
kann eine definierte Sequenz oder eine definierte Funktion oder
beides aufweisen. Umfasst beispielsweise die Reportersequenz eine
definierte Nucleotidsequenz, so kann das Nucleinsäuremolekül, mit dem
sie assoziiert ist, durch ein Hybridisierungsverfahren identifiziert
werden, worin die Reportersequenz mit einer komplementären Nucleinsäure hybridisiert,
die an einem festen Träger
immobilisiert ist. Das Hybridisierungsverfahren kann mittels jeglichen
geeigneten Verfahrens durchgeführt
werden, einschließlich
jener, die von Choutelle et al., Gene 3, 113–122 (1978), und in der Europäischen Patentanmeldung
Nr. 0 221 308 (Carrico) beschrieben sind. Alternativ dazu kann die
Reportersequenz auch durch ihre Funktion nachgewiesen werden, wobei
ihre Sequenz bekannt sein kann oder nicht. Beispiele umfassen das
Gen eines nachweisbaren Phänotyps
oder vorzugsweise einen Replikationsursprung oder einen Promotor.
Umfasst die Reportersequenz beispielsweise einen Replikationsursprung
oder einen Promotor, so wird das Nucleinsäuremolekül, mit dem die Reportersequenz
assoziiert ist, auf Grundlage seiner Replikation oder Transkription
unter der Steuerung der Reportersequenz leicht identifiziert.
-
Die
Bezeichnung "kohäsives Ende" wie hierin in Bezug
auf Linker und Restriktionsfragmente verwendet bezieht sich auf
eine einzelsträngige
Extension am Ende eines doppelsträngigen Nucleinsäuremoleküls, das
sich über
die Region von Basenpaarung zwischen den komplementären Strängen hinaus
erstreckt. Solche einzelsträngigen
Extensionen werden als kohäsive
Enden benannt, da sie in der Lage sind, mit einer anderen Sequenz
durch Basenpaaren von komplementären
Nucleotiden zu hybridisieren, wodurch das intramolekulare oder intermolekulare
Verbinden von Nucleinsäuren
erleichtert wird. Die Nucleotidsequenz der einzelsträngigen Extension
wird als "Sequenz
mit kohäsivem
Ende" bezeichnet.
Restriktionsfragmente mit kohäsiven
Enden werden vorzugsweise durch Verdau von doppelsträngigen DNA
mit einem geeigneten Restriktionsenzym, wie beispielsweise jenen,
die nachstehend offenbart werden, erhalten. Linker mit kohäsiven Enden
können
mittels desselben Verfahrens gewonnen werden oder können synthetisch
produziert werden, wie beispielsweise durch Anellieren einzelsträngiger Oligonucleotide.
-
Die
Bezeichnung "Oligonucleotid" wie hierin in Bezug
auf Linker und Primer verwendet ist als ein Nucleinsäuremolekül definiert,
das aus zwei oder mehr Desoxyribonucleotiden oder Ribonucleotiden
besteht. Ein erwünschtes
Oligonucleotid kann durch jedes geeignete Verfahren, wie z.B. durch
Reinigung aus einer natürlich
vorkommenden Nucleinsäure
oder durch De-novo-Synthese, hergestellt werden. Mehrere Verfahren
wurden bereits in der Literatur beschrieben, z.B. für die Synthese
von Oligonucleotiden mit definierter Sequenz unter Verwendung verschiedener
Verfahren der organischen Chemie. Narrang et al., Meth. Enzymol.
68, 90–109
(1979); Caruthers et al., Meth. Enzymol. 154, 287 (1985); Froehler
et al., Nuc. Acids Res. 14, 5399–5407 (1986). Oligonucleotide,
die durch ein beliebiges Verfahren hergestellt werden, können in
weiterer Folge durch Ligation oder auch anders miteinander verbunden
werden, um ein einzelnes Oligonucleotid mit jeder beliebigen erforderlichen
Länge und
Sequenz zu bilden.
-
Die
Bezeichnung "Linker" wie hierin verwendet
bezieht sich auf ein Oligonucleotid, unabhängig davon ob natürlich vorkommend
oder synthetisch hergestellt, das doppelsträngige DNA umfasst.
-
Die
Bezeichnung "Primer" wie hierin verwendet
bezieht sich auf ein Oligonucleotid, unabhängig davon ob natürlich vorkommend
oder synthetisch hergestellt, das zu einer ganzen zu amplifizierenden
Nucleinsäuresequenz
oder zu einem Teil davon im Wesentlichen komplementär oder homolog
ist. Der Primer muss ausreichend lang sein, um mit einer Matrizen-Nucleinsäure zu hybridisieren,
die die zu amplifizierende Sequenz umfasst, und um die Synthese
eines Extensionsprodukts in Gegenwart eines Polymerisationsmittels
zu primen. Typischerweise enthält
der Primer 15–30
oder mehr Nucleotide, obwohl er auch weniger Nucleotide enthalten kann.
Es ist jedoch nicht erforderlich, dass der Primer die exakte Sequenz
der zu amplifizierenden Nucleinsäuresequenz
oder ihres Komplements widerspiegelt. Beispielsweise können nicht-komplementäre Basen
in den Primer eingefügt
werden, oder komplementäre
Basen können
aus dem Primer deletiert werden, vorausgesetzt, dass der Primer
in der Lage ist, mit der zu amplifizierenden Nucleinsäuresequenz
oder mit ihrem Komplement unter den ausgewählten Bedingungen zu hybridisieren.
-
Die
Bezeichnung "Ursprungsprimer" wie hierin verwendet
bezieht sich auf ein Oligonucleotid, unabhängig davon ob von natürlichem
oder synthetischem Ursprung, der einen Replikationsursprung, wie
noch hierin definiert wird, gebunden an das 5'-Ende eines Primers, umfasst. Unter
geeigneten Bedingungen und in Gegenwart eines Polymerisationsmittels
ist der Ursprungsprimer in der Lage, als ein Startpunkt eines Ursprungsprimer-Extensionsprodukts
zu wirken, das die zu amplifizierende Nucleinsäuresequenz oder ihre komplementäre Sequenz
sowie den Replikationsursprung des Ursprungsprimers umfasst.
-
Die
Bezeichnung "Sekundärprimer" wie hierin verwendet
bezieht sich auf ein Oligonucleotid, unabhängig davon ob von natürlichem
oder synthetischem Ursprung, das unter geeigneten Bedingungen und
in Gegenwart eines Polymerisationsmittels in der Lage ist, als ein
Startpunkt für
ein Sekundärprimer-Extensionsprodukt,
das die zu amplifizierende Nucleinsäuresequenz oder ihre komplementäre Sequenz
umfasst, zu wirken.
-
Die
Bezeichnung "Extensionsprodukt" wie hierin verwendet
bezieht sich auf ein Nucleinsäuremolekül, dessen
Synthese am 3'-OH-Terminus
eines Primers initiiert wird, wobei eine Matrize zur Synthese des
Nucleinsäuremoleküls, an das
der Primer hybridisiert wird, eingesetzt wird.
-
Die
Bezeichnung "Polymerisationsmittel" wie hierin verwendet
soll sich auf jedes beliebige Enzym beziehen, das unter Verwendung
einer bestehenden Nucleinsäure
als eine Matrize die Synthese eines Nucleinsäuremoleküls aus Desoxyribonucleotiden
oder Ribonucleotiden katalysiert. Beispiele für solche Enzyme umfassen DNA-Polymerase, RNA-Polymerase
und reverse Transkriptase.
-
In
manchen ihrer Aspekte ist die vorliegende Erfindung ein Verfahren
zum Klonieren genomischer DNA, das als Anfangsschritt das Verdauen
genomischer DNA mit einem Restriktionsenzym umfasst, das zahlreiche
verschiedene Sequenzen mit kohäsiven
Enden erzeugt. Solche Enzyme sind auf dem Gebiet der Erfindung bekannt
und umfassen beispielsweise die Restriktionsenzyme Bgl I, BstX I,
Hga I und Sfi I.
-
Die
voraussagbare Spaltung von doppelsträngiger DNA durch ein Restriktionsenzym
resultiert aus der Erkennung einer bestimmten Sequenz von Basenpaaren
(Erkennungssequenz) im DNA-Substrat durch das Enzym. Für jedes
einzelne Restriktionsenzym ist diese Spezifität charakteristisch und im Wesentlichen
invariant bei DNAs. Die Erkennungssequenzen für die meisten Restriktionsenzyme
bestehen aus einer spezifischen Sequenz von vier bis acht Basenpaaren
oder mehr und können
zusätzlich
ein oder mehrere zufällig
ausgewählte
Basenpaare einbinden.
-
Zusätzlich zur
Erkennungssequenz ist ein Restriktionsenzym auch durch die Stellen
charakterisiert, an denen es Brüche
in die Phosphodiesterbindungen von jedem Strang des DNA-Substrats
(Spaltungsstellen) einführt,
um einzelne Restriktionsfragmente zu bilden. Die Spaltungsstelle
für ein
bestimmtes Restriktionsenzym kann innerhalb der Erkennungssequenz
des Enzyms oder in einem bestimmten Abstand hiervon auftreten. Im
Fall eines Restriktionsenzyms, das in der Lage ist, mehrere verschiedene
Sequenzen mit kohäsiven Enden
zu bilden, umfasst die Sequenz, die die Spaltungsstellen unmittelbar
umgibt, notwendigerweise ein oder mehrere, zufällig ausgewählte Basenpaare.
-
Beispielsweise
umfasst die Erkennungssequenz für
das Restriktionsenzym Sfi I eine spezifische Sequenz von vier Basenpaaren,
die wie nachstehend gezeigt durch fünf zufällig ausgewählte Basenpaare aus einer spezifischen
Sequenz von vier Basenpaaren voneinander getrennt sind:
worin N jedes beliebige der
vier Nucleotide A (Adenin), T (Thymin), G (Guanin) oder C (Cytosin)
sein kann. Sfi I führt
innerhalb der Erkennungssequenz an den Stellen, die durch die senkrechten
Pfeile bezeichnet sind, zu versetzten Spaltungen. Demgemäß endet
jedes resultierende Sfil-Restriktionsfragment an einem oder an beiden
Enden mit einem kohäsiven
Ende mit der Struktur
5' ...
GGCCNNNN 3'
3' ... CCGGN 5'
worin die Sequenz
mit kohäsivem
Ende, 5'-NNN-3', jede beliebige
der 64 möglichen
Trinucleotidsequenzen umfasst.
-
Im
Allgemeinen, sofern die Substrat-DNA ein lineares Molekül ist, sind
die Restriktionsfragmente, die aus Verdau der Substrat-DNA mit einem
Restriktionsenzym resultieren, das mehrere verschiedene Sequenzen mit
kohäsiven
Enden erzeugt, zwei Typen zuzuordnen: Restriktionsfragmenten, die
eines der ursprünglichen Enden
der linearen Substrat-DNA und ein durch das Restriktionsenzym gebildetes
kohäsives
Ende umfassen, und sogenannte "interne" Restriktionsfragmente,
die zwei durch das Restriktionsenzym gebildete kohäsive Enden
umfassen. Ist die Substrat-DNA ringförmig, so umfassen alle Restriktionsfragmente
zwei durch das Restriktionsenzym gebildete kohäsive Enden.
-
Wie
aus dieser Beschreibung deutlich hervorgeht, hängt sowohl die Anzahl der verschiedenen
Restriktionsfragmente, die bei vollständigem Verdau der Substrat-DNA mit
einem Restriktionsenzym entstehen, als auch die Anzahl der verschiedenen
Sequenzen mit kohäsiven
Enden, die für
jene Restriktionsfragmente möglich
sind, vom verwendeten Restriktionsenzym ab.
-
Die
Anzahl der verschiedenen Restriktionsfragmente, die bei vollständigem Verdau
der Substrat-DNA mit einem Restriktionsenzym gebildet werden, hängt wiederum
von der Anzahl des Auftretens der Restriktionsenzym-Erkennungssequenz
in der Substrat-DNA ab. Die Anzahl des Auftretens einer spezifischen
Erkennungssequenz kann aus der Länge
der Restriktionsenzym-Erkennungssequenz und der Größe der Substrat-DNA
bestimmt werden. Angenommen, die DNA umfasst vier verschiedene Nucleotide,
so wird die statistische Häufigkeit
einer spezifischen Erkennungssequenz der Länge n Basenpaare durch die
nachstehende Formel bestimmt:
-
-
Beispielsweise
tritt eine Erkennungssequenz mit vier Basenpaaren erwartungsgemäß mit einer
Häufigkeit
von 1/256 auf, eine Erkennungssequenz mit fünf Basenpaaren erwartungsgemäß mit einer
Häufigkeit von
1/1024, eine Erkennungssequenz mit sechs Basenpaaren erwartungsgemäß mit einer
Häufigkeit
von 1/4096 usw. Die erwartete Anzahl des Auftretens einer spezifischen
Erkennungssequenz in der Substrat-DNA wird dann durch Multiplizieren
der berechneten Erkennungssequenz-Häufigkeit
mit der Größe der Substrat-DNA
in Basenpaaren erhalten.
-
Die
Anzahl verschiedener Sequenzen mit kohäsiven Enden, die unter den
Restriktionsfragmenten möglich
ist, die durch ein Restriktionsenzym erzeugt werden, das in der
Lage ist, mehrere verschiedene Sequenzen mit kohäsiven Enden zu produzieren,
ist eine Funktion der Anzahl an erlaubten Nucleotidvariationen innerhalb
der Sequenz mit kohäsivem
Ende. Üblicherweise
kann jedes der zufällig
ausgewählten
Nucleotide innerhalb der Sequenz mit kohäsivem Ende jedes beliebige
der vier Nucleotide Adenin, Thymin, Guanin oder Cytosin sein, wobei
die erwartete Anzahl an verschiedenen Sequenzen mit kohäsiven Enden
gleich 4n beträgt, worin n für die An zahl
an zufällig
ausgewählten
Nucleotiden innerhalb der Sequenz mit kohäsivem Ende steht.
-
Jedes
beliebige Restriktionsenzym, das in der Lage ist, mehrere verschiedene
Sequenzen mit kohäsivem
Ende zu produzieren, kann in der vorliegenden Erfindung verwendet
werden, obgleich die Auswahl eines Restriktionsenzyms in einer bestimmten
Situation vorzugsweise auf Grundlage der Größe und Komplexität der Substrat-DNA erfolgt.
-
Im
Allgemeinen ist es wünschenswert,
dass die Erkennungssequenz des ausgewählten Restriktionsenzyms relativ
selten in der Substrat-DNA auftritt, um die Anzahl an produzierten
DNA-Restriktionsfragmenten zu reduzieren, die darauf folgender Manipulation
und/oder Analyse unterzogen werden. In Kartierungsstudien von prokaryotischer
oder eukaryotischer chromosomaler DNA beispielsweise ist üblicherweise
ein Restriktionsenzym mit einer Erkennungssequenz von zumindest
sechs Basenpaaren, vorzugsweise zumindest acht Basenpaaren, erforderlich,
damit die resultierenden Restriktionsfragmente eine durchschnittliche
Größe im Bereich
von etwa 10.000 Basenpaaren bis 100.000 Basenpaaren oder mehr aufweisen.
Gegebenenfalls kann durch Einstellen der Bedingungen, unter denen
die Substrat-DNA mit dem Restriktionsenzym kontaktiert wird (z.B.
Reaktionsdauer oder -temperatur), die Anzahl an Restriktionsfragmentprodukten
reduziert (und die mittlere Größe demnach
gesteigert) werden, sodass das DNA-Substrat nur teilweise verdaut
wird, wobei eine oder mehrere der Restriktionsenzym-Spaltungsstellen
ungespaltet bleiben.
-
Zugleich
ist es wünschenswert,
dass das Restriktionsenzym in der Lage ist, Restriktionsfragmente
der Substrat-DNA mit einer ausreichenden Anzahl an verschiedenen
Sequenzen mit kohäsivem
Ende zu produzieren. Im Allgemeinen gilt, dass, je größer die
Anzahl an Sequenzen mit kohäsivem
Ende ist, die durch das Restriktionsenzym gebildet werden, desto
größer die
Wahrscheinlichkeit ist, die resultierenden Restriktionsfragmente
auf Grundlage ihrer Sequenzen mit kohäsivem Ende voneinander zu unterscheiden,
und dass es wiederum desto einfacher ist, die einzelnen DNA-Restriktionsfragmente
zu klonieren und/oder sie in einer physischen Karte anzuord nen.
Zum Verdau von prokaryotischer oder eukaryotischer chromosomaler
DNA beispielsweise ist das ausgewählte Restriktionsenzym üblicherweise
eines, das in der Lage ist, zumindest 64 verschiedene Sequenzen
mit kohäsivem
Ende zu bilden und das einer Sequenz mit kohäsivem Ende entspricht, die
mindestens drei zufällig
ausgewählte
Nucleotide umfasst.
-
Nach
Verdauen von genomischer DNA mit einem geeigneten Restriktionsenzym
umfasst das Verfahren zum Klonieren genomischer DNA als nächsten Schritt
das Kontaktieren des/der resultierenden DNA-Restriktionsfragments(e)
mit einem Oligonucleotid-Linker, der eine Reportersequenz und eine
Sequenz mit kohäsivem
Ende umfasst, die komplementär
zu einer der mehreren verschiedenen Sequenzen mit kohäsivem Ende ist,
die durch das Restriktionsenzym gebildet wurden.
-
Der
Oligonucleotid-Linker und das/die DNA-Restriktionsfragmente) werden
wünschenswerterweise zusammen
unter solchen Bedingungen inkubiert, dass das kohäsive Ende
des Oligonucleotid-Linkers spezifisch mit dem komplementären kohäsiven Ende
eines Restriktionsfragmentes hybridisiert. Der Linker und ein DNA-Restriktionsfragment,
mit dem er hybridisiert ist, werden dann kovalent unter Verwendung
jedes beliebigen geeigneten Verfahrens verbunden, vorzugsweise mittels
Ligation mit DNA-Ligase. Die Gegenwart der Reportersequenz liefert
das Mittel zur Identifikation des resultierenden Produkts aus einem
Gemisch an DNA-Restriktionsfragmenten und liefert vorzugsweise das
Mittel zur Isolation und/oder selektiven Amplifikation des resultierenden
Produkts.
-
Liefert
der Verdau der genomischen DNA ein Gemisch verschiedener Restriktionsfragmente
umfassend verschiedene Sequenzen mit kohäsivem Ende, so kann jedes unterschiedliche
Restriktionsfragment des Gemisches leicht gemäß der vorliegenden Erfindung
durch Kontaktieren des Gemisches mit einer Kombination von zwei
oder mehr Linkern mit Sequenzen mit kohäsiven Enden, die komplementär zu jenen
der verschiedenen Restriktionsfragmente sind, kloniert werden.
-
Da
die Sequenzen mit kohäsivem
Ende der verschiedenen Restriktionsfragmente des Gemisches üblicherweise
nicht mit Bestimmtheit bekannt sind, ist es unter solchen Umständen wünschenswert,
dass die Kombination von Linkern eine Bibliothek von Linkern umfasst,
die Sequenzen mit kohäsivem
Ende aufweisen, die komplementär
zu im Wesentlichen jeder möglichen
Sequenz mit kohäsivem
Ende sind, die durch das bestimmte verwendete Restriktionsenzym
produziert wurde. Auf diese Weise kann sichergestellt werden, dass im
Wesentlichen jedes Restriktionsfragment mit kohäsivem Ende mit einem Linker
verbunden ist. Je nach Anzahl der verschiedenen Restriktionsfragmente,
die aus dem Verdau der genomischen DNA resultieren, kann es weiters
wünschenswert
sein, dass einzelne Aliquoten des Gemisches separat mit jedem einzelnen
Linker aus einer Bibliothek von Linkern in separaten Reaktionsgefäßen, wie
z.B. den separaten Wells einer Mikrotiterplatte, kontaktiert wird,
wobei vorzugsweise zwei oder mehr Linker verschiedene Sequenzen
mit kohäsivem Ende
umfassen. Auf diese Weise kann die Anzahl an verschiedenen Restriktionsfragmenten,
die mit Linkern in jeder möglichen
Reaktion verbunden werden, reduziert werden, wodurch wiederum der
Bedarf an einem zusätzlichen
Schritt zum Trennen eines jeden einzelnen Restriktionsfragmentes,
eines vom anderen, vom anderen reduziert oder nichtig gemacht wird,
um das Klonieren jedes einzelnen genomischen DNA-Restriktionsfragmentes
zu erreichen.
-
Der
letzte Schritt des Verfahrens zum Klonieren genomischen DNA ist
die Amplifikation eines genomischen DNA-Restriktionsfragmentes,
an das ein Linker und eine Reportersequenz durch jedes beliebige
geeignete Mittel gebunden wurden, entweder in vivo, wie z.B. durch
Replikation in einer Wirtszelle, oder in vitro. In-vitro-Amplifikation
eines Restriktionsfragmentes, an das eine Reportersequenz mit definierter
Sequenz gebunden ist, kann beispielsweise durch die von Mullis et
al., s.o., oder Miller et al., PCT-Veröffentlichung Nummer WO 89/06700,
veröffentlicht
am 27. Juli 1989, offenbarten Verfahren unter Verwendung eines Primers,
der eine Sequenz umfasst, die zu jener der Reportersequenz komplementär ist, erfolgen.
Keines dieser Verfahren ist jedoch besonders gut geeignet für die Amplifikation
von längeren
DNA-Fragmenten. Beispielsweise ist das Verfahren von Mullis et al.
im Allgemeinen aufgrund der langsamen Verfahrensdurchführung und
der relativ hohen Fehlerquote der in der Amplifi kationsreaktion
verwendeten DNA-Polymerase auf die Amplifikation von DNA-Fragmenten eingeschränkt, die
nicht länger
als mehrere tausend Basenpaare sind. Higuchi et al., Nuc. Acids
Res. 16, 7351–7367
(1988); Saiki et al., Science 239, 487–491 (1988). Darüber hinaus
erfordert das Verfahren von Mullis et al. mehrere Zyklen an Nucleinsäure-Denaturierung
und Primerhybridisierung, was zu hohen Arbeits- und Automationskosten
führt.
-
In
einer besonders bevorzugten Ausführungsform
der vorliegenden Erfindung umfasst die zum Klonieren von genomischer
DNA verwendete Reportersequenz einen Bakteriophagen-phi29-Replikationsursprung, und
Amplifikation des Restriktionsfragmentes, an das es gebunden wird,
erfolgt in vitro unter Verwendung von Bakteriophagen-phi29-DNA-Polymerase.
-
Die
Bezeichnung "Replikationsursprung" bezieht sich im
Allgemeinen auf eine Sequenz in DNA, an der DNA-Synthese durch ein
Polymerisationsmittel initiiert wird. Gutierrez et al., Nuc. Acids
Res. 16, 5895–5914
(1988), offenbart, dass die Mindestanzahl an phi29-Replikationsursprüngen, die
durch phi29-DNA-Polymerase verwendet werden, innerhalb der letzten
12 Basenpaare an jedem Ende von phi29-DNA angeordnet sind. Der so
genannte "linke
Replikationsursprung" umfasst
die Sequenz 5'-AAAGTAAGCCCC-3', und der "rechte Replikationsursprung" umfasst die Sequenz
5'-AAAGTAGGGTAC-3', wobei die Replikation
wie gezeigt in 5'-3'-Richtung abläuft. Da
jedoch Nucleotidveränderungen
an einer oder mehreren Positionen innerhalb dieser Sequenzen vorgenommen
werden können,
ohne ihre Funktion zu beeinträchtigen,
sind alle solche Sequenzvarianten ebenso vom Umfang der Bezeichnung "Bakteriophagen-phi29-Replikationsursprung", wie hierin verwendet,
umfasst.
-
Blanco
et al., Gene 29, 33–40
(1984), und Blanco & Salas,
Proc. Nat. Acad. Sci. 81, 5325–5329
(1984), beschreiben zusammen die Reinigung von Bakteriophagen-phi29-DNA-Polymerase
aus E.-coli-Zellen, die mit einem rekombinanten Plasmid transformiert
sind, das das phi29-DNA-Polymerasegen enthält. Garcia et al., Gene 21,
65–76
(1983), und Prieto et al., Proc. Nat. Acad. Sci. 81, 1639–1643 (1984),
beschreiben zusammen die Reinigung von terminalem Protein des Bakteriophagen phi29
aus E.-coli-Zellen, die mit einem rekombinanten Plasmid transformiert
sind, das das phi29-Gen für
das terminate Protein enthält.
-
Blanco & Salas, Proc.
Nat. Acad. Sci. 82, 6404–6408
(1985), und Blanco et al., in: "EMBO
Workshop – Gene
Organization and Expression in Bakteriophages", S. 63 (1988), beschreiben die Replikation
von Bakteriophagen-phi29-DNA in Gegenwart von gereinigtem terminalem
phi29-Protein und phi29-DNA-Polymerase. Die Replikation von doppelsträngiger Bakteriophagen-phi29-DNA
wird an den Replikationsursprüngen,
die an beiden Enden der DNA vorhanden sind, durch einen Protein-Primingmechanismus
initiiert. In Gegenwart von terminalem phi29-Protein, phi29-DNA-Polymerase und
den vier Desoxynucleosidtriphosphaten wird ein dAMP-Initiationskomplex
des terminalen Proteins gebildet, der durch phi29-DNA-Polymerase durch
einen Strangverdrängungsmechanismus
zu einer Volllängen-phi29-DNA verlängert werden
kann.
-
In
bevorzugten Ausführungsformen
der Erfindung wird ein Amplifikationsverfahren zur Amplifikation von
heterologen DNA-Sequenzen in der Größenordnung von 10.000 Basenpaaren
bis 100.000 Basenpaaren oder mehr in der Länge sowie von heterologen DNA-Sequenzen
von weniger als 10.000 Basenpaaren in der Länge verwendet, wobei das Verfahren
einen Bakteriophagen-phi29-Replikationsursprung und hoch-progressiv
arbeitende Bakteriophagen-phi29-DNA-Polymerase verwendet. Gemäß der in
der Stammanmeldung beschriebenen Erfindung ist es nun möglich, jede
beliebige DNA-Sequenz durch Inkorporieren eines Bakteriophagen-phi29-Replikationsursprungs
an ein oder an beide Enden davon zu amplifizieren. Somit stellt
die in der Stammanmeldung beschriebene Erfindung neue DNA-Konstrukte
bereit, die nicht natürlich
vorkommen und die unter der Steuerung eines Bakteriophagen-phi29-Replikationsursprungs
repliziert werden können.
-
Der
Bakteriophagen-phi29-Replikationsursprung kann aus natürlichen
Quellen gewonnen oder kann synthetisch hergestellt werden und kann
an das Ende eines heterologen DNA-Fragments in einer Ligationsreaktion
mit DNA-Ligase gebunden oder anders angrenzend in eine DNA-Sequenz,
die durch auf dem Gebiet der Erfindung bekannte Verfahren amplifiziert
wird, wie z.B. mittels ortsgerichteter Mutagenese, oder durch die Verwendung
eines Ursprungs-Primers gemäß den Verfahren,
die im Allgemeinen von Mullis et al., s.o., beschrieben werden,
eingeführt
werden.
-
Amplifikation
einer heterologen DNA-Sequenz unter der Steuerung eines Bakteriophagen-phi29-Replikationsursprungs
erfolgt typischerweise in vitro in einer gepufferten wässrigen
Lösung
in Gegenwart von terminalem Protein des Bakteriophagen phi29, Bakteriophagen-phi29-DNA-Polymerase
und den vier Desoxynucleosidtriphosphaten und unter geeigneten Bedingungen
bezüglich
Temperatur, Salzkonzentration (z.B. Mg2+, NH4 +) und pH, sodass
zahlreiche Volllängenkopien
der heterologen DNA synthetisiert werden.
-
Da
die Replikation aus einem Bakteriophagen-phi29-Replikationsursprung
unter Verwendung eines Strangs einer doppelsträngigen DNA als Matrize in eine
Richtung erfolgt, wird die Amplifikation einer doppelsträngigen heterologen
DNA durch Binden eines Linkers, der einen Bakteriophagen-phi29-Replikationsursprung
umfasst, an beide DNA-Enden durchgeführt, sodass beide Stränge der
DNA-Matrize repliziert werden. Demgemäß erfolgt die Amplifikation
eines genomischen DNA-Restriktionsfragmentes vorzugsweise durch Binden
von Linkern, die einen Bakteriophagen-phi29-Replikationsursprung umfassen,
an beide Enden des Restriktionsfragmentes. Ein Linker, der einen
Bakteriophagen-phi29-Replikationsursprung umfasst, wird passenderweise
als ein "phi29-Ursprungslinker" bezeichnet.
-
In
einer Ausführungsform
der Erfindung umfasst das genomische DNA-Restriktionsfragment zwei durch
das Restriktionsenzym gebildete kohäsive Enden, und die phi29-Ursprungslinker
weisen vorzugsweise jeweils eine Sequenz mit kohäsivem Ende auf, das komplementär zu einem
der Enden des genomischen DNA-Restriktionsfragments
ist. In einer anderen Ausführungsform
der Erfindung umfasst das genomische DNA-Restriktionsfragment eines
der ursprünglichen
Enden des genomischen DNA-Substrats und ein durch Restriktionsenzym
gebildetes kohäsives
Ende. Typischerweise ist das ursprüngliche Ende des genomischen DNA-Substrats
ein stumpfes Ende, wobei in diesem Fall die Amplifikation des genomischen
DNA- Restriktionsfragments
vorzugsweise durch Binden eines phi29-Ursprungslinkers mit einem
stumpfen Ende an das ursprüngliche
Ende und durch Binden eines phi29-Ursprungslinkers mit einem komplementären kohäsiven Ende an
das durch Restriktionsenzym gebildete kohäsive Ende erfolgt. Die Bezeichnung "stumpfes Ende" wie hierin verwendet
bezieht sich auf ein Ende einer doppelsträngigen Nucleinsäure, dem
jeglicher einzelsträngige Überhang
fehlt. Ist das ursprüngliche
Ende des genomischen DNA-Substrats kein stumpfes Ende, so wird es
vorzugsweise zu einem stumpfen Ende umgesetzt, beispielsweise durch
Entfernen eines vorhandenen einzelsträngigen Überhangs mit SI-Nuclease oder
jede andere geeignete, einzelsträngige
Exonuclease, oder durch Auffüllen
der ursprünglichen
Enden gemäß bekannter
Verfahren. Siehe beispielsweise Maniatis et al., s.o.
-
Werden
in einem Amplifikationsschritt zwei oder mehr verschiedene genomische
DNA-Restriktionsfragmente in derselben Reaktion amplifiziert, so
wird es erforderlich sein, die verschiedenen Restriktionsfragmente
voneinander zu trennen, um einzelne genomische DNA-Klone zu produzieren.
Die Trennung der verschiedenen Restriktionsfragmente kann nach der
Amplifikation durch jedes der bekannten Verfahren zum physischen
Trennen von Nucleinsäuren
durchgeführt
werden, wie z.B. mittels Chromatographie, Zentrifugation oder Elektrophorese.
Längere
DNA-Moleküle
in einem Größenbereich
von etwa 10.000 Basenpaaren bis etwa 100.000 Basenpaaren oder mehr
werden vorzugsweise durch das Verfahren der Gelelektrophorese mit
gepulstem Feld getrennt. Carle & Olson,
Nuc. Acids Res. 12, 5647–5664
(1984); Smith et al., Genetic Engineering 8, 45–70, Plenum Press, New York
(1986). Die getrennten DNA-Moleküle
können
dann auf jede bekannte Weise isoliert werden, und, sofern erwünscht, können die
isolierten DNA-Moleküle
wiederum amplifiziert werden, um zahlreiche Kopien jedes einzelnen
genomischen DNA-Klons zu produzieren.
-
Alternativ
dazu können
die verschiedenen DNA-Restriktionsfragmente mit Gruppierungen, die
in der Lage sind, entweder direkt oder indirekt verschiedene nachweisbare
Signale zu produzieren, markiert werden, beispielsweise durch Inkorporieren
solcher Gruppierungen in die verschiedenen Linker, die mit den DNA-Restriktionsfragmenten
verbunden sind, und durch physikalisches Trennen der DNA-Restrik tionsfragmente
auf Grundlage jener verschiedenen Signale. Somit kann beispielsweise
die nachweisbare Gruppierung ein Fluorophor sein, und die DNA-Restriktionsfragmente
werden durch Durchflusszytometrie getrennt. Gray et al., Science
238, 323–329
(1987).
-
In
wiederum einem anderen Aspekt liefert die vorliegende Erfindung
wirksame Mittel zum physischen Kartieren genomischer DNA-Restriktionsfragmente
mit mehreren verschiedenen Sequenzen mit kohäsiven Enden. Nach Verdauen
genomischer DNA mit einem Restriktionsenzym, das in der Lage ist,
mehrere verschiedene Sequenzen mit kohäsiven Enden zu bilden, werden
die relativen Positionen der resultierenden Restriktionsfragmente
innerhalb der genomischen Substrat-DNA durch Bestimmen der Sequenz
an einem oder beiden Enden jedes unterschiedlichen Restriktionsfragmentes,
einschließlich
zumindest der Sequenz von jedem kohäsiven Ende, ermittelt. Vorausgesetzt,
die Sequenzen mit kohäsivem
Ende unterscheiden sich zwischen den unterschiedlichen Restriktionsfragmenten,
kann ein vergleichendes Anordnen der Restriktionsfragmente durch
Profitieren von der Tatsache, dass Restriktionsfragmente, die innerhalb
des genomischen DNA-Substrats benachbart sind und daher gemeinsame
Spaltungsstellen haben, komplementäre Sequenzen mit kohäsiven Enden
aufweisen, leicht durchgeführt
werden.
-
Die
Nucleotidsequenz am Ende eines genomischen DNA-Restriktionsfragmentes
kann direkt durch jedes bekannte Verfahren des Nucleinsäuresequenzierens,
beispielsweise durch das chemische Abbauverfahren von Maxam & Gilbert, Meth.
Enzymol. 65, 499–560
(1980), oder durch das Kettenabbruchverfahren von Sanger et al.,
Proc. Nat. Acad. Sci. 74, 5463–5467
(1977), bestimmt werden oder kann indirekt aus der Sequenz mit kohäsivem Ende
eines oder mehrerer Linker bestimmt werden, die an das Restriktionsfragment
gebunden sind.
-
Manipulation
und Analyse von gesammelten Sequenzdaten, insbesondere das vergleichende
Anordnen einzelner genomischer DNA-Restriktionsfragmente in einer
physischen Karte, erfolgen auf einfache Weise unter Verwendung eines
Computerverfahrens. Staden, Nuc. Acids Res. 10, 4731–4751 (1982),
beispielsweise be schreibt ein Computerverfahren zur Bearbeitung
von DNA-Sequenzinformation und zum vergleichenden Anordnen von DNA-Restriktionsfragment-Klonen,
die miteinander durch Überlappung
ihrer Sequenzen verbunden sind.
-
Die
folgenden Beispiele werden zur Veranschaulichung bereitgestellt
und sind auf keine Weise als Einschränkung der Erfindung zu verstehen.
Alle hierin beschriebenen Patent- und Literaturverweise sind ausdrücklich hierin
aufgenommen.
-
Beispiele
-
Verdau von Adenovirus-2-DNA
mit Sfi I
-
Gereinigte
Adenovirus-2-DNA (International Biotechnologies, Inc., New Haven,
CT) wird mit Restriktionsendonuclease Sfi I (New England BioLabs,
Beverly, MA) in einer Reaktion, die aus 10 mM Tris-HCl (pH 7,9),
10 mM MgCl2, 10 mM 2-Mercaptoethanol, 50 mM NaCl, 100 μg/ml Rinderserumalbumin,
20 μg/ml
Adenovirus-2-DNA und 5 Einheiten Sfi I mit einem Gesamtreaktionsvolumen
von 100 μl
besteht, 1 Stunde lang bei 50°C
verdaut.
-
Entfernen von terminalem
Protein des Adenovirus 2
-
Adenovirus-2-DNA
enthält
ein Virus-kodiertes Protein, das kovalent an den 5'-Terminus von jedem Strang des linearen
DNA-Moleküls
gebunden ist und dessen Entfernung erforderlich ist, um Enden zu
produzieren, die in der Lage sind, mit Linkern Ligationen zu bilden.
Stillman et al., Cell 23, 497–508
(1981); Tamanoi et al., Proc. Nat. Acad. Sci. 79, 2221–2225 (1982).
Um das 5'-terminate
Protein von der Adenovirus-2-DNA zu trennen, wird 20 μg/ml Adenovirus-2-DNA
in 10 mm Tris-HCl (pH 7,5) mit einem gleichen Volumen an 1 M Piperidin
vermischt, 2 Stunden lang bei 37°C
inkubiert, dann lyophilisiert, in Wasser aufgelöst und neuerlich lyophilisiert.
-
Oligonucleotidsynthese
-
Das
einzelsträngige
12-mer-Oligonucleotid 5'-GGGGCTTACTTT-3' und jedes der 64
verschiedenen einzelsträngigen
15-mer-Oligonucleotide mit der allgemeinen Sequenz 5'-AAAGTAAGCCCCNNN-3', worin N jedes beliebige
der vier Nucleotide Adenin, Thymin, Guanin und Cytosin ist, werden
an einem DNA-Synthesegerät
von Biosearch, Modell 8600, gemäß dem Verfahren
von Froehler et al., s.o., synthetisiert. Um Linker herzustellen,
wird jedes der verschiedenen 15-mer-Oligonucleotide mit dem komplementären 12-mer-Oligonucleotid
in Hybridisierungspuffer, der aus 10 mM Tris HCl (pH 7,5), 10 mM
MgCl2, 20 mM NaCl besteht, bei einer Temperatur
zwischen 25°C
und 30°C
anelliert. Die Nucleotidsequenzen von den 64 Linkerprodukten mit
der allgemeinen Struktur
5' AAAGTAAGCCCCNNN
3'
3' TTTCATTCGGGG 5'
sind in 1 gezeigt.
-
Klonieren des Adenovirus-2-Genoms
-
Das
terminale Protein des Adenovirus 2 wird von den Enden von Adenovirus-2-DNA
wie zuvor beschrieben entfernt. Linker, die zwei linke Bakteriophagen-phi29-Replikationsursprünge in einer End-zu-End-Ausrichtung
umfassen und die Sequenz
5' AAAGTAAGCCCCGGGGCTTACTTT
3'
3' TTTCATTCGGGGCCCCGAATGAAA
5'
aufweisen,
werden dann an die resultierenden stumpfen Enden der Adenovirus-2-DNA unter Verwendung
von 100 pmol Linker pro μg
Adenovirus-2-DNA in Ligationspuffer, bestehend aus 50 mM Tris-HCl
(pH 7,8), 10 mM MgCl2, 2 mM Dithiothreit,
1 mM ATP, 1 mM Spermidin und 50 μg/ml
Rinderserumalbumin, gebunden. 2 Einheiten von T4-DNA-Ligase (New
England BioLabs, Beverly, MA) werden dann pro μg Adenovirus-2 im Reaktionsgemisch
zugesetzt, und das Reaktionsgemisch wird dann bei 15°C eine Stunde
lang inkubiert.
-
Nach
Ligation der Bakteriophagen-phi29-Ursprungslinker an die ursprünglichen
Enden der Adenovirus-2-DNA wird die Adenovirus-2-DNA mit Sfi I wie
zuvor beschrieben verdaut. Das Klonieren der resultierenden Sfi-I-Restriktionsfragmente
erfolgt dann einfach gemäß den Verfahren
der Erfindung in den einzelnen Wells von 96-Well-Mikrotiterplatten.
-
Zu
jedem einzelnen Well der Mikrotiterplatten werden 100 pmol von jeweils
zwei verschiedenen Linkern aus 1 zugesetzt,
sodass jede mögliche
Kombination von zwei verschiedenen Linkern aus 1 in einem
oder einem anderen Mikrotiterwell enthalten ist. Die Anzahl an verschiedenen
Kombinationen der 64 Linker aus 1 und
somit die Anzahl an Mikrotiterwells, die zum Klonieren von Sfi-I-Restriktionsfragmenten vorbereitet
werden müssen,
beträgt
2016. Im Allgemeinen kann die Anzahl der verschiedenen Kombinationen von
N verschiedenen Linkern gemäß der folgenden
Formel bestimmt werden:
-
-
1 μg von Sfi-I-verdauter
Adenovirus-2-DNA wird dann zu jedem einzelnen Mikrotiterwell in
25 μl Ligationspuffer
zusammen mit 2 Einheiten von T4-DNA-Ligase (New England BioLabs,
Beverly, MA) zugesetzt. Das Reaktionsgemisch wird bei 15°C eine Stunde
lang inkubiert, um die Ligation von Linkern an die kohäsiven Enden
der Adenovirus-2-DNA-Restriktionsfragmente zu ermöglichen.
Die Ligationsreaktion wird durch 15-minütiges Erhitzen bei 68°C gestoppt.
-
Nach
der Ligation von Linkern an die Adenovirus-2-DNA-Restriktionsfragmente
erfolgt Amplifikation der Adenovirus-2-Restriktionsfragmente durch
Zusatz von 20 μM
jeweils von dATP, dTTP, dGTP und dCTP, 20 mM (NH4)2SO4, 5 Vol.-% Glycerin,
300 ng gereinigtem terminalem Protein des Bakteriophagen phi29 und
20 ng Bakteriophagen-phi29-DNA-Polymerase zum Reaktionsgemisch in
jeden Mikrotiterwell. Nach 2-stündiger Inkubation
bei 30°C
wird die DNA-Synthesereaktion durch den Zusatz von 10 mM EDTA und
10-minütiges
Erhitzen bei 68°C
gestoppt.
-
Nach
Polyacrylamidgelelektrophorese der DNA-Synthesereaktionsgemische
wird jedes der amplifizierten Adenovirus-2-DNA-Restriktionsfragmente
durch Färben
des Gels mit Ethidiumbromid sichtbar gemacht und dann aus dem Gel
durch Elektroelution gereinigt. Sequenzieren der Enden von jedem
Strang der Restriktionsfragmente wird gemäß dem Verfahren von Maxam & Gilbert, s.o.,
unter Verwendung von α32P-Cordycepin-5'-triphosphat zum
3'-Endmarkieren
durchgeführt.
Tu et al., Gene 10, 177–183
(1980).
-
Physisches Kartieren des
Adenovirus-2-Genoms
-
Verdau
von Adenovirus-2-DNA mit Sfi I erzeugt vier Restriktionsfragmente
in einem Größenbereich von
etwa 1.000 Basenpaaren bis etwa 16.000 Basenpaaren. Die Nucleotidsequenz
an den 3'-Enden
von jedem der Restriktionsfragmente lautet wie folgt:
-
-
Vergleichendes
Anordnen der Restriktionsfragmente in einer physischen Karte erfolgt
durch Analysieren der Nucleotidsequenz von jedem Restriktionsfragment
auf komplementäre
3'-Endsequenzen.
Demgemäß sind die
vier Sfi-I-Restriktionsfragmente von Adenovirus-2-DNA wie folgt
vergleichend angeordnet:
-
-
Klonieren eines inneren
Sfi-I-Fragments von Adenovirus-2-DNA
-
Dieses
Beispiel veranschaulicht eine Ausführungsform der Erfindung, worin
ein genomisches DNA-Restriktionsfragment mit einer vorbestimmten
Sequenz mit kohäsivem
Ende kloniert wird.
-
Adenovirus-2-DNA
wird mit Sfi I wie zuvor beschrieben verdaut. Aufgrund der bekannten
Nucleotidsequenz des Adenovirus-2-Genoms, Roberts et al., in "Adenovirus DNA", W. Doerfler (Hrsg.),
Martinus Nijhoff Publishing, Boston, MA (1986), kann vorausgesagt
werden, dass eines der resultierenden Restriktionsfragmente, das
sich von Nucleotid 17305 bis Nucleotid 23046 des Adenovirus-2-Genoms
erstreckt, die folgende Struktur aufweisen wird:
5' CGGC ... GCCGGAC
3'
3' GACGCCG ... CGGC
5'.
-
Als
erster Schritt beim In-vitro-Klonieren dieses Restriktionsfragmentes
wird 1 μg
von Sfi-I-verdauter Adenovirus-2-DNA mit 100 pmol Oligonucleotidlinker
mit der Sequenz
5' AAAGTAAGCCCCCTG
3'
3' TTTCATTCGGGG 5'
und mit 100
pmol Oligonucleotidlinker mit der Sequenz
5' AAAGTAAGCCCCGTC 3'
3' TTTCATTCGGGG 5'
in 25 μl Ligationspuffer vermischt.
2 Einheiten von T4-DNA-Ligase werden dann dem Gemisch zugesetzt,
und die Ligationsreaktion wird eine Stunde lang bei 15°C laufen
gelassen.
-
Nach
Ligation der Linker an die komplementären kohäsiven Enden des erwünschten
Adenovirus-2-DNA-Restriktionsfragmentes erfolgt Amplifikation des
Restriktionsfragmentes durch Zusatz von 20 μM jeweils von dATP, dTTP, dGTP
und dCTP, 20 mM (NH4)2SO4, 5 Vol.-% Glycerin, 300 ng gereinigtem
terminalem Protein des Bakteriophagen phi29 und 20 ng Bakteriophagen-phi29-DNA-Polymerase
zum Ligations-Reaktionsgemisch. Nach 20-minütiger Inkubation bei 30°C wird die
DNA-Synthesereaktion
durch Zusatz von 10 mM EDTA und 10-minütiges Erhitzen bei 68°C gestoppt.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-