-
Die
vorliegende Erfindung betrifft das Gebiet der molekularen Genomforschung
und der genetischen Analyse, insbesondere die genetische Kartierung
komplexer quantitativer und qualitativer Merkmale. Insbesondere
stellt die vorliegende Erfindung Zusammensetzungen und Verfahren
bereit, genetische Information aus verschiedenen Quellen zu analysieren,
um relevante therapeutische Gene oder Mutationen zu identifizieren.
Diese Erfindung betrifft insbesondere Zusammensetzungen und Verfahren,
um identische DNA-Fragmente aus unterschiedlichen DNA-Quellen zu
identifizieren. Das Verfahren erlaubt die Separation perfekt gepaarter
DNAs aus unvollkommen gepaarten DNAs oder aus DNAs, welche durch
die Hybridisierung aus derselben Quelle (z.B. Homohybride) entstanden
sind. Das Verfahren stellt alternative und/oder verbesserte Varianten
des Genomic Mismatch Scanning (GMS) dar und stellt bedeutende Verbesserungen
der GMS-Methode bereit, indem es das Arbeiten mit geringen Anfangsmengen an
DNA, eine spezifische Vervielfältigung,
reduzierte Kosten und eine reduzierte Anzahl von Reaktionsschritten
erlaubt.
-
Eine
der Hauptherausforderungen der heutigen Biologie und Medizin ist
die Identifizierung von Genen, die bei verbreiteten, komplexen Erkrankungen
des Menschen wie Asthma, Typ 2-Diabetes
mellitus, Fettleibigkeit, etc. beteiligt sind. Die Identifizierung
solcher Gene wird üblicherweise
ausgeführt,
indem bei großen
Familien oder Testgruppen von Patienten Kopplungs- und/oder Assoziationsuntersuchungen
durchgeführt
werden. Diese Untersuchungen können
mit einer Vielfalt genetischer Marker durchgeführt werden (Sequenzen im Genom,
die sich zwischen Individuen unterscheiden, d.h. die polymorph sind).
Die weitverbreitetsten Polymorphismen, die verwendet werden, sind
Mikrosatellitenmarker, die aus kurzen, spezifischen repetitiven
Sequenzen bestehen, oder Einzelnukleotidpolymorphismen (SNPs), die
sich in nur einem Nukleotid unterscheiden. Es wurden unterschiedliche
Analysetechnologien entwickelt, um diese Marker zu genotypisieren, beispielsweise
Gel-basierte Elektrophorese, DNA-Hybridisierung eines geordneten
Arrays, Identifizierung mit Massenspektrometrie.
-
Das
Hauptziel der Genetik besteht darin, einen Phänotyp (d.h. ein qualitativ
oder quantitativ messbares Merkmal eines Organismus) mit einem Gen
oder einer Anzahl von Genen in Verbindung zu bringen. Aus historischen
Gründen
gibt es zwei genetische Ansätze,
die verwendet werden, um Genorte zu identifizieren, welche für einen
Phänotyp
verantwortlich sind, nämlich
die familiären
Kopplungs- und Assoziationsuntersuchungen. Welcher Ansatz auch immer
verwendet wird, beruhen genetische Untersuchungen auf Polymorphismen,
d.h. Basenunterschiede in der DNA-Sequenz zwischen zwei Individuen
am selben Genort. Das Vorhandensein von Sequenzunterschieden am
selben Genort wird allelische Variation genannt. Es ist seit langem
bekannt, dass unterschiedliche Allele eines Gens in einer unterschiedlichen
Expression eines gegebenen Phänotyps
resultieren können.
-
Die
Kopplungsanalyse ist die Methode der Wahl, um Gene zu identifizieren,
die bei vielen sowohl monogenen als auch multigenen Erkrankungen beteiligt
sind, aber wo nur ein Gen pro Patient beteiligt ist. Die Kopplungsanalyse
folgt der Vererbung von Allelen in einer Familie und versucht, bestimmte
Allele mit einem Phänotyp
(z.B. einer Erkrankung) in Verbindung zu bringen. Anders ausgedrückt sucht
man nach Allelen, die Individuen mit demselben Phänotyp, die
identischer Abstammung (identical by descent, IBD) sind, d.h. die
vom selben Vorfahren abstammen, gemeinsam sind. Um in der statistischen Analyse
eine vernünftige
Aussagekraft zu besitzen, müssen
die untersuchten Polymorphismen mehrere Kriterien erfüllen:
- – hohe
Heterozygotie, d.h. viele Allele existieren für einen gegebenen Locus (dies
erhöht
den Informationsgehalt);
- – genomweite
Repräsentierung;
- – nachweisbar
mit Standardlaborverfahren.
-
Eine
Art von Polymorphismen, welche die meisten dieser Kriterien erfüllt, ist
ein Mikrosatellitenmarker. Diese sind repetitive Sequenzelemente
von zwei (z.B. CA), drei oder vier Basen. Die Anzahl der Repetitionen
ist für
einen gegebenen Locus variabel, was in einer hohen Anzahl möglicher
Allele resultiert, d.h. einer hohen Heterozygotie (70-90 %). Sie
sind über
das Genom hinweg weit verteilt. Bis heute wurden fast 20.000 Mikrosatellitenmarker
identifiziert und kartiert (Abdeckung etwa 0,5-2 Megabasen).
-
Mikrosatellitenmarker
sind für
Kopplungsanalysen immer noch die genetischen Marker der Wahl. Die
Genotypisierung dieser Marker erfolgt durch die Vervielfältigung
der Allele mittels PCR und einer Größenauftrennung in einer Gelmatrix
(Plattengel oder Kapillare). Für
die Untersuchung komplexer menschlicher Erkrankungen werden üblicherweise 400-600
Mikrosatellitenmarker verwendet, die in regelmäßigen Abständen über das gesamte Genom verteilt
sind (etwa alle 10-15 Megabasen).
-
Die
Vorteile familiärer
Kopplungsuntersuchungen beinhalten etablierte, gut kartierte Markersysteme
(Mikrosatellitenmarker); Hilfsmittel für die statistische Analyse
sind relativ gut entwickelt; hoher Informationsgehalt; Ermöglichung
der parallelen Analyse mehrerer bei einem Genotyp beteiligter Loci (Meta-Analyse);
gut entwickelte zwischenartliche Vergleichskarten.
-
Nachteile
familiärer
Kopplungsuntersuchungen beinhalten den Kostenaspekt (viele PCRs,
Allel-Identifizierung
ist arbeitsintensiv, Fluoreszenzmarker-Markierung); langsam, weil
eine hohe Parallelverarbeitung, trotz einer bis zu einem gewissen Grad
erreichbaren Multiplexverarbeitung, nicht möglich ist (keine Mikrosatelliten-DNA-Chips);
die statistischen Möglichkeiten,
um kleine Effekte zu analysieren, sind begrenzt; Ergebnisse sind
von Allelfrequenzen und Heterozygotie abhängig; umfangreiche Familiensammlungen
mit betroffenen Individuen sind notwendig (200- 2000 Individuen); IBD-Regionen erstrecken
sich üblicherweise über große Bereiche,
die für
eine direkte Genklonierung ungeeignet sind, oft über 10-15 Megabasen (geringe
Auflösung).
-
Ein
weiterer Ansatz für
eine genetische Analyse beruht auf Assoziationsuntersuchungen. Kopplungsuntersuchungen
folgen Allelen in Familien. Allerdings könnte jede Familie ein anderes
Allel eines Genorts besitzen, das mit dem betrachteten Phänotyp gekoppelt
ist. Assoziationsuntersuchungen folgen im Gegensatz dazu der Evolution
eines gegebenen Allels in einer Population. Die zugrunde liegende Annahme
besteht darin, dass zu einem gegebenen Zeitpunkt in der Evolutionsgeschichte
ein Polymorphismus mit einem Phänotyp
gekoppelt wurde, weil:
- a) er selbst für eine Veränderung
des Phänotyps verantwortlich
ist oder
- b) er physikalisch in der Nähe
eines Genorts, der einen solchen Effekt hervorruft, liegt und daher selten
durch Rekombination vom ursächlichen Sequenzelement
getrennt wird (man sagt, dass sich der Polymorphismus in einem Kopplungsungleichgewicht
mit dem ursächlichen
Ereignis befindet).
-
Dies
stellt einen fundamentalen Unterschied zwischen Kopplung und Assoziation
dar. Während bei
einem genetisch erworbenen Merkmal eine Kopplung einer Sequenz mit
dem ursächlichen
Allel bestehen muss, wenn man ein unendlich dichtes Kopplungsexperiment
ausführen
könnte,
gibt es keinen a priori-Grund, dass es ein einzelnes (oder sehr wenige)
ursächliches
Allel (Allele) in der Population geben könnte (d.h. es liegt eine Assoziation
vor). Dies hat wichtige Auswirkungen auf die statistische Analyse
zur Folge. Ein Beispiel für
eine Kopplung ohne Assoziation sind viele monogenen Erkrankungen,
z.B. Typ-II-Diabetes mellitus bei Jugendlichen (MODY), bei dem fast
jede Familie eine unterschiedliche Mutation im selben Gen trägt. Das
Gen wurde mittels Kopplungsuntersuchungen identifiziert. Assoziationsuntersuchungen
hätten
bei, der Identifizierung des Locus versagt. Da Assoziationsuntersuchungen
die Existenz eines bestimmten Allels für ein Merkmal von Interesse
postulieren, möchte
man, dass die Marker für
eine Assoziationsuntersuchung einfach sind. Die Marker der Wahl
für diese
Untersuchungen sind dementsprechend Einzelnukleotid-Polymorphismen
(SNPs). Diese Polymorphismen zeigen einen einfachen Basenaustausch
an einem gegebenen Locus (d.h. sie sind zwei-, selten drei-allelisch).
Assoziierungsuntersuchungen können
entweder in Populations-Testgruppen (Fälle vs. Kontrollen) oder in
Familien-Testgruppen (Eltern und ein Abkömmling, wo die übertragenen
Allele die "Fälle" und die nicht-übertragenen
Allele die "Kontrollen" darstellen) durchgeführt werden.
Die hauptsächlichen
Vorteile von Assoziationsuntersuchungen mit SNPs sind:
- – relativ
einfach zu typisieren (jede Technologie, die eine Unterscheidung
einzelner Basen ermöglicht,
z.B. DNA-Chips, Massenspektrometrie);
- – SNPs
sind im Humangenom im Überfluss
vorhanden (durchschnittlich ein SNP alle 300-1000 Basen);
- – Assoziation
erlaubt die Bestimmung eines relativ gut abgegrenzten genetischen
Bereichs (üblicherweise
einige Kilobasen).
-
Nachteile
sind:
-
- – Assoziationen
können
nur in einer sehr hohen Auflösung
nachgewiesen werden (eine ungeeignet hohe Anzahl von SNPs muss durchmustert werden,
wahrscheinlich mehr als 100.000);
- – da
nicht postuliert werden kann, dass eine Assoziation a priori vorliegt,
gelten die statistischen Regeln für eine Mehrfach-Testung, d.h.
das Ergebnis für
jeden zusätzlich
getesteten SNP muss daraufhin korrigiert werden. Das Ergebnis ist
ein ungeeignet hoher Schwellenwert für positive Assoziation, wenn
Tausende von Markern getestet werden, oder, anders ausgedrückt, eine
Inflation falsch positiver Ergebnisse bei nominalen Signifikanzwerten.
Neue statistische Hilfsprogramme sind vonnöten;
- – Assoziationstests
werden üblicherweise
als Zwei-auf-Zwei-Tests ausgeführt
(d.h. Polymorphismen an einem gegebenen Locus werden gegen einen
Phänotyp
getestet). Meta-Analysen sind für
Tausende von Markern schwierig, wenn nicht unmöglich, auszuführen;
- – wie
die Kopplungs- wird auch die Assoziations-Analyse durch die Allelfrequenz
beeinflusst;
- – es
existieren noch keine durchgängigen
genetischen Karten für
SNPs;
- – große Musterkollektionen
sind vonnöten;
- – die
gegenwärtige
Technologie ist zu teuer, um Tausende von Proben auf Tausende SNPs
zu genotypisieren (PCR, Kosten der Chip-Technologie, Gerätschaften),
und die Unterscheidung ist immer noch nicht verlässlich genug (z.B. Affymetrix SNP-Chip).
-
Dementsprechend
gibt es ein Bedürfnis
nach verbesserten oder alternativen Verfahren für die genetische Analyse, welche
die Nachteile dieser Technologien des Stands der Technik überwinden
würden.
Diesbezüglich
sollte die ideale Genotypisierungs-Technologie in der Lage sein,
sowohl nach Kopplung als auch Assoziation zu suchen und gleichzeitig
die Nachteile dieser Methoden zu vermeiden. Sie sollte verlässlich sein,
eine genomweite Analyse ermöglichen,
in der Lage sein, Phänotyp-gekoppelte Genorte
auf kleine Bereiche einzugrenzen, und einfach auszuführen und
zu analysieren und billig sein.
-
Ein "genomische Mismatch-Analyse ("GMS")" genanntes Verfahren scheint die meisten dieser
Anforderungen zu erfüllen.
Die genomische Mismatch-Analyse wurde in der "Mismatch-Reparatur-Gemeinde" entwickelt, die wenig mit der humanen
Kopplungsgemeinde zu tun hatte, welche versucht, die Gene zu finden,
die bei humanen Merkmalen beteiligt sind. Insbesondere wurde in
Nelson SF et al. (Genomic mismatch scanning: A new approach to genetic
linkage mapping. Am. J. Hum. Genet. 61:111-119 (1993)) ein Verfahren
beschrieben, welches den Nachweis und die Quantifizierung der Beziehung
zwischen unterschiedlichen Hefestämmen erlaubt. Das Verfahren
besteht darin, die DNAs von unterschiedlichen Hefestämmen zu
mischen und alles, was nicht identisch ist, mit einem Satz von Fehlpaarungsreparaturenzymen
zu zerstören.
Außer
bei der Forschergemeinde, die auf dem Gebiet der Fehlpaarungsreparatur
arbeitet, hatte der Artikel keine besondere Bedeutung. Allerdings
schien es logisch, dass diese Technologie auch angewendet werden könnte, um
identische Bereiche in Menschen nachzuweisen. Diesbezüglich veröffentlichten
Linda McAllister et al. 1998 einen proof-ofprinciple-Artikel, in
dem sie die Identifizierung eines humanen Erkrankungslocus auf Chromosom
11 mittels GMS beschreiben (Linda McAllister, Lolita Penland and
Patrick O. Brown. Enrichment of loci identical by descent between
pairs of mouse or human genomes by genomic mismatch scanning, Genomics
47: 7-11 (1998)).
-
Kurz
gesagt besteht das Verfahren aus den folgenden Schritten:
- – Restriktion
der DNA zweier Individuen;
- – Markierung
einer der DNAs durch Methylierung;
- – Mischung
der zwei DNAs, wobei ein Gemisch von Heteroduplexstrukturen zwischen
den zwei DNAs erzeugt wird, die hemimethyliert sind und von Homoduplexstrukturen
der ursprünglichen DNAs,
die der Renaturierung der DNA jedes Individuums mit sich selbst
entstammt. Da die DNA eines Individuums vollständig methyliert wurde und die
andere nicht-methyliert ist, sind die resultierenden Homoduplexstrukturen
ebenfalls methyliert oder nicht-methyliert;
- – die
nicht-informativen Homoduplexstrukturen werden durch mehrere enzymatische
Schritte eliminiert, die Restriktionsenzyme beinhalten, die nur
vollständig
methylierte oder vollständig
unmethylierte DNA verdauen und ein finaler Verdau der DNA durch
ExoIII-Nuklease.
- – Die
verbleibenden Heteroduplexstrukturen, die sich zwischen den DNAs
der zwei Individuen ausgebildet haben, bestehen aus wenigen Fragmenten,
die in ihrer Sequenzzusammensetzung 100 % identisch sind (die Fragmente
von Interesse), und aus denjenigen, welche aufgrund der Heterogenität zwischen
den Individuen Sequenzunterschiede zeigen (d.h. die Basen sind an
diesen Stellen fehlgepaart);
- – die
fehlgepaarten DNA-Fragmente werden mit einem enzymatischen DNA-Mismatch-Reparatursystem,
das aus drei Proteinen besteht (mutS, mutH, mutL), welche diese
Fehlpaarungen erkennen und die DNA-Stränge an einer spezifischen Erkennungssequenz
(GATC) schneiden, eliminiert;
- – die
verbleibenden zu 100 % identischen DNA-Heterohybride können anschließend durch eine
spezifische PCR-Vervielfältigung
identifiziert werden, bei der das Auftreten oder das Fehlen eines
Vervielfältigungsprodukts
gewertet wird.
-
Die
Vorteile dieses Verfahrens im Vergleich zu klassischen Kopplungs-
und Assoziationsuntersuchungen sind:
- – das Verfahren
erlaubt einen eindeutigen Nachweis von IBD-Fragmenten zwischen Individuen, da
es von Allelfrequenzen oder Markerheterozygotie unabhängig ist;
- – das
Verfahren ist nicht auf die Verwendung von polymorphen Markern beschränkt. Für die Ermittlung
kann jede beliebige Sequenz verwendet werden, solange etwas Sequenz-
und Kartierungsinformation verfügbar
ist;
- – es
ist keine Allelunterscheidung notwendig. Das Nachweissignal ist
digital (d.h. Vorhandensein oder Fehlen eines Fragments);
- – das
Nachweisverfahren kann auf jede beliebige Dichte skaliert werden;
- – aufgrund
des eindeutigen IBD-Nachweises und der Unabhängigkeit von der Allelfrequenz
müssen weniger
Individuen durchmustert werden (z.B. 100 Blutsverwandte besitzen
dieselbe Möglichkeit,
Kopplungsregionen nachzuweisen wie 400-600 Blutsverwandte in der
klassischen Kopplungsanalyse).
-
Die
klassische GMS-Methodik besitzt allerdings einige Nachteile, die
ihre Verwendung als ein Routinewerkzeug für eine genetische Analyse schwierig
machen:
- – die
DNA-Menge für
ein einzelnes Experiment ist groß auf Grund des Materialsverlusts
während der
Prozedur. Üblicherweise
werden 5 μg
DNA benötigt.
Iri Abhängigkeit
vom Extraktionsverfahren stellt dies oft mehr als die Hälfte der
DNA dar, die in einer Kollektion verfügbar ist.
- – Die
Methylierung einer der DNAs ist nicht zu 100 % effizient, d.h. einige
der Heteroduplexstrukturen können
nicht unterschieden werden und gehen verloren und einige der Homoduplexstrukturen der "methylierten" Individuen-DNA werden
nach dem Hybridisierungsschritt tatsächlich hemimethyliert sein
und daher bei der Nachweisschwelle im Hintergrund resultieren (wie
die DNA eines Individuums a priori zu 100 % identisch mit sich selbst
ist);
- – da
der Verdau mit der ExoIII-Nuklease eine zentrale Rolle in der Technologie
spielt, können
ausschließlich
Restriktionsenzyme, die 3'-überhängende Enden
erzeugen, für
den anfänglichen
Verdau der DNA verwendet werden (normalerweise wird PstI verwendet).
Diese Enzyme sind selten und schränken die Wahlmöglichkeit
für die
Restriktion der DNA und daher die Zusammensetzung der erzeugten
Fragmente ein;
- – eine
effiziente Erkennung nicht-identischer, fehlgepaarter DNA-Sequenzen
durch das mutSHL-System beruht auf der Anwesenheit der Erkennungssequenz
GATC in einem gegebenen Fragment. Das Fehlen der Sequenz resultiert
in einem Hintergrundsignal aufgrund der nicht-eliminierten fehlgepaarten
DNA;
- – paarweisen
die Markierung einer der DNAs durch Methylierung erlaubt nur einen Zwei-auf-Zwei
Vergleich zwischen verschiedenen DNAs.
-
Smith
et al. (PNAS 93 (1996) 4374) betrifft ein Verfahren für den Nachweis
von Mutationen in PCR-vervielfältigten
Nukleinsäurefragmenten.
WO 89/12695 betrifft ein Verfahren für die Isolierung von Nukleinsäuren, welche
zwei Nukleinsäurepopulationen
unterscheiden. WO 93/22462 betrifft einen Kit, der ein Nukleinsäure bindendes
Protein umfasst.
-
Daher
besteht auf diesem Gebiet ein Bedürfnis nach genetischen Analysetechniken
und Bestandteilen, die zweckmäßiger, einfach
auszuführen, verlässlich und
bei breiteren Populationen genetischen Materials anwendbar sind.
-
Die
vorliegende Erfindung stellt jetzt neuartige genetische Analyseverfahren
bereit, welche die Nachteile der GMS-Technik des Stands der Technik überwinden.
In besonderen Ausführungsformen
offenbart die Erfindung alternative und/oder verbesserte, auf dem
Konzept der GMS basierende Varianten, welche die meisten Nachteile
des oben genannten klassischen Ansatzes umgehen.
-
Insbesondere
wird ein Verfahren bereitgestellt, welches die Identifizierung identischer DNA-Sequenzen aus unterschiedlichen
Quellen ausgehend von einer kleinen anfänglichen Menge genomischer
DNA ermöglicht.
-
Es
wird ebenfalls ein Verfahren bereitgestellt, Nukleinsäuren aus
unterschiedlichen Populationen mit einem Primer zu vervielfältigen,
welcher eine für
jede Population spezifische Markierung umfasst.
-
Es
wird auch ein Verfahren bereitgestellt, um genomische DNA-Regionen
zu identifizieren, welche für
pathologische Zustände
oder besondere Merkmale relevant sind.
-
Es
wird auch ein Verfahren bereitgestellt für die Zubereitung heterohybrider
Nukleinsäuremoleküle aus zwei
oder mehr Nukleinsäurepopulationen, umfassend
einen Vervielfältigungsschritt
für jede
Nukleinsäurepopulation
vor einem Hybridisierungsschritt, wobei die Vervielfältigung
vorzugsweise das Koppeln eines Adapter-Moleküls an jede Nukleinsäure in den
Populationen umfasst, bevorzugterweise an deren beide Enden, und
eine Vervielfältigung
auszuführen
mit einem Primer, umfassend wenigstens einen Sequenzbereich, der
zu einem Sequenzbereich des Adapter-Moleküls komplementär ist.
-
Ein
besonderer Aspekt dieser Erfindung beruht insbesondere auf einem
Verfahren für
die Separierung identischer DNA-Fragmente aus komplexen Gemischen
von wenigstens zwei Nukleinsäurepopulationen
(aus unterschiedlichen Quellen), wobei das Verfahren die Hybridisierung
der wenigstens zwei Populationen und die Separierung der erzeugten identischen Heterohybride
umfasst, wobei die Nukleinsäurepopulationen
vervielfältigte
Nukleinsäuren umfassen.
-
Insbesondere
beruht ein Gegenstand der vorliegenden Erfindung auf einem Verfahren
für die Identifizierung
(oder Separation) identischer Nukleinsäurefragmente aus einem Gemisch
von mindestens zwei Nukleinsäurepopulationen
aus unterschiedlichen Quellen, wobei das Verfahren die Schritte
umfasst: a) separater Verdau der Nukleinsäuren der mindestens zwei Populationen
mit wenigstens einem Restriktionsenzym; b) Ligation spezifischer
Adapter-Sequenzen an die Restriktionsfragmente; c) Vervielfältigung
der an die Adapter-Sequenzen ligierten Fragmente, die in den Schritten
a) und b) mittels Adapter-spezifischer Primer erzeugt wurden; d)
Hybridisierung der Vervielfältigungsprodukte
von den verschiedenen Nukleinsäurepopulationen
untereinander; e) Identifizierung (oder Isolierung oder Separation)
der identischen, keine Basenunterschiede aufweisenden Heterohybridfragmente.
-
Dieses
Verfahren ist vorteilhaft, da es die Vervielfältigung der DNAs (d.h. die
Verwendung kleiner Mengen Ausgangsmaterials) und die Selektion von
Heteroduplexstrukturen ohne eine der Fehlpaarungsreparaturselektion
vorhergehende Methylierung (d.h. ohne Restriktion mit Restriktionsenzymen) erlaubt.
-
Es
wird auch ein Verfahren bereitgestellt, DNA-Bereiche zu identifizieren,
die für
pathologische Zustände
oder bestimmte Merkmale relevant sind, wobei das Verfahren die Hybridisierung
von wenigstens zwei Nukleinsäurepopulationen
aus unterschiedlichen Quellen, die ein bestimmtes Merkmal oder eine
bestimmte Pathologie aufweisen, und Separation der erzeugten identischen
Heterohybride, welche DNA-Bereiche enthalten, die für die pathologischen
Zustände
oder besonderen Merkmale relevant sind, wobei die Nukleinsäurepopulationen
vervielfältigte
und/oder prä-selektionierte
Nukleinsäuren umfassen.
-
Andere
Aspekte der vorliegenden Erfindung beruhen auf Zusammensetzungen,
Kits und diagnostischen Assays.
-
Wie
oben angegeben, stellt die vorliegende Erfindung ein Verfahren zur
Identifizierung (oder Isolierung oder Separation) identischer Nukleinsäurefragmente
aus einem Gemisch von mindestens zwei Nukleinsäurepopulationen bereit, wobei
das Verfahren die Schritte umfasst: a) separater Verdau der Nukleinsäuren der
mindestens zwei Populationen mit mindestens einem Restriktionsenzym;
b) Ligation einer spezifischen Adapter-Sequenz an die Restriktionsfragmente;
c) Vervielfältigung
der an die Adapter-Sequenzen ligierten Restriktionsfragmente, die
in den Schritten a) und b) mittels Adapter-spezifischer Primer erzeugt
wurden; d) Hybridisierung der Vervielfältigungsprodukte von den verschiedenen Nukleinsäurepopulationen
untereinander; und e) Identifizierung (oder Isolation oder Separation)
identischer, keine Basenunterschiede aufweisender Heterohybridfragmente.
-
Die
Erfindung kann für
die Analyse verschiedener Nukleinsäurepopulationen verwendet werden, insbesondere
mit dem Ziel, darin vorhandene identische Bereiche zu identifizieren
(oder zu separieren). Normalerweise sind die Nukleinsäurepopulationen genomische
DNA, insbesondere genomische DNA aus einem Säugetier, beispielsweise humane
genomische DNA. In einer bevorzugten Ausführungsform sind die Nukleinsäurepopulationen
humane genomische DNA aus verschiedenen Individuen, die ein Merkmal
von Interesse gemeinsam haben, insbesondere einen Phänotyp oder
eine Pathologie. In dieser Ausführungsform
zielt das Verfahren der vorliegenden Erfindung auf die Identifizierung
genetischer Marker der Pathologie ab, oder von Genen (Mutationen),
die an der Pathologie beteiligt oder für sie verantwortlich sind.
-
Die
Nukleinsäurepopulationen
können
auch genomische DNA von anderen Säugetierarten wie Rind, Schaf,
Hund, Schaf, Ziegen und ähnlichem sein.
Insbesondere kann die genomische DNA von Tieren (derselben Art)
zubereitet werden, die ein besonderes Merkmal (hohe Fleisch-, hohe
Milchproduktion, etc.) gemeinsam haben.
-
Die
Nukleinsäurepopulationen
können
auch genomische DNA aus anderen Quellen sein, einschließlich Prokaryonten
(Bakterien, pathogene Organismen, etc.), niedere Eukaryonten (Hefen,
etc.), Pflanzen, Viren und Ähnliches.
-
Während die
Nukleinsäurepopulation
zum Beispiel die gesamte genomische DNA einer Zelle (oder eines
Gewebes oder eines Organismus) oder eine komplette genomische Bibliothek
umfassen kann, sollte besonders erwähnt werden, dass eine Durchmusterung
oder Auswahl der Ausgangsnukleinsäuren ebenfalls ausgeführt werden
kann. Insbesondere kann die Nukleinsäurepopulation ein isoliertes
Chromosom (oder eine Gruppe von Chromosomen) sein.
-
Für die Durchführung der
vorliegenden Erfindung können
zwei oder mehr Nukleinsäurepopulationen
verwendet werden, die von unterschiedlichen Quellen abstammen. In
bevorzugten Ausführungsformen
können
zwei bis 10 Nukleinsäurepopulationen verwendet
werden.
-
Im
ersten (optionalen) Schritt werden die Nukleinsäurepopulationen separat verdaut,
so dass Restriktionsfragmente bereitgestellt werden. Der Ausdruck "separat" zeigt an, dass jede
Population dem Verdau einzeln unterzogen wird, d.h. ohne miteinander
vermischt zu werden. Es kann/können
ein oder mehrere Restriktionsenzyme) verwendet werden. Vorzugsweise
wird/werden das/dieselbe(n) Restriktionsenzyme) für jede Nukleinsäurepopulation
verwendet. Das/die Restriktionsenzym(e) kann/können entsprechend praktischer Überlegungen
ausgewählt werden,
wie die Größe der erzeugten
Fragmente, die Spezifität
für DNA-Arten,
enzymatische Aktivität,
Benutzerfreundlichkeit, etc. In einer bevorzugten Ausführungsform
stellt das Restriktionsenzym im Durchschnitt Restriktionsfragmente
mittlerer Länge,
insbesondere Fragmente zwischen 2 und 10 Kilobasen (kb) bereit.
Solche Restriktionsenzyme beinhalten beispielsweise Enzyme mit einer
sechs Basen langen Erkennungsstelle, wie ApaI (~2 kb), BamHI (~5 kb),
BglI + II (~3 kb), HindIII (~4 kb), NarI (~4 kb), SmaI (~4 kb) oder
XbaI (~5 kb).
-
In
einer spezifischen Ausführungsform
wird ein einzelnes Restriktionsenzym verwendet, welches im Durchschnitt
Restriktionsfragmente von zwischen 2 und 10 Kilobasen bereitstellt.
-
In
einer besonderen Ausführungsform
können
die Restriktionsfragmente vor dem nachfolgenden Ligations- und/oder
Vervielfältigungsschritt
ausgewählt
werden. Insbesondere können
die Restriktionsfragmente Größen-selektioniert
werden, so dass eine gleichmäßige Vervielfältigung
aller Fragmente ermöglicht
wird. Eine Größenselektion
kann auf einem Gel oder mittels anderer Techniken ausgeführt werden.
In einem Agarosegel werden Restriktionsfragmente in einem elektrischen
Feld neben einem Größenstandard
zur Orientierung der Größe nach aufgetrennt.
Fragmente der bevorzugten Größenordnung
können
aus dem Gel herausgeschnitten und mittels Standardmethoden (z.B.
Gelextraktionskit Quiaex II, Quiagen AG, Deutschland) aus der Agarose
extrahiert werden. Eine Größenseparation
kann auch mit einer Säulenseparation
mit einem Siebmaterial wie Polyacrylamid, Sephadex, etc. erreicht
werden.
-
Zusätzlich können die
Restriktionsfragmente vor dem Vervielfältigungsschritt in jeden geeigneten Vektor
kloniert werden. Der Vektor kann jedes beliebige Plasmid, jeder
Phage, Virus, Cosmid, künstliches
Chromosom (YAC, BAC), etc. sein. Insbesondere können die Restriktionsfragmente
Chromosomen- und Sequenz-spezifisch kloniert werden. In einer besonderen
Ausführungsform
umfasst das Verfahren daher (i) einen separaten Verdau der Nukleinsäurepopulationen
(z.B. genomische DNA von wenigstens zwei unterschiedlichen Quellen)
und (ii) die Klonierung (bestimmter) Restriktionsfragmente in einen
Vektor, auf eine Chromosomen- und Sequenz-spezifische Art (z.B.
durch homologe Rekombination). Dieser Klonierungsschritt kann verwendet werden,
um bestimmte Fragmente für
eine weitere Analyse auszuwählen,
ohne die gesamte DNA-Population zu analysieren.
-
Ein
weiterer besonderer Aspekt dieser Erfindung beruht auf der Verwendung
von Adaptermolekülen,
die eine spezifische Vervielfältigung
der Nukleinsäuren
und eine spezifische Behandlung der Proben erleichtern, so dass
die Selektivität
des Identifikationsverfahrens erhöht wird.
-
Adapter-Moleküle sind
vorzugsweise kurze doppelsträngige
DNA-Fragmente (oder Oligonukleotide) mit bekannter Sequenzzusammensetzung.
Bevorzugterweise sind Adapter- Moleküle 5-100
Basenpaare lange doppelsträngige
DNA-Moleküle,
sogar noch bevorzugter sind sie 5-50 Basenpaare lang. Die Adapter-Moleküle erlauben
die Einführung
von Sequenzmerkmalen, welche die Prozedur der genetischen Analyse
wesentlich verbessern. Insbesondere besitzt die Einführung dieser
Adaptoren die folgenden Vorteile:
-
- – die
DNA kann vor der genetischen Analyse (z.B. GMS) mittels PCR vervielfältigt werden,
so dass mit weniger Material angefangen werden kann (100-500 ng).
Es ist nur eine Vervielfältigung
pro Experiment mit einer einzigen Primersequenz notwendig, was dieses
Verfahren billig macht;
- – die
Adapter-Sequenz ist vorzugsweise gestaltet, so dass sie die mutHL-Erkennungssequenz (GATC)
beinhaltet, was die Entfernung aller fehlgepaarter Fragmente aus
dem Gemisch ermöglicht,
so dass die Selektivität
erhöht
und das Hintergrundsignal verringert wird;
- – das
Adapter-Molekül
kann auch eine Erkennungsstelle für ein Restriktionsenzym umfassen, das
3'-überhängende Enden
erzeugt, wie AatIII.
-
In
einer bevorzugten Ausführungsform
ist das Adapter-Molekül
ein 5-100 Basen langes (doppelsträngiges) Oligonukleotid, das
wenigstens ein GATC-Motiv umfasst.
-
Die
Adapter-Moleküle
können
nach gängigen
Techniken (künstliche
Synthese) zubereitet und mittels herkömmlicher Verfahren an die Restriktionsfragmente
(oder an die Nukleinsäurepopulation,
sofern kein Restriktionsschritt ausgeführt wurde) ligiert werden (indem
beispielsweise ein Ligase-Enzym wie die T4-Ligase verwendet wird).
Das Verfahren dieser Erfindung umfasst vorzugsweise die Ligation
aller Nukleinsäuren
in den verschiedenen Populationen an das gleiche Adapter-Molekül. Bevorzugterweise resultiert
die Ligation des Adapter-Moleküls
in DNA-Fragmenten, die eine Adapter-Sequenz an beiden Enden tragen.
-
Die
Vervielfältigung
der Nukleinsäuren
(oder Restriktionsfragmente) kann durch eine Polymerasekettenreaktion
(PCR) gemäß herkömmlicher
Techniken erreicht werden. Vorzugsweise wird die Vervielfältigung
durch eine Polymerasekettenreaktion mit einer weitreichenden DNA-Polymerase
mit einer hohen Wiedergabetreue ausgeführt. Beispiele für solche
Polymerasen beinhalten die Pfx-Polymerase (Life Technologies) und
die Z-Taq-Polymerase
(TaKaRa). Es können
mehrere Vervielfältigungszyklen durchgeführt werden,
insbesondere 25 bis 40.
-
Ein
weiterer Vorteil der vorliegenden Erfindung beruht in der Verwendung
bestimmter Primer für
die Vervielfältigungsreaktion.
Die Primer sind vorzugsweise zu wenigstens einem Teil des Adapter-Moleküls komplementär. Die Primer
können
jedes beliebige Oligonukleotid sein, vorzugsweise mit 5 bis 30 Basen,
noch bevorzugter mit 5-20 Basen. Der Teil der Primer, der zu dem
(Teil des) Adapter-Moleküls) komplementär ist, sollte
vorzugsweise wenigstens 5, bevorzugterweise wenigstens 10 Basen
umfassen, um eine ausreichende Selektivität sicherzustellen. Primer können vom
Durchschnittsfachmann gemäß herkömmlicher
Techniken, die im Fachgebiet bekannt sind, hergestellt werden (vorzugsweise
künstliche
Nukleinsäuresynthese).
-
In
einer bevorzugten Ausführungsform
werden die Primer markiert, was dem vorliegenden Verfahren weitere
Vorteile bringt. Insbesondere erlaubt die Einführung markierter Primer für die (PCR)-Vervielfältigung
die Unterscheidung der unterschiedlichen, gemischten DNA-Populationen. In
der Tat kann der jeweilige Primer, welcher für die Vervielfältigung der
jeweiligen Nukleinsäurepopulation
verwendet wird, eine unterschiedliche Markierung aufweisen, beispielsweise
unterschiedliche, einzigartige 5'-Sequenzen
(oder einige können
markiert sein und einige nicht), was die Unterscheidung der vervielfältigen Produkte
der jeweiligen Quelle erlaubt. Dies umgeht die Notwendigkeit für einen
Methylierungsschritt. Dementsprechend werden keine Methylierungs-spezifischen
Restriktionsenzyme gebraucht, und so kann eine beachtliche Senkung
der Kosten pro Experiment erreicht werden. Ferner ermöglicht es
die Verwendung von markierten Primern, mehr als nur paarweise Vergleiche
auszuführen
(mehrere Individuen sind in einer Reaktion beinhaltet, d.h. mehr
als zwei Nukleinsäurepopulationen).
Dies kann verwendet werden, um die Auflösung dieses Verfahrens zu erhöhen (es
werden kleinere IBD-Bereiche nachgewiesen). Dieses Merkmal ist besonders
nützlich,
wenn nach einer allelischen Assoziation gesucht wird.
-
Darüber hinaus
können
die Primer auf eine Weise gestaltet werden, die es der ExoIII-Nuklease erlaubt,
die nach der Hybridisierung zwischen den Nukleinsäurepopulationen
ausgebildeten Homoduplexstrukturen anzugreifen, aber nicht die Heteroduplexstrukturen.
Dementsprechend spielen die Restriktionsenden keine Rolle in der
Wahl des Restriktionsenzyms für
den Verdau der Nukleinsäurepopulationen.
Daher können
die Enzyme gemäß praktischer Überlegungen
ausgewählt
werden (Größe der erzeugten
Fragmente, Spezifität
für DNA-Arten,
Enzymaktivität
und Benutzerfreundlichkeit).
-
Primer
können
durch (i) die Zugabe einer einzigartigen 5'-Sequenz zu jedem Primer, (ii) durch die
Zugabe einer chemischen Aktivität
zu dem Primer, die Mittel bereitstellt, um zwischen den Vervielfältigungsprodukten
der unterschiedlichen DNA-Quellen zu unterscheiden, und (iii) durch
die Zugabe modifizierter Nukleotide zum Primer, welche es erlauben,
zwischen den Vervielfältigungsprodukten
der unterschiedlichen DNA-Quellen zu unterscheiden, markiert werden.
Eine bevorzugte Markierungstechnik umfasst die Einführung einer
einzigartigen 5'-Sequenz zu jedem
Set von Primern.
-
Die
Identifizierung (oder Isolierung oder Separation) der identischen,
keine Basenunterschiede aufweisenden Heterohybridfragmente kann
auf mehrere Arten ausgeführt
werden. Vorzugsweise umfasst die Identifizierung die folgenden Schritte:
(i) Separation der Homohybriden von den Heterohybriden; (ii) (Identifizierung
und) Eliminierung von fehlgepaarten Heterohybriden, und (iii) Identifizierung
(oder Isolierung oder Separation) der identischen Heterohybridfragmente.
-
Die
Heterohybride können
von den Homohybriden, basierend auf der Markierung der Primer, wie oben
beschrieben, separiert werden. Insbesondere kann die Separation,
basierend auf der Verwendung von Primern mit einer für jede Nukleinsäurepopulation
einzigartigen 5'-Endsequenz
ausgeführt
werden. Gemäß dieser
Ausführungsform
werden die Homohybride nur glatte Enden aufweisen, d.h. perfekt
basengepaarte DNA-Enden umfassen (die einzigartige 5'-Endsequenz des spezifischen
Primers). Dementsprechend können
alle Homohybride durch eine Behandlung des Hybridisierungsprodukts
mit einem Enzym, das spezifisch doppelsträngige DNA-Fragmente mit glatten
Enden verdaut, wie ExoIII, eliminiert werden. Die Behandlung mit
ExoIII resultiert in der Bildung von Einzelsträngen, die mit verschiedenen Verfahren
eliminiert werden können,
beispielsweise durch die Bindung an eine Einzelstrang-spezifische Matrix.
-
In
dieser Hinsicht umfasst das Verfahren der vorliegenden Erfindung
in einer spezifischen Ausführungsform
a) eine separate Vervielfältigung
der Restriktionsfragmente aus unterschiedlichen Quellen mit einem
Primer mit einer für
jede DNA-Quelle einzigartigen 5'-Sequenz; b) Mischen
der Vervielfältigungsprodukte
der unterschiedlichen Quellen, die einzigartige 5'-Enden tragen; c)
Denaturierung und Rehybridisierung der DNAs; d) Verdau perfekt basengepaarter
DNAs (Homoduplexstrukturen mit glatten Enden) durch ExoIII und e)
Eliminierung der von ExoIII erzeugten Einzelstränge durch die Bindung an eine Einzelstrangspezifische
Matrix.
-
Die
Separation von DNA-Homoduplexstrukturen von DNA-Heteroduplexstrukturen
kann auch basiert auf die Methylierung einer der zwei Nukleinsäurezubereitungen
(oder der Restriktionsfragmente) ausgeführt werden. Obwohl nicht bevorzugt,
kann diese Ausführungsform
vorteilhaft ausgeführt
werden, wenn der Vervielfältigungsprimer
oder das Adapter-Molekül
eine Erkennungsstelle für
ein Enzym umfasst, das 3'-überhängende Enden
erzeugt (wie AatIII). In der Tat können die Nukleinsäurepopulationen
in dieser Ausführungsform
mit jedem beliebigen Typ von Restriktionsenzym verdaut werden.
-
Fehlgepaarte
Heterohybride können
vorzugsweise mit Mismatch-Reparaturenzymen eliminiert werden. Insbesondere
kann die Unterscheidung zwischen (oder Eliminierung oder Separation
von) fehlgepaarten und keine Basenunterschiede aufweisenden Nukleinsäurefragmenten
ausgeführt
werden, indem die Mismatch-Reparaturenzyme mutS, mutL und/oder mutH
oder Derivate oder Homologe davon verwendet werden. Derivate beinhalten
Fragmente oder Varianten der mut-Proteine, d.h. jedes Polypeptid
oder Fragment, das von diesen abgeleitet wurde und die biologische
Aktivität
des Proteins beibehalten hat. Bevorzugte Derivate behalten wenigstens
80 % der primären
Struktur des mut-Proteins bei. Homologe beinhalten Proteine, welche
denselben Typ von enzymatischer Aktivität in anderen biologischen Systemen
(Hefen, Pflanzen, etc.) aufweisen.
-
Insbesondere
können
fehlgepaarte Nukleinsäurefragmente
durch (i) Inkubation des Hybridisierungsgemisches mit mutS (das
an die Fehlpaarung bindet) und Kontaktierung des resultierenden
Produkts mit einem mutS-bindenden Material (z.B. Trägermaterial,
Bead, Säule,
etc.) eliminiert werden.
-
Fehlgepaarte
Nukleinsäurefragmente
können
auch durch eine Inkubation des Hybridisierungsgemisches mit mutS,
mutL und mutH, was in einer spezifischen Spaltung der fehlgepaarten
Hybride und einer darauf folgenden Ausbildung von glatten Enden resultiert,
die durch die Behandlung mit besonderen Enzymen (wie ExoIII eliminiert
werden können,
und durch Eliminierung der ausgebildeten Einzelstrang-DNA eliminiert
werden.
-
In
einer spezifischeren Ausführungsform
umfasst das Verfahren folgende Schritte:
- – separater
Verdau der genomischen DNAs aus wenigstens zwei unterschiedlichen
Quellen mit einem Restriktionsenzym;
- – Ligation
eines Adapter-Moleküls
an diese genomischen Restriktionsfragmente;
- – Vervielfältigung
der Adapter-ligierten Restriktionsfragmente (vorzugsweise mittels
Polymerasekettenreaktion (PCR)), indem markierte Adapter-spezifische
Primer verwendet werden;
- – Hybridisierung
der Vervielfältigungsprodukte (z.B.
PCR) der unterschiedlichen DNA-Quellen untereinander;
- – Separation
der Homoduplexstrukturen von den Heteroduplexstrukturen;
- – Identifizierung
und Eliminierung fehlgepaarter Heterohybride mit den mutSHL-Proteinen;
- – Identifizierung
der zu 100 % identischen Heteroduplexfragmente.
-
Wie
zuvor angegeben besitzen die Primer eine Sequenz, die zu wenigstens
einem Teil der Adapter-Sequenz komplementär ist. Des Weiteren sind sie
vorzugsweise markiert, und stellen daher ein Mittel bereit, um zwischen
den Vervielfältigungsprodukten
der unterschiedlichen DNA-Quellen zu unterscheiden.
-
In
einem weiteren Aspekt beruht die Erfindung auf einem Verfahren der
genetischen Analyse, wobei das Verfahren die Schritte umfasst: a)
Verdau von DNA aus verschiedenen Quellen, die ein Merkmal von Interesse
gemeinsam haben, von dem angenommen wird, dass es auf derselben
genetischen Veränderung
beruht, mit einem Enzym, das im Durchschnitt DNA-Fragmente mittlerer
Länge bereitstellt
(z.B. Fragmente von 2 bis 10 Kilobasen); b) Ligation spezifischer Adaptoren
an diese Restriktionsfragmente (diese Adaptoren stellen ein Mittel
bereit, eine bekannte Sequenz und ein Mittel für die spätere Selektion in der Reaktion
einzuführen);
c) Markieren von wenigstens einer der DNAs aus den verschiedenen
Quellen mit einer Methode, die es erlaubt, die DNAs aus den verschiedenen
Quellen voneinander zu unterscheiden; d) Vervielfältigung
der auf diese Weise zubereiteten Restriktionsfragmente mittels Polymerasekettenreaktion
(PCR); e) Mischen der DNAs aus verschiedenen Quellen und Erzeugung von
Heteroduplexstrukturen zwischen den DNA-Strängen dieser Quellen; f) Eliminierung
von Homoduplexstrukturen, die durch die Renaturierung zweier DNA-Stränge derselben
Quelle erzeugt werden; g) Eliminierung von Heteroduplexstrukturen
mit fehlgepaarten Basen; h) Nachweis und Identifizierung der resultierenden
zu 100 % identischen DNA-Sequenzen.
-
Wie
oben erwähnt,
beinhaltet das Adapter-Molekül
in einer bevorzugten Ausführungsform der
Erfindung spezifische Sequenzeigenschaften: a) die Erkennungsstelle
für mutHL
(GATC), b) eine Erkennungsstelle für ein Restriktionsenzym, das 3'-überhängende Enden erzeugt (z.B.
AatIII.
-
In
einer weiteren spezifischen Ausführungsform
der vorliegenden Erfindung wird eine der an der Prozedur teilnehmenden
DNAs nach dem Verdau und der Adapter-Ligation vorzugsweise mit dam-Methylase
methyliert. Die DNAs aus verschiedenen Quellen werden anschließend separat
mittels PCR vervielfältigt,
wobei Adapter-spezifische Oligonukleotidprimer verwendet werden.
Die resultierenden Vervielfältigungsprodukte
werden mit einem Restriktionsenzym verdaut, das 3'-überhängende Enden erzeugt (wenigstens
2 Stellen/Fragment, die in den Adapter eingeführt wurden), so dass die Fragmente
vor einem ExoIII-Verdau geschützt
werden. Die DNA-Fragmente
aus zwei verschiedenen Quellen werden dann gemischt und hemi-methylierte
Heteroduplexstrukturen werden zwischen den DNA-Strängen durch
Hitzedenaturierung und Renaturierung unter stringenten Bedingungen
ausgebildet (Casna et al. (1986) genomic analysis II, isolation
of high molecular weight heteroduplex DNA following methylase protection
and formamide PERT hybridization, Nucleic Acids Res. 14: 7285-7303).
Nicht-methylierte und vollständig
methylierte Homoduplexstrukturen werden mit Methylierungs-sensitiven
Restriktionsenzymen geschnitten. Die geschnittenen Fragmente werden
dann mit der ExoIII-Exonuklease
weiter verdaut, und die resultierenden einzelsträngigen Bereiche werden aus
dem Reaktionsgemisch mittels einer Einzelstrang-spezifischen Matrix
eliminiert, welche dem Durchschnittsfachmann bekannt ist (z.B. BND-Cellulose-Beads).
Die verbleibenden Heteroduplexstrukturen stellen ein Gemisch von
Fragmenten dar, die zu 100 % basengepaart sind und denen, die DNA-Basenpaar-Fehlpaarungen
aufweisen (aufgrund des Unterschieds zwischen den Individuen). DNA-Fragmente
mit fehlgepaarten DNA-Sequenzen werden durch Zugabe des mutSHL-Mismatch-Reparaturproteins
zum Reaktionsgemisch erkannt und geschnitten. Fragmente, die geschnitten
wurden, werden mit der ExoIII-Exonuklease weiter verdaut, und Einzelstränge werden
wie oben beschrieben eliminiert.
-
In
einer bevorzugten Ausführungsform
der Erfindung ist das Verfahren durch die folgenden Schritte charakterisiert:
a) Verdau von DNA aus wenigstens zwei verschiedenen Quellen mit
einem Restriktionsenzym; b) Ligation spezifischer Adaptoren an die
Restriktionsfragmente; c) separate Vervielfältigung der Restriktionsfragmente
aus den unterschiedlichen Quellen unter Verwendung eines Primers
mit einer unterschiedlichen Markierung (z.B. ein einzigartiges 5'-Ende) für jede DNA dieser Quellen;
d) Mischen der Vervielfältigungsprodukte
der verschiedenen Quellen, die eine einzigartige Markierung tragen (z.B.
ein einzigartiges 5'-Ende);
e) Denaturierung und Re-Hybridisierung dieser DNAs aus verschiedenen Quellen;
f) Verdau von perfekt basengepaarten DNAs (Homoduplexstrukturen
mit glatten Enden) mittels ExoIII-Exonuklease; g) Eliminierung der durch ExoIII
erzeugten Einzelstränge
mittels Bindung an eine Einzelstrang-spezifische Matrix; h) Erkennung und
Nicken der fehlgepaarten Heteroduplexstrukturen durch Zugabe der
mutSHL-Proteine zum Reaktionsgemisch; i) ExoIII-Verdau der genickten DNAs; j) Eliminierung
der durch ExoIII erzeugten Einzelstränge mittels Bindung an eine
Einzelstrang-spezifische Matrix; k) Nachweis und Identifizierung
der verbleibenden zu 100 % basengepaarten Sequenzen im Reaktionsgemisch.
-
Die
identifizierten (oder separierten oder isolierten) identischen DNA-Fragmente
können
weiter analysiert werden, um ein Gen, eine Mutation und Ähnliches
zu bestimmen. Insbesondere können
die Fragmente mittels Sequenzierung analysiert werden. Sie können auch
mittels Hybridisierung mit (einem) geordneten DNA-Arrays) oder mit
kodierten Beads, die spezifische DNA-Sequenzen tragen, analysiert werden.
-
Die
Erfindung betrifft auch Kits, die verwendet werden können, um
die oben beschriebenen Techniken der genetischen Analyse auszuführen. Insbesondere
beruht die Erfindung auf einem Kit, der für eine genetische Analyse,
wie sie oben beschrieben ist, geeignet ist, wobei das Kit ein doppelsträngiges Adapter-Molekül, einen
spezifisch markierten Primer und, gegebenenfalls, Kontroll-DNAs
und Enzyme umfasst. Kits gemäß der vorliegenden
Erfindung können
ferner ein Mittel für
den Nachweis der ausgewählten
DNA-Fragmente umfassen, vorzugsweise einen geordneten DNA-Array
oder kodierte Beads, die spezifische DNA-Sequenzen tragen.
-
Die
Erfindung kann verwendet werden, um Gene oder Mutationen zu identifizieren,
die in einer Pathologie, beispielsweise in komplexen Pathologien (Fettleibigkeit,
Asthma, kardiovaskuläre
Erkrankungen, Störungen
des ZNS, etc.), beteiligt sind. Die Erfindung ist allgemein für die Analyse
jedes genetischen Materials anwendbar, besonders mit dem Ziel, identische
DNA-Bereiche, die
in zwei (oder mehr) unterschiedlichen Nukleinsäurepopulationen vorhanden sind,
zu identifizieren (oder zu durchmustern).
-
Weitere
Aspekte und Vorteile der vorliegenden Erfindung werden im folgenden
Abschnitt mit den Beispielen offenbart und sollten als erläuternd und nicht
als begrenzend betrachtet werden.
-
Beispiel 1: Identifizierung
Erkrankungs-bezogener Loci in verwandten menschlichen Individuen
-
Genomische
DNA von mindestens zwei verwandten Individuen mit demselben Erkrankungs-Phänotyp wird
mittels Standardverfahren, z.B. Phenol-Chloroform-Extraktion, extrahiert.
Die DNAs werden separat mit einem Restriktionsenzym (z.B. BamHI)
geschnitten, so dass Restriktionsfragmente mit einer durchschnittlichen
Größe von ungefähr 4 Kilobasen
erzeugt werden. Zu diesen Restriktionsfragmenten wird eine Lösung mit
kurzen doppelsträngigen
Oligonukleotiden (Adaptoren) hinzugefügt. Die Adapter-Moleküle haben
Sequenzenden, die zu den Sequenzen der Restriktionsstellen komplementär sind,
so dass eine Ligation ermöglicht
wird. Die Adaptoren werden anschließend mit einer gewöhnlichen Ligase
(z.B. T4-Ligase) an die Restriktionsfragmente der genomischen DNAs
ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass:
a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere,
die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und
nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren.
Die Adapter-tragenden Fragmente werden dann, separat für jedes
Individuum, mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind und
die einzigartige 5'-Enden
tragen, vervielfältigt.
Nach mehreren Vervielfältigungsrunden
unterscheiden sich die PCR-Produkte der unterschiedlichen Individuen
in ihren Enden. Die Vervielfältigungsprodukte
werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter
Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis
II, Isolation of high molecular weight heteroduplex DNA following
methylase protection and formamide PERT hybridization, Nucleic Acids Res.
14:7285-7303) wird eine Anlagerung der DNA-Stränge ermöglicht. Dies resultiert in
der Ausbildung von Heteroduplexstrukturen aus den DNAs verschiedener
Quellen (Individuen) mit gegabelten (einzelsträngigen) Enden, wegen der Nicht-Komplementarität der Primersequenzen.
Darüber
hinaus werden Homoduplexstrukturen durch Renaturierung der Stränge eines
Individuums mit sich selbst ausgebildet. Diese Homoduplexstrukturen
besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche
die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit
Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) enthält,
zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit
glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in den
Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert
werden. Die verbleibenden Heteroduplexstrukturen umfassen einen
Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen
(Nicht-IBD-Fragmente). Eine
Lösung
mit den Mismatch-Reparaturenzymen mutSHL wird dem Gemisch zugefügt, was
im Nicken der fehlgepaarten Heteroduplexstrukturen an einer spezifischen
Erkennungsstelle (GATC) resultiert. Diese Nicks werden durch die
Zugabe der ExoIII-Exonuklease
(oder einer äquivalenten
Exonuklease mit Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) zu dem Reaktionsgemisch weiter verdaut,
was große
einzelsträngige
Lücken
in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads)
eliminiert werden. Die verbleibenden Fragmente im Reaktionsgemisch
stellen einen Pool von zu 100 % identischen DNA-Hybriden dar, die
zwischen den DNAs der verschiedenen Individuen ausgebildet werden,
und umfassen die Loci, die für
den Krankheits-Phänotyp
verantwortlich sind. Diese Fragmente können nachgewiesen und identifiziert
werden (z.B. durch Hybridisierung mit einem DNA-Array, der das gesamte Humangenom repräsentiert).
Ein Signalvergleich einer Anzahl von Experimenten in unterschiedlichen
Familien mit demselben Krankheits-Phänotyp erlaubt die Identifizierung
der mit der Erkrankung gekoppelten Bereiche (Erkrankungs-spezifischer
Genom-Haplotyp).
-
Beispiel 2: Identifizierung
von Loci für
quantitative Merkmale (QTLs) in Haustieren
-
Ein
Ziel in der modernen landwirtschaftlichen Tierzucht ist die Selektion
auf oder gegen bestimmte quantitative Merkmals-Phänotypen
(z.B. Muskelmasse, Milchmenge, Konzentration von Kasein in der Milch
für die
Käseproduktion,
etc.). Die genetischen Mechanismen, die zu einem Merkmal führen, sind
mit mehreren beteiligten Loci häufig
komplex. Diese Loci können
mit unserem Verfahren identifiziert werden. In diesem Beispiel wird
genomische DNA von verschiedenen Tieren, die ein Merkmal von Interesse gemeinsam
haben (z.B. überdurchschnittlich
hohe Kaseinkonzentration in der Milch) mit einer Restriktionsendonuklease
restringiert, die Fragmente einer durchschnittlichen Länge von
etwa 4 Kilobasen erzeugt (z.B. BamHI). Zu diesen Restriktionsfragmenten
wird eine Lösung
mit kurzen doppelsträngigen Oligonukleotiden
(Adaptoren) hinzugefügt.
Die Adapter-Moleküle
haben Sequenzenden, die zu den Sequenzen der Restriktionsstellen
komplementär
sind, so dass eine Ligation ermöglicht
wird. Die Adaptoren werden anschließend mit einer gewöhnlichen
Ligase (z.B. T4-Ligase) an die Restriktionsfragmente der genomischen
DNAs ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass:
a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere,
die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und
nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren.
Die Adapter-tragenden Fragmente werden dann, separat mittels PCR
mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind,
aber die einzigartige 5'-Enden
tragen, vervielfältigt.
Nach mehreren Vervielfältigungsrunden
unterscheiden sich die PCR-Produkte der DNAs der verschiedenen Tiere
in ihren Enden. Die Vervielfältigungsprodukte
werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter
Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis
II, Isolation of high molecular weight heteroduplex DNA following
methylase protection and formamide PERT hybridization, Nucleic Acids
Res. 14:7285-7303)
wird eine Anlagerung der DNA-Stränge
ermöglicht.
Dies resultiert in der Ausbildung von Heteroduplexstrukturen aus
den DNAs der verschiedenen Tiere mit gegabelten (einzelsträngigen)
Enden, wegen der Nicht-Komplementarität der Primersequenzen. Darüber hinaus
werden Homoduplexstrukturen durch Renaturierung der Stränge eines
Tieres mit sich selbst ausgebildet. Diese Homoduplexstrukturen besitzen
glatte Enden. Diesem Gemisch wird eine Lösung, welche die ExoIII-Exonuklease
(oder eine äquivalente
Exonuklease mit Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) enthält,
zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit
glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in
den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert
werden. Die verbleibenden Heteroduplexstrukturen umfassen einen
Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen
(Nicht-IBD-Fragmente).
Eine Lösung
mit den Mismatch-Reparaturenzymen mutSHL wird dem Gemisch zugefügt, was
im Nicken der fehlgepaarten Heteroduplexstrukturen an einer spezifischen
Erkennungsstelle (GATC) resultiert. Diese Nicks werden durch die
Zugabe der ExoIII-Exonuklease
(oder einer äquivalenten
Exonuklease mit Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) zu dem Reaktionsgemisch weiter verdaut,
was große einzelsträngige Lücken in
den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads)
eliminiert werden. Die verbleibenden Fragmente im Reaktionsgemisch
stellen einen Pool von zu 100 % identischen DNA-Hybriden dar, die
zwischen den DNAs der verschiedenen Tiere ausgebildet werden, und
umfassen die Loci, die für
das quantitative Merkmal von Interesse verantwortlich sind. Diese
können
mit einem Array hybridisiert werden, der eine repräsentative
Auswahl von Sequenzen enthält,
die das gesamte Genom des Tieres abdecken. Da in diesem Fall nicht-verwandte Tiere
verwendet werden können,
um die QTLs zu identifizieren, sollten die IBD-Bereiche klein sein,
d.h. eine sehr begrenzte Anzahl von Experimenten sollte nötig sein
(bestenfalls nur eines), um die Gene, welche für das Merkmal verantwortlich
sind, zu identifizieren. Die Einführung eines Kontrolltieres,
das hinsichtlich des Merkmals von Interesse nicht übereinstimmend
ist, kann das Auflösungsvermögen des Systems
weiter verstärken.
-
Beispiel 3: Feinkartierung
eines mit einer Erkrankung gekoppelten Bereichs
-
In
Abhängigkeit
von der Komplexität
und der Heterogenität
eines Erkrankungs-Phänotyps
kann die Eingrenzung des Locus nach einem GMS-Experiment, wie es
in Beispiel 1 beschrieben ist, zwischen mehreren Kilobasen und einigen
Megabasen variieren. Im letzteren Fall müssen weitere Experimente ausgeführt werden,
um den genetischen Bereich, in dem sich das Krankheitsgen befindet,
einzuengen. Das erfindungsgemäße Verfahren
kann auch verwendet werden, um das Gen/die Gene von Interesse fein
zu kartieren. DNA von verschiedenen nicht verwandten Individuen,
von denen gezeigt wurde, dass sie mit demselben Krankheits-Locus
verknüpft
sind, wird extrahiert und mit einer geeigneten Restriktionsendonuklease
(z.B. ein Enzym mit einer 4 Basenpaare langen Erkennungsstelle)
verdaut, um Fragmente wohl definierter Länge zu erzeugen. Zu diesen
Restriktionsfragmenten wird eine Lösung mit kurzen doppelsträngigen Oligonukleotiden
(Adaptoren) hinzugefügt.
Die Adapter-Moleküle
haben Sequenzenden, die zu den Sequenzen der Restriktionsstellen
komplementär
sind, so dass eine Ligation ermöglicht wird.
Die Adaptoren werden anschließend
mit einer gewöhnlichen
Ligase (z.B. T4-Ligase) an die Restriktionsfragmente der genomischen
DNAs ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass:
a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere,
die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und
nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren.
Die Adapter-tragenden Fragmente werden dann, separat für jedes
Individuum, mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz
komplementär
sind und die einzigartige 5'-Enden
tragen, vervielfältigt.
Nach mehreren Vervielfältigungsrunden
unterscheiden sich die PCR-Produkte der unterschiedlichen Individuen
in ihren Enden. Die Vervielfältigungsprodukte
werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter Hybridisierungsbedingungen
(Casna et al. (1986), Genomic analysis II, Isolation of high molecular weight
heteroduplex DNA following methylase protection and formamide PERT
hybridization, Nucleic Acids Res. 14:7285-7303) wird eine Anlagerung
der DNA-Stränge
ermöglicht.
In Abhängigkeit
von den Beschränkungen
hinsichtlich der Wahl einzigartiger 5'-Enden für die Primer, können die
Vervielfältigungsprodukte
mehrerer Individuen gemischt werden, was das Auflösungsvermögen verbessert.
Das Mischen der PCR-Fragmente resultiert in der Ausbildung von Heteroduplexstrukturen
aus den DNAs verschiedener Quellen (Individuen) mit gegabelten (einzelsträngigen)
Enden, wegen der Nicht-Komplementarität der Primersequenzen. Darüber hinaus
werden Homoduplexstrukturen durch Renaturierung der Stränge eines
Individuums mit sich selbst ausgebildet. Diese Homoduplexstrukturen
besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche
die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit
Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) enthält,
zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit
glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in
den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads)
eliminiert werden. Die verbleibenden Heteroduplexstrukturen umfassen
einen Pool von zu 100 % identischen Fragmenten und Fragmenten mit
Basenpaar-Fehlpaarungen (Nicht-IBD-Fragmente). Eine Lösung mit
den Mismatch-Reparaturenzymen mutSHL wird dem Gemisch zugefügt, was
im Nicken der fehlgepaarten Heteroduplexstrukturen an einer spezifischen
Erkennungsstelle (GATC) resultiert. Diese Nicks werden durch die
Zugabe der ExoIII-Exonuklease (oder einer äquivalenten Exonuklease mit
Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) zu dem Reaktionsgemisch weiter verdaut,
was große einzelsträngige Lücken in
den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads)
eliminiert werden. Die verbleibenden Fragmente im Reaktionsgemisch
stellen einen Pool von zu 100 % identischen DNA-Hybriden dar, die
zwischen den DNAs der verschiedenen Individuen ausgebildet werden,
und umfassen die Loci, die für
den Krankheits-Phänotyp
verantwortlich sind. Da zwischen diesen Individuen praktisch keine
IBD vorliegt, sollte nur eine sehr geringe Anzahl relativ kurzer
Fragmente identisch sein (dies ist im Grunde eine sehr effiziente
An, um nach allelischer Assoziation zu suchen). Es kann ein dichter
Locus-spezifischer Array von DNA-Sequenzen verwendet werden, um
Sequenzen innerhalb des Pools identischer DNAs nachzuweisen und
zu identifizieren. Da die Sequenzen auf dem Array bekannt sind,
können
sie verwendet werden, um die Fragmente aus dem GMS-Verfahren direkt
zu sequenzieren, um offene Leseraster (ORFs) und die Gene von Interesse
zu identifizieren.
-
Beispiel 4: Direkte Eliminierung
fehlgepaarter Heteroduplexstrukturen aus einer Lösung
-
Genomische
DNA von mindestens zwei verwandten Individuen mit demselben Erkrankungs-Phänotyp wird
mittels Standardverfahren, z.B. Phenol-Chloroform-Extraktion, extrahiert.
Die DNAs werden separat mit einem Restriktionsenzym (z.B. BamHI)
geschnitten, so dass Restriktionsfragmente mit einer durchschnittlichen
Größe von ungefähr 4 Kilobasen
erzeugt werden. Zu diesen Restriktionsfragmenten wird eine Lösung mit
kurzen doppelsträngigen
Oligonukleotiden (Adaptoren) hinzugefügt. Die Adapter-Moleküle haben
Sequenzenden, die zu den Sequenzen der Restriktionsstellen komplementär sind,
so dass eine Ligation ermöglicht
wird. Die Adaptoren werden anschließend mit einer gewöhnlichen Ligase
(z.B. T4-Ligase) an die Restriktionsfragmente der genomischen DNAs
ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass:
a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere,
die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und
nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren.
Die Adapter-tragenden Fragmente werden dann, separat für jedes
Individuum, mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind und
die einzigartige 5'-Enden tragen, vervielfältigt. Nach
mehreren Vervielfältigungsrunden
unterscheiden sich die PCR-Produkte der unterschiedlichen Individuen
in ihren Enden. Die Vervielfältigungsprodukte
werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter
Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis
II, Isolation of high molecular weight heteroduplex DNA following
methylase protection and formamide PERT hybridization, Nucleic Acids Res.
14:7285-7303) wird eine Anlagerung der DNA-Stränge ermöglicht. Dies resultiert in
der Ausbildung von Heteroduplexstrukturen aus den DNAs verschiedener
Quellen (Individuen) mit gegabelten (einzelsträngigen) Enden, wegen der Nicht-Komplementarität der Primersequenzen.
Darüber
hinaus werden Homoduplexstrukturen durch Renaturierung der Stränge eines
Individuums mit sich selbst ausgebildet. Diese Homoduplexstrukturen
besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche
die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit
Spezifität
für 3'-zurückgesetzte
Enden oder glatte Enden) enthält,
zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit
glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in den
Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch
durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert
werden. Die verbleibenden Heteroduplexstrukturen umfassen einen
Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen
(Nicht-IBD-Fragmente).
-
Eine
Lösung,
die das Mismatch-erkennende Protein mutS enthält, wird dem Reaktionsgemisch hinzugefügt. mutS
bindet an die fehlgepaarte DNA an der Stelle der Fehlpaarung. Der
Protein-DNA-Komplex
wird anschließend
aus dem Reaktionsgemisch durch eine spezifische Bindung von mutS
an eine Matrix (z.B. eine Antikörper-tragende
Säule,
eine Proteinbindungsmembran) eliminiert. Dieses Vorgehen lässt die
Schritte des mutLH-Nickens und den zweiten ExoIII-Verdau weg, genauso
wie die Notwendigkeit einer Matrix für die Bindung von Einzelsträngen, um
die Produkte, die aus einem Exonuklease-Verdau resultieren, zu eliminieren.
Die verbleibenden identischen DNA-Heteroduplexfragmente können wie
in Beispiel 1 aufgezeigt nachgewiesen und identifiziert werden.