DE60014067T2

DE60014067T2 - Zusammensetzungen und verfahren zur genetischen analyse

Info

Publication number: DE60014067T2
Application number: DE60014067T
Authority: DE
Inventors: Jörg Hager
Original assignee: Integragem S A S; INTEGRAGEM Sas
Current assignee: Integragem S A S; INTEGRAGEM Sas
Priority date: 1999-03-12
Filing date: 2000-03-09
Publication date: 2005-01-20
Anticipated expiration: 2020-03-10
Also published as: ES2228480T3; EP1179088A1; DE19911130A1; ATE277199T1; CA2366107A1; JP2002537855A; DE60014067D1; WO2000053802A1; EP1179088B1; PT1179088E; IL145141A; DK1179088T3; IL145141A0; US6887666B1; CA2366107C

Description

Die vorliegende Erfindung betrifft das Gebiet der molekularen Genomforschung und der genetischen Analyse, insbesondere die genetische Kartierung komplexer quantitativer und qualitativer Merkmale. Insbesondere stellt die vorliegende Erfindung Zusammensetzungen und Verfahren bereit, genetische Information aus verschiedenen Quellen zu analysieren, um relevante therapeutische Gene oder Mutationen zu identifizieren. Diese Erfindung betrifft insbesondere Zusammensetzungen und Verfahren, um identische DNA-Fragmente aus unterschiedlichen DNA-Quellen zu identifizieren. Das Verfahren erlaubt die Separation perfekt gepaarter DNAs aus unvollkommen gepaarten DNAs oder aus DNAs, welche durch die Hybridisierung aus derselben Quelle (z.B. Homohybride) entstanden sind. Das Verfahren stellt alternative und/oder verbesserte Varianten des Genomic Mismatch Scanning (GMS) dar und stellt bedeutende Verbesserungen der GMS-Methode bereit, indem es das Arbeiten mit geringen Anfangsmengen an DNA, eine spezifische Vervielfältigung, reduzierte Kosten und eine reduzierte Anzahl von Reaktionsschritten erlaubt.
Eine der Hauptherausforderungen der heutigen Biologie und Medizin ist die Identifizierung von Genen, die bei verbreiteten, komplexen Erkrankungen des Menschen wie Asthma, Typ 2-Diabetes mellitus, Fettleibigkeit, etc. beteiligt sind. Die Identifizierung solcher Gene wird üblicherweise ausgeführt, indem bei großen Familien oder Testgruppen von Patienten Kopplungs- und/oder Assoziationsuntersuchungen durchgeführt werden. Diese Untersuchungen können mit einer Vielfalt genetischer Marker durchgeführt werden (Sequenzen im Genom, die sich zwischen Individuen unterscheiden, d.h. die polymorph sind). Die weitverbreitetsten Polymorphismen, die verwendet werden, sind Mikrosatellitenmarker, die aus kurzen, spezifischen repetitiven Sequenzen bestehen, oder Einzelnukleotidpolymorphismen (SNPs), die sich in nur einem Nukleotid unterscheiden. Es wurden unterschiedliche Analysetechnologien entwickelt, um diese Marker zu genotypisieren, beispielsweise Gel-basierte Elektrophorese, DNA-Hybridisierung eines geordneten Arrays, Identifizierung mit Massenspektrometrie.
Das Hauptziel der Genetik besteht darin, einen Phänotyp (d.h. ein qualitativ oder quantitativ messbares Merkmal eines Organismus) mit einem Gen oder einer Anzahl von Genen in Verbindung zu bringen. Aus historischen Gründen gibt es zwei genetische Ansätze, die verwendet werden, um Genorte zu identifizieren, welche für einen Phänotyp verantwortlich sind, nämlich die familiären Kopplungs- und Assoziationsuntersuchungen. Welcher Ansatz auch immer verwendet wird, beruhen genetische Untersuchungen auf Polymorphismen, d.h. Basenunterschiede in der DNA-Sequenz zwischen zwei Individuen am selben Genort. Das Vorhandensein von Sequenzunterschieden am selben Genort wird allelische Variation genannt. Es ist seit langem bekannt, dass unterschiedliche Allele eines Gens in einer unterschiedlichen Expression eines gegebenen Phänotyps resultieren können.
Die Kopplungsanalyse ist die Methode der Wahl, um Gene zu identifizieren, die bei vielen sowohl monogenen als auch multigenen Erkrankungen beteiligt sind, aber wo nur ein Gen pro Patient beteiligt ist. Die Kopplungsanalyse folgt der Vererbung von Allelen in einer Familie und versucht, bestimmte Allele mit einem Phänotyp (z.B. einer Erkrankung) in Verbindung zu bringen. Anders ausgedrückt sucht man nach Allelen, die Individuen mit demselben Phänotyp, die identischer Abstammung (identical by descent, IBD) sind, d.h. die vom selben Vorfahren abstammen, gemeinsam sind. Um in der statistischen Analyse eine vernünftige Aussagekraft zu besitzen, müssen die untersuchten Polymorphismen mehrere Kriterien erfüllen:

– hohe Heterozygotie, d.h. viele Allele existieren für einen gegebenen Locus (dies erhöht den Informationsgehalt);
– genomweite Repräsentierung;
– nachweisbar mit Standardlaborverfahren.

Eine Art von Polymorphismen, welche die meisten dieser Kriterien erfüllt, ist ein Mikrosatellitenmarker. Diese sind repetitive Sequenzelemente von zwei (z.B. CA), drei oder vier Basen. Die Anzahl der Repetitionen ist für einen gegebenen Locus variabel, was in einer hohen Anzahl möglicher Allele resultiert, d.h. einer hohen Heterozygotie (70-90 %). Sie sind über das Genom hinweg weit verteilt. Bis heute wurden fast 20.000 Mikrosatellitenmarker identifiziert und kartiert (Abdeckung etwa 0,5-2 Megabasen).
Mikrosatellitenmarker sind für Kopplungsanalysen immer noch die genetischen Marker der Wahl. Die Genotypisierung dieser Marker erfolgt durch die Vervielfältigung der Allele mittels PCR und einer Größenauftrennung in einer Gelmatrix (Plattengel oder Kapillare). Für die Untersuchung komplexer menschlicher Erkrankungen werden üblicherweise 400-600 Mikrosatellitenmarker verwendet, die in regelmäßigen Abständen über das gesamte Genom verteilt sind (etwa alle 10-15 Megabasen).
Die Vorteile familiärer Kopplungsuntersuchungen beinhalten etablierte, gut kartierte Markersysteme (Mikrosatellitenmarker); Hilfsmittel für die statistische Analyse sind relativ gut entwickelt; hoher Informationsgehalt; Ermöglichung der parallelen Analyse mehrerer bei einem Genotyp beteiligter Loci (Meta-Analyse); gut entwickelte zwischenartliche Vergleichskarten.
Nachteile familiärer Kopplungsuntersuchungen beinhalten den Kostenaspekt (viele PCRs, Allel-Identifizierung ist arbeitsintensiv, Fluoreszenzmarker-Markierung); langsam, weil eine hohe Parallelverarbeitung, trotz einer bis zu einem gewissen Grad erreichbaren Multiplexverarbeitung, nicht möglich ist (keine Mikrosatelliten-DNA-Chips); die statistischen Möglichkeiten, um kleine Effekte zu analysieren, sind begrenzt; Ergebnisse sind von Allelfrequenzen und Heterozygotie abhängig; umfangreiche Familiensammlungen mit betroffenen Individuen sind notwendig (200- 2000 Individuen); IBD-Regionen erstrecken sich üblicherweise über große Bereiche, die für eine direkte Genklonierung ungeeignet sind, oft über 10-15 Megabasen (geringe Auflösung).
Ein weiterer Ansatz für eine genetische Analyse beruht auf Assoziationsuntersuchungen. Kopplungsuntersuchungen folgen Allelen in Familien. Allerdings könnte jede Familie ein anderes Allel eines Genorts besitzen, das mit dem betrachteten Phänotyp gekoppelt ist. Assoziationsuntersuchungen folgen im Gegensatz dazu der Evolution eines gegebenen Allels in einer Population. Die zugrunde liegende Annahme besteht darin, dass zu einem gegebenen Zeitpunkt in der Evolutionsgeschichte ein Polymorphismus mit einem Phänotyp gekoppelt wurde, weil:

a) er selbst für eine Veränderung des Phänotyps verantwortlich ist oder
b) er physikalisch in der Nähe eines Genorts, der einen solchen Effekt hervorruft, liegt und daher selten durch Rekombination vom ursächlichen Sequenzelement getrennt wird (man sagt, dass sich der Polymorphismus in einem Kopplungsungleichgewicht mit dem ursächlichen Ereignis befindet).

Dies stellt einen fundamentalen Unterschied zwischen Kopplung und Assoziation dar. Während bei einem genetisch erworbenen Merkmal eine Kopplung einer Sequenz mit dem ursächlichen Allel bestehen muss, wenn man ein unendlich dichtes Kopplungsexperiment ausführen könnte, gibt es keinen a priori-Grund, dass es ein einzelnes (oder sehr wenige) ursächliches Allel (Allele) in der Population geben könnte (d.h. es liegt eine Assoziation vor). Dies hat wichtige Auswirkungen auf die statistische Analyse zur Folge. Ein Beispiel für eine Kopplung ohne Assoziation sind viele monogenen Erkrankungen, z.B. Typ-II-Diabetes mellitus bei Jugendlichen (MODY), bei dem fast jede Familie eine unterschiedliche Mutation im selben Gen trägt. Das Gen wurde mittels Kopplungsuntersuchungen identifiziert. Assoziationsuntersuchungen hätten bei, der Identifizierung des Locus versagt. Da Assoziationsuntersuchungen die Existenz eines bestimmten Allels für ein Merkmal von Interesse postulieren, möchte man, dass die Marker für eine Assoziationsuntersuchung einfach sind. Die Marker der Wahl für diese Untersuchungen sind dementsprechend Einzelnukleotid-Polymorphismen (SNPs). Diese Polymorphismen zeigen einen einfachen Basenaustausch an einem gegebenen Locus (d.h. sie sind zwei-, selten drei-allelisch). Assoziierungsuntersuchungen können entweder in Populations-Testgruppen (Fälle vs. Kontrollen) oder in Familien-Testgruppen (Eltern und ein Abkömmling, wo die übertragenen Allele die "Fälle" und die nicht-übertragenen Allele die "Kontrollen" darstellen) durchgeführt werden. Die hauptsächlichen Vorteile von Assoziationsuntersuchungen mit SNPs sind:

– relativ einfach zu typisieren (jede Technologie, die eine Unterscheidung einzelner Basen ermöglicht, z.B. DNA-Chips, Massenspektrometrie);
– SNPs sind im Humangenom im Überfluss vorhanden (durchschnittlich ein SNP alle 300-1000 Basen);
– Assoziation erlaubt die Bestimmung eines relativ gut abgegrenzten genetischen Bereichs (üblicherweise einige Kilobasen).

Nachteile sind:

– Assoziationen können nur in einer sehr hohen Auflösung nachgewiesen werden (eine ungeeignet hohe Anzahl von SNPs muss durchmustert werden, wahrscheinlich mehr als 100.000);
– da nicht postuliert werden kann, dass eine Assoziation a priori vorliegt, gelten die statistischen Regeln für eine Mehrfach-Testung, d.h. das Ergebnis für jeden zusätzlich getesteten SNP muss daraufhin korrigiert werden. Das Ergebnis ist ein ungeeignet hoher Schwellenwert für positive Assoziation, wenn Tausende von Markern getestet werden, oder, anders ausgedrückt, eine Inflation falsch positiver Ergebnisse bei nominalen Signifikanzwerten. Neue statistische Hilfsprogramme sind vonnöten;
– Assoziationstests werden üblicherweise als Zwei-auf-Zwei-Tests ausgeführt (d.h. Polymorphismen an einem gegebenen Locus werden gegen einen Phänotyp getestet). Meta-Analysen sind für Tausende von Markern schwierig, wenn nicht unmöglich, auszuführen;
– wie die Kopplungs- wird auch die Assoziations-Analyse durch die Allelfrequenz beeinflusst;
– es existieren noch keine durchgängigen genetischen Karten für SNPs;
– große Musterkollektionen sind vonnöten;
– die gegenwärtige Technologie ist zu teuer, um Tausende von Proben auf Tausende SNPs zu genotypisieren (PCR, Kosten der Chip-Technologie, Gerätschaften), und die Unterscheidung ist immer noch nicht verlässlich genug (z.B. Affymetrix SNP-Chip).

Dementsprechend gibt es ein Bedürfnis nach verbesserten oder alternativen Verfahren für die genetische Analyse, welche die Nachteile dieser Technologien des Stands der Technik überwinden würden. Diesbezüglich sollte die ideale Genotypisierungs-Technologie in der Lage sein, sowohl nach Kopplung als auch Assoziation zu suchen und gleichzeitig die Nachteile dieser Methoden zu vermeiden. Sie sollte verlässlich sein, eine genomweite Analyse ermöglichen, in der Lage sein, Phänotyp-gekoppelte Genorte auf kleine Bereiche einzugrenzen, und einfach auszuführen und zu analysieren und billig sein.
Ein "genomische Mismatch-Analyse ("GMS")" genanntes Verfahren scheint die meisten dieser Anforderungen zu erfüllen. Die genomische Mismatch-Analyse wurde in der "Mismatch-Reparatur-Gemeinde" entwickelt, die wenig mit der humanen Kopplungsgemeinde zu tun hatte, welche versucht, die Gene zu finden, die bei humanen Merkmalen beteiligt sind. Insbesondere wurde in Nelson SF et al. (Genomic mismatch scanning: A new approach to genetic linkage mapping. Am. J. Hum. Genet. 61:111-119 (1993)) ein Verfahren beschrieben, welches den Nachweis und die Quantifizierung der Beziehung zwischen unterschiedlichen Hefestämmen erlaubt. Das Verfahren besteht darin, die DNAs von unterschiedlichen Hefestämmen zu mischen und alles, was nicht identisch ist, mit einem Satz von Fehlpaarungsreparaturenzymen zu zerstören. Außer bei der Forschergemeinde, die auf dem Gebiet der Fehlpaarungsreparatur arbeitet, hatte der Artikel keine besondere Bedeutung. Allerdings schien es logisch, dass diese Technologie auch angewendet werden könnte, um identische Bereiche in Menschen nachzuweisen. Diesbezüglich veröffentlichten Linda McAllister et al. 1998 einen proof-ofprinciple-Artikel, in dem sie die Identifizierung eines humanen Erkrankungslocus auf Chromosom 11 mittels GMS beschreiben (Linda McAllister, Lolita Penland and Patrick O. Brown. Enrichment of loci identical by descent between pairs of mouse or human genomes by genomic mismatch scanning, Genomics 47: 7-11 (1998)).
Kurz gesagt besteht das Verfahren aus den folgenden Schritten:

– Restriktion der DNA zweier Individuen;
– Markierung einer der DNAs durch Methylierung;
– Mischung der zwei DNAs, wobei ein Gemisch von Heteroduplexstrukturen zwischen den zwei DNAs erzeugt wird, die hemimethyliert sind und von Homoduplexstrukturen der ursprünglichen DNAs, die der Renaturierung der DNA jedes Individuums mit sich selbst entstammt. Da die DNA eines Individuums vollständig methyliert wurde und die andere nicht-methyliert ist, sind die resultierenden Homoduplexstrukturen ebenfalls methyliert oder nicht-methyliert;
– die nicht-informativen Homoduplexstrukturen werden durch mehrere enzymatische Schritte eliminiert, die Restriktionsenzyme beinhalten, die nur vollständig methylierte oder vollständig unmethylierte DNA verdauen und ein finaler Verdau der DNA durch ExoIII-Nuklease.
– Die verbleibenden Heteroduplexstrukturen, die sich zwischen den DNAs der zwei Individuen ausgebildet haben, bestehen aus wenigen Fragmenten, die in ihrer Sequenzzusammensetzung 100 % identisch sind (die Fragmente von Interesse), und aus denjenigen, welche aufgrund der Heterogenität zwischen den Individuen Sequenzunterschiede zeigen (d.h. die Basen sind an diesen Stellen fehlgepaart);
– die fehlgepaarten DNA-Fragmente werden mit einem enzymatischen DNA-Mismatch-Reparatursystem, das aus drei Proteinen besteht (mutS, mutH, mutL), welche diese Fehlpaarungen erkennen und die DNA-Stränge an einer spezifischen Erkennungssequenz (GATC) schneiden, eliminiert;
– die verbleibenden zu 100 % identischen DNA-Heterohybride können anschließend durch eine spezifische PCR-Vervielfältigung identifiziert werden, bei der das Auftreten oder das Fehlen eines Vervielfältigungsprodukts gewertet wird.

Die Vorteile dieses Verfahrens im Vergleich zu klassischen Kopplungs- und Assoziationsuntersuchungen sind:

– das Verfahren erlaubt einen eindeutigen Nachweis von IBD-Fragmenten zwischen Individuen, da es von Allelfrequenzen oder Markerheterozygotie unabhängig ist;
– das Verfahren ist nicht auf die Verwendung von polymorphen Markern beschränkt. Für die Ermittlung kann jede beliebige Sequenz verwendet werden, solange etwas Sequenz- und Kartierungsinformation verfügbar ist;
– es ist keine Allelunterscheidung notwendig. Das Nachweissignal ist digital (d.h. Vorhandensein oder Fehlen eines Fragments);
– das Nachweisverfahren kann auf jede beliebige Dichte skaliert werden;
– aufgrund des eindeutigen IBD-Nachweises und der Unabhängigkeit von der Allelfrequenz müssen weniger Individuen durchmustert werden (z.B. 100 Blutsverwandte besitzen dieselbe Möglichkeit, Kopplungsregionen nachzuweisen wie 400-600 Blutsverwandte in der klassischen Kopplungsanalyse).

Die klassische GMS-Methodik besitzt allerdings einige Nachteile, die ihre Verwendung als ein Routinewerkzeug für eine genetische Analyse schwierig machen:

– die DNA-Menge für ein einzelnes Experiment ist groß auf Grund des Materialsverlusts während der Prozedur. Üblicherweise werden 5 μg DNA benötigt. Iri Abhängigkeit vom Extraktionsverfahren stellt dies oft mehr als die Hälfte der DNA dar, die in einer Kollektion verfügbar ist.
– Die Methylierung einer der DNAs ist nicht zu 100 % effizient, d.h. einige der Heteroduplexstrukturen können nicht unterschieden werden und gehen verloren und einige der Homoduplexstrukturen der "methylierten" Individuen-DNA werden nach dem Hybridisierungsschritt tatsächlich hemimethyliert sein und daher bei der Nachweisschwelle im Hintergrund resultieren (wie die DNA eines Individuums a priori zu 100 % identisch mit sich selbst ist);
– da der Verdau mit der ExoIII-Nuklease eine zentrale Rolle in der Technologie spielt, können ausschließlich Restriktionsenzyme, die 3'-überhängende Enden erzeugen, für den anfänglichen Verdau der DNA verwendet werden (normalerweise wird PstI verwendet). Diese Enzyme sind selten und schränken die Wahlmöglichkeit für die Restriktion der DNA und daher die Zusammensetzung der erzeugten Fragmente ein;
– eine effiziente Erkennung nicht-identischer, fehlgepaarter DNA-Sequenzen durch das mutSHL-System beruht auf der Anwesenheit der Erkennungssequenz GATC in einem gegebenen Fragment. Das Fehlen der Sequenz resultiert in einem Hintergrundsignal aufgrund der nicht-eliminierten fehlgepaarten DNA;
– paarweisen die Markierung einer der DNAs durch Methylierung erlaubt nur einen Zwei-auf-Zwei Vergleich zwischen verschiedenen DNAs.

Smith et al. (PNAS 93 (1996) 4374) betrifft ein Verfahren für den Nachweis von Mutationen in PCR-vervielfältigten Nukleinsäurefragmenten. WO 89/12695 betrifft ein Verfahren für die Isolierung von Nukleinsäuren, welche zwei Nukleinsäurepopulationen unterscheiden. WO 93/22462 betrifft einen Kit, der ein Nukleinsäure bindendes Protein umfasst.
Daher besteht auf diesem Gebiet ein Bedürfnis nach genetischen Analysetechniken und Bestandteilen, die zweckmäßiger, einfach auszuführen, verlässlich und bei breiteren Populationen genetischen Materials anwendbar sind.
Die vorliegende Erfindung stellt jetzt neuartige genetische Analyseverfahren bereit, welche die Nachteile der GMS-Technik des Stands der Technik überwinden. In besonderen Ausführungsformen offenbart die Erfindung alternative und/oder verbesserte, auf dem Konzept der GMS basierende Varianten, welche die meisten Nachteile des oben genannten klassischen Ansatzes umgehen.
Insbesondere wird ein Verfahren bereitgestellt, welches die Identifizierung identischer DNA-Sequenzen aus unterschiedlichen Quellen ausgehend von einer kleinen anfänglichen Menge genomischer DNA ermöglicht.
Es wird ebenfalls ein Verfahren bereitgestellt, Nukleinsäuren aus unterschiedlichen Populationen mit einem Primer zu vervielfältigen, welcher eine für jede Population spezifische Markierung umfasst.
Es wird auch ein Verfahren bereitgestellt, um genomische DNA-Regionen zu identifizieren, welche für pathologische Zustände oder besondere Merkmale relevant sind.
Es wird auch ein Verfahren bereitgestellt für die Zubereitung heterohybrider Nukleinsäuremoleküle aus zwei oder mehr Nukleinsäurepopulationen, umfassend einen Vervielfältigungsschritt für jede Nukleinsäurepopulation vor einem Hybridisierungsschritt, wobei die Vervielfältigung vorzugsweise das Koppeln eines Adapter-Moleküls an jede Nukleinsäure in den Populationen umfasst, bevorzugterweise an deren beide Enden, und eine Vervielfältigung auszuführen mit einem Primer, umfassend wenigstens einen Sequenzbereich, der zu einem Sequenzbereich des Adapter-Moleküls komplementär ist.
Ein besonderer Aspekt dieser Erfindung beruht insbesondere auf einem Verfahren für die Separierung identischer DNA-Fragmente aus komplexen Gemischen von wenigstens zwei Nukleinsäurepopulationen (aus unterschiedlichen Quellen), wobei das Verfahren die Hybridisierung der wenigstens zwei Populationen und die Separierung der erzeugten identischen Heterohybride umfasst, wobei die Nukleinsäurepopulationen vervielfältigte Nukleinsäuren umfassen.
Insbesondere beruht ein Gegenstand der vorliegenden Erfindung auf einem Verfahren für die Identifizierung (oder Separation) identischer Nukleinsäurefragmente aus einem Gemisch von mindestens zwei Nukleinsäurepopulationen aus unterschiedlichen Quellen, wobei das Verfahren die Schritte umfasst: a) separater Verdau der Nukleinsäuren der mindestens zwei Populationen mit wenigstens einem Restriktionsenzym; b) Ligation spezifischer Adapter-Sequenzen an die Restriktionsfragmente; c) Vervielfältigung der an die Adapter-Sequenzen ligierten Fragmente, die in den Schritten a) und b) mittels Adapter-spezifischer Primer erzeugt wurden; d) Hybridisierung der Vervielfältigungsprodukte von den verschiedenen Nukleinsäurepopulationen untereinander; e) Identifizierung (oder Isolierung oder Separation) der identischen, keine Basenunterschiede aufweisenden Heterohybridfragmente.
Dieses Verfahren ist vorteilhaft, da es die Vervielfältigung der DNAs (d.h. die Verwendung kleiner Mengen Ausgangsmaterials) und die Selektion von Heteroduplexstrukturen ohne eine der Fehlpaarungsreparaturselektion vorhergehende Methylierung (d.h. ohne Restriktion mit Restriktionsenzymen) erlaubt.
Es wird auch ein Verfahren bereitgestellt, DNA-Bereiche zu identifizieren, die für pathologische Zustände oder bestimmte Merkmale relevant sind, wobei das Verfahren die Hybridisierung von wenigstens zwei Nukleinsäurepopulationen aus unterschiedlichen Quellen, die ein bestimmtes Merkmal oder eine bestimmte Pathologie aufweisen, und Separation der erzeugten identischen Heterohybride, welche DNA-Bereiche enthalten, die für die pathologischen Zustände oder besonderen Merkmale relevant sind, wobei die Nukleinsäurepopulationen vervielfältigte und/oder prä-selektionierte Nukleinsäuren umfassen.
Andere Aspekte der vorliegenden Erfindung beruhen auf Zusammensetzungen, Kits und diagnostischen Assays.
Wie oben angegeben, stellt die vorliegende Erfindung ein Verfahren zur Identifizierung (oder Isolierung oder Separation) identischer Nukleinsäurefragmente aus einem Gemisch von mindestens zwei Nukleinsäurepopulationen bereit, wobei das Verfahren die Schritte umfasst: a) separater Verdau der Nukleinsäuren der mindestens zwei Populationen mit mindestens einem Restriktionsenzym; b) Ligation einer spezifischen Adapter-Sequenz an die Restriktionsfragmente; c) Vervielfältigung der an die Adapter-Sequenzen ligierten Restriktionsfragmente, die in den Schritten a) und b) mittels Adapter-spezifischer Primer erzeugt wurden; d) Hybridisierung der Vervielfältigungsprodukte von den verschiedenen Nukleinsäurepopulationen untereinander; und e) Identifizierung (oder Isolation oder Separation) identischer, keine Basenunterschiede aufweisender Heterohybridfragmente.
Die Erfindung kann für die Analyse verschiedener Nukleinsäurepopulationen verwendet werden, insbesondere mit dem Ziel, darin vorhandene identische Bereiche zu identifizieren (oder zu separieren). Normalerweise sind die Nukleinsäurepopulationen genomische DNA, insbesondere genomische DNA aus einem Säugetier, beispielsweise humane genomische DNA. In einer bevorzugten Ausführungsform sind die Nukleinsäurepopulationen humane genomische DNA aus verschiedenen Individuen, die ein Merkmal von Interesse gemeinsam haben, insbesondere einen Phänotyp oder eine Pathologie. In dieser Ausführungsform zielt das Verfahren der vorliegenden Erfindung auf die Identifizierung genetischer Marker der Pathologie ab, oder von Genen (Mutationen), die an der Pathologie beteiligt oder für sie verantwortlich sind.
Die Nukleinsäurepopulationen können auch genomische DNA von anderen Säugetierarten wie Rind, Schaf, Hund, Schaf, Ziegen und ähnlichem sein. Insbesondere kann die genomische DNA von Tieren (derselben Art) zubereitet werden, die ein besonderes Merkmal (hohe Fleisch-, hohe Milchproduktion, etc.) gemeinsam haben.
Die Nukleinsäurepopulationen können auch genomische DNA aus anderen Quellen sein, einschließlich Prokaryonten (Bakterien, pathogene Organismen, etc.), niedere Eukaryonten (Hefen, etc.), Pflanzen, Viren und Ähnliches.
Während die Nukleinsäurepopulation zum Beispiel die gesamte genomische DNA einer Zelle (oder eines Gewebes oder eines Organismus) oder eine komplette genomische Bibliothek umfassen kann, sollte besonders erwähnt werden, dass eine Durchmusterung oder Auswahl der Ausgangsnukleinsäuren ebenfalls ausgeführt werden kann. Insbesondere kann die Nukleinsäurepopulation ein isoliertes Chromosom (oder eine Gruppe von Chromosomen) sein.
Für die Durchführung der vorliegenden Erfindung können zwei oder mehr Nukleinsäurepopulationen verwendet werden, die von unterschiedlichen Quellen abstammen. In bevorzugten Ausführungsformen können zwei bis 10 Nukleinsäurepopulationen verwendet werden.
Im ersten (optionalen) Schritt werden die Nukleinsäurepopulationen separat verdaut, so dass Restriktionsfragmente bereitgestellt werden. Der Ausdruck "separat" zeigt an, dass jede Population dem Verdau einzeln unterzogen wird, d.h. ohne miteinander vermischt zu werden. Es kann/können ein oder mehrere Restriktionsenzyme) verwendet werden. Vorzugsweise wird/werden das/dieselbe(n) Restriktionsenzyme) für jede Nukleinsäurepopulation verwendet. Das/die Restriktionsenzym(e) kann/können entsprechend praktischer Überlegungen ausgewählt werden, wie die Größe der erzeugten Fragmente, die Spezifität für DNA-Arten, enzymatische Aktivität, Benutzerfreundlichkeit, etc. In einer bevorzugten Ausführungsform stellt das Restriktionsenzym im Durchschnitt Restriktionsfragmente mittlerer Länge, insbesondere Fragmente zwischen 2 und 10 Kilobasen (kb) bereit. Solche Restriktionsenzyme beinhalten beispielsweise Enzyme mit einer sechs Basen langen Erkennungsstelle, wie ApaI (~2 kb), BamHI (~5 kb), BglI + II (~3 kb), HindIII (~4 kb), NarI (~4 kb), SmaI (~4 kb) oder XbaI (~5 kb).
In einer spezifischen Ausführungsform wird ein einzelnes Restriktionsenzym verwendet, welches im Durchschnitt Restriktionsfragmente von zwischen 2 und 10 Kilobasen bereitstellt.
In einer besonderen Ausführungsform können die Restriktionsfragmente vor dem nachfolgenden Ligations- und/oder Vervielfältigungsschritt ausgewählt werden. Insbesondere können die Restriktionsfragmente Größen-selektioniert werden, so dass eine gleichmäßige Vervielfältigung aller Fragmente ermöglicht wird. Eine Größenselektion kann auf einem Gel oder mittels anderer Techniken ausgeführt werden. In einem Agarosegel werden Restriktionsfragmente in einem elektrischen Feld neben einem Größenstandard zur Orientierung der Größe nach aufgetrennt. Fragmente der bevorzugten Größenordnung können aus dem Gel herausgeschnitten und mittels Standardmethoden (z.B. Gelextraktionskit Quiaex II, Quiagen AG, Deutschland) aus der Agarose extrahiert werden. Eine Größenseparation kann auch mit einer Säulenseparation mit einem Siebmaterial wie Polyacrylamid, Sephadex, etc. erreicht werden.
Zusätzlich können die Restriktionsfragmente vor dem Vervielfältigungsschritt in jeden geeigneten Vektor kloniert werden. Der Vektor kann jedes beliebige Plasmid, jeder Phage, Virus, Cosmid, künstliches Chromosom (YAC, BAC), etc. sein. Insbesondere können die Restriktionsfragmente Chromosomen- und Sequenz-spezifisch kloniert werden. In einer besonderen Ausführungsform umfasst das Verfahren daher (i) einen separaten Verdau der Nukleinsäurepopulationen (z.B. genomische DNA von wenigstens zwei unterschiedlichen Quellen) und (ii) die Klonierung (bestimmter) Restriktionsfragmente in einen Vektor, auf eine Chromosomen- und Sequenz-spezifische Art (z.B. durch homologe Rekombination). Dieser Klonierungsschritt kann verwendet werden, um bestimmte Fragmente für eine weitere Analyse auszuwählen, ohne die gesamte DNA-Population zu analysieren.
Ein weiterer besonderer Aspekt dieser Erfindung beruht auf der Verwendung von Adaptermolekülen, die eine spezifische Vervielfältigung der Nukleinsäuren und eine spezifische Behandlung der Proben erleichtern, so dass die Selektivität des Identifikationsverfahrens erhöht wird.
Adapter-Moleküle sind vorzugsweise kurze doppelsträngige DNA-Fragmente (oder Oligonukleotide) mit bekannter Sequenzzusammensetzung. Bevorzugterweise sind Adapter- Moleküle 5-100 Basenpaare lange doppelsträngige DNA-Moleküle, sogar noch bevorzugter sind sie 5-50 Basenpaare lang. Die Adapter-Moleküle erlauben die Einführung von Sequenzmerkmalen, welche die Prozedur der genetischen Analyse wesentlich verbessern. Insbesondere besitzt die Einführung dieser Adaptoren die folgenden Vorteile:

– die DNA kann vor der genetischen Analyse (z.B. GMS) mittels PCR vervielfältigt werden, so dass mit weniger Material angefangen werden kann (100-500 ng). Es ist nur eine Vervielfältigung pro Experiment mit einer einzigen Primersequenz notwendig, was dieses Verfahren billig macht;
– die Adapter-Sequenz ist vorzugsweise gestaltet, so dass sie die mutHL-Erkennungssequenz (GATC) beinhaltet, was die Entfernung aller fehlgepaarter Fragmente aus dem Gemisch ermöglicht, so dass die Selektivität erhöht und das Hintergrundsignal verringert wird;
– das Adapter-Molekül kann auch eine Erkennungsstelle für ein Restriktionsenzym umfassen, das 3'-überhängende Enden erzeugt, wie AatIII.

In einer bevorzugten Ausführungsform ist das Adapter-Molekül ein 5-100 Basen langes (doppelsträngiges) Oligonukleotid, das wenigstens ein GATC-Motiv umfasst.
Die Adapter-Moleküle können nach gängigen Techniken (künstliche Synthese) zubereitet und mittels herkömmlicher Verfahren an die Restriktionsfragmente (oder an die Nukleinsäurepopulation, sofern kein Restriktionsschritt ausgeführt wurde) ligiert werden (indem beispielsweise ein Ligase-Enzym wie die T4-Ligase verwendet wird). Das Verfahren dieser Erfindung umfasst vorzugsweise die Ligation aller Nukleinsäuren in den verschiedenen Populationen an das gleiche Adapter-Molekül. Bevorzugterweise resultiert die Ligation des Adapter-Moleküls in DNA-Fragmenten, die eine Adapter-Sequenz an beiden Enden tragen.
Die Vervielfältigung der Nukleinsäuren (oder Restriktionsfragmente) kann durch eine Polymerasekettenreaktion (PCR) gemäß herkömmlicher Techniken erreicht werden. Vorzugsweise wird die Vervielfältigung durch eine Polymerasekettenreaktion mit einer weitreichenden DNA-Polymerase mit einer hohen Wiedergabetreue ausgeführt. Beispiele für solche Polymerasen beinhalten die Pfx-Polymerase (Life Technologies) und die Z-Taq-Polymerase (TaKaRa). Es können mehrere Vervielfältigungszyklen durchgeführt werden, insbesondere 25 bis 40.
Ein weiterer Vorteil der vorliegenden Erfindung beruht in der Verwendung bestimmter Primer für die Vervielfältigungsreaktion. Die Primer sind vorzugsweise zu wenigstens einem Teil des Adapter-Moleküls komplementär. Die Primer können jedes beliebige Oligonukleotid sein, vorzugsweise mit 5 bis 30 Basen, noch bevorzugter mit 5-20 Basen. Der Teil der Primer, der zu dem (Teil des) Adapter-Moleküls) komplementär ist, sollte vorzugsweise wenigstens 5, bevorzugterweise wenigstens 10 Basen umfassen, um eine ausreichende Selektivität sicherzustellen. Primer können vom Durchschnittsfachmann gemäß herkömmlicher Techniken, die im Fachgebiet bekannt sind, hergestellt werden (vorzugsweise künstliche Nukleinsäuresynthese).
In einer bevorzugten Ausführungsform werden die Primer markiert, was dem vorliegenden Verfahren weitere Vorteile bringt. Insbesondere erlaubt die Einführung markierter Primer für die (PCR)-Vervielfältigung die Unterscheidung der unterschiedlichen, gemischten DNA-Populationen. In der Tat kann der jeweilige Primer, welcher für die Vervielfältigung der jeweiligen Nukleinsäurepopulation verwendet wird, eine unterschiedliche Markierung aufweisen, beispielsweise unterschiedliche, einzigartige 5'-Sequenzen (oder einige können markiert sein und einige nicht), was die Unterscheidung der vervielfältigen Produkte der jeweiligen Quelle erlaubt. Dies umgeht die Notwendigkeit für einen Methylierungsschritt. Dementsprechend werden keine Methylierungs-spezifischen Restriktionsenzyme gebraucht, und so kann eine beachtliche Senkung der Kosten pro Experiment erreicht werden. Ferner ermöglicht es die Verwendung von markierten Primern, mehr als nur paarweise Vergleiche auszuführen (mehrere Individuen sind in einer Reaktion beinhaltet, d.h. mehr als zwei Nukleinsäurepopulationen). Dies kann verwendet werden, um die Auflösung dieses Verfahrens zu erhöhen (es werden kleinere IBD-Bereiche nachgewiesen). Dieses Merkmal ist besonders nützlich, wenn nach einer allelischen Assoziation gesucht wird.
Darüber hinaus können die Primer auf eine Weise gestaltet werden, die es der ExoIII-Nuklease erlaubt, die nach der Hybridisierung zwischen den Nukleinsäurepopulationen ausgebildeten Homoduplexstrukturen anzugreifen, aber nicht die Heteroduplexstrukturen. Dementsprechend spielen die Restriktionsenden keine Rolle in der Wahl des Restriktionsenzyms für den Verdau der Nukleinsäurepopulationen. Daher können die Enzyme gemäß praktischer Überlegungen ausgewählt werden (Größe der erzeugten Fragmente, Spezifität für DNA-Arten, Enzymaktivität und Benutzerfreundlichkeit).
Primer können durch (i) die Zugabe einer einzigartigen 5'-Sequenz zu jedem Primer, (ii) durch die Zugabe einer chemischen Aktivität zu dem Primer, die Mittel bereitstellt, um zwischen den Vervielfältigungsprodukten der unterschiedlichen DNA-Quellen zu unterscheiden, und (iii) durch die Zugabe modifizierter Nukleotide zum Primer, welche es erlauben, zwischen den Vervielfältigungsprodukten der unterschiedlichen DNA-Quellen zu unterscheiden, markiert werden. Eine bevorzugte Markierungstechnik umfasst die Einführung einer einzigartigen 5'-Sequenz zu jedem Set von Primern.
Die Identifizierung (oder Isolierung oder Separation) der identischen, keine Basenunterschiede aufweisenden Heterohybridfragmente kann auf mehrere Arten ausgeführt werden. Vorzugsweise umfasst die Identifizierung die folgenden Schritte: (i) Separation der Homohybriden von den Heterohybriden; (ii) (Identifizierung und) Eliminierung von fehlgepaarten Heterohybriden, und (iii) Identifizierung (oder Isolierung oder Separation) der identischen Heterohybridfragmente.
Die Heterohybride können von den Homohybriden, basierend auf der Markierung der Primer, wie oben beschrieben, separiert werden. Insbesondere kann die Separation, basierend auf der Verwendung von Primern mit einer für jede Nukleinsäurepopulation einzigartigen 5'-Endsequenz ausgeführt werden. Gemäß dieser Ausführungsform werden die Homohybride nur glatte Enden aufweisen, d.h. perfekt basengepaarte DNA-Enden umfassen (die einzigartige 5'-Endsequenz des spezifischen Primers). Dementsprechend können alle Homohybride durch eine Behandlung des Hybridisierungsprodukts mit einem Enzym, das spezifisch doppelsträngige DNA-Fragmente mit glatten Enden verdaut, wie ExoIII, eliminiert werden. Die Behandlung mit ExoIII resultiert in der Bildung von Einzelsträngen, die mit verschiedenen Verfahren eliminiert werden können, beispielsweise durch die Bindung an eine Einzelstrang-spezifische Matrix.
In dieser Hinsicht umfasst das Verfahren der vorliegenden Erfindung in einer spezifischen Ausführungsform a) eine separate Vervielfältigung der Restriktionsfragmente aus unterschiedlichen Quellen mit einem Primer mit einer für jede DNA-Quelle einzigartigen 5'-Sequenz; b) Mischen der Vervielfältigungsprodukte der unterschiedlichen Quellen, die einzigartige 5'-Enden tragen; c) Denaturierung und Rehybridisierung der DNAs; d) Verdau perfekt basengepaarter DNAs (Homoduplexstrukturen mit glatten Enden) durch ExoIII und e) Eliminierung der von ExoIII erzeugten Einzelstränge durch die Bindung an eine Einzelstrangspezifische Matrix.
Die Separation von DNA-Homoduplexstrukturen von DNA-Heteroduplexstrukturen kann auch basiert auf die Methylierung einer der zwei Nukleinsäurezubereitungen (oder der Restriktionsfragmente) ausgeführt werden. Obwohl nicht bevorzugt, kann diese Ausführungsform vorteilhaft ausgeführt werden, wenn der Vervielfältigungsprimer oder das Adapter-Molekül eine Erkennungsstelle für ein Enzym umfasst, das 3'-überhängende Enden erzeugt (wie AatIII). In der Tat können die Nukleinsäurepopulationen in dieser Ausführungsform mit jedem beliebigen Typ von Restriktionsenzym verdaut werden.
Fehlgepaarte Heterohybride können vorzugsweise mit Mismatch-Reparaturenzymen eliminiert werden. Insbesondere kann die Unterscheidung zwischen (oder Eliminierung oder Separation von) fehlgepaarten und keine Basenunterschiede aufweisenden Nukleinsäurefragmenten ausgeführt werden, indem die Mismatch-Reparaturenzyme mutS, mutL und/oder mutH oder Derivate oder Homologe davon verwendet werden. Derivate beinhalten Fragmente oder Varianten der mut-Proteine, d.h. jedes Polypeptid oder Fragment, das von diesen abgeleitet wurde und die biologische Aktivität des Proteins beibehalten hat. Bevorzugte Derivate behalten wenigstens 80 % der primären Struktur des mut-Proteins bei. Homologe beinhalten Proteine, welche denselben Typ von enzymatischer Aktivität in anderen biologischen Systemen (Hefen, Pflanzen, etc.) aufweisen.
Insbesondere können fehlgepaarte Nukleinsäurefragmente durch (i) Inkubation des Hybridisierungsgemisches mit mutS (das an die Fehlpaarung bindet) und Kontaktierung des resultierenden Produkts mit einem mutS-bindenden Material (z.B. Trägermaterial, Bead, Säule, etc.) eliminiert werden.
Fehlgepaarte Nukleinsäurefragmente können auch durch eine Inkubation des Hybridisierungsgemisches mit mutS, mutL und mutH, was in einer spezifischen Spaltung der fehlgepaarten Hybride und einer darauf folgenden Ausbildung von glatten Enden resultiert, die durch die Behandlung mit besonderen Enzymen (wie ExoIII eliminiert werden können, und durch Eliminierung der ausgebildeten Einzelstrang-DNA eliminiert werden.
In einer spezifischeren Ausführungsform umfasst das Verfahren folgende Schritte:

– separater Verdau der genomischen DNAs aus wenigstens zwei unterschiedlichen Quellen mit einem Restriktionsenzym;
– Ligation eines Adapter-Moleküls an diese genomischen Restriktionsfragmente;
– Vervielfältigung der Adapter-ligierten Restriktionsfragmente (vorzugsweise mittels Polymerasekettenreaktion (PCR)), indem markierte Adapter-spezifische Primer verwendet werden;
– Hybridisierung der Vervielfältigungsprodukte (z.B. PCR) der unterschiedlichen DNA-Quellen untereinander;
– Separation der Homoduplexstrukturen von den Heteroduplexstrukturen;
– Identifizierung und Eliminierung fehlgepaarter Heterohybride mit den mutSHL-Proteinen;
– Identifizierung der zu 100 % identischen Heteroduplexfragmente.

Wie zuvor angegeben besitzen die Primer eine Sequenz, die zu wenigstens einem Teil der Adapter-Sequenz komplementär ist. Des Weiteren sind sie vorzugsweise markiert, und stellen daher ein Mittel bereit, um zwischen den Vervielfältigungsprodukten der unterschiedlichen DNA-Quellen zu unterscheiden.
In einem weiteren Aspekt beruht die Erfindung auf einem Verfahren der genetischen Analyse, wobei das Verfahren die Schritte umfasst: a) Verdau von DNA aus verschiedenen Quellen, die ein Merkmal von Interesse gemeinsam haben, von dem angenommen wird, dass es auf derselben genetischen Veränderung beruht, mit einem Enzym, das im Durchschnitt DNA-Fragmente mittlerer Länge bereitstellt (z.B. Fragmente von 2 bis 10 Kilobasen); b) Ligation spezifischer Adaptoren an diese Restriktionsfragmente (diese Adaptoren stellen ein Mittel bereit, eine bekannte Sequenz und ein Mittel für die spätere Selektion in der Reaktion einzuführen); c) Markieren von wenigstens einer der DNAs aus den verschiedenen Quellen mit einer Methode, die es erlaubt, die DNAs aus den verschiedenen Quellen voneinander zu unterscheiden; d) Vervielfältigung der auf diese Weise zubereiteten Restriktionsfragmente mittels Polymerasekettenreaktion (PCR); e) Mischen der DNAs aus verschiedenen Quellen und Erzeugung von Heteroduplexstrukturen zwischen den DNA-Strängen dieser Quellen; f) Eliminierung von Homoduplexstrukturen, die durch die Renaturierung zweier DNA-Stränge derselben Quelle erzeugt werden; g) Eliminierung von Heteroduplexstrukturen mit fehlgepaarten Basen; h) Nachweis und Identifizierung der resultierenden zu 100 % identischen DNA-Sequenzen.
Wie oben erwähnt, beinhaltet das Adapter-Molekül in einer bevorzugten Ausführungsform der Erfindung spezifische Sequenzeigenschaften: a) die Erkennungsstelle für mutHL (GATC), b) eine Erkennungsstelle für ein Restriktionsenzym, das 3'-überhängende Enden erzeugt (z.B. AatIII.
In einer weiteren spezifischen Ausführungsform der vorliegenden Erfindung wird eine der an der Prozedur teilnehmenden DNAs nach dem Verdau und der Adapter-Ligation vorzugsweise mit dam-Methylase methyliert. Die DNAs aus verschiedenen Quellen werden anschließend separat mittels PCR vervielfältigt, wobei Adapter-spezifische Oligonukleotidprimer verwendet werden. Die resultierenden Vervielfältigungsprodukte werden mit einem Restriktionsenzym verdaut, das 3'-überhängende Enden erzeugt (wenigstens 2 Stellen/Fragment, die in den Adapter eingeführt wurden), so dass die Fragmente vor einem ExoIII-Verdau geschützt werden. Die DNA-Fragmente aus zwei verschiedenen Quellen werden dann gemischt und hemi-methylierte Heteroduplexstrukturen werden zwischen den DNA-Strängen durch Hitzedenaturierung und Renaturierung unter stringenten Bedingungen ausgebildet (Casna et al. (1986) genomic analysis II, isolation of high molecular weight heteroduplex DNA following methylase protection and formamide PERT hybridization, Nucleic Acids Res. 14: 7285-7303). Nicht-methylierte und vollständig methylierte Homoduplexstrukturen werden mit Methylierungs-sensitiven Restriktionsenzymen geschnitten. Die geschnittenen Fragmente werden dann mit der ExoIII-Exonuklease weiter verdaut, und die resultierenden einzelsträngigen Bereiche werden aus dem Reaktionsgemisch mittels einer Einzelstrang-spezifischen Matrix eliminiert, welche dem Durchschnittsfachmann bekannt ist (z.B. BND-Cellulose-Beads). Die verbleibenden Heteroduplexstrukturen stellen ein Gemisch von Fragmenten dar, die zu 100 % basengepaart sind und denen, die DNA-Basenpaar-Fehlpaarungen aufweisen (aufgrund des Unterschieds zwischen den Individuen). DNA-Fragmente mit fehlgepaarten DNA-Sequenzen werden durch Zugabe des mutSHL-Mismatch-Reparaturproteins zum Reaktionsgemisch erkannt und geschnitten. Fragmente, die geschnitten wurden, werden mit der ExoIII-Exonuklease weiter verdaut, und Einzelstränge werden wie oben beschrieben eliminiert.
In einer bevorzugten Ausführungsform der Erfindung ist das Verfahren durch die folgenden Schritte charakterisiert: a) Verdau von DNA aus wenigstens zwei verschiedenen Quellen mit einem Restriktionsenzym; b) Ligation spezifischer Adaptoren an die Restriktionsfragmente; c) separate Vervielfältigung der Restriktionsfragmente aus den unterschiedlichen Quellen unter Verwendung eines Primers mit einer unterschiedlichen Markierung (z.B. ein einzigartiges 5'-Ende) für jede DNA dieser Quellen; d) Mischen der Vervielfältigungsprodukte der verschiedenen Quellen, die eine einzigartige Markierung tragen (z.B. ein einzigartiges 5'-Ende); e) Denaturierung und Re-Hybridisierung dieser DNAs aus verschiedenen Quellen; f) Verdau von perfekt basengepaarten DNAs (Homoduplexstrukturen mit glatten Enden) mittels ExoIII-Exonuklease; g) Eliminierung der durch ExoIII erzeugten Einzelstränge mittels Bindung an eine Einzelstrang-spezifische Matrix; h) Erkennung und Nicken der fehlgepaarten Heteroduplexstrukturen durch Zugabe der mutSHL-Proteine zum Reaktionsgemisch; i) ExoIII-Verdau der genickten DNAs; j) Eliminierung der durch ExoIII erzeugten Einzelstränge mittels Bindung an eine Einzelstrang-spezifische Matrix; k) Nachweis und Identifizierung der verbleibenden zu 100 % basengepaarten Sequenzen im Reaktionsgemisch.
Die identifizierten (oder separierten oder isolierten) identischen DNA-Fragmente können weiter analysiert werden, um ein Gen, eine Mutation und Ähnliches zu bestimmen. Insbesondere können die Fragmente mittels Sequenzierung analysiert werden. Sie können auch mittels Hybridisierung mit (einem) geordneten DNA-Arrays) oder mit kodierten Beads, die spezifische DNA-Sequenzen tragen, analysiert werden.
Die Erfindung betrifft auch Kits, die verwendet werden können, um die oben beschriebenen Techniken der genetischen Analyse auszuführen. Insbesondere beruht die Erfindung auf einem Kit, der für eine genetische Analyse, wie sie oben beschrieben ist, geeignet ist, wobei das Kit ein doppelsträngiges Adapter-Molekül, einen spezifisch markierten Primer und, gegebenenfalls, Kontroll-DNAs und Enzyme umfasst. Kits gemäß der vorliegenden Erfindung können ferner ein Mittel für den Nachweis der ausgewählten DNA-Fragmente umfassen, vorzugsweise einen geordneten DNA-Array oder kodierte Beads, die spezifische DNA-Sequenzen tragen.
Die Erfindung kann verwendet werden, um Gene oder Mutationen zu identifizieren, die in einer Pathologie, beispielsweise in komplexen Pathologien (Fettleibigkeit, Asthma, kardiovaskuläre Erkrankungen, Störungen des ZNS, etc.), beteiligt sind. Die Erfindung ist allgemein für die Analyse jedes genetischen Materials anwendbar, besonders mit dem Ziel, identische DNA-Bereiche, die in zwei (oder mehr) unterschiedlichen Nukleinsäurepopulationen vorhanden sind, zu identifizieren (oder zu durchmustern).
Weitere Aspekte und Vorteile der vorliegenden Erfindung werden im folgenden Abschnitt mit den Beispielen offenbart und sollten als erläuternd und nicht als begrenzend betrachtet werden.
Beispiel 1: Identifizierung Erkrankungs-bezogener Loci in verwandten menschlichen Individuen
Genomische DNA von mindestens zwei verwandten Individuen mit demselben Erkrankungs-Phänotyp wird mittels Standardverfahren, z.B. Phenol-Chloroform-Extraktion, extrahiert. Die DNAs werden separat mit einem Restriktionsenzym (z.B. BamHI) geschnitten, so dass Restriktionsfragmente mit einer durchschnittlichen Größe von ungefähr 4 Kilobasen erzeugt werden. Zu diesen Restriktionsfragmenten wird eine Lösung mit kurzen doppelsträngigen Oligonukleotiden (Adaptoren) hinzugefügt. Die Adapter-Moleküle haben Sequenzenden, die zu den Sequenzen der Restriktionsstellen komplementär sind, so dass eine Ligation ermöglicht wird. Die Adaptoren werden anschließend mit einer gewöhnlichen Ligase (z.B. T4-Ligase) an die Restriktionsfragmente der genomischen DNAs ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass: a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere, die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren. Die Adapter-tragenden Fragmente werden dann, separat für jedes Individuum, mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind und die einzigartige 5'-Enden tragen, vervielfältigt. Nach mehreren Vervielfältigungsrunden unterscheiden sich die PCR-Produkte der unterschiedlichen Individuen in ihren Enden. Die Vervielfältigungsprodukte werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis II, Isolation of high molecular weight heteroduplex DNA following methylase protection and formamide PERT hybridization, Nucleic Acids Res. 14:7285-7303) wird eine Anlagerung der DNA-Stränge ermöglicht. Dies resultiert in der Ausbildung von Heteroduplexstrukturen aus den DNAs verschiedener Quellen (Individuen) mit gegabelten (einzelsträngigen) Enden, wegen der Nicht-Komplementarität der Primersequenzen. Darüber hinaus werden Homoduplexstrukturen durch Renaturierung der Stränge eines Individuums mit sich selbst ausgebildet. Diese Homoduplexstrukturen besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) enthält, zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Heteroduplexstrukturen umfassen einen Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen (Nicht-IBD-Fragmente). Eine Lösung mit den Mismatch-Reparaturenzymen mutSHL wird dem Gemisch zugefügt, was im Nicken der fehlgepaarten Heteroduplexstrukturen an einer spezifischen Erkennungsstelle (GATC) resultiert. Diese Nicks werden durch die Zugabe der ExoIII-Exonuklease (oder einer äquivalenten Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) zu dem Reaktionsgemisch weiter verdaut, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Fragmente im Reaktionsgemisch stellen einen Pool von zu 100 % identischen DNA-Hybriden dar, die zwischen den DNAs der verschiedenen Individuen ausgebildet werden, und umfassen die Loci, die für den Krankheits-Phänotyp verantwortlich sind. Diese Fragmente können nachgewiesen und identifiziert werden (z.B. durch Hybridisierung mit einem DNA-Array, der das gesamte Humangenom repräsentiert). Ein Signalvergleich einer Anzahl von Experimenten in unterschiedlichen Familien mit demselben Krankheits-Phänotyp erlaubt die Identifizierung der mit der Erkrankung gekoppelten Bereiche (Erkrankungs-spezifischer Genom-Haplotyp).
Beispiel 2: Identifizierung von Loci für quantitative Merkmale (QTLs) in Haustieren
Ein Ziel in der modernen landwirtschaftlichen Tierzucht ist die Selektion auf oder gegen bestimmte quantitative Merkmals-Phänotypen (z.B. Muskelmasse, Milchmenge, Konzentration von Kasein in der Milch für die Käseproduktion, etc.). Die genetischen Mechanismen, die zu einem Merkmal führen, sind mit mehreren beteiligten Loci häufig komplex. Diese Loci können mit unserem Verfahren identifiziert werden. In diesem Beispiel wird genomische DNA von verschiedenen Tieren, die ein Merkmal von Interesse gemeinsam haben (z.B. überdurchschnittlich hohe Kaseinkonzentration in der Milch) mit einer Restriktionsendonuklease restringiert, die Fragmente einer durchschnittlichen Länge von etwa 4 Kilobasen erzeugt (z.B. BamHI). Zu diesen Restriktionsfragmenten wird eine Lösung mit kurzen doppelsträngigen Oligonukleotiden (Adaptoren) hinzugefügt. Die Adapter-Moleküle haben Sequenzenden, die zu den Sequenzen der Restriktionsstellen komplementär sind, so dass eine Ligation ermöglicht wird. Die Adaptoren werden anschließend mit einer gewöhnlichen Ligase (z.B. T4-Ligase) an die Restriktionsfragmente der genomischen DNAs ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass: a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere, die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren. Die Adapter-tragenden Fragmente werden dann, separat mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind, aber die einzigartige 5'-Enden tragen, vervielfältigt. Nach mehreren Vervielfältigungsrunden unterscheiden sich die PCR-Produkte der DNAs der verschiedenen Tiere in ihren Enden. Die Vervielfältigungsprodukte werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis II, Isolation of high molecular weight heteroduplex DNA following methylase protection and formamide PERT hybridization, Nucleic Acids Res. 14:7285-7303) wird eine Anlagerung der DNA-Stränge ermöglicht. Dies resultiert in der Ausbildung von Heteroduplexstrukturen aus den DNAs der verschiedenen Tiere mit gegabelten (einzelsträngigen) Enden, wegen der Nicht-Komplementarität der Primersequenzen. Darüber hinaus werden Homoduplexstrukturen durch Renaturierung der Stränge eines Tieres mit sich selbst ausgebildet. Diese Homoduplexstrukturen besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) enthält, zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Heteroduplexstrukturen umfassen einen Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen (Nicht-IBD-Fragmente). Eine Lösung mit den Mismatch-Reparaturenzymen mutSHL wird dem Gemisch zugefügt, was im Nicken der fehlgepaarten Heteroduplexstrukturen an einer spezifischen Erkennungsstelle (GATC) resultiert. Diese Nicks werden durch die Zugabe der ExoIII-Exonuklease (oder einer äquivalenten Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) zu dem Reaktionsgemisch weiter verdaut, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Fragmente im Reaktionsgemisch stellen einen Pool von zu 100 % identischen DNA-Hybriden dar, die zwischen den DNAs der verschiedenen Tiere ausgebildet werden, und umfassen die Loci, die für das quantitative Merkmal von Interesse verantwortlich sind. Diese können mit einem Array hybridisiert werden, der eine repräsentative Auswahl von Sequenzen enthält, die das gesamte Genom des Tieres abdecken. Da in diesem Fall nicht-verwandte Tiere verwendet werden können, um die QTLs zu identifizieren, sollten die IBD-Bereiche klein sein, d.h. eine sehr begrenzte Anzahl von Experimenten sollte nötig sein (bestenfalls nur eines), um die Gene, welche für das Merkmal verantwortlich sind, zu identifizieren. Die Einführung eines Kontrolltieres, das hinsichtlich des Merkmals von Interesse nicht übereinstimmend ist, kann das Auflösungsvermögen des Systems weiter verstärken.
Beispiel 3: Feinkartierung eines mit einer Erkrankung gekoppelten Bereichs
In Abhängigkeit von der Komplexität und der Heterogenität eines Erkrankungs-Phänotyps kann die Eingrenzung des Locus nach einem GMS-Experiment, wie es in Beispiel 1 beschrieben ist, zwischen mehreren Kilobasen und einigen Megabasen variieren. Im letzteren Fall müssen weitere Experimente ausgeführt werden, um den genetischen Bereich, in dem sich das Krankheitsgen befindet, einzuengen. Das erfindungsgemäße Verfahren kann auch verwendet werden, um das Gen/die Gene von Interesse fein zu kartieren. DNA von verschiedenen nicht verwandten Individuen, von denen gezeigt wurde, dass sie mit demselben Krankheits-Locus verknüpft sind, wird extrahiert und mit einer geeigneten Restriktionsendonuklease (z.B. ein Enzym mit einer 4 Basenpaare langen Erkennungsstelle) verdaut, um Fragmente wohl definierter Länge zu erzeugen. Zu diesen Restriktionsfragmenten wird eine Lösung mit kurzen doppelsträngigen Oligonukleotiden (Adaptoren) hinzugefügt. Die Adapter-Moleküle haben Sequenzenden, die zu den Sequenzen der Restriktionsstellen komplementär sind, so dass eine Ligation ermöglicht wird. Die Adaptoren werden anschließend mit einer gewöhnlichen Ligase (z.B. T4-Ligase) an die Restriktionsfragmente der genomischen DNAs ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass: a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere, die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren. Die Adapter-tragenden Fragmente werden dann, separat für jedes Individuum, mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind und die einzigartige 5'-Enden tragen, vervielfältigt. Nach mehreren Vervielfältigungsrunden unterscheiden sich die PCR-Produkte der unterschiedlichen Individuen in ihren Enden. Die Vervielfältigungsprodukte werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis II, Isolation of high molecular weight heteroduplex DNA following methylase protection and formamide PERT hybridization, Nucleic Acids Res. 14:7285-7303) wird eine Anlagerung der DNA-Stränge ermöglicht. In Abhängigkeit von den Beschränkungen hinsichtlich der Wahl einzigartiger 5'-Enden für die Primer, können die Vervielfältigungsprodukte mehrerer Individuen gemischt werden, was das Auflösungsvermögen verbessert. Das Mischen der PCR-Fragmente resultiert in der Ausbildung von Heteroduplexstrukturen aus den DNAs verschiedener Quellen (Individuen) mit gegabelten (einzelsträngigen) Enden, wegen der Nicht-Komplementarität der Primersequenzen. Darüber hinaus werden Homoduplexstrukturen durch Renaturierung der Stränge eines Individuums mit sich selbst ausgebildet. Diese Homoduplexstrukturen besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) enthält, zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Heteroduplexstrukturen umfassen einen Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen (Nicht-IBD-Fragmente). Eine Lösung mit den Mismatch-Reparaturenzymen mutSHL wird dem Gemisch zugefügt, was im Nicken der fehlgepaarten Heteroduplexstrukturen an einer spezifischen Erkennungsstelle (GATC) resultiert. Diese Nicks werden durch die Zugabe der ExoIII-Exonuklease (oder einer äquivalenten Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) zu dem Reaktionsgemisch weiter verdaut, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Fragmente im Reaktionsgemisch stellen einen Pool von zu 100 % identischen DNA-Hybriden dar, die zwischen den DNAs der verschiedenen Individuen ausgebildet werden, und umfassen die Loci, die für den Krankheits-Phänotyp verantwortlich sind. Da zwischen diesen Individuen praktisch keine IBD vorliegt, sollte nur eine sehr geringe Anzahl relativ kurzer Fragmente identisch sein (dies ist im Grunde eine sehr effiziente An, um nach allelischer Assoziation zu suchen). Es kann ein dichter Locus-spezifischer Array von DNA-Sequenzen verwendet werden, um Sequenzen innerhalb des Pools identischer DNAs nachzuweisen und zu identifizieren. Da die Sequenzen auf dem Array bekannt sind, können sie verwendet werden, um die Fragmente aus dem GMS-Verfahren direkt zu sequenzieren, um offene Leseraster (ORFs) und die Gene von Interesse zu identifizieren.
Beispiel 4: Direkte Eliminierung fehlgepaarter Heteroduplexstrukturen aus einer Lösung
Genomische DNA von mindestens zwei verwandten Individuen mit demselben Erkrankungs-Phänotyp wird mittels Standardverfahren, z.B. Phenol-Chloroform-Extraktion, extrahiert. Die DNAs werden separat mit einem Restriktionsenzym (z.B. BamHI) geschnitten, so dass Restriktionsfragmente mit einer durchschnittlichen Größe von ungefähr 4 Kilobasen erzeugt werden. Zu diesen Restriktionsfragmenten wird eine Lösung mit kurzen doppelsträngigen Oligonukleotiden (Adaptoren) hinzugefügt. Die Adapter-Moleküle haben Sequenzenden, die zu den Sequenzen der Restriktionsstellen komplementär sind, so dass eine Ligation ermöglicht wird. Die Adaptoren werden anschließend mit einer gewöhnlichen Ligase (z.B. T4-Ligase) an die Restriktionsfragmente der genomischen DNAs ligiert. Die Sequenz der Adaptoren wurde dabei so gewählt, dass: a) die Sequenz die Erkennungsstelle für mutHL beinhaltet, b) Adapter-Dimere, die durch eine Autoligation zweier Adapter-Moleküle gebildet werden, selbst-komplementär sind und nicht mit den genomischen Ligationsprodukten während der PCR um Primer kompetitieren. Die Adapter-tragenden Fragmente werden dann, separat für jedes Individuum, mittels PCR mit Primern, die zu einem Teil der Adapter-Sequenz komplementär sind und die einzigartige 5'-Enden tragen, vervielfältigt. Nach mehreren Vervielfältigungsrunden unterscheiden sich die PCR-Produkte der unterschiedlichen Individuen in ihren Enden. Die Vervielfältigungsprodukte werden dann gemischt, Hitze-denaturiert und unter Verwendung stringenter Hybridisierungsbedingungen (Casna et al. (1986), Genomic analysis II, Isolation of high molecular weight heteroduplex DNA following methylase protection and formamide PERT hybridization, Nucleic Acids Res. 14:7285-7303) wird eine Anlagerung der DNA-Stränge ermöglicht. Dies resultiert in der Ausbildung von Heteroduplexstrukturen aus den DNAs verschiedener Quellen (Individuen) mit gegabelten (einzelsträngigen) Enden, wegen der Nicht-Komplementarität der Primersequenzen. Darüber hinaus werden Homoduplexstrukturen durch Renaturierung der Stränge eines Individuums mit sich selbst ausgebildet. Diese Homoduplexstrukturen besitzen glatte Enden. Diesem Gemisch wird eine Lösung, welche die ExoIII-Exonuklease (oder eine äquivalente Exonuklease mit Spezifität für 3'-zurückgesetzte Enden oder glatte Enden) enthält, zugesetzt. Die Exonuklease verdaut die Homoduplexstrukturen mit glatten Enden, aber nicht die Heteroduplexstrukturen mit ihrem 3'-Überhang, was große einzelsträngige Lücken in den Homoduplexfragmenten erzeugt. Diese können aus dem Reaktionsgemisch durch Bindung an eine Einzelstrang-spezifische Matrix (z.B. BND-Cellulose-Beads) eliminiert werden. Die verbleibenden Heteroduplexstrukturen umfassen einen Pool von zu 100 % identischen Fragmenten und Fragmenten mit Basenpaar-Fehlpaarungen (Nicht-IBD-Fragmente).
Eine Lösung, die das Mismatch-erkennende Protein mutS enthält, wird dem Reaktionsgemisch hinzugefügt. mutS bindet an die fehlgepaarte DNA an der Stelle der Fehlpaarung. Der Protein-DNA-Komplex wird anschließend aus dem Reaktionsgemisch durch eine spezifische Bindung von mutS an eine Matrix (z.B. eine Antikörper-tragende Säule, eine Proteinbindungsmembran) eliminiert. Dieses Vorgehen lässt die Schritte des mutLH-Nickens und den zweiten ExoIII-Verdau weg, genauso wie die Notwendigkeit einer Matrix für die Bindung von Einzelsträngen, um die Produkte, die aus einem Exonuklease-Verdau resultieren, zu eliminieren. Die verbleibenden identischen DNA-Heteroduplexfragmente können wie in Beispiel 1 aufgezeigt nachgewiesen und identifiziert werden.

Claims

Ein Verfahren zur Identifizierung (oder Isolierung oder Separation) identischer Nukleinsäure-Fragmente aus einem Gemisch von mindestens zwei Nukleinsäure-Populationen, wobei das Verfahren die Schritte umfaßt: a) Separater Verdau der mindestens zwei Nukleinsäure-Populationen mit mindestens einem Restriktionsenzym (Restriktionsenonuklease); b) Ligation einer Adapter-Sequenz an die Restriktionsfragmente; c) Vervielfältigung der an die Adapter-Sequenzen ligierten Restriktionsfragmente, die in den Schritten a) und b) mittels unterschiedlich markierter, Adapter-spezifischer Primer erzeugt worden sind; d) Hybridisierung der Vervielfältigungsprodukte von den verschiedenen Nukleinsäure-Populationen untereinander; e) Eliminierung der gebildeten Homohybride basierend auf der Markierung von Primern; und f) Identifizierung (oder Isolation oder Separation) der identischen, keine Basenunterschiede aufweisenden, Hetero-Hybridfragmente.
Das Verfahren nach Anspruch 1, wobei die Nukleinsäure-Populationen genomische DNA-Populationen, vorzugsweise humane genomische DNA-Populationen, sind, insbesondere bevorzugt solche von verschiedenen Individuen mit einem gemeinsamen Phänotyp.
Das Verfahren nach Anspruch 1 oder 2, wobei die Nukleinsäure-Populationen (ein) ausgewähltes) Chromosomen) umfassen.
Das Verfahren nach Anspruch 1 bis 3, wobei zwei bis zehn Nukleinsäure-Populationen verschiedenen Ursprungs eingesetzt werden.
Das Verfahren nach einem der vorhergehenden Ansprüche, wobei die Restriktionsfragmente vor der Vervielfältigung nach ihrer Größe ausgewählt werden.
Das Verfahren nach einem der vorhergehenden Ansprüche, wobei ein Teil oder die Gesamtheit der Restriktionsfragmente vor der Vervielfältigung in einen Vektor kloniert werden.
Das Verfahren nach einem der Ansprüche 1 bis 6, wobei die Adapter-Sequenz eine Erkennungsstelle für mut HL enthält.
Das Verfahren nach Anspruch 7, wobei das Adapter-Molekül ein 5-100 Basen langes, doppelsträngiges DNA-Fragment ist, welches mindestens ein GATC-Motiv enthält.
Das Verfahren nach einem der Ansprüche 1 bis 8, wobei die Vervielfältigung durch eine Polymerasekettenreaktion (PCR) erfolgt.
Das Verfahren nach einem der Ansprüche 1 bis 9, wobei der Primer zu mindestens einem Teil der Adaptermolekül-Sequenz komplementär ist.
Das Verfahren nach Anspruch 9, wobei der Primer markiert ist, vorzugsweise durch (i) Anhängen einer einzigartigen 5'-Sequenz an jeden Primer, (ii) Anhängen einer chemischen Gruppe an den Primer, welche die Unterscheidung der Amplifikationsprodukte von verschiedenen Nukleinsäure-Populationen erlaubt, oder (iii) Anhängen von modifizierten Nukleotiden in die Primer-Sequenz, welche die Unterscheidung der Amplifikationsprodukte von verschiedenen Nukleinsäure-Populationen ermöglicht.
Das Verfahren nach einem der vorhergehenden Ansprüche, wobei die Identifizierung von 100% basengepaarten Heterohybriden die folgenden Schritte umfaßt: (i) Separation von Homo- und Heteroduplexen, (ii) (Identifizierung und) Eliminierung nicht 100%ig basengepaarter Heterohybride und (iii) Identifizierung (oder Isolierung oder Separation) der identischen Heterohybrid-Fragmente.
Das Verfahren nach Anspruch 12, wobei das Verfahren die folgenden Schritte umfaßt: a) Separate Vervielfältigung der Restriktionsfragmente mittels eines Primers mit einer einzigartigen 5'-Sequenz für jede Nukleinsäure-Population; b) Mischen der Vervielfältigungsprodukte von diesen verschiedenen Nukleinsäure-Populationen, die einzigartige 5'-Endsequenzen aufweisen; c) Denaturierung und erneute Hybridisierung der besagten Nukleinsäuren; d) Verdau der 100%ig basengepaarten DNA (mit glatten Enden; Homoduplexe) durch Exo III und e) Elimination der durch Exo III generierten Einzelstränge, bevorzugterweise durch Bindung an eine einzelstrang-spezifische Matrix.
Das Verfahren nach Anspruch 12, wobei die Heterohybride von den Homohybriden durch die Methylierung von einer der beiden Nukleinsäure-Präparationen (oder Restriktionsfragmente) abgetrennt werden.
Das Verfahren nach Anspruch 12, wobei die nicht 100%ig basengepaarten Heterohybride mittels Enzymen, welche DNA Miss-Paarungen reparieren, eliminiert werden.
Das Verfahren nach Anspruch 15, wobei die Eliminierung der nicht 100%ig basengepaarten Nukleinsäure-Fragmente dadurch erreicht wird, dass (i) das Hybridisierungsgemisch mit MutS inkubiert wird und (ii) das resultierende Produkt mit einem MutS-bindenden Material in Berührung gebracht wird.
Das Verfahren nach Anspruch 15, wobei nicht 100%ig basengepaarte Nukleinsäure-Fragmente dadurch eliminiert werden, dass das Hybridisierungsgemisch mit MutS, MutL und MutH inkubiert wird, was zu einer spezifischen Spaltung der nicht 100%ig gepaarten Hybride führt.