Hybridisierungsproben reduzierter Komplexität
Die Erfindung betrifft ein Verfahren zur Analyse eines Nukleinsäure-Gemisches durch Hybridisierung eines DNA-Arrays mit einer komplexitätsreduzierten Nersion des Nukleinsäure-Gemisches, wobei das zu analysierende Nukleinsäure-Gemisch mindestens mit einer Bcgl-ähnlichen Restriktionsendonuklease geschnitten, markiert und gegebenenfalls isoliert wird.
Ein weiterer Gegenstand der Erfindung betrifft eine Hybridisierungsprobe (engl.: „sample") umfassend ein markiertes Nukleinsäurefragment-Gemisch mit im Wesentlichen identisch langen Fragmenten und mit verbesserter Hybridisierungsspezifität, welche nach dem oben genannten Verfahren erhältlich ist.
Ein weiterer Gegenstand der Erfindung betrifft die Verwendung eines markierten Nukleinsäurefragment-Gemisches mit im wesentlichen identisch langen Fragmenten, welches nach dem oben genannten Verfahren erhältlich ist zur Hybridisierung mit immobilisierten Nukleinsäuren, insbesondere mit DNA-Arrays.
Ein weiterer Gegenstand der Erfindung betrifft ein DNA-Array mit immobilisierten Oligonukleotiden, deren Sequenz mit der Sequenz von aus einem Nukleinsäure-Gemisch mit einer oder mehreren ßcgl-ähnlichen Restriktionsendonukleasen freisetzbaren Nukleinsäurefragmenten mindestens weitgehend identisch ist.
Hybridisierungen von DNA-JMicroarrays werden derzeitig zumeist mit komplexen Nukleinsäure-Gemischen als Hybridisierungsproben durchgeführt, vorzugsweise mit Gemischen aus den vollständigen cDNAs einer definierten Herkunft, insbesondere mit Gemischen der vollständigen cDNAs aus einem bestimmten Organ, Gewebe oder aus
einem bestimmten Organismus. Wie in Science 1995 Oct 20; 270(5235):467-70 und in Nat Biotechnol 1996 Dec; 14(13): 1675-80 beschrieben wurde, weisen solche Hybridisierungen von DNA-Arrays mit Hybridisierungsproben, bestehend aus den vollständigen cDNAs einer definierten Herkunft oftmals eine zu geringe Hybridisierungsspezifität und Empfindlichkeit auf, um eine zuverlässige Expressionsanalyse von cDNA-Gemischen definierter Herkunft zu liefern.
Die Hauptursache der limitierten Hybridisierungsspezifität der derzeitig eingesetzten Hybridisierungsproben, die meist ein Gemisch aus allen vollständigen cDNAs aus einem bestimmen Organismus, Gewebe oder Organ umfassen, ist ihre oftmals enorme Komplexität. Die Komplexität der eingesetzten Hybridisierungsproben wird in der Regel als das Produkt aus Länge der einzelnen Nukleinsäuremoleküle und der Anzahl verschiedener Nukleinsäuremolekülsorten im Gemisch erfaßt. Sind in einer Probe beispielsweise 15.000 verschiedene cDNA-Moleküle einer Durchschnittslänge von 2,5 kb vorhanden, so beträgt die Komplexität der Probe 2.500x15.000 = 3,7xl07. Hiervon trägt nur ein kleiner Teil zum Erhalt der gewünschten spezifischen Hybridisierungsereignisse bei, nämlich diejenigen Teilsequenzen, zu welchen an der Oberfläche des DNA-Arrays immobilisierte Nukleinsäuremoleküle mit komplementärer Sequenz (die sog. Hybridisierungssonden, engl.: „probes") existieren. Alle übrigen Teilsequenzen sollten durch ihre Tendenz zur „Kreuzhybridisierung", also der „unspezifischen" Hybridisierung mit nicht perfekt komplementären oberflächengebundenen Hybridisierungssonden, zur Entstehung von Hintergrundsignalen führen. Dies gilt insbesondere für sog. Oligonukleotid-Arrays, welche immobilisierte Oligonukleotide einer Länge von meist 20- 100 bp tragen, denn hier ist das Verhältnis von „gewünschten" Sequenzbereichen (zu welchen komplementäre, immobilisierte Nukleinsäuremoleküle auf dem DNA-Array existieren) zu „unerwünschten" Sequenzbereichen (zu welchen keine komplementären, immobilisierten Nukleinsäuremoleküle als „Gegenstück" auf dem DNA-Array vorliegen) besonders ungünstig. Andererseits ist bei sogenannten „cDNA-Arrays", also Arrays, bei denen die Hybridisierungssonden durch längere, meist deutlich über 100 bp lange Nukleinsäuremoleküle, wie insbesondere durch PCR-Produkte, gebildet werden, die Länge der gebildeten Hybride größer als für die maximal erreichbare Hybridisierungsspezifität erforderlich, so daß in diesem Fall eine überflüssig hohe Komplexität auf Seite der Hybridisierungssonden vorliegt, welche ebenfalls zu erhöhtem Hintergrund durch Kreuzhybridisierung führt.
Für die Hybridisierung von DNA-Arrays erscheint es somit zur Reduktion der Kreuzhybridisierung und damit zur Verbesserung der Hybridisierungsspezifität sinnvoll, die Komplexität der als Hybridisierungsproben eingesetzten komplexen cDNA-Gemische zu reduzieren. Bei einer solchen Reduktion der Komplexität der eingesetzten Hybridisierungsprobe sollte somit idealerweise nur die Nukleinsäure-Sequenzmenge pro cDNA (d. h. die Länge von cDNA-Fragmenten gegenüber der vollständigen cDNA- Länge), nicht aber die Zahl der im Nukleinsäure-Gemisch vertretenen cDNAs erniedrigt werden. Weiterhin ist anzustreben, daß die Komplexität der immobilisierten Hybridisierungssonden im Wesentlichen der Komplexität der Hybridisierungsprobe entspricht.
Aus dem Stand der Technik sind verschiedene Verfahren zur Komplexitätserniedrigung von Nukleinsäuremolekül-Gemischen bekannt.
Lisitsyn et al. (Science 1993 Feb 12; 259 (5097): 946-51) beschreiben ein Verfahren, das ,JRepresentational Difference Analysis" (RJDA) genannt wird. RDA beruht auf der Erzeugung von sogenannten „Repräsentationen" des ursprünglichen Nukleinsäure- Gemisches durch Restriktionsdau mit nicht häufig schneidenden Restriktionsendonukleasen, gefolgt von einer Amplifikation der kleineren hierbei erzeugten Fragmente. Längere Fragmente (beispielsweise über 1 kb) werden unter den gewählten Bedingungen nicht effizient amplifiziert, so daß das Amplifikationsprodukt im Wesentlichen aus einer Mischung kürzerer Fragmente besteht. Nachteil dieses Verfahrens ist das Fehlen eines eindeutigen Selektionskriteriums derjenigen Nukleinsäuremoleküle, welche in einer Repräsentation vorhanden sein oder fehlen sollen, da zwischen gut amplifizierbaren, kurzen und schlecht amplifizierbaren, langen Nukleinsäurefragmenten ein Kontinuum besteht. Das Fehlen eines solchen eindeutigen Kriteriums wirkt sich nachteilig auf die Reproduzierbarkeit des Verfahrens aus. Da bei PCR-basierten Amplifikationsverfahren cDNA-Fragmente mit bis zu 1 kb Länge noch mit großer Effizienz entstehen können, ist außerdem der Umfang der erwünschten Komplexitätserniedrigung pro cDNA eher gering, der Umfang der unerwünschten Komplexitätserniedrigung bezüglich der Anzahl der repräsentierten cDNAs jedoch eher groß, wodurch viele verschiedene Parallelexperimente, etwa mit verschiedenen Restriktionsendonukleasen, notwendig werden.
Ein weiteres Verfahren, die sogenannte Differential Display" -Technik (DD), wird von Liang und Pardee (Science 1992 Aug 14; 257(5072):967-71) beschrieben. DD beruht auf
der Verwendung von kurzen Primern mit zufälliger Sequenz („arbitrary primers") zur Amplifikation von cDNA-Fragmenten aus einer cDNA-Präparation. Abhängig von Primersequenzen und Amplifikationsbedingungen (vor allem abhängig von der Elongationszeit, sowie von der α/ eα/mg-Temperatur) werden Fragmentmischungen definierter Zusammensetzung erhalten. Nachteile von DD sind jedoch schlechte Reproduzierbarkeit, Überlappung der einzelnen Fragmentpools, Unterrepräsentation schwach exprimierter Transkripte sowie die schlechte Vorhersagbarkeit der erhaltenen Ergebnisse.
Ein anderes Verfahren zur Komplexitätsreduktion wird in EP-A 0 650 528 beschrieben. Hier werden Nukleinsäuremolekül-Populationen mit Typ πS-Restriktionsendonukleasen behandelt, welche überhängende Enden mit unbekannter Sequenz erzeugen. Anschließend wird das überhängende Strangende mit einer Mischung von Adaptoren ligiert, welche ebenfalls unterschiedliche überhängende Enden besitzen, wobei nur zueinander passende, zueinander komplementäre Überhänge aufweisende Enden miteinander verbunden werden, und somit eine Auswahl vorgenommen werden kann. Auf diese Weise wird die Einteilung der erzeugten Fragmente in verschiedene Subpopulationen und damit eine Reduktion der Komplexität der verschiedenen Subpopulationen gegenüber der ursprünglichen Population vorgenommen.
Ein ähnliches Verfahren wird in der US-A 6,361,947 zur Komplexitätsreduktion genomischer DNA offenbart. Nachteile dieses Verfahrens und des Verfahrens nach EP-A 0 650 528 sind aber die eingeschränkte Reproduzierbarkeit der Verfahren aufgrund von sogenannten „Fehlligationen". Solche Fehlligationen äußern sich in der Verknüpfung von nicht perfekt komplementären überhängenden Enden. Fehlligationen sind zu einem bestimmten Prozentsatz bei allen bekannten DNA-Ligasen zu beobachten und limitieren entscheidend die Reproduzierbarkeit und Genauigkeit des Verfahrens.
In US-A 6,352,829 wird ein Verfahren zur Komplexitätsreduktion beschrieben, welche auf der Erzeugung von Nukleinsäuremolekül-Subpopulationen mittels genspezifischer Primer beruht. Spezieller Nachteil dieses Verfahrens ist, daß hierbei nur eine wenig komplexe Subpopulation bekannter und ausgewählter Nukleinsäuremoleküle und nicht die Gesamtheit der Nukleinsäuremoleküle im cDNA-Gemisch untersucht werden kann. Auch bei diesem Verfahren zur Reduzierung der Komplexität ist der Umfang der erwünschten Komplexitätserniedrigung pro cDNA (Sequenzumfang pro cDNA) eher gering, der Umfang der unerwünschten Komplexitätserniedrigung bezüglich der Anzahl der
repräsentierten cDNAs in der Subpopulation jedoch eher groß, wodurch viele verschiedene Parallelexperimente notwendig werden. Die geringe Komplexitätserniedrigung pro cDNA führt dazu, daß bei der Array-Hybridisierung mit der nach diesem Verfahren hergestellten Hybridisierungsprobe viele Nukleinsäuremoleküle in voller oder in nahezu voller Länge teilnehmen. Dies wiederum bedeutet, daß bei der Hybridisierung selbst auch Molekülabschnitte zugegen sind, welche nicht zur spezifischen Hybridisierung beitragen, sondern lediglich ein Hintergrundsignal durch Kreuzhybridisierung erzeugen können.
Alle vorstehend genannten Verfahren zur Komplexitätserniedrigung von Nukleinsäure- Gemischen haben, sofern sie für die Komplexitätsreduktion von Hybridisierungsproben eingesetzt werden, mindestens einen der nachfolgenden Nachteile:
• Da bei den meisten Verfahren zur Komplexitätserniedrigung einer Hybridisierungsprobe - vor allem bei den auf PCR-Amplifikationen basierenden Verfahren - noch relativ große cDNA-Fragmente generiert werden, ist der Umfang der erwünschten Komplexitätserniedrigung pro cDNA bei diesen Verfahren eher gering. Dadurch sind noch relativ viele Nukleotidsequenzen bei der Hybridisierung zugegen, die nicht zu einer spezifischen Hybridisierung, sondern lediglich zur unspezifischen bzw. unerwünschten Kreuzhybridisierung beitragen. • Bei den meisten Verfahren ist der Umfang der unerwünschten
Komplexitätserniedrigung bezüglich der Anzahl der in der Hybridisierungsprobe repräsentierten cDNAs eher groß. Dadurch werden viele verschiedene zeit- und kostenaufwendige parallele Hybridisierungen notwendig, um alle in der Hybridisierungsprobe vertretenen cDNAs abzudecken. • Bei den meisten Verfahren zur Komplexitätserniedrigung - vor allem bei den auf
PCR-Amplifikationen basierenden Verfahren - ist die Reproduzierbarkeit gering. Dies folgt nicht etwa aus einer mangelnden Reproduzierbarkeit der PCR selbst, sondern aus der Tatsache, dass zur Selektion gewünschter Fragmente gegenüber unerwünschten Fragmenten ein unscharfes, in einem Kontinuum angesiedeltes Kriterium (geringere Zykluseffizienz bei der Amplifikation längerer als bei der
Amplifikation kürzerer Fragmente) eingesetzt wird. Schon leichte Variationen der experimentellen Bedingungen können daher deutliche Verschiebungen der Produktzusammensetzung zur Folge haben.
• Da bei den meisten Verfahren zur Komplexitätserniedrigung noch relativ große Nukleinsäure-Fragmente generiert werden, erlauben es diese Verfahren nicht, die
Existenz bzw. die Expressionsniveaus alternativer Spleiß- Varianten zu detektieren oder zu analysieren.
Neben der in der Regel zu großen Komplexität der für Array-Hybridisierungen nach dem Stand der Technik als Hybridisierungsproben eingesetzten Nukleinsäure-Gemische gibt es weitere Ursachen, die zu einer unzureichenden Hybridisierungsspezifität bei der Hybridisierung mit komplexen Hybridisierungsproben führen können. So unterscheiden sich beispielsweise die einzelnen Nukleinsäuren bzw. Nukleinsäure-Fragmente, aus denen die komplexe Hybridisierungsprobe besteht, in der Regel in ihrer Länge.
Längere Nukleinsäurefragmente unterscheiden sich von kürzeren Nukleinsäurefragmenten in ihren optimalen Hybridisierungs- und Waschbedingungen, wie insbesondere in der optimalen Hybridisierungs- und Waschtemperatur, in der optimalen Zusammensetzung der Hybridisierungs- und Waschlösungen, - sowie in den optimalen Hybridisierungs- und Waschzeiten.
Die Hybridisierung von DNA-Arrays mit komplexen Hybridisierungsproben, d.h. zumeist mit einem Gemisch aus unterschiedlich langen DNAs bzw. DNA-Fragmenten, wird daher oft unter solchen Hybridisierungs- und Waschbedingungen durchgeführt, die für die mittlere Größe der DNAs oder der DNA-Fragmente optimal sind. Dies kann zur Folge haben, daß besonders kleine oder besonders große Nukleinsäuren oder Nukleinsäure- Fragmente unter diesen „mittleren Hybridisierungsbedingungen" nicht mit ausreichender Spezifität hybridisieren und daher im Ergebnis unter- oder überrepräsentiert sein können.
Es ist daher Aufgabe der vorliegenden Erfindung, ein Verfahren zur Analyse eines Nukleinsäure-Gemisches durch Hybridisierung dieses Nukleinsäure-Gemisches mit einem DNA-Array bereitzustellen, bei dem ein Verfahrensschritt zur Reduktion der Komplexität des als Hybridisierungsprobe eingesetzten Nukleinsäure-Gemisches vorgesehen ist, welcher die vorstehend beschriebenen Nachteile der bereits bekannten Verfahren zur Komplexitätsreduktion von Nukleinsäure-Gemischen überwindet. Insbesondere ist es Aufgabe der Erfindung, ein Verfahren zur Analyse eines Nukleinsäure- Gemisches durch Hybridisierung dieses Nukleinsäure-Gemisches mit einem DNA-Array bereitzustellen, bei dem die Komplexität der vom Nukleinsäure-Gemisch bereitgestellten Sequenzmengen pro Nukleinsäuresorte (z.B. pro cDNA-Spezies) stark reduziert wird,
die Komplexität der vom Nukleinsäure-Gemisch bereitgestellten unterschiedlichen Nukleinsäuresorten (z.B. unterschiedliche cDNA-Spezies) möglichst nicht reduziert wird, eine gute Reproduzierbarkeit des Verfahrens gegeben ist, die Fragmentlängen aller unterschiedlichen Nukleinsäuren des Nukleinsäure- Gemisches (z.B. aller cDNAs im Gemisch) mindestens weitgehend identisch sind, und die Fragmentlängen so kurz sind, daß in der Regel auch alternative Spleiß- Varianten bei der Analyse unterschieden werden können.
Die Aufgabe wird erfindungsgemäß gelöst durch ein Verfahren zur Analyse eines Nukleinsäure-Gemisches durch Hybridisierung eines DNA-Arrays, der immobilisierte Nukleinsäuren umfaßt, mit einem markierten, komplexitätsreduzierten Nukleinsäure- Gemisch als Hybridisierungsprobe, mit den folgenden Verfahrensschritten:
(la) Schneiden des Nukleinsäure-Gemisches mit einer oder mehreren Bcgl- ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im Wesentlichen identisch langen Nukleinsäure- Fragmenten, (2a) gegebenenfalls Isolation des Gemisches aus identisch langen Nukleinsäure-
Fragmenten aus (la),
(3a) Markierung der Nukleinsäure-Fragmente des Gemisches aus (la) oder (2a),
(4a) gegebenenfalls Isolation des Gemisches aus markierten und identisch langen Nukleinsäure-Fragmenten aus Schritt (3a), (5a) Hybridisierung eines DNA-Arrays mit dem Gemisch aus Schritt (3a) oder
(4a) als Hybridisierungsprobe,
(6a) Auswertung der Hybridisierung.
Das vorstehend beschriebene Verfahren dient der Analyse eines Nukleinsäure-Gemisches mit Hilfe eines DNA-Arrays. Bevorzugte Analysen, die mit dem erfindungsgemäßen Verfahren durchgeführt werden können, betreffen die Expressionsanalyse von Nukleinsäure-Gemischen einer definierten Herkunft, die Identifizierung von kurzen Nukleinsäure-tαgs in einem Nukleinsäure-Gemisch, sowie besonders bevorzugt vergleichende Expressions- und/oder Sequenz-Analysen von mehreren Nukleinsäure- Gemischen unterschiedlicher Herkunft. Hierbei dient das erfindungsgemäße Verfahren
insbesondere der vergleichenden Expressions- und/oder Sequenz-Analyse von verschiedenen Gemischen aus cDNA, genomischer DNA oder RNA, welche jeweils aus unterschiedlichen oder auf unterschiedliche Weise behandelten Organismen, Geweben oder Organen gewonnen wurden.
In Verfahrensschritt (la) wird das zu analysierende Nukleinsäure-Gemisch zunächst mit mindestens einer Z?cgl-ähnlichen Restriktionsendonuklease geschnitten, wobei ein Gemisch aus Nukleinsäure-Fragmenten generiert wird. Die einzelnen Nukleinsäure- Fragmente sind hierbei - sofern sie aus dem Verdau mit dem gleichen 5cgl-ähnlichen Restriktionsenzym stammen - meist identisch lang. Beim Verdau des Nukleinsäure- Gemisches mit mehr als einer ZJcgI-ähnlichen Restriktionsendonuklease können die Fragmente, die aus den unterschiedlichen Restriktionen hervorgehen, unterschiedlich lang sein. Weiterhin können unterschiedlich lange Fragmente auch dadurch entstehen, daß das Nukleinsäure-Gemisch mit einer auf nicht eindeutige Weise schneidenden 5cgl-ähnlichen Restriktionsendonuklease verdaut wird. Ein Beispiel für eine solche auf nicht eindeutige Weise schneidende ßcgl-ähnliche Restriktionsendonuklease ist Hin l, welches entweder in einer Entfernung von 13 oder von 14 Nukleotiden von seiner Erkennungsstelle einen Strangbruch katalysieren kann, so daß hierbei Fragmente mit sehr geringen Längendifferenzen entstehen können.
Bei Durchführung eines Restriktionsverdaus des Nukleinsäure-Gemisches mit den oben genannten nicht eindeutig schneidenden ßcgl-ähnlichen Restriktionsendonukleasen bzw. mit Kombinationen von ßcgl-ähnlichen Restriktionsendonukleasen entstehen jedoch in der Regel Fragmente, deren Länge lediglich in geringem Ausmaß differiert. Solche Fragment- Gemische werden daher im Folgenden als Nukleinsäure-Fragment-Gemische mit einer „im wesentlichen identischen Fragmentlänge" bezeichnet.
Die Längenunterschiede zwischen den kürzesten und den längsten Fragmenten, die durch einen Restriktionsverdau mit ßcgl-ähnlichen Restriktionsendonukleasen erzeugt wurden, betragen in der Regel nicht mehr als 25%, vorzugsweise nicht mehr als 10%, insbesondere nicht mehr als 5%. Hierbei sind mit Fragmenten selbstverständlich nicht solche Fragmente gemeint, welche sich zwischen zwei zu verschiedenen Erkennungsstellen gehörenden Schnittstellen für die eingesetzte(n) Rcgl-ähnliche(n) Restriktionsendonuklease(n) befanden, sondern diejenigen Fragmente, welche ihrerseits eine Erkennungsstelle für die ßcgl-ähnliche Restriktionsendonuklease aufweisen, mittels derer sie erzeugt wurden.
In jedem Fall sind die Längendifferenzen verschiedener mittels einer oder mehrerer Bcgl- ähnlicher Restriktionsendonuklease(n) erzeugter Fragmente so gering, daß die gleichen Hybridisierungsbedingungen für alle erzeugten Fragmente zur Anwendung kommen können, ohne daß unspezifische Hybridisierung einzelner Fragmente störend in Erscheinung tritt.
Unter Rcgl-ähnlichen Restriktionsendonukleasen werden solche Restriktionsendonukleasen verstanden, die einen als Substrat dienenden DNA-Doppelstrang an zwei Stellen, meistens beidseitig ihrer Erkennungssequenz, schneiden. Hierfür müssen im Gegensatz zu konventionellen Restriktionsendonukleasen vom Typ II oder Es, welche einen als Substrat dienenden Doppelstrang an einer Stelle schneiden und hierfür zwei Einzelstrangbrüche katalysieren, vier Einzelstrangbrüche katalysiert werden, so daß ein kurzes Doppelstrang-Fragment definierter Länge (i.d.R. zwischen 20 und 30 bp) freigesetzt wird (Nucleic Acids Res 1996 Sep 15; 24(18):3590-2; Gene 1998 Jun 15; 213(1-2): 17-22; einige Beispiele siehe Tabelle 1). Wird demnach ein komplexes Gemisch aus verschiedenen Nukleinsäuren, wie beispielsweise die gesamte cDNA aus einem definierten Organ, Gewebe oder Organismus, mit einer solchen RcgI-ähnlichen Restriktionsendonuklease geschnitten, so erhält man meist exakt gleich lange Fragmente für alle unterschiedlichen cDNAs, d.h. man erhält Nukleinsäure-tαgs, die jeweils einem kurzen, zur Identifikation der cDNA ausreichenden Sequenzabschnitt entsprechen. Im Folgenden wird unter einem tag also ein mittels einer ßcgl-ähnlichen Restriktionsendonuklease erzeugtes oder erzeugbares Nukleinsäurefragment verstanden.
Zu einem analogen Ergebnis gelangt man jedoch auch mit bestimmten Kombinationen („Doppeldaus") von Typ IIs-Restriktionsendonukleasen oder auch einer Typ IIs- Restriktionsendonuklease und einer Typ JLI-Restriktionsendonuklease, wobei ein solcher Doppeldau mit beiden Enzymen gleichzeitig oder nacheinander durchgeführt werden kann. Beispielsweise kann durch Inkubation von DNA mit den Typ IIs- Restriktionsendonukleasen Mnll (Schneidecharakteristik CCTC(7/6)) und BseRI (Schneidecharakteristik GAGGAG(10/8) bzw., in umgekehrter Orientierung gelesen, (8/10)CTCCTC) ebenfalls ein kurzes Doppelstrang-Fragment (Länge: 22bp zuzüglich einzelsträngiger Überhänge) freigesetzt werden.
Unter Typ IIs-Restriktionsendonukleasen werden solche Restriktionsendonukleasen verstanden, die ihr Substrat in einem definierten Abstand (bei derzeit bekannten Typus- Enzymen bis zu 20 bp) von der Erkennungsstelle entfernt schneiden.
Ähnlich kann die Restriktionsendonuklease Alwl (Schneidecharakteristik GGATC(4/5) bzw., in umgekehrter Orientierung gelesen, (5/4)GATCC) beim Vorliegen der Teilsequenz GGATCC (einer „kombinierten Erkennungsstelle") ein Doppelstrang-Fragment der Länge 12 bp freisetzen, dessen einbasige einzelsträngige Enden sich so auffüllen lassen, daß ein 14 bp-Fragment erhalten wird.
Es ist ebenso möglich, daß eines der beiden Enzyme innerhalb der Erkennungsstelle des anderen Enzyms schneidet, oder beide Enzyme auf der gleichen Seite ihrer kombinierten Erkennungsstelle schneiden. In diesem Fall muß der Doppeldau so durchgeführt werden, daß zunächst das von der kombinierten Erkennungsstelle weiter entfernt schneidende Enzym und danach das andere Enzym zur Anwendung kommt, da anderenfalls mit der Schneidecharakteristik des zweiten Enzyms kein Schnitt mehr erfolgen könnte. So kann man etwa mit einer Kombination der Restriktionsendonukleasen Bsgl (Schneidecharakteristik GTGCAG( 16/14)) und Btsl (Schneidecharakteristik GCAGTG(2/0)) die Sequenz GTGCAGTG erkennen und 12 bp lange Doppelstrang- Fragmente erzeugen oder mit einer Kombination der Restriktionsendonukleasen Bpml (Schneidecharakteristik CTGGAG(16/14)) und BsrI (Schneidecharakteristik ACTGG(1/- 1)) die Sequenz ACTGGAG erkennen und 13 bp lange Doppelstrang-Fragmente generieren.
Dementsprechend umfasst der Begriff der „Ztegl-ähnlichen Restriktionsendonukleasen" im Sinne des erfindungsgemäßen Verfahrens ausdrücklich auch solche Enzyme oder Enzymkombinationen, welche beim Vorliegen einer geeigneten, ggf. aus zwei Erkennungsstellen kombinierten Erkennungsstelle die Erzeugung von Fragmenten definierter, weitgehend einheitlicher Länge ermöglichen (siehe Tabelle 1).
Tabelle 1 zeigt ßcgl-ähnliche Restriktionsendonukleasen, die beidseitig ihrer Erkennungssequenz schneiden, sowie Kombinationen von Typ US- bzw. Typ JQ- Restriktionsendonukleasen, die im Rahmen der vorliegenden Erfindung ebenfalls zu den Ztegl-ähnlichen Restriktionsendonukleasen gezählt werden. Allen diesen ßcgl-ähnlichen Restriktionsendonukleasen ist gemeinsam, daß sie identisch lange oder im Wesentlichen identisch lange Fragmente aus einzelnen Nukleinsäure-Molekülen, die auch in komplexen Nukleinsäure-Gemischen vorliegen können, herausschneiden.
Erkennungssequenz Enzym Fragmentlänge*
(7/12)GAACNNNNNNTCC( 12/7) Alol 27 bp
(10/15)ACNNNNGTAYC(12/7) Bael 28 bp
(10/12)CGANNNNNNTGC(12/10) Bcgl 32 bp
(8/13)GAGNNNNNCTC( 13/8) Bpli 27 bp
(9/12) ACNNNNNCTCC( 10/7) BsaXl 27 bp
(8/13)GACNNNNNNTGG(12/7) Bsp2Al 27 bp
(8/14)CCANNNNNNGT( 15/9) Cjel 28 bp
(7/13)CCAJNNJNNNNNTC(14/8) CjePϊ 27 bp
(8/13) AAGNNNNNCTT( 13/8) Fan 27 bp
(7/13)GAYNNNNNRTC(14/9) HaeJV 27 bp
(8/13)GAYNNNNNVTC( 13/8) HinΛl 27 bp
(7/12)GAACNNNNNCTC(13/8) Ppil 27 bp
(7/12)GAACNNNNNNTAC(12/7) Psrl 27 bp
(8/10)CTCCTC(7/6) Mnll + BseRI 20 bp
(4/3)GGATCC(3/4) Alwl 12 bρ (14 bp**)
ACTGGAG(-1/-3)(16/14) Bpml + Bsrl 15 bp
GTGCAGTG(2/0)( 14/12) Bsgl + BtsI 10 bp
*) doppelsträngiger Anteil; **) nach Endauffüllung
Tabelle 1: Beispiele für RcgI-ähnliche Restriktionsendonukleasen
Die Vorteile der ungewöhnlichen Fragmentierungscharakteristika der Rcgl-ähnlichen Restriktionsendonukleasen liegen im Hinblick auf das erfindungsgemäße Verfahren darin, daß durch die ßcgl-ähnlichen Restriktionsendonukleasen
erstens sehr kurze Fragmente mit meist nicht mehr als 40 Nukleotiden Länge erzeugt werden, wodurch die Komplexität der vom Nukleinsäure-Gemisch bereitgestellten Sequenzmengen pro Nukleinsäuresorte (z.B. pro cDNA-Spezies) stark reduziert wird, und zweitens Fragmente mit identischer Länge erzeugt werden, die alle die gleichen oder hinreichend ähnliche optimale Hybridisierungsbedingungen (Hybridisierungs- Temperatur, -Dauer, Zusammensetzung der Hybridisierungslösung, Waschbedingungen) besitzen, um gemeinsam zur Hybridisierung eingesetzt zu werden, ohne daß unspezifische Hybridisierungsereignisse störend in Erscheinung treten.
Durch den Restriktionsverdau des Nukleinsäure-Gemisches mit einer oder mehreren Bcgl- ähnlichen Restriktionsendonukleasen sinkt die Komplexität des Nukleinsäure-Gemisches in der Regel um einen Faktor von 10 bis 1000, vorzugsweise um einem Faktor von 50 bis 200, insbesondere um einen Faktor von ca. 100, so daß bei der Hybridisierung eines DNA- Arrays mit der erfindungsgemäß komplexitätsreduzierten Nukleinsäurefragment-Mischung als Hybridisierungsprobe ein deutlich geringerer Hintergrund durch Kreuzhybridisierung entsteht.
Außerdem basiert die Komplexitätsreduktion des hier eingesetzten Verfahrens nicht auf dem Einsatz von PCR zur unterschiedlich effizienten Amplifikation längerer und kürzerer Fragmente aus einer Fragmentmischung, in der im wesentlichen ein Kontinuum von Fragmentlängen gegeben ist, sondern lediglich auf definierten Restriktionsschritten, so daß sich das Verfahren durch eine gute Reproduzierbarkeit auszeichnet. Sofern in dem erfindungsgemäßen Verfahren nach einem der genannten Verfahrensschritte dennoch ein PCR-Amplifikationsschritt durchgeführt wird, was im Rahmen des Verfahrens ausdrücklich möglich ist, so wird dieser Amplifikationsschritt aufgrund der im wesentlichen identischen Fragmentlängen im Gemisch unter Bedingungen erfolgen, unter denen keine Beeinträchtigung der Reproduzierbarkeit des Verfahrens auftritt.
Weiterhin kann durch die Restriktion des Nukleinsäure-Gemisches durch mehr als eine ßcgl-ähnliche Restriktionsendonuklease gewährleistet werden, daß annähernd alle im ursprünglichen Nukleinsäure-Gemisch vertretenen Nukleinsäuresorten (bzw. alle cDNA- Spezies im Gemisch) auch in dem komplexitätsreduzierten Fragmentgemisch, das aus der Restriktion mit einer jBcgl-ähnlichen Restriktionsendonuklease hervorgeht, repräsentiert sind. Somit sollte die „unerwünschte Komplexitätserniedrigung", d.h. die Komplexitätserniedrigung bezüglich der Anzahl der in der Hybridisierungsprobe repräsentierten cDNA-Spezies, eher gering sein. Somit werden keine zahlreichen, kosten- und zeitaufwendigen Parallelhybridisierungen notwendig.
Daher wird in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens das Nukleinsäure-Gemisch in Verfahrensschritt (la) mit mehreren 5cgl-ähnlichen Restriktionsendonukleasen gleichzeitig oder nacheinander geschnitten.
In Verfahrensschritt (2a) werden die aus dem Restriktionsverdau des Nukleinsäure- Gemisches mit einer oder mehreren Rcgl-ähnlichen Restriktionsendonukleasen hervorgehenden Nukleinsäurefragmente gegebenenfalls isoliert.
Eine solche Isolation bzw. Reinigung der identisch langen Fragmente kann über alle dem Fachmann geläufigen Standardverfahren der Molekularbiologie zur Isolation und/oder Größenselektion von Nukleinsäurefragmenten erfolgen. Insbesondere ist es möglich, die aus dem Verdau mit ßcgl-ähnlichen Restriktionsendonukleasen hervorgegangenen Nukleinsäure-Fragmente durch Gelelektrophorese oder Chromatographie- Verfahren oder auch durch größenselektive Fällungs-Methoden zu isolieren (Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, 1987-2001, unit 5.5.6 - 5.5.8).
Im Verfahrensschritt (3a) wird das Fragmentgemisch aus (la) bzw. das gegebenenfalls gereinigte Fragmentgemisch aus (2a) mit Hilfe von Standardverfahren als Hybridisierungsprobe markiert.
Die Markierung kann durch alle Markierungsverfahren erfolgen, die dem Fachmann nach dem Stand der Technik bekannt sind. Vorzugsweise kann die Markierung durch kovalente Verknüpfung bzw. Ligation mit markierten Linkermolekülen vorgenommen werden.
Werden Linker (auch als Adaptoren bezeichnet) verwendet, ist auch eine vorherige Amplifikation der Nukleinsäure-Fragmente (Nukleinsäure-tαg.s) - insbesondere durch PCR - möglich. Gegebenenfalls kann die Markierung unter Verwendung detektierbar markierter Nukleotid-Triphosphate und/oder detektierbar markierter Primer gleichzeitig mit der Amplifikation stattfinden. Hier können die Linker als Bindungsstellen für Oligonukleotid- Primer dienen.
In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens werden Linker eingesetzt, welche einen RNA-Polymerase-Promotor aufweisen. Daraufhin folgt dann eine in v tro-Transkription, zu der bevorzugt markierte Ribonukleotide eingesetzt werden.
Weiterhin bevorzugt ist die Markierung des Fragmentgemisches aus (la) bzw. des gegebenenfalls gereinigten Fragmentgemisches aus (2a)
durch den Einbau von Nukleotiden, welche radioaktive Isotope umfassen, wie insbesondere 32P, 33P oder 35S, oder durch die kovalente Verknüpfung mit Fluoreszenzfarbstoffen, wie insbesondere Cy3, Cy5 etc.
durch die Inkorporation von Molekülgruppen, die einen Partner eines spezifischen Bindungspaares darstellen. Beispiele für spezifische Bindungspaare sind Haptene und die gegen sie gerichteten Antikörper oder das Paar Biotin-Streptavidin, Fragmente, die eine solche Molekülgruppe enthalten, lassen sich durch Bindung des jeweiligen, beispielsweise fluoreszenzmarkierten, Bindungspartners detektieren.
Im Verfahrensschritt (4a) kann das in Schritt (3a) markierte Gemisch aus im wesentlichen gleich langen Nukleinsäure-Fragmenten, welches als Hybridisierungsprobe eingesetzt werden soll, gegebenenfalls nochmals isoliert beziehungsweise gereinigt. Diese Reinigung kann durch alle dem Fachmann bekannten Isolations- bzw. Reinigungsverfahren erfolgen, insbesondere auch durch die unter Schritt (2a) genannten Techniken.
In Verfahrensschritt (5a) wird ein DNA-Array mit dem markierten Gemisch aus im Wesentlichen identisch langen Nukleinsäure-Fragmenten, welches als komplexe Hybridisierungsprobe eingesetzt wird, hybridisiert.
Unter einem DNA-Array wird im Rahmen der Erfindung eine beliebige Oberfläche verstanden, an der eine Vielzahl von unterschiedlichen Nukleinsäuren bzw. Nukleinsäurefragmenten, sogenannte Hybridisierungssonden, immobilisiert worden sind. Bei der Oberfläche handelt es sich oft um eine planare Oberfläche eines Trägers aus Glas, Kunststoff, Metall, Silizium oder anderen Werkstoffen. Allerdings kann die Oberfläche auch auf beliebig andere Weise geformt oder strukturiert sein; auch ist es nicht erforderlich, daß sich alle Hybridisierungssonden auf dem selben Träger befinden. Vielmehr sind Array- Anordnungen denkbar, bei denen sich die Hybridisierungssonden auf den Oberflächen kleiner Partikel, beispielsweise sog. beads, befinden. Man spricht in solchen Fällen oft von Suspensions-Arrays. Bei den immobilisierten Hybridisierungssonden handelt es sich meist um DNA- oder RNA-Stränge, wobei artifizielle Nukleinsäuren wie beispielsweise PNA (peptidic nucleic acids) oder auf beliebige Weise modifizierte Nukleinsäuren ebenfalls zum Einsatz kommen könnten. Es ist möglich, Hybridisierungssonden durch PCR-Amplifikation ausgewählter Bereiche von mRNA- bzw. cDNA-Molekülen zu erzeugen oder aus cDNA-Banken stammende Klone als Hybridisierungssonden einzusetzen.
Um eine möglichst hohe Sensitivität zu erzielen, ist es bevorzugt, daß die Hybridisierungssonden vor Einsatz des Arrays zur Hybridisierung in einzelsträngiger Form vorliegen. Sind die immobilisierten Nukleinsäuremoleküle zunächst doppelsträngig, so
kann einer der beiden Stränge durch Denaturierung abgeschmolzen und fortgewaschen werden. In diesem Fall ist insbesondere einer der beiden Stränge mit einer immobilisierbaren Gruppe ausgestattet, welche der Gegenstrang nicht aufweist, so daß gezielt einer der beiden Stränge entfernt werden kann.
In einer bevorzugten Ausfuhrungsform des erfindungsgemäßen Verfahrens sind die eingesetzten Hybridisierungssonden, welche die auf der Array-Oberfläche immobilisierten Nukleinsäuren bezeichnen, nicht oder nicht wesentlich länger als die in der Hybridisierungsprobe enthaltenen markierten Nukleinsäurefragmente. Dies trägt neben der Komplexitätsreduktion der Hybridisierungsprobe weiter zur Unterdrückung von Hintergrundsignal durch Kreuzhybridisierung bei.
Es ist im Rahmen des erfindungsgemäßen Verfahrens weiterhin bevorzugt, die Hybridisierungssonden durch Behandlung geeigneter Nukleinsäuremischungen, beispielsweise einer cDNA-JMischung, mit geeigneten ßcgl-ähnlichen Restriktionsendonukleasen, gefolgt von einer Klonierung und einer geordneten Ablage, d.h. einer lokal geordneten Immobilisierung der gewonnenen Klone auf der Oberfläche in Form eines DNA-Arrays zu erzeugen.
Vorzugsweise wird daher bei dem Verfahren ein DNA-Array eingesetzt, der solche immobilisierten Nukleinsäuren umfaßt, die ebenfalls mit den gleichen ßcgl-ähnlichen Restriktionsendonukleasen geschnitten sind.
In einer besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens werden als Hybridisierungssonden, d.h. als immobilisierte Nukleinsäuren auf der Array- Oberfläche, Oligonukleotide, insbesondere synthetisch hergestellte Oligonukleotide, eingesetzt. Diese Oligonukleotide werden vorzugsweise derart entworfen, daß sie im Wesentlichen die Nukleotidsequenzen aller in einer Hybridisierungsprobe vorhandenen oder alle nachzuweisenden Nukleinsäure-tαgs „abdecken", d.h. komplementär zu einem der beiden tαg-Stränge sind. In der Regel zeichnen sich solche Oligonukleotide aus durch
(i) eine immobilisierbare Gruppe,
(ii) gegebenenfalls durch einen geeigneten Distanzhalter („spacer"), sowie (iii) einen Sequenzbereich, welcher komplementär zu einem Strang eines Nukleinsäure- tags ist, der in einer relevanten Hybridisierungsprobe erwartet wird oder möglicherweise vorhandenen ist.
Bevorzugt ist daher der Einsatz eines DNA-Arrays, welcher Oligonukleotide als immobilisierte Nukleinsäuren umfaßt. Vorzugsweise umfaßt zumindest ein Anteil dieser Oligonukleotide identische Nukleotidsequenzen wie mindestens ein Teil der in Schritt (la) durch Schneiden mit mindestens einer Rcgl-ähnlichen Restriktionsendonuklease generierten Nukleinsäure-Fragmente.
Weiterhin sind solche Oligonukleotide, die auf einem Array in geordneter Weise immobilisiert sind, in der Regel 20 bis 100 Nukleotide, vorzugsweise 25 bis 40 Nukleotide lang.
In Verfahrensschritt (6a) wird die Hybridisierung vorzugsweise mit Hilfe geeigneter Computerprogramme ausgewertet.
Die Verfahrensschritte (5a) und (6a) werden im Einzelnen nach solchen Methoden durchgeführt, die dem Fachmann bekannt sind, und die im Detail in Science 1995 Oct 20; 270(5235):467-70 und in Nat Biotechnol 1996 Dec; 14(13): 1675-80) beschrieben sind.
In einer weiteren Ausführungsform des erfindungsgemäßen Verfahrens kann die zur Hybridisierung genutzte Nukleinsäure-tαg-Länge nachträglich anligierte Adaptersequenzen ganz oder teilweise umfassen. Damit auf diese Weise die Hybridisierungsspezifität der einzelnen Nukleinsäure-Fragmente nicht verringert wird, werden in einer bevorzugten
Ausführungsform des erfindungsgemäßen Verfahrens eine Vielzahl von Adaptern mit degenerierten Überhängen an die jeweils komplementären Überhänge der einzelnen Nukleinsäure-tαgs ligiert. Hierfür müßten beispielsweise für einen zweibasigen degenerierten Überhang der Nukleinsäure-Fragmente 16, d.h. 42 Linker mit sequenzverschiedenen, zweibasigen Überhängen eingesetzt werden. Da durch die Sequenz des fag-Überhangs vorherbestimmt ist, welcher der Adapter befestigt werden wird, kann das zu diesem Nukleinsäure-tαg gehörige Oligonukleotid auf dem DNA-Array in einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens ebenfalls um die entsprechende Sequenz (nämlich das reverse Komplement des entsprechenden
Adapterstrangs) verlängert werden.
In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird im Verfahrensschritt (5a) zur Hybridisierung eines DNA-Arrays lediglich einer der beiden Stränge des Nukleinsäurefragment-Gemisches aus Schritt (3a) oder (4a) eingesetzt.
Der Einsatz nur eines Stranges des Nukleinsäurefragment-Gemisches hat einen zusätzlichen Sensitivitätsgewinn des Hybridisierungsschrittes (5a) zur Folge, da dadurch eine erneute Re-Hybridisierung („Reannealing") des (+)-Stranges und des (-)-Stranges in der Hybridisierungslösung vermieden wird. Diese erneute Re-Hybridisierung steht sonst in Kompetition zur Hybridisierung der Fragmente des Gemisches mit den immobilisierten Nukleinsäuren des Arrays und vermindert somit die Sensitivität des Analyseverfahrens.
Die Isolation nur jeweils eines Stranges des als Hybridisierungsprobe eingesetzten Nukleinsäurefragment-Gemisches kann in der Regel durch alle dem Fachmann bekannten Verfahren erreicht werden, die die Generation solcher Nukleinsäure-tαgs, bzw. solcher Nukleinsäure-Fragmente beinhalten, bei denen die (+)- Stränge und die (-)-Stränge enzymatisch, chemisch oder physikalisch voneinander unterscheidbar sind. Eine enzymatische Unterscheidbarkeit zwischen (+)- Strang und (-)-Strang kann insbesondere über die folgenden Verfahrensschritte erreicht werden: (lb) Restriktionsverdau eines Hybrids aus messenger-RNA (mRNA) und Erststrang- cDNA mit mindestens einer ßcgl-ähnlichen Restriktionsendonuklease,
(2b) Ligation eines Adapters, der einen Promotor für eine RNA-Polymerase, beispielsweise für die T7 RNA-Polymerase, umfaßt,
(3b) enzymatischer Abbau des RNA-Strangs und (4b) m-v tro-Transkription in Anwesenheit markierter Nukleotide.
Anstelle eines enzymatischen Abbaus des RNA-Strangs ist auch ein chemischer Abbau, insbesondere eine Hydrolyse, denkbar.
In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens werden daher die Verfahrensschritte (la) bis (4a) durch die Verfahrensschritte (lb) bis (4b) ersetzt, um die Herstellung einer einzelsträngigen, markierten Hybridisierungsprobe, die eine komplexitätsreduzierte Version des zu analysierenden Nukleinsäure-Gemisches umfaßt, zu ermöglichen. Anschließend erfolgt dann die Hybridisierung der so erzeugten Hybridisierungsprobe mit einem DNA-Array, sowie die Auswertung dieser Hybridisierung nach den Verfahrensschritten (5a) und (6a).
Eine alternative Möglichkeit, eine Unterscheidbarkeit von (+)- und (-)-Strang zu erzielen, besteht darin, daß während der Synthese von doppelsträngiger cDNA zur Erststrang- Synthese eine andere Mischung von Nukleotidbausteinen eingesetzt wird als zur
Zweitstrangsynthese. Insbesondere können beispielsweise nur zur Zweitstrang-Synthese besondere Nukleotide oder modifizierte Nukleotide eingesetzt werden, welche demzufolge nur in den cDNA-Zweitstrang inkorporiert werden, aber während der Erststrang-Synthese nicht anwesend waren. Ein solches Verfahren würde nachfolgend eine Unterscheidung beider Stränge zulassen.
In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens erfolgt daher die Isolation jeweils nur der (+)-Stränge oder nur der (-)-Stränge der einzelnen Nukleinsäure-Fragmente des Fragment-Gemisches über die folgenden Einzelschritte, welche die Verfahrensschritte (la) bis (2a) ersetzen:
(lc) Synthese eines Gemisches aus doppelsträngiger cDNA, wobei entweder nur bei der Erststrang- oder nur bei der Zweitstrang-Synthese mindestens ein modifiziertes Nukleotidtriphosphat unter Entstehung eines doppelsträngigen cDNA-Gemisches mit unterscheidbaren Einzelsträngen inkorporiert wird,
(2c) Schneiden des doppelsträngigen cDNA-Gemisches aus (lc) mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im Wesentlichen identisch langen cDNA-Fragmenten, (3c) gegebenenfalls Isolation des Gemisches aus cDNA-Fragmenten aus (2c),
(4c) spezifische Entfernung nur der Erst-Stränge oder nur der Zweit-Stränge der einzelnen cDNA-Fragmente des Gemisches aus (2c) oder (3c) unter Generierung eines Gemisches aus einzelsträngigen cDNA-Fragmenten.
Danach erfolgen die Verfahrensschritte (3a) bis (6a).
Beispiele für solche besonderen und/oder modifizierten Nukleotide sind dUTP oder mittels einer immobilisierbaren Gruppe modifizierte Nukleotide, wie etwa Biotin-dUTP.
Wird dUTP beispielsweise bei der Zweitstrangsynthese zugegeben, zeichnet sich die doppelsträngige DNA durch einen Uracil-haltigen (Zweit-)Strang aus, während der andere (Erst-)Strang kein Uracil aufweist. Wird ein solcher Doppelstrang (oder ein doppelsträngiger Nukleinsäure-tαg, welcher durch Restriktionsverdau mit RcgI-ähnlichen Restriktionsendonukleasen erzeugt wurde) mit Uracil-DNA-Glycosylase (UDG) behandelt, werden die Uracil-Gruppen entfernt, so daß nur noch der Gegenstrang als Template für eine RNA- oder DNA-Polymerase dienen kann.
Die Erfindung betrifft daher weiterhin ein Verfahren zur Analyse eines Nukleinsäure- Gemisches durch Hybridisierung eines DNA-Arrays, der immobilisierte Nukleinsäuren umfaßt, mit einem markierten, komplexitätsreduzierten Nukleinsäure-Gemisch als Hybridisierungsprobe, mit den folgenden Verfahrensschritten:
(ld) Synthese eines Gemisches aus doppelsträngiger cDNA, wobei entweder nur bei der Erststrang- oder nur bei der Zweitstrang-Synthese dUTP anstelle von dTTP inkorporiert wird, (2d) Schneiden des Gemisches aus doppelsträngiger cDNA aus (ld) mit mindestens einer ßcgl-ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im wesentlichen identisch langen cDNA-Fragmenten, (3d) gegebenenfalls Isolation des Gemisches aus cDNA-Fragmenten aus (2d), (4d) kovalente Verknüpfung von Adaptor-Molekülen mit den Enden der cDNA-
Fragmente des Gemisches aus (2d) oder (3d), wobei die Adaptoren mindestens eine Promotor-Sequenz für eine RNA-Polymerase enthalten, unter Entstehung eines Gemisches aus doppelsträngigen cDNA-Fragmenten, (5d) Entfernung der inkorporierten Uracil-Basen aus den doppelsträngigen cDNA-Fragmenten des Gemisches aus (4d) mittels Uracil-DNA-
Glykosylase, (6d) in-vitro-Transkription der Adaptor-flankierten Fragmente mittels einer RNA-Polymerase, deren Promotor-Sequenz in den Adaptormolekülen enthalten ist, in Gegenwart markierter Nukleotidtriphosphate unter Entstehung eines Gemisches aus markierten, einzelsträngigen cDNA-
Fragmenten, (7d) Hybridisierung eines DNA-Arrays mit dem Gemisch aus cDNA-
Fragmenten aus (6d), (8d) Auswertung der Hybridisierung.
Eine alternative Möglichkeit, eine Unterscheidbarkeit zwischen den (+)- und den (-)- Strängen der Nukleinsäure-Fragmente des Gemisches zu erzielen, besteht darin, daß entweder nur während der Erststrang-cDNA-Synthese oder nur während der Zweitstrang- cDNA-Synthese ein mittels einer immobilisierbaren Gruppe modifiziertes Nukleotidtriphosphat, beispielsweise Biotin-dUTP, zugegeben wird. Hierdurch entsteht doppelsträngige cDNA, die sich beispielsweise durch einen biotinylierten Zweitstrang
auszeichnet, während der Erststrang nicht biotinyliert ist. Werden solche Doppelstränge (oder ein doppelsträngiger Nukleinsäure-tαg, welcher durch Restriktionsverdau mit Bcgl- ähnlichen Restriktionsendonukleasen erzeugt wurde) an einer Streptavidin-haltige Phase immobilisiert, läßt sich der nicht-biotinylierte Strang selektiv unter Denaturierung (Hitze- Denaturierung oder alkalische Denaturierung) ablösen und nachfolgend zur Gewinnung einer Hybridisierungsprobe einsetzen. Danach können entweder die immobilisierbaren Stränge oder die nicht immobilisierbaren Stränge des cDNA-Fragment-Gemisches als einzelsträngige Hybridisierungsprobe zur Hybridisierung mit dem Array eingesetzt werden.
Ein weiterer Gegenstand der Erfindung betrifft daher ein Verfahren zur Analyse eines Nukleinsäure-Gemisches durch Hybridisierung eines DNA-Arrays, der immobilisierte Nukleinsäuren umfaßt, mit einem markierten, komplexitätsreduzierten Nukleinsäure- Gemisch als Hybridisierungsprobe, mit den folgenden Verfahrensschritten:
(le) Synthese eines Gemisches aus doppelsträngiger cDNA, wobei entweder nur bei der Erststrang- oder nur bei der Zweitstrang-Synthese ein mittels einer immobilisierbaren Gruppe modifiziertes Nukleotidtriphosphat inkorporiert wird, (2e) Schneiden des doppelsträngigen cDNA-Gemisches aus (le) mit mindestens einer ßcgl-ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im Wesentlichen identisch langen cDNA-Fragmenten, (3e) gegebenenfalls Isolation des Gemisches aus cDNA-Fragmenten aus (2e), (4e) Trennung der immobilisierbaren Stränge des Gemisches von den nicht immobilisierbaren Strängen des Gemisches durch Immobilisierung und Denaturierung, (5e) Markierung der immobilisierbaren Stränge aus dem Gemisch oder der nicht immobilisierbaren Stränge aus dem Gemisch, (6e) Hybridisierung eines DNA-Arrays mit den markierten, immobilisierbaren
Strängen des Gemisches aus (5e) oder mit den markierten, nicht immobilisierbaren Strängen des Gemisches aus (5e), (7e) Auswertung der Hybridisierung.
In einer weiteren Ausführungsform des obigen Verfahrens entfällt der Markierungsschritt (5e) zugunsten einer Markierung während des Verfahrensschrittes (le), wobei die
Markierung eines oder beider cDNA-Stränge des Gemisches über die zusätzliche Inkorporation markierter Nukleotidtriphosphate während der Erst- und/oder Zweit-Strang- Synthese erfolgt.
In einer weiteren Ausführungsform des obigen Verfahrens entfällt der Markierungsschritt (5e) zugunsten einer Markierung während des Verfahrensschrittes (2e), wobei das mit mindestens einer ßcgl-ähnlichen Restriktionsendonuklease verdaute cDNA-Fragmente des cDNA-Fragment-Gemisches anschließend durch kovalente Verknüpfung mit markierten Adaptormolekülen markiert wird.
In einer weiteren bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird nur einer der beiden Stränge zur Hybridisierung eingesetzt, indem vor der Durchführung einer -vitro-Transkription mittels RNA-Polymerase einer der beiden Linker entfernt wird. Bevorzugt geschieht dies mit einer halbseitig mutierten ßcgl-ähnlichen Restriktionsendonuklease. 5cgl- ähnliche Restriktionsendonukleasen erkennen häufig asymmetrische DNA-Sequenzen, sind also ihrerseits ebenfalls asymmetrisch. Es ist daher möglich, diese Enzyme derart zu mutieren, dass ein Schnitt nur noch auf einer Seite der Erkennungsstelle erfolgt, die Schneidecharakteristik also der einer gewöhnlichen Typ JDJs- Restriktionsendonuklease entspricht. Der Schnitt auf der gegenüberliegenden Seite kann vollständig unterdrückt werden oder auch mit stark reduzierter Rate erfolgen. Werden mittels einer ßcgl-ähnlichen Restriktionsendonuklease erzeugte, mit Linkern versehene Nukleinsäurefragmente, deren Linker Promotorsequenzen für eine RNA-Polymerase enthalten, mit der zur ursprünglich verwendeten ßcgl-ähnlichen Restriktionsendonuklease (beispielsweise C je I) korrespondierenden, halbseitig mutierten ßcgl-ähnlichen Restriktionsendonuklease (C je I1™) behandelt, so resultieren Fragmente, welche nur noch auf einer Seite von einem Linker mit einem Promotor für eine RNA-Polymerase flankiert werden. Dennoch wird in einer m-v tro-Transkription zur Herstellung einer Hybridisierungsprobe nur noch ein Strang (der (+)-Strang oder der (-)-Strang) synthetisiert.
Ein weiterer Gegenstand der Erfindung betrifft daher ein Verfahren zur Analyse eines Nukleinsäure-Gemisches durch Hybridisierung eines DNA-Arrays, der immobilisierte Nukleinsäuren umfasst, mit einem markierten, komplexitätsreduzierten Nukleinsäure- Gemisch als Hybridisierungsprobe, mit den folgenden Verfahrensschritten:
(lj) Schneiden des Nukleinsäure-Gemisches mit mindestens einer ßcgl-ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im Wesentlichen identisch langen Nukleinsäure-Fragmenten,
(2j) gegebenenfalls Isolation des Gemisches aus identisch langen Nukleinsäure- Fragmenten aus (lj),
(3j) kovalente Verknüpfung von Linker-Molekülen mit den Enden der Nukleinsäure- Fragmente aus (lj) oder (2j), wobei die Linker mindestens eine Promotor-Sequenz für eine RNA-Polymerase enthalten, unter Entstehung eines Gemischs aus doppelsträngigen cDNA-Fragmenten ( J) gegebenenfalls PCR-Amplifikation der Verknüpfungsprodukte aus (3j),
(5j) Behandlung der Fragmente aus (3j) oder (4j) mit einer halbseitig mutierten, zur RcgI-ähnlichen Restriktionsendonuklease aus (lj) korrespondierenden, halbseitig mutierten ßcgl-ähnlichen Restriktionsendonuklease, (6j) -vttrσ-TransJkription der Linker-flankierten Fragmente mittels einer JRNA- Polymerase, deren Promotor-Sequenz in den Linkermolekülen enthalten ist, in
Gegenwart markierter Nukleotidtriphosphate unter Entstehung eines Gemisches aus markierten, einzelsträngigen cDNA-Fragmenten, (7j) Hybridisierung eines DNA-Arrays mit dem Gemisch aus cDNA-Fragmenten aus (6d), (8j) Auswertung der Hybridisierung.
Hierbei wird unter einer zu einer Ztegl-ähnlichen Restriktionsendonuklease korrespondierenden halbseitig mutierten RcgI-ähnlichen Restriktionsendonuklease eine halbseitig mutierte RcgI-ähnliche Restriktionsendonuklease verstanden, welche die gleiche Erkennungssequenz wie die RcgI-ähnliche Restriktionsendonuklease aufweist.
Handelt es sich bei der ßcgl-ähnlichen Restriktionsendonuklease wie vorstehend dargelegt um eine Kombination zweier Typ IIs-Restriktionsendonukleasen, so ist der gewünschte Effekt selbstverständlich zu erreichen, indem anstelle der halbseitig mutierten Bcgl- ähnlichen Restriktionsendonuklease eine der beiden Typ JUs-Restriktionsendonukleasen eingesetzt wird.
Die Erfindung betrifft weiterhin eine Hybridisierungsprobe, die ein markiertes Nukleinsäurefragment-Gemisch mit identisch langen oder im Wesentlichen identisch langen Fragmenten und mit verbesserter Hybridisierungsspezifität umfaßt und die erhältlich ist durch die folgenden Verfahrensschritte:
(la) Schneiden des Nukleinsäure-Gemisches mit mindestens einer ßcgl- ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im Wesentlichen identisch langen Nukleinsäure- Fragmenten,
(2a) gegebenenfalls Isolation des Gemisches aus identisch langen Nukleinsäure- Fragmenten aus (la),
(3a) Markierung der Nukleinsäure-Fragmente des Gemisches aus (la) oder (2a), sofern die Fragmente nicht bereits markiert sind, (4a) gegebenenfalls Isolation des Gemisches aus Nukleinsäure-Fragmenten aus
Schritt (3a).
Einen weiteren Aspekt der vorliegenden Erfindung stellt die Verwendung eines markierten Nukleinsäurefragment-Gemisches mit identisch langen oder im wesentlichen identisch langen Fragmenten dar, wobei das Nukleinsäurefragment-Gemisch erhältlich ist durch die oben benannten Verfahrensschritte (la) bis (4a), zur Hybridisierung mit immobilisierten Nukleinsäuren.
Bei den immobilisierten Nukleinsäuren handelt es sich vorzugsweise um einen DNA- Array, stärker bevorzugt um einen DNA-Array mit weitgehend identisch langen, Oligonukleotiden mit 20 bis 100 Nukleotiden, insbesondere mit 25 bis 40 Nukleotiden Länge. Die Oligonukleotide besitzen hierbei vorzugsweise die gleichen Sequenzen wie die (+)-Stränge oder die (-)-Stränge der in Schritt (la) durch Schneiden mit mindestens einer ßcgl-ähnlichen Restriktionsendonuklease generierten Nukleinsäure-Fragmente.
Ein weiterer Gegenstand der vorliegenden Erfindung betrifft auch einen DNA-Array, welcher eine Oberfläche und darauf immobilisierte Oligonukleotide mit einer im wesentlichen einheitlichen Länge von 20 bis 100 Nukleotiden, vorzugsweise von 25 bis 40 Nukleotiden, umfaßt. Die Sequenz dieser immobilisierten Oligonukleotide auf dem Array ist hierbei komplementär zu jeweils einem Strang solcher Nukleinsäure-tαgs, die durch Restriktionsverdau eines definierten Nukleinsäure-Gemisches mit einer oder mehreren ausgewählten ßcgl-ähnlichen Restriktionsendonukleasen generiert worden sind. Erhältlich ist ein solcher DNA- bzw. Oligonukleotid- Array durch die folgenden Verfahrensschritte:
(lh) Ermittlung der aus einem Nukleinsäure-Gemisch mittels Restriktionsverdau mit einer oder mehreren ßcgl-ähnlichen Restriktionsendonukleasen freisetzbaren Nukleinsäure-Fragmente,
(2h) Herstellung von solchen Oligonukleotiden mit weitgehend einheitlicher
Länge und mit jeweils 20 bis 100 Nukleotiden, deren Sequenz mit den in Schritt (lh) ermittelten Nukleinsäure-Fragmenten mindestens weitgehend identisch ist,
(3h) Immobilisierung der Oligonukleotide aus Schritt (2h) auf jeweils lokal definierten Regionen einer geeigneten Oberfläche.
Hierbei wird unter „mindestens weitgehend identisch" verstanden, dass die den freisetzbaren Nukleinsäure-Fragmenten entsprechenden Oligonukleotidabschnitte eine Sequenzidentität von mindestens 70 %, bevorzugt von mindestens 90 %, besonders bevorzugt von 100 % zu einem der beiden Fragmentstränge aufweisen. Hierdurch soll nicht ausgeschlossen werden, dass die zu immobilisierenden Oligonukleotide noch weitere Sequenzabschnitte aufweisen können, die beispielsweise als Spacer dienen können oder in der Lage sind, mit an die Nukleinsäure-Fragmente angefügten Linkern zu hybridisieren.
Wie bereits ausgeführt, können an den Enden der mittels Bcgl-ähnlichen Restriktionsendonukleasen erzeugten Nukleinsäure-Fragmente Linkermoleküle befestigt werden, die eine Promotor-Sequenz einer RNA-Polymerase enthalten oder als Primerbindungsstellen für eine nachfolgende PCR dienen können. Wie aus Tabelle 1 hervorgeht, erzeugen RcgI-ähnliche Restriktionsendonukleasen in der Regel 3'- überhängende Enden. Da die Sequenz dieser Überhänge oftmals nicht bekannt ist, so dass sich keine Linker mit hierzu komplementären überhängenden Enden gezielt herstellen lassen, kann beispielsweise auf eine der folgenden Weisen vorgegangen werden:
(A) Entfernung der terminalen Fragmentüberhänge mittels einer geeigneten Nuclease (beispielsweise Mung bean-Nuclease oder T4-DNA-Polymerase in Gegenwart von Nukleotid-triphosphaten; vergleiche auch Ausubel et al.), gefolgt von einer Ligation von Linkern mit glatten Enden an die so erzeugten glatten Fragmentenden.
(B) Einsatz von Linkern mit degenerierten Überhängen korrekter Länge zur Ligation, wobei sich für ein gegebenes Fragmentende jeweils eine Sorte von Linkermolekül
in der Mischung befinden soll, dessen Überhang komplementär zum Fragmentüberhang ist und welches somit an das gegebene Fragmentende ligiert werden kann.
(C) Ligation einzelsträngiger DNA- oder RNA-Oligonukleotide an das überhängende Fragmentende, bevorzugt mittels T4 RNA-Ligase, gefolgt von der Ergänzung des Gegenstrangs. Die Ergänzung des Gegenstrangs kann durch folgende Schritte erfolgen: (i) Bereitstellung eines Primers. Es kann hier ein zum ligierten Oligonukleotid mindestens teilweise komplementäres Oligonukleotid hybridisiert werden. Es ist aber ebenfalls möglich, dass das zu ligierende DNA- oder JRNA-
Oligonukleotid zur Ausbildung einer 3 '-terminalen Haarnadelstruktur befähigt ist, so dass die Hybridisierung eines separaten Primers überflüssig ist. (ii) Verlängerung des Primers. Es kommt hier bevorzugt eine nicht zum "Strand displacement" befähigte DNA-Polymerase zur Anwendung, so dass im Zuge der Primerverlängerung das 3 '-überhängende Fragmentende zum Doppelstrang ergänzt wird. Die Primerverlängerung wird in der Regel angehalten, wenn sich das neu synthetisierte 3 '-Ende des verlängerten Primers und das 5 '-Ende des Nukleinsäurefragments derart gegenüberstehen, dass ein Doppelstrang mit einem Einzelstrangbruch („nick") vorliegt, (iii) Schließen des Einzelstrangbruchs. Dies erfolgt in der Regel enzymatisch mittels einer DNA-Ligase (z. B. T4 DNA-Ligase,
E. coli DNA-Ligase, Tag DNA-Ligase). Bei dieser Vorgehensweise können neben reinen DNA- oder RNA-Oligonukleotiden selbstverständlich auch „gemischte", also sowohl DNA- als auch RNA-Nukleotide enthaltende Oligonukleotide zur Anwendung kommen. Weiterhin ist es möglich, eine unerwünschte Konkatemerisierung (Selbstligation) der zur Ligation eingesetzten Oligonukleotide zu verhindern, indem das 3 '-Ende der Oligonukleotide geeignet modifiziert wird. Ein Beispiel für eine geeignete Modifikation ist ein 3'-terminales Didesoxynukleotid.
(D) Ligation eines Oligonukleotids mittels eines degenerierten Helferoligonukleotids. Aufgabe des Helferoligonukleotids ist die Erzeugung eines zum Fragmentende komplementären und an dieses ligierbaren doppelsträngigen DNA-Abschnitts. Das Helferoligonukleotid weist daher mindestens folgende zwei Bereiche auf: (Da) Einen zum 5 '-Ende des zu ligierenden Oligonukleotids komplementären Bereich, mittels dessen es an das zu ligierende Oligonukleotid hybridisiert wird. (Db) Einen an das 3 '-Ende des Bereichs (Da) angrenzenden degenerierten Bereich, dessen
Länge der Länge der 3 '-Fragmentüberhänge entspricht. Degeneriert meint hier, dass eine mindestens partielle Hybridisierung mit einer Vielzahl möglicher Fragmentüberhänge, bevorzugt mit allen möglichen Fragmentüberhängen, möglich ist, so dass eine Ligation des zu ligierenden Oligonukleotids an eine Vielzahl, bevorzugt an alle möglichen Fragmentenden ermöglicht wird. Eine geeignete
Degeneration kann mittels Mischung mehrerer, bevorzugt aller vier, Basen an mehreren, bevorzugt allen, Positionen des degenerierten Bereichs erreicht werden. Neben einer Mischung mehrerer Basen ist weiterhin denkbar, besondere Nukleotide einzusetzen, welche mit mehreren verschiedenen Nukleotiden eine Basenpaarung eingehen können. Beispiele für solche „universellen" Nukleotide sind etwa Inosin oder Nitropyrrol. Die Sequenz eines Helferoligonukleotids kann also beispielsweise sein:
5'-Xι X2 X3 X4 Xs Xό X? Xs X9 X10 NNNNN-3'
wobei X1-X10 den zum zu ligierenden Oligonukleotid komplementären Bereich und „N" eine Mischung aller Nukleotide A, C, G und T bedeuten. Ein solches Helferoligonukleotid würde also die Ligation eines Oligonukleotids an einen fünfbasigen 3 '-Überhang ermöglichen. Ein weiteres Beispiel für die Sequenz eines Helferoligonukleotids ist:
5'-Xι X2 X3 X X5 X6 X7 X8 X9 X101111 1-3' ,
wobei "F für die universelle Base Inosin steht. Der Vorteil eines Einsatzes von Helferoligonukleotiden besteht darin, dass eine Ligation des zu ligierenden
Oligonukleotids an das Fragmentende mittels DNA-Ligase, insbesondere T4 DNA- Ligase, möglich ist. Hierbei wird in der Regel eine Ligation des Helferoligonukleotids an das Fragmentende durch geeignete Modifikation des Helferoligonukleotid-3' -Endes, etwa durch Einsatz eines 3 '-terminalen Didesoxynukleotids, verhindert.
Nach erfolgter, durch das Helferoligonukleotid vermittelten Befestigung des zu ligierenden Oligonukleotids ans Fragmentende kann das Helferoligonukleotid entfernt werden, und die Ergänzung des Gegenstrangs kann wie unter (Ci) - (Ciii) beschrieben vorgenommen werden.
Welche dieser vier Varianten im Einzelfall gewählt wird, hängt von den jeweiligen Erfordernissen ab. Variante (A) ist leicht durchzuführen und erfordert kein besonderes Design der Linker. Variante (B) kommt mit besonders wenig Schritten aus, besitzt aber den Nachteil, dass sich bei der Ligation Fehler ereignen können (zum Beispiel Ligation nicht exakt komplementärer Verhänge), so dass Sequenzverfälschungen möglich sind. Varianten (C) und (D) sind aufwendiger, erlauben aber eine sequenztreue Inkorporation der 3 '-Überhänge von mittels ?cgl-ähnlichen Restriktionsendonukleasen erzeugten Nukleinsäurefragmenten in die herzustellenden Hybridisierungsproben. Beispielsweise beträgt die genspezifische Länge einer über Variante (A) mittels Hin4l hergestellten Hybridisierungsprobe 27 Basen, bei einer Erzeugung über Variante (C) oder (D) 37 Basen. Bei einer Erzeugung gemäß Variante (B) beträgt die Länge ebenfalls 37 Basen, wobei jedoch die ersten 5 Basen und die letzten 5 Basen Fehler enthalten können.
Die gemäß Variante (C) oder (D) an die Enden von mittels Rcgl-ähnlichen Restriktionsendonukleasen erzeugten Nukleinsäurefragmenten angefügten Sequenzen werden im Sinne des erfindungsgemäßen Verfahrens ebenfalls als Linker (bzw. Adaptor) bezeichnet. In jedem Fall wird durch die Anfügung terminaler und vielen oder allen Nukleinsäurefragmenten gemeinsamer Sequenzbereiche ein Kopieren der Fragmente mittels Polymerasen möglich. Sofern dieses Kopieren über Primerextension stattfinden soll (z. B. PCR), dienen besagte Sequenzbereiche als Primerbindungsstellen. Soll das Kopieren mittels RNA-Polymerasen stattfinden (beispielsweise T7-RNA Polymerase, T3-RNA Polymerase oder SP6-RNA Polymerase), so enthalten die Linker eine oder mehrere Promotorsequenzen für die einzusetzende RNA-Polymerase. Dabei schließen sich beide Möglichkeiten natürlich nicht aus; so kann beispielsweise zunächst eine PCR- Amplifikation der erzeugten Nukleinsäurefragmente erfolgen, gefolgt von einer Herstellung markierter Hybridisierungsproben durch tn-vitro-Transkription der PCR- Produkte mittels RNA-Polymerase unter Inkorporation detektierbar markierter Nukleotide. Hierbei kann nach der PCR-Amplifikation und vor der m-v tro-Transkription durch Behandlung der Amplifikationsprodukte mit einer geeigneten halbseitig mutierten Bcgl- ähnlichen Restriktionsendonuklease einer der beiden Linker (und damit eine der beiden Promotorregionen) entfernt werden, so dass lediglich einer der beiden Fragmentstränge in eine Hybridisierungsprobe umgeschrieben wird.
In einer weiteren Ausführungsform der vorliegenden Erfindung wird eine PCR- Amplifikation der mittels einer ßcgl-ähnlichen Restriktionsendonuklease erzeugten
Nukleinsäurefragmente durchgeführt. Hierzu werden zunächst Primerbindungsstellen
bereitgestellt, was wie vorstehend beschrieben durch die Anfügung von Linkern geschehen kann. Vorteil dieser Vorgehensweise ist eine große Flexibilität hinsichtlich der Menge an Ausgangsmaterial, da der erzielte Amplifikationsfaktor durch Wahl der Zyklenzahl in großem Umfang wählbar ist. Dank der extrem hohen Amplifikationsfaktoren, welche sich mittels PCR erzielen lassen, ist auch die Untersuchung sehr kleiner Probenmengen möglich, wie sie etwa durch Mikrodissektion (beispielsweise laser capture microdissection, LCM) erhalten werden. So ist mittels des erfindungsgemäßen Verfahrens eine Expressionsanalyse von ca. 1.000 bis 10.000 Zellen, von ca. 10 bis 100 Zellen oder sogar von 1 bis 10 Zellen möglich. Dabei ist bekannt, dass eine PCR- Amplifikation von geringen RNA-Mengen als Ausgangsmaterial bessere Ergebnisse liefert als auf T7 RNA- Polymerase basiertem Amplifikationsverfahren (siehe Iscove et al. Nature Biotechnology 2002).
Ein weiterer Gegenstand der Erfindung betrifft daher ein Verfahren zur Analyse eines Nukleinsäure-Gemisches durch Hybridisierung eines DNA-Arrays, der immobilisierte Nukleinsäuren umfasst, mit einem markierten, komplexitätsreduzierten Nukleinsäure- Gemisch als Hybridisierungsprobe, mit den folgenden Verfahrensschritten:
(lk) Schneiden des Nukleinsäure-Gemisches mit mindestens einer RcgI-ähnlichen Restriktionsendonuklease unter Herstellung eines Gemisches aus identisch langen oder im Wesentlichen identisch langen Nukleinsäure-Fragmenten, (2k) gegebenenfalls Isolation des Gemisches aus identisch langen Nukleinsäure- Fragmenten aus (lk), (3k) kovalente Verknüpfung von Linker-Molekülen mit den Enden der Nukleinsäure- Fragmente aus (lk) oder (2k),
(4k) PCR- Amplifikation der Verknüpfungsprodukte aus (3k), wobei die Linker- Moleküle aus (3k) als Primerbindungsstellen dienen, (5k) gegebenenfalls Markierung der Amplifikationsprodukte aus (4k), sofern eine Markierung nicht bereits in Schritt (4k) durchgeführt wurde, (6k) Hybridisierung eines DNA-Arrays mit den markierten Amplifikationsprodukten aus (4k) oder (5k). (7k) Auswertung der Hybridisierung.
Eine gleichzeitig mit der PCR- Amplifikation stattfindende Markierung in Schritt (4k) kann beispielsweise durch die Inkorporation detektierbar markierter Nukleotide oder detektierbar markierter Primer erfolgen. In diesem Fall ist es möglich, die
Primersequenzen zur Erhöhung der Hybridisierungsspezifität mindestens teilweise abzutrennen, wobei natürlich darauf geachtet werden muss, dass gegebenenfalls mit den Primern verbundene Markierungsgruppen mit den als Hybridisierungsproben zu verwendenden Nukleinsäurefragmenten verbunden bleiben. Diese Abtrennung kann beispielsweise mittels in den Primern vorliegenden Erkennungsstellen für - bevorzugt selten schneidende - Restriktionsendonukleasen erfolgen. Die Amplifikationsprodukte werden dann vor ihrem Einsatz als Hybridisierungsprobe mit der oder den jeweiligen Restriktionsendonuklease(n) behandelt. Eine nachträgliche Markierung der Amplifikationsprodukte in Schritt (5k) kann nach aus dem Stand der Technik bekannten Verfahren vorgenommen werden (vergleiche etwa Ausubel et al.), erfolgt aber vorzugsweise wie vorstehend beschrieben durch w-v tro-Transkription der Amplifikationsprodukte in Gegenwart detektierbar markierter Nukleotide, wobei mindestens eine Promotorsequenz für mindestens eine RNA-Polymerase Bestandteil oder Linkersequenz ist. Die kovalente Verknüpfung von Linker-Molekülen mit den Fragmentenden in Schritt (3k) erfolgt bevorzugt wie vorstehend beschrieben nach einer der Varianten A - D.
Im Übrigen kann auf eine Markierung der erfindungsgemäßen Hybridisierungssonden immer dann verzichtet werden, wenn eine Detektion von Hybridisierungsereignissen markierungsunabhängig (beispielsweise durch kapazitive Messungen) erfolgen soll.
In allgemeiner Form betrifft die Erfindung die Verwendung von mittels ßcgl-ähnlichen Restriktionsendonukleasen erhaltenen Nukleinsäurefragmenten zur Herstellung von Hybridisierungsproben sowie zur Hybridisierung mit diesen geeignete DNA-Arrays.
Abbildungen
Figur 1 zeigt die Herstellung von Hybridisierungssonden aus mittels ßcgl-ähnlichen
Restriktionsendonukleasen erzeugten Nukleinsäurefragmenten mittels PCR unter Inkorporation markierten Nukleotiden. Es zeigen im Einzelnen:
1.1) Die Erzeugung von Nukleinsäurefragmenten durch Behandlung eines Nukleinsäure-Gemisches mit einer ßcgl-ähnlichen Restriktionsendonuklease, 1.2) die Entfernung der überhängenden Fragmentenden zu glatten Enden,
1.3) die Befestigung von Linkermolekülen (gestrichelt) an den Fragmentenden,
1.4) die Amplifikation der Befestigungsprodukte unter Inkorporation markierter Nukleotide, wobei die Markierungsgruppen durch einen Stern gekennzeichnet sind,
1.5) die Entfernung der Linkersequenzen,
1.6) die Denaturierung der Doppelstänge,
1.7) den Einsatz der gewonnenen Hybridisierungsproben zur Hybridisierung eines DNA-Arrays.
Figur 2 zeigt die Herstellung von Hybridisierungssonden aus mittels ßcgl-ähnlichen
Restriktionsendonukleasen erzeugten Nukleinsäurefragmenten mittels PCR unter Inkorporation markierter Primer. Es zeigen im Einzelnen:
2.1) Die Erzeugung von Nukleinsäurefragmenten durch Behandlung eines Nukleinsäure-Gemisches mit einer ßcgl-ähnlichen Restriktionsendonuklease,
2.2) die Entfernung der überhängenden Fragmentenden zu glatten Enden,
2.3) die Befestigung von Linkermolekülen (gestrichelt) an den Fragment- enden,
2.4) die Amplifikation der Befestigungsprodukte unter Inkorporation markierter Primer, wobei die Markierungsgruppen durch einen Stern gekennzeichnet sind,
2.5) die Denaturierung der Doppelstränge, 2.6) den Einsatz der gewonnenen Hybridisierungsproben zur
Hybridisierung eines DNA-Arrays.
Figur 3 zeigt die Herstellung von Hybridisierungssonden aus mittels ßcgl-ähnlichen
Restriktionsendonukleasen erzeugten Nukleinsäurefragmenten mittels PCR m-v/trσ-Transkription unter Inkorporation markierter Nukleotide. Es zeigen im Einzelnen:
3.1) Die Erzeugung von Nukleinsäurefragmenten durch Behandlung eines Nukleinsäure-Gemisches mit einer RcgI-ähnlichen Restriktionsendonuklease,
3.2) die Entfernung der überhängenden Fragmentenden zu glatten Enden, 3.3) die Befestigung von Linkermolekülen (gepunktet) an den
Fragmentenden, welche eine Promotorsequenz für eine RNA- Polymerase aufweisen,
3.4) in-v tro-Transkription der Nukleinsäurefragmente unter Inkorporation markierter Nukleotide, wobei die Markierungsgruppen durch einen Stern gekennzeichnet sind,
3.5) den Einsatz der gewonnenen Hybridisierungsproben zur Hybridisierung eines DNA-Arrays.
Figur 4 zeigt die Befestigung von Linkern mit degeneriertem Überhang an den Enden von mittels Rcgl-ähnlichen Restriktionsendonukleasen erzeugten
Nukleinsäurefragmenten. Es zeigen im Einzelnen:
4.1) Die Erzeugung von Nukleinsäurefragmenten durch Behandlung eines Nukleinsäure-Gemisches mit einer ßcgl-ähnlichen Restrik- tionsendonuklease,
4.2) die Ligation von Linkern mit degeneriertem Überhang, wobei N die Mischung der Basen A, C, G und T kennzeichnet,
4.3) die Ligation von Linkern mit degeneriertem Überhang, wobei I die universelle Base Inosin kennzeichnet, 4.4) die Weiterverarbeitung der Befestigungsprodukte zu Hybridise- rungssonden.
Figur 5 zeigt die Befestigung von Linkern über Einzelstrangligation. Im Einzelnen zeigen:
5.1) Die Erzeugung von Nukleinsäurefragmenten durch Behandlung eines Nukleinsäure-Gemisches mit einer BcgI-ähnlichen Restriktionsendonuklease,
5.2) Befestigung einzelsträngiger Oligonukleotide an den überhängenden Fragmentenden mittels T4 RNA-Ligase,
5.3) die Hybridisierung von Primern für die Ergänzung der einzelsträngigen Bereiche zum Doppelstrang,
5.4) die Verlängerung der Primer aus (5.3),
5.5) das Schließen der Einzelstrangbrücke mittels DNA-Ligase, 6.6) die Weiterverarbeitung der Produkte aus (5.5) zu Hybridisierungssonden.
Gefüllte Kreise zeigen mittels Ligase hergestellte Phosphodiester- Bindungen an, schwarze Pfeilspitzen weisen auf Einzelstrangbrüche hin,
Figur 6 zeigt die Befestigung von Linkern mittels Helferoligonukleotiden. Es zeigen im Einzelnen:
6.1) Die Erzeugung von Nukleinsäurefragmenten durch Behandlung eines Nukleinsäure-Gemisches mit einer ßcgl-ähnlichen Restriktionsendonuklease,
6.2) Befestigung von Oligonukleotiden an den überhängenden Fragmentenden mittels DNA-Ligase und Helfernukleotiden (gepunktet). Die Helferoligonukleotide weisen einen ersten, zum 5'- Ende der zu befestigenden Oligonukleotide komplementären Bereich
(I) sowie einen zweiten, degenerierten Bereich zur Hybridisierung mit den Fragmentüberhängen (JJJUJJJJUJ) auf,
6.3) Entfernung der Helferoligonukleotide,
6.4) die Hybridisierung von Primern für die Ergänzung der einzelsträngigen Bereiche zum Doppelstrang,
6.5) die Verlängerung der Primer aus (6.4),
6.6) das Schließen der Einzelstrangbrüche mittels DNA-Ligase,
6.7) die Weiterverarbeitung der Produkte aus (6.6) zu Hybridisierungssonden.