DE10144132A1 - Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge - Google Patents

Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge

Info

Publication number
DE10144132A1
DE10144132A1 DE10144132A DE10144132A DE10144132A1 DE 10144132 A1 DE10144132 A1 DE 10144132A1 DE 10144132 A DE10144132 A DE 10144132A DE 10144132 A DE10144132 A DE 10144132A DE 10144132 A1 DE10144132 A1 DE 10144132A1
Authority
DE
Germany
Prior art keywords
nucleic acid
tags
bcgi
sequencing
die
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10144132A
Other languages
English (en)
Inventor
Achim Fischer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sygnis Pharma AG
Original Assignee
Axaron Bioscience AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axaron Bioscience AG filed Critical Axaron Bioscience AG
Priority to DE10144132A priority Critical patent/DE10144132A1/de
Priority to AU2002339526A priority patent/AU2002339526A1/en
Priority to PCT/EP2002/010016 priority patent/WO2003022986A2/de
Publication of DE10144132A1 publication Critical patent/DE10144132A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection

Abstract

Die Erfindung betrifft ein Verfahren zur Identifikation und zur Quantifizierung von Nukleinsäuren aus einem Nukleinsäuregemisch, insbesondere zur Ermittlung von Genexpressionsdaten oder von Sequenzvariationen, wobei DOLLAR A È die doppelsträngige Nukleinsäure mit einer BcgI-ähnlichen Restriktionsendonuklease zur Herstellung von identisch langen Nukleinsäure-tags geschnitten wird, DOLLAR A È die freigesetzten Nukleinsäure-tags gegebenenfalls isoliert werden, DOLLAR A und dann entweder DOLLAR A È die Nukleinsäure-tags in einen Vektor, umfassend ein Hybridisierungs-tag, kloniert werden, wobei aus diesem Konstrukt anschließend ein Fragment, umfassend das Nukleinsäure-tag und das Hybridisierungs-tag, präpariert wird, DOLLAR A È die von den Fragmenten umfaßten Hybridisierungs-tags anschließend in einen zumindest teilweise einzelsträngen Überhang überführt werden, diese Nukleinsäure-tags dann durch Hybridisierung ihrer Hybridisierungs-tags an mikroskopische Partikel gebunden werden, DOLLAR A È die beladenen Partikel in eine einlagige Schicht überführt und die Nukleinsäure-tags parallel sequenziert werden, DOLLAR A oder DOLLAR A È die mit Bcgl-ähnlichen Restriktionsendonukleasen generierten Nukleinsäure-tags mittels Oberflächenamplifiktion zu klonalen Inseln amplifiziert werden und anschließend auf der Oberfläche parallel sequenziert werden, DOLLAR A oder DOLLAR A È die mit Bcgl-ähnlichen Restriktionsendonukleasen generiert...

Description

  • Die vorliegende Erfindung betrifft verschiedene Verfahren zur Identifikation und zur Quantifizierung von Nukleinsäuren aus einem Nukleinsäure-Gemisch, insbesondere zur Ermittlung von Genexpressionsdaten, wobei Sequenz-tags einheitlicher Länge mittels BcgI-ähnlicher Restriktionsendonukleasen erzeugt werden und anschließend parallel oder seriell sequenziert werden, sowie zur Identifikation von Sequenzvariationen.
  • Ein wichtiger Bereich der modernen biologischen Analytik ist die Genexpressionsanalyse. Hier wird die relative oder absolute Abundanz der verschiedenen Transkripte einer Zelle bzw. eines Zellverbands oder eines Gewebes bestimmt, um Aufschluß über Stoffwechselwege, Signalübertragungswege, Reaktionen auf äußere Einflüsse etc. zu erhalten. Bei den hierfür eingesetzten Verfahren muß unterschieden werden zwischen solchen, welche die Quantifizierung eines bzw. einiger weniger bekannter Transkripte erlauben (insbesondere Northern-Blot-Hybridisierung, quantitative PCR), und solchen, welche in Form eines umfassenden Ansatzes die simultane Identifkation zahlreicher auch unbekannter Transkripte ermöglichen. Diese zweite Gruppe läßt sich ihrerseits wiederum unterteilen in Verfahren, die auf
    • 1. vergleichender Hybridisierung (insbesondere DNA-arrays; s. etwa Trends Biotechnol. 1998 Jul; 16(7): 301-6),
    • 2. subtraktiver Hybridisierung (beispielsweise suppression subtractive hybridization SBH, s. Proc. Natl. Acad. Sci. U.S.A. 1996 Jun 11; 93(12): 6025-30),
    • 3. cDNA-Fragmentdisplay (s. EP 0 743 367), oder
    • 4. tag-Sequenzierung
    beruhen. Die der tag-Sequenzierung zugrundeliegende Idee besteht darin, kurze cDNA- Sequenzabschnitte (sog. Sequenz-tags) zu bestimmen und ihre jeweilige relative Häufigkeit zu ermitteln und zwischen verschiedenen Proben zu vergleichen, um differentiell exprimierte Gene anhand ihrer unterschiedlichen Transkripthäufigkeit zu erkennen. Ein solches Vorgehen wurde erstmals realisiert, indem aus verschiedenen miteinander zu vergleichenden Proben gewonnene ESTs (expressed sequence tags) sequenziert und auf ihre Häufigkeit untersucht wurden (z. B. Proc. Natl. Acad. Sci. U.S.A. 1995 Aug 29; 92(18): 8303-7). Da ESTs jedoch in der Regel einige hundert Basenpaare lang sind, wird für jeden EST eine separate Sequenzierreaktion benötigt, was einen höheren Durchsatz verhindert und die Sequenzierung und Analyse von mehr als einigen hundert oder höchstens einigen tausend ESTs unpraktikabel werden läßt. Da eine Kollektion von ESTs in der Regel stark von einigen wenigen ESTs dominiert wird, welche besonders stark exprimierte Gene (v. a. sogenannte housekeeping-Gene) repräsentieren, werden niedriger exprimierte Gene im Zuge von EST-Sequenzierungsexperimenten meist überhaupt nicht erfaßt. Andererseits ist der Informationsgehalt eines durchschnittlich langen ESTs um ein Vielfaches höher als für die eindeutige Identifikation des zugehörigen Gens bzw. Transkripts nötig. Daher zielen neuere Verfahren zur tag-Sequenzierung darauf ab, nur noch sehr kurze Sequenz-tags (beispielsweise 13-20 bp) zu erzeugen bzw. zu sequenzieren. Rein rechnerisch kann beispielsweise ein 13 bp langes tag für 413 = 67.108.864 verschiedene Transkripte codieren. In der Praxis werden für eine eindeutige Zuordnung eines Transkripts zu einem tag jedoch größere tag-Längen benötigt, da bestimmte Sub-Sequenzen in Genomen stark überrepräsentiert sind. Hierdurch ist häufig keine eindeutige Zuordnung zu kurzer tags zu einem Gen möglich. Beispielsweise ergab die Datenbanksuche des 13mer-tags CATGCCTGTAATC einen Treffer mit 13 verschiedenen Einträgen (Science 1995 Oct 20; 270(5235): 484-7). Jedenfalls bieten sich zur Sequenzierung großer tag-Anzahlen eine parallele Sequenzierung oder eine serielle Sequenzierung an.
  • Ein Verfahren zur parallelen Sequenzierung von tags (Nat. Biotechnol. 2000 Jun; 18(6): 630-4; Proc. Natl. Acad. Sci. U.S.A. 2000 Feb 15; 97(4): 1665-70) besteht darin, kleine Kugeln (Durchmesser ca. 8 µm) mit zu sequenzierender Nukleinsäure auf eine solche Weise zu beschichten, daß jede Kugel zahlreiche Moleküle lediglich einer Nukleinsäurespezies erhält. Zur Sequenzierung wird dann das Verfahren des "stepwise ligation and cleavage" (USP 5,552,278) eingesetzt, bei dem von einem artifiziellen Linker aus die zu sequenzierende Nukleinsäure durch Einsatz eines Typ IIs-Restriktionsenzyms schrittweise abgebaut und dabei ihre Sequenz bestimmt wird. Damit eine Beobachtung und Aufzeichnung des Sequenziervorgangs möglich ist, werden die verwendeten Kugeln in eine flachen Küvette eingebracht, die nur wenig höher ist als dem Kugeldurchmesser entspricht, um die Bildung einer einzelnen Lage zu erlauben. Weiterhin müssen die Kugeln in dichtester Packung in der Küvette vorliegen, damit es während des Sequenziervorgangs weder durch den erforderlichen Austausch der Reaktionslösungen noch durch Erschütterungen des Geräts zu einer Veränderung der Kugelanordnung kommt. Auf diese Weise lassen sich viele Sequenzierreaktionen (bis zu ca. 1-2 Millionen) auf kleinstem Raum durchführen. Um eine klonale Beladung der Kugeln zu erreichen, wird folgendermaßen vorgegangen: doppelsträngige cDNA wird mit einem häufig schneidenden Restriktionsenzym fragmentiert und die erhaltenen 3'-Enden werden von cDNA-internen Fragmenten sowie den 5'-Enden befreit. Im nächsten Schritt wird jedes cDNA-3'- Fragment-Molekül durch Klonierung in einen ein Hybridisierungs-tag enthaltenden sogenannten tag-Vektor mit einem individuellen, zur Hybridisierung befähigten einzelsträngigen 32mer-Überhang versehen und zusammen mit diesem vervielfältigt. Zur "Beladung" der Kugeln mit cDNA-Fragmenten wird zunächst eine Beschichtung der Kugeln mit ebenfalls 32mer-Oligonukleotiden vorgenommen, so daß über eine kombinatorische Synthese direkt an der Kugeloberfläche jede individuelle Kugel lediglich ein bestimmtes Oligonukleotid erhält. Beschichtete Kugeln und mit Überhang versehene Oligonukleotide werden dann unter Hybridisierungsbedingungen zusammengegeben, so daß eine klonale Beladung der Kugeln mit jeweils nur einer cDNA-Spezies stattfindet, deren einzelsträngiger Überhang komplementär ist zum Oligonukleotid der jeweiligen Kugel. Die Weiterverarbeitung und Sequenzierung der beladenen Kugeln erfolgt dann wie oben beschrieben. Ein Nachteil des beschriebenen Verfahrens ist aber, daß DNA- Fragmente unterschiedlicher Länge sich in ihrer Hybridisierungskinetik voneinander unterscheiden, was zu einer Unterrepräsentation langer Fragmente gegenüber kürzeren führt.
  • Ein alternatives Verfahren zur parallelen tag-Sequenzierung basiert auf der Erzeugung von Zufallsanordnungen sogenannter "klonaler Inseln" amplifizierter DNA auf einer festen Oberfläche (WO 01/48184). Hier werden adaptor-flankierte cDNA-Fragmente mittels oberflächen-gebundener PCR-Primer amplifiziert und die entstandenen DNA-Inseln werden mittels reversibler Abbruchnukleotide sequenziert. Auch dieses Verfahren weist jedoch den Nachteil auf, daß ein längenabhängiger Schritt (die Amplifikation unterschiedlich langer cDNA-Fragmente) zur einer Verschiebung relativer Fragment- Abundanzen und somit zu Fehlern in der Transkript-Quantifizierung führen kann.
  • Eine serielle tag-Sequenzierung kann erfolgen, indem kurze DNA-Abschnitte konkatemerisiert werden und die Konkatemere kloniert und sequenziert werden. Es muß dann anschließend mittels Computeranalyse dafür gesorgt werden, daß die zusammenhängenden Sequenzen in Sequenzen der einzelnen DNA-Abschnitte, die tags, zerlegt werden. Beispielsweise beschreiben Velculescu et al. (Science 1995 Oct 20; 270(5235): 484-7) ein "Serial Analysis of Gene Expression" (SAGE) genanntes Verfahren, welches auf der Erzeugung kurzer DNA-Abschnitte mittels Typ IIs- Restriktionsenzyme basiert. Hierzu werden, vergleichbar dem beschriebenen Verfahren nach Brenner et al., zunächst cDNAs mit einem häufig schneidenden Restriktionsenzym fragmentiert und die erhaltenen 3'-Fragmente über die Kopplung an eine feste Phase von den internen Fragmenten befreit. Es wird dann mittels eines Typ IIs-Enzyms, dessen Erkennungsstelle über eine an der festen Phase durchgeführte Adapterligation eingeführt wird, ein kurzes DNA-Fragment freigesetzt. Die so erhaltenen Fragmente werden dimerisiert, amplifiziert, zur Abtrennung der Adaptoren nachgeschnitten, konkatemerisiert und kloniert, um dann sequenziert zu werden. Obwohl die Durchführung von SAGE keine spezielle Apparaturen verlangt und lediglich ein automatischer Sequencer benötigt wird, hat diese Methode eine Reihe von Nachteilen: Die Länge der so erhältlichen Sequenzinformation pro cDNA ist auf die "Reichweite" des eingesetzten Typ IIs- Restriktionsenzyms beschränkt, also auf die Entfernung der Schnittstelle von der Erkennungsstelle des Enzyms. Die am weitesten reichenden kommerziell erhältlichen Typ IIs-Enzyme (Schneidecharakteristik 16/14, also Entferung des Schnitts von der Erkennungsstelle 16 Basen im "oberen" Strang und 14 Basen im "unteren" Strang) haben eine Reichweite von maximal 16 Basenpaaren, wobei es sich bei dem dann entstehenden einzelsträngige Ende um einen nicht auffüllbaren 3'-Überhang handelt. Da dieser zur Dimerisierung in ein glattes Ende (blunt end) überführt werden muß, müssen die überhängenden Basen entfernt werden, so daß die von einem tag erhältliche Sequenzinformation auf 14 bp reduziert wird. Dies führt häufig zu Ambiguitäten in der Zuordnung einer cDNA bzw. eines Gens zu einem identifizierten tag (siehe oben).
  • Die bekannten Verfahren zur Expressionsanalyse mittels tag-Sequenzierung weisen also einen oder mehrere der folgenden Nachteile auf:
    • - sie erlauben die Identifikation einer zu geringen Anzahl von tags, so daß eine unzureichende Empfindlichkeit erreicht wird;
    • - sie basieren auf der Amplifikation und/oder Festphasenkopplung unterschiedlich langer Nukleinsäurefragmente, so daß Verschiebungen relativer Abundanzen auftreten;
    • - sie erfordern eine relativ große Zahl an Einzelschritten, so daß eine erhöhte Fehlerrate auftritt;
    • - sie beinhalten mehrfache Ligation und anschließende Entfernung von Adaptorsequenzen;
    • - sie erfordern einen Dimerisierungsschritt, um Artefakte in Form von Häufigkeitsverschiebungen identifizieren zu können;
    • - sie sind nur zur Erzeugung sehr kurzer tags geeignet, so daß oft keine eindeutige Zuordnung eines tags zu einem Gen möglich ist.
  • Es ist Aufgabe der Erfindung ein Verfahren bereit zu stellen, das die oben beschriebenen Nachteile der Verfahren nach dem Stand der Technik überwindet.
  • Die erfindungsgemäße Aufgabe wird durch ein Verfahren zur Erzeugung und Sequenzierung von tags aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren gelöst, wobei in einer Ausführungsform
    • 1. doppelsträngige DNA mit einer BcgI-ähnlichen Restriktionsendonuklease geschnitten wird,
    • 2. die freigesetzten Nukleinsäure-tags gegebenenfalls isoliert werden,
    • 3. die erhaltenen Nukleinsäure-tags in einen tag-Vektor kloniert werden,
    • 4. eine Plasmid-Präparation durchgeführt wird,
    • 5. aus den in 4a. erhaltenen Plasmiden eine Fragmentpräparation durchgeführt wird, wobei die Sequenz der präparierten Fragmente die Sequenz jeweils eines der in 3a. eingesetzten Nukleinsäure-tags sowie eines bereits zuvor im tag-Vektor enthaltenen Hybridisierungs-tags umfaßt,
    • 6. die in der Fragmentpräparation aus 5a. enthaltenen doppelsträngigen Hybridisierungs-tags mindestens teilweise in einen einzelsträngigen Überhang überführt werden,
    • 7. die in 6a. gewonnenen teilweise einzelsträngigen Nukleinsäurefragmente durch Hybridisierung an mikroskopische Partikel gebunden werden, welche jeweils im wesentlichen eine Sorte einzelsträngiger Oligonukleotide an ihrer Oberfläche tragen,
    • 8. die durch Hybridisierung beladenen Partikel aus 7a. in eine im wesentlichen einlagige Schicht überführt werden, und
    • 9. die an die Partikel gebundenen Nukleinsäure-tags parallel sequenziert werden.
  • In einer Abwandlung des obigen Verfahrens wird die erfindungsgemäße Aufgabe durch ein Verfahren zur Erzeugung und Sequenzierung von tags aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren gelöst, wobei
    • 1. doppelsträngige DNA mit einer BcgI-ähnlichen Restriktionsendonuklease geschnitten wird,
    • 2. die freigesetzten Nukleinsäure-tags gegebenenfalls isoliert werden,
    • 3. die erhaltenen Nukleinsäure-tags mit Bindungsstellen für Amplifikationsprimer versehen werden,
    • 4. die mit Primerbindungsstellen versehenen Nukleinsäure-tags einer Amplifikation unterzogen werden, wobei mindestens ein an eine feste Oberfläche gekoppelter Amplifikationsprimer zur Anwendung kommt,
    • 5. die amplifizierten Nukleinsäure-tags, sofern erforderlich, halbseitig von der Oberfläche gelöst werden,
    • 6. die an die Oberfläche gebundenen amplifizierten Nukleinsäure-tags parallel sequenziert werden.
  • In einer weiteren Abwandlung des obigen Verfahrens wird die erfindungsgemäße Aufgabe durch ein Verfahren zur Erzeugung und Sequenzierung von tags aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren gelöst, wobei
    • 1. doppelsträngige DNA mit einer BcgI-ähnlichen Restriktionsendonuklease geschnitten wird,
    • 2. die freigesetzten Nukleinsäure-tags gegebenenfalls isoliert werden,
    • 3. die erhaltenen Nukleinsäure-tags mit Bindungsstellen für Amplifikationsprimer versehen werden,
    • 4. die mit Primerbindungsstellen versehenen Nukleinsäure-tags einer Amplifikation unterzogen werden,
    • 5. die amplifizierten Nukleinsäure-tags parallel oder seriell sequenziert werden.
  • Die erfindungsgemäße Aufgabe wird weiterhin gelöst durch ein Verfahren zur Erzeugung und Sequenzierung von tags aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren, wobei
    • 1. doppelsträngige DNA mit einer BcgI-ähnlichen Restriktionsendonuklease geschnitten wird,
    • 2. die freigesetzten Nukleinsäure-tags isoliert werden,
    • 3. die erhaltenen Nukleinsäure-tags konkatemerisiert werden,
    • 4. die Konkatemere aus 3d. kloniert werden,
    • 5. die Konkatemere seriell sequenziert werden.
  • In einer weiteren Abwandlung des obigen Verfahrens wird die erfindungsgemäße Aufgabe durch ein Verfahren zur Erzeugung und Sequenzierung von tags aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren gelöst, wobei
    • 1. doppelsträngige DNA mit einer BcgI-ähnlichen Restriktionsendonuklease geschnitten wird,
    • 2. die freigesetzten Nukleinsäure-tags gegebenenfalls isoliert werden,
    • 3. die erhaltenen Nukleinsäure-tags mit doppelsträngigen DNA-Linkermolekülen ligiert werden, welche sich durch einen palindromischen sowie einen degenerierten Überhang auszeichnen, wobei der degenerierte Überhang an alle möglichen überhängenden Enden der in 1e generierten tags ligierbar ist,
    • 4. die Linker-Enden der Linker-flankierten Nukleinsäure-tags phosphoryliert werden und diese Linker-flankierten Nukleinsäure-tags anschließend über ihre kohäsiven Enden konkatemerisiert werden,
    • 5. die Konkatemere in einen Vektor kloniert werden,
    • 6. die Konkatemere seriell sequenziert werden.
  • In einer weiteren Abwandlung des obigen Verfahrens wird die erfindungsgemäße Aufgabe durch ein Verfahren zur Erzeugung von tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren gelöst, wobei
    • 1. Doppelsträngige DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease geschnitten wird,
    • 2. die freigesetzten Nukleinsäure-tags gegebenenfalls isoliert werden,
    • 3. Bindungsstellen für Amplifikationsprimer an die erhaltenen Nukleinsäuretags angefügt werden,
    • 4. die mit Primerbindungsstellen versehenen Nukleinsäure-tags amplifiziert werden.
  • Unter BcgI-ähnlichen Restriktionsendonukleasen werden solche Restriktionsendonukleasen verstanden, die einen als Substrat dienenden DNA-Doppelstrang an zwei Stellen, beispielsweise beidseitig ihrer Erkennungssequenz, schneiden. Hierfür müssen im Gegensatz zu konventionellen Restriktionsendonukleasen vom Typ II oder IIs, welche einen als Substrat dienenden Doppelstrang an einer Stelle schneiden und hierfür zwei Einzelstrangbrüche katalysieren, vier Einzelstrangbrüche katalysiert werden, so daß ein kurzes Doppelstrang-Fragment definierter Länge (i.d.R. zwischen 20 und 30 bp) freigesetzt wird (Nucleic Acids Res 1996 Sep 15; 24(18): 3590-2; Gene 1998 Jun 15; 213(1-2): 17-22; einige Beispiele siehe Tabelle 1). Wird demnach ein komplexes Gemisch aus verschiedenen cDNAs, wie es beispielsweise eine cDNA-Bibliothek darstellt, mit einer solchen BcgI-ähnlichen Restriktionsendonuklease geschnitten, so erhält man exakt gleich lange Fragmente für alle unterschiedlichen cDNAs, die jeweils für ein kurzes, zur Identifikation der cDNA ausreichendes Nukleinsäure-tag kodieren. Analog wird durch Behandlung genomischer DNA mit einer BcgI-ähnlichen Restriktionsendonuklease eine Anzahl gleich langer Fragmente erzeugt, welche von verschiedenen Bereichen des jeweiligen Genoms stammen.
  • Zu einem analogen Ergebnis gelangt man jedoch auch mit bestimmten Kombinationen ("Doppeldaus") von Typ IIs-Restriktionsendonukleasen oder auch einer Typ IIs- Restriktionsendonuklease und einer Typ II-Restriktionsendonuklease, wobei ein solcher Doppeldau mit beiden Enzymen gleichzeitig oder nacheinander durchgeführt werden kann. Beispielsweise kann durch Inkubation von DNA mit den Typ IIs- Restriktionsendonukleasen MnlI (Schneidecharakteristik CCTC(7/6)) und BseRI (Schneidecharakteristik GAGGAG(10/8) bzw., in umgekehrter Orientierung gelesen, (8/10)CTCCTC) ebenfalls ein kurzes Doppelstrang-Fragment (Länge: 22 bp zuzügl. einzelsträngiger Überhänge) freigesetzt werden.
  • Unter Typ IIs-Restriktionsendonukleasen werden solche Restriktionsendonukleasen verstanden, die ihr Substrat in einem definierten Abstand (bei derzeit bekannten TypIIs- Enzymen bis zu 20 bp) von der Erkennungsstelle entfernt schneiden.
  • Ähnlich kann die Restriktionsendonuklease AlwI (Schneidecharakteristik GGATC(4/5) bzw., in umgekehrter Orientierung gelesen, (5/4)GATCC) beim Vorliegen der Teilsequenz GGATCC (einer "kombinierten Erkennungsstelle") ein Doppelstrang-Fragment der Länge 12 bp freisetzen, dessen einbasige einzelsträngige Enden sich so auffüllen lassen, daß ein 14 bp-Fragment erhalten wird.
  • Es ist ebenso möglich, daß eines der beiden Enzyme innerhalb der Erkennungsstelle des anderen Enzyms schneidet, oder beide Enzyme auf der gleichen Seite ihrer kombinierten Erkennungsstelle schneiden. In diesem Fall muß der Doppeldau so durchgeführt werden, daß zunächst das von der kombinierten Erkennungsstelle weiter entfernt schneidende Enzym und danach das andere Enzym zur Anwendung kommt, da anderenfalls mit der Schneidecharakteristik des zweiten Enzyms kein Schnitt mehr erfolgen könnte. So kann man etwa mit einer Kombination der Restriktionsendonukleasen BsgI (Schneidecharakteristik GTGCAG(16/14)) und BtsI (Schneidecharakteristik GCAGTG(2/0)) die Sequenz GTGCAGTG erkennen und 12 bp lange Doppelstrang- Fragmente erzeugen oder mit einer Kombination der Restriktionsendonukleasen BpmI (Schneidecharakteristik CTGGAG(16/14)) und BsrI (Schneidecharakteristik ACTGG(1/- 1)) die Sequenz ACTGGAG erkennen und 13 bp lange Doppelstrang-Fragmente generieren.
  • Dementsprechend umfaßt der Begriff der "BcgI-ähnlichen Restriktionsendonukleasen" im Sinne des erfindungsgemäßen Verfahrens ausdrücklich auch solche Enzyme oder Enzymkombinationen, welche beim Vorliegen einer geeigneten, ggf. aus zwei Erkennungstellen kombinierten Erkennungsstelle die Erzeugung von Fragmenten definierter Länge ermöglichen (siehe Tabelle 1).
  • Tabelle 1 zeigt die BcgI-ähnlichen Restriktionsendonukleasen oder Kombinationen von Typ IIs- bzw. Typ II-Restriktionsendonukleasen, die besonders bevorzugt in den Ausführungsformen a) bis e) zur Herstellung von gleich langen Fragmenten aus einem cDNA-Gemisch eingesetzt werden. Tabelle 1 Beispiele für BcgI-ähnliche Restriktionsendonukleasen

  • Der Hauptvorteil der ungewöhnlichen Fragmentierungscharakteristika der BcgI-ähnlichen Restriktionsendonukleasen im Hinblick auf die erfindungsgemäßen Verfahren a bis e liegt darin, daß durch BcgI-ähnliche Restriktionsendonukleasen aus einem Gemisch von cDNA- Molekülen mit völlig unterschiedlicher Nukleotidsequenz Fragmente von exakt gleicher Länge freigesetzt werden können. Zudem ist die Länge dieser Fragmente - je nach Enzym meist zwischen 20 bp und 30 bp - für eine tag-Sequenzierung gut geeignet, da mit der Ermittlung der Sequenz von 20 bis 30 bp pro tag der Sequenzierungsaufwand relativ gering bleibt, was einen hohen Durchsatz der Methode gewährt, die erhaltene Sequenzinformation aber dennoch ausreicht, um das entsprechende tag durch den Abgleich mit Datenbank-Sequenzen eindeutig zu identifizieren.
  • In der Ausführungsform a der vorliegenden Erfindung (siehe Fig. 1) hat der Einsatz BcgI- ähnlicher Restriktionsendonukleasen zur Herstellung einer Bibliothek identisch langer, cDNA-interner Fragmente den Vorteil, daß Fragmente identischer Länge in der Regel auch sehr ähnliche Beweglichkeiten in wäßriger Lösung besitzen und sich damit auch ihre Hybridisierungscharakteristika ähnlich sind.
  • Im Gegensatz dazu liegt der Nachteil des in Nat. Biotechnol., 2000, 18 (6), 630-634 und in PNAS 2000, 97 (4), 1665-1670 beschriebenen Verfahrens vor allem darin, daß längere cDNA/Hybridisierungs-tag-Fragmente weniger beweglich sind, eine trägere Hybridisierungscharakteristik besitzen und damit weniger effizient auf die mikroskopischen Partikel nach (7a) geladen werden als kürzere Fragmente. Dadurch ergibt sich eine relative Häufigkeitsverschiebung einzelner cDNAs zueinander, die sich vor allem für die Genexpressionsanalyse fatal auswirken kann, da sie die tatsächlichen Genexpressionsverhältnisse verfälscht.
  • Dieser entscheidende Nachteil wird in der erfindungsgemäßen Ausführungsform a durch den Einsatz von BcgI-ähnlichen Restriktionsendonukleasen (Verfahrensschritt 1a) zur Herstellung von cDNA-Fragmenten einheitlicher Länge überwunden.
  • Im folgenden werden die einzelnen Schritte der Ausführungsform a näher erläutert:
    • 1. Doppelsträngige DNA wird einem Restriktionsverdau bzw. Doppeldau mit einer oder mehreren BcgI-ähnlichen Restriktionsendonukleasen unterworfen zur Herstellung identisch langer Fragmente (Nukleinsäure-tags).
      Als doppelsträngige DNA wird hierbei bevorzugt eine cDNA-Bibliothek eingesetzt, die nach Standardverfahren durch das Umschreiben von Gesamt-RNA oder von mRNA mittels reverser Transkriptase, gefolgt von einer Synthese des cDNA-Zweitstrangs, hergestellt wird. Die Gesamt-RNA oder mRNA wird hierbei vorher nach einer dem Fachmann bekannten Standardmethode aus einer Zelle, einem Zellverband oder einem Gewebe isoliert. Wird eine solche cDNA-Bibliothek mit einer oder mehreren BcgI- ähnlichen Restriktionsendonukleasen geschnitten, so ergibt sich eine Bibliothek von identisch langen Nukleinsäure-tags, die das Genexpressionsmuster der Zelle, des Zellverbands oder des Gewebes wiederspiegeln. In einer zweiten, ebenfalls bevorzugten Variante handelt es sich bei der doppelsträngigen DNA um genomische DNA so daß eine Bibliothek von statistisch im Genom verteilten Fragmenten genomischer DNA erzeugt wird. Somit wird im Sinne des erfindungsgemäßen Verfahrens unter einem Nukleinsäuregemisch auch genomische DNA verstanden.
    • 2. Die optionale Isolierung der freigesetzten Nukleinsäure-tags erfolgt bevorzugt durch ein auf der Größenselektionierung von DNA-Fragmenten beruhendes Trennverfahren und dient dazu, alle beim Restriktionsverdau erzeugten Nebenprodukte anderer Größe zu entfernen, welche die Regionen zwischen zwei verschiedenen Erkennungs- bzw. Schnittstellen der jeweils eingesetzten BcgI-ähnlichen Restriktionsendonuklease repräsentieren. Hierfür können die üblichen dem Fachmann bekannten Isolations- und/oder Trennverfahren für Nukleinsäurefragmente definierter Größe zur Anwendung kommen, beispielsweise präparative Gelelektrophorese, Gelchromatographie oder größenselektive Präzipitation. Sofern gewünscht, kann die Isolierung der freigesetzten Nukleinsäure-tags auch entfallen.
    • 3. Die Klonierung der erhaltenen Nukleinsäure-tags in einen tag-Vektor erfolgt nach den Angaben in Brenner et al., Nature Biotech., 18, 630-634 (2000) oder in Brenner et al., PNAS, 97, 1665-1670 (2000). Der tag-Vektor umfaßt hierbei ein Hybridisierungs-tag, das durch kombinatorische Synthese hergestellt wurde und daher bei den Molekülen einer Vektorpräparation aus einer individuellen, zufälligen Sequenz besteht. Bevorzugt ist die Verwendung des tag-Vektors pLCV2 nach Brenner et al., PNAS, 97, 1665-1670 (2000).
    • 4. Sowohl die Plasmid-Präparation als auch die Fragmentpräparation aus diesen Plasmiden wird nach einer dem Fachmann bekannten Methode durchgeführt.
    • 5. Die zumindest teilweise Überführung des doppelsträngigen Hybridisierungs-tags in in einen einzelsträngigen Überhang erfolgt bevorzugt durch den Einsatz von T4- Polymerase in Anwesenheit von 1 mM dGTP für 60 min. wie in Brenner et al., PNAS, 97, 1665-1670 (2000) beschrieben.
    • 6. Das Beladen der mikroskopischen Partikel (7a) und die parallele Sequenzierung der mit Nukleinsäure-tags beladenen mikroskopischen Partikel (8a, 9a) nach der sogenannten massive parallel signal sequencing-Methode (MPSS) wird bevorzugt nach Brenner et al., Nature Biotech., 18, 630-634 (2000) und/oder Brenner et al., PNAS, 97, 1665-1670 (2000) durchgeführt. Als Alternative zur Verwendung mikroskopischer Partikel könnte im übrigen auch eine Anordnung geeigneter Nukleinsäuremoleküle auf einer, insbesondere planaren, Oberfläche eingesetzt werden. Ein solcher DNA-Array würde dann diskrete Bereiche aufweisen, dadurch gekennzeichnet, daß dort Nukleinsäuremoleküle (DNA, RNA, PNA und Derivate hiervon, die bevorzugterweise mindestens partiell als Einzelstrang vorliegen) jeweils einer Sorte, also im wesentlichen gleicher Sequenz, immobilisiert sind. Bei diesen Nukleinsäuremolekülen würde es sich wie auch von Brenner et al. beschrieben um sogenannte anti-tags handeln, also Moleküle, welche zur Hybridisierung mit einzelsträngig vorliegenden Hybridisierungstags befähigt sind. Die verschiedenen Bereiche eines solchen anti-tag-arrays würden sich dann durch jeweils verschiedene Sorten (d. h. Sequenzen) der dort immobilisierten Nukleinsäuremoleküle auszeichnen.
  • Für die Ausführungsform b (siehe Fig. 2) bringt der Einsatz von Fragmenten einheitlicher Länge, die mit Hilfe von BcgI-ähnlichen Restriktionsendonukleasen hergestellt wurden, besonders große Vorteile, da die Ausführungsform b auf einem Amplifikationsschritt durch die Polymerase-Kettenreaktion (PCR) beruht (Verfahrensschritt 4b).
  • Es ist dem Fachmann bekannt, daß Amplifikationen durch PCR wesentlich effizienter für kleine Fragmente als für größere Fragmente verlaufen. Bei der PCR-Amplifikation eines Gemisches unterschiedlich langer Fragmente, wie es in WO 01/48184 beschrieben ist, verschieben sich daher in der Regel die relativen Häufigkeiten der längeren Fragmente zugunsten der kürzeren Fragmente, so daß ihre nachfolgende Quantifizierung zur Ermittlung von Genexpressionsdaten zu verfälschten Ergebnissen führt.
  • Dieser erhebliche Nachteil, den z. B. auch die parallele tag-Sequenzierung nach WO 01/48184 aufweist, wird durch den erfindungsgemäßen Einsatz BcgI-ähnlicher Restriktionsendonukleasen überwunden, der zur Generierung identisch langer Fragmente aus einem cDNA-Gemisch führt. Die durch den Einsatz von BcgI-ähnlichen Restriktionsendonukleasen generierten identisch langen Nukleinsäure-Fragmente werden daher durch den PCR-Verfahrensschritt 4b) alle mit gleicher Effizienz amplifiziert. Ein Amplifikationsprodukt dieser identisch langen Fragmente sollte daher die zu ermittelnden relativen Häufigkeitsverhältnisse der im ursprünglichen Gemisch vorhandenen Nukleinsäuren exakt wiederspiegeln. Die erfindungsgemäße Ausführungsform b eignet sich daher zur Ermittlung exakter quantitativer Daten bezüglich der Genexpression wesentlich besser als das in WO 01/48184 offenbarte Verfahren.
  • Im folgenden werden die einzelnen Schritte der Ausführungsform b näher erläutert:
    • 1. Doppelsträngige DNA wird einem Restriktionsverdau bzw. Doppeldau mit einer oder mehreren BcgI-ähnlichen Restriktionsendonukleasen unterworfen zur Herstellung identisch langer Fragmente (Nukleinsäure-tags).
      Als doppelsträngige DNA wird hierbei bevorzugt eine cDNA-Bibliothek eingesetzt, die nach Standardverfahren durch das Umschreiben von Gesamt-RNA oder von mRNA mittels reverser Transkriptase, gefolgt von einer Synthese des cDNA-Zweitstrangs, hergestellt wird. Die Gesamt-RNA oder mRNA wird hierbei vorher nach einer dem Fachmann bekannten Standardmethode aus einer Zelle, einem Zellverband oder einem Gewebe isoliert. Wird eine solche cDNA-Bibliothek mit einer oder mehreren BcgIähnlichen Restriktionsendonukleasen geschnitten, so ergibt sich eine Bibliothek von identisch langen Nukleinsäure-tags, die das Genexpressionsmuster der Zelle, des Zellverbands oder des Gewebes wiederspiegeln. In einer zweiten, ebenfalls bevorzugten Variante handelt es sich bei der doppelsträngigen DNA um genomische DNA, so daß eine Bibliothek von statistisch im Genom verteilten Fragmenten genomischer DNA erzeugt wird.
    • 2. Die optionale Isolierung der freigesetzten Nukleinsäure-tags erfolgt bevorzugt durch ein auf der Größenselektionierung von DNA-Fragmenten beruhendes Trennverfahren und dient dazu, alle beim Restriktionsverdau erzeugten Nebenprodukte anderer Größe zu entfernen, welche die Regionen zwischen zwei verschiedenen Erkennungs- bzw. Schnittstellen der jeweils eingesetzten BcgI-ähnlichen Restriktionsendonuklease repräsentieren. Hierfür können die üblichen dem Fachmann bekannten Isolations- und/oder Trennverfahren für Nukleinsäurefragmente definierter Größe zur Anwendung kommen, beispielsweise präparative Gelelektrophorese, Gelchromatographie oder größenselektive Präzipitation. Sofern gewünscht, kann die Isolierung der freigesetzten Nukleinsäure-tags auch entfallen.
    • 3. Die Nukleinsäure-tags aus 2b) werden danach mit Bindungsstellen für Amplifikationsprimer versehen, indem sie mit geeigneten doppelsträngigen DNA- Adaptoren ligiert werden.
    • 4. Die mit Primerbindungsstellen, d. h. mit identischen Adaptoren versehenen Nukleinsäure-tags werden, wie in WO 01/48184 offenbart, einer PCR-Amplifikation unterzogen, wobei mindestens einer der zu den Adaptorsequenzen komplementären Amplifikationsprimer an eine feste Oberfläche gekoppelt ist. Hierbei entsteht eine klonale Anordnung von DNA-Inseln auf der Oberfläche.
      Die Kopplung des Amplifikationsprimers an die Oberfläche erfolgt hierbei nach WO 01 /48184 durch die Ausbildung von Wechselwirkungen mit dieser Oberfläche, besonders bevorzugt durch das Ausbilden kovalenter Bindungen.
      Dabei ergibt sich eine klonale Verteilung der einzelnen cDNAs auf der festen Oberfläche, die nach WO 01/48184 aus Kunststoff, Metall, Glas, Silicium oder ähnlich geeigneten Werkstoffen bestehen kann.
    • 5. Die amplifizierten Nukleinsäure-tags werden hierbei, sofern erforderlich, halbseitig von der Oberfläche gelöst und an dieser Oberfläche parallel sequenziert.
      Das halbseitige Lösen der amplifizierten Nukleinsäure-tags erfolgt hierbei bevorzugt nach WO 01/48184 durch die Ligation an ein Fragment, das eine "Schleifen"-Struktur ("Loop-Struktur") besitzt. Hierbei entstehen zumindest teilweise einzelsträngige, oberflächengebundene Nukleinsäuren. Anschließend erfolgt die Sequenzierung dieser in klonalen Inseln angeordneten Nukleinsäuren bevorzugt durch die parallele Sequenzierung durch Primerextension mittels reversibler Abbruchnukleotide, so wie in WO 01 /48184 offenbart.
  • Ähnlich wie Ausführungsform b umfaßt auch die erfindungsgemäße Ausführungsform c einen Amplifikationsschritt eines komplexen Gemisches aus identisch langen cDNAs durch PCR (Verfahrensschritt 4c).
  • Auch in Ausführungsform c stellt daher der durch die BcgI-ähnlichen Restriktionsendonukleasen ermöglichte Einsatz gleich langer cDNAs aus den oben benannten Gründen einen erheblichen Vorteil bei der Genexpressionsanalyse dar.
  • Im folgenden werden die einzelnen Schritte der Ausführungsform c näher erläutert:
    • 1. Doppelsträngige DNA wird einem Restriktionsverdau bzw. Doppeldau mit einer oder mehreren Bcg-ähnlichen Restriktionsendonukleasen unterworfen zur Herstellung identisch langer Fragmente (Nukleinsäure-tags). Als doppelsträngige DNA wird hierbei bevorzugt eine cDNA-Bibliothek eingesetzt, die nach Standardverfahren durch das Umschreiben von Gesamt-RNA oder von mRNA mittels reverser Transkriptase, gefolgt von einer Synthese des cDNA-Zweitstrangs, hergestellt wird. Die Gesamt-RNA oder mRNA wird hierbei vorher nach einer dem Fachmann bekannten Standardmethode aus einer Zelle, einem Zellverband oder einem Gewebe isoliert. Wird eine solche cDNA- Bibliothek mit einer oder mehreren BcgI-ähnlichen Restriktionsendonukleasen geschnitten, so ergibt sich eine Bibliothek von identisch langen Nukleinsäure-tags, die das Genexpressionsmuster der Zelle, des Zellverbands oder des Gewebes wiederspiegeln. In einer zweiten, ebenfalls bevorzugten Variante handelt es sich bei der doppelsträngigen DNA um genomische DNA, so daß eine Bibliothek von statistisch im Genom verteilten Fragmenten genomischer DNA erzeugt wird.
    • 2. Die optionale Isolierung der freigesetzten Nukleinsäure-tags erfolgt bevorzugt durch ein auf der Größenselektionierung von DNA-Fragmenten beruhendes Trennverfahren und dient dazu, alle beim Restriktionsverdau erzeugten Nebenprodukte anderer Größe zu entfernen, welche die Regionen zwischen zwei verschiedenen Erkennungs- bzw. Schnittstellen der jeweils eingesetzten BcgI-ähnlichen Restriktionsendonuklease repräsentieren. Hierfür können die üblichen dem Fachmann bekannten Isolations- und/oder Trennverfahren für Nukleinsäurefragmente definierter Größe zur Anwendung kommen, beispielsweise präparative Gelelektrophorese, Gelchromatographie oder größenselektive Präzipitation. Sofern gewünscht, kann die Isolierung der freigesetzten Nukleinsäure-tags auch entfallen.
    • 3. Die Nukleinsäure-tags aus 2c) werden danach mit Bindungsstellen für Amplifikationsprimer versehen, indem sie mit geeigneten Adaptoren ligiert werden.
    • 4. Die Nukleinsäure-tags aus 3c) werden mit Hilfe von Amplifikationsprimern, die zu den Adaptorsequenzen komplementär sind, mittels PCR amplifiziert.
    • 5. Die Amplifikationsprodukte nach 4c) werden anschließend parallel unter Durchführung der Schritte 3a) bis 9a) (nach Brenner et al., Nature Biotech., 18, 630-634 (2000) oder nach Brenner et al., PNAS, 97, 1665-1670 (2000)) oder unter Durchführung der Schritte 4b) bis 6b) nach WO 01/48184 sequenziert.
      Alternativ kann die Sequenzierung der Amplifikationsprodukte nach 4c) auch seriell unter Durchführung der Schritte 3d) bis 5d) oder unter Durchführung der Schritte 3e) bis 6e) erfolgen.
  • Die erfindungsgemäße Ausführungsform d stellt eine neue Variante des Verfahrens zur Genexpressionsanalyse durch serielle Sequenzierung (SAGE) von Nukleinsäure-tags dar, das in US 5,695,937 und in Velculescu et al., Science, 270, 484-487 offenbart wurde.
  • Im Rahmen dieses Verfahrens (US 5,695,937 und in Velculescu et al., Science, 270, 484-487) werden - wie bereits oben beschrieben - mittels. Typ IIs-Restriktionsenzymen kurze DNA-Fragmente generiert, die jedoch in ihrer Länge auf die "Reichweite" der derzeit kommerziell erhältlichen Typ IIs-Restriktionsendonukleasen auf maximal 14 bp tagspezifische Nukleotidsequenz beschränkt sind. Solche kurzen Sequenzen reichen oftmals nicht zur eindeutigen Identifizierung eines Nukleinsäure-tags aus.
  • Die Verwendung von erfindungsgemäßen BcgI-ähnlichen Restriktionsendonukleasen ermöglicht jedoch die Herstellung von deutlich längeren, identisch langen tags aus einem Nukleinsäuregemisch (ca. 20 bis 30 bp lange tags), die zur eindeutigen Identifikation der einzelnen tags in der Regel genügen.
  • Das in US 5,695,937 und in Velculescu et al., Science, 270, 484-487 offenbarte Verfahren umfaßt weiterhin die Dimerisierung, d. h. die Ligation zweier zufälliger Nukleinsäure-tags, zur Herstellung sogenannter "Ditags", die anschließend konkatemerisiert und in einen Vektor kloniert werden. Aus der Sequenzierung der Konkatemere ergibt sich hierbei in der Regel ein repräsentatives Bild des Genexpressionsmusters der Zelle bzw. des Gewebes.
  • Die Generation eines "Ditags", die dem eigentlichen Konkatemerisierungsschritt vorangeht, dient dabei mehreren Zwecken (Velculescu et al., Science, 270, Seite 485, 1. und 2. Spalte):
    • 1. Zunächst wird durch die Herstellung von Ditags sowohl die Punktuation, d. h. Anfang und Ende der Nukleinsäure-tags, als auch die Orientierung der Nukleinsäure-tags festgelegt. Ohne die vorherige Generierung von Ditags könnte insbesondere die Orientierung der einzelnen tags, die durch Ligationen über glatte Enden ("blunt ends") konkatemerisiert werden, nicht nachvollzogen werden. Es müßten demnach beide möglichen Orientierungen der einzelnen tags mit den Datenbanksequenzen verglichen werden, was die Wahrscheinlichkeit einer eindeutigen Identifikation der ohnehin recht kurzen tags weiterhin verringert.
    • 2. Die Herstellung von Ditags dient außerdem der Detektion von gewissen relativen Häufigkeitsverschiebungen einzelner cDNAs zueinander, die wegen der zahlreichen erforderlichen Einzelschritte des Verfahrens nach dem Stand der Technik, insbesondere während der Schritte der Festphasenkopplung, der PCR-Amplifikation, oder der Klonierung auftreten können (Spalte 2, Zeile 29 bis 33 aus US 5,695,937).
      Da die Ligation zweier cDNA-tags zur Generierung eines Ditags ein zufälliges Ereignis ist und da die Anzahl an unterschiedlichen cDNA-tags sehr hoch ist, ist davon auszugehen, daß die Wahrscheinlichkeit für das zwei- oder mehrmalige Auftreten des exakt identischen Ditags selbst bei sehr abundanten eDNAs recht klein ist. Daher werden in dem in US 5,695,937 beschriebenen Verfahren solche Ditags von der Auswertung hinsichtlich des Genexpressionsmusters ausgenommen, die mehrfach wiederholt vorkommen und daher mit großer Wahrscheinlichkeit auf eine der oben beschriebenen relativen Häufigkeitsverschiebungen zurückzuführen sind.
  • Im folgenden werden die einzelnen Schritte der Ausführungsform d näher erläutert:
    • 1. Doppelsträngige DNA wird einem Restriktionsverdau bzw. Doppeldau mit einer oder mehreren BcgI-ähnlichen Restriktionsendonukleasen unterworfen zur Herstellung identisch langer Fragmente (Nukleinsäure-tags).
      Als doppelsträngige DNA wird hierbei bevorzugt eine cDNA-Bibliothek eingesetzt, die nach Standardverfahren durch das Umschreiben von Gesamt-RNA oder von mRNA mittels reverser Transkriptase, gefolgt von einer Synthese des cDNA-Zweitstrangs, hergestellt wird. Die Gesamt-RNA oder mRNA wird hierbei vorher nach einer dem Fachmann bekannten Standardmethode aus einer Zelle, einem Zellverband oder einem Gewebe isoliert. Wird eine solche cDNA-Bibliothek mit einer oder mehreren BcgI- ähnlichen Restriktionsendonukleasen geschnitten, so ergibt sich eine Bibliothek von identisch langen Nukleinsäure-tags, die das Genexpressionsmuster der Zelle, des Zellverbands oder des Gewebes wiederspiegeln. In einer zweiten, ebenfalls bevorzugten Variante handelt es sich bei der doppelsträngigen DNA um genomische DNA, so daß eine Bibliothek von statistisch im Genom verteilten Fragmenten genomischer DNA erzeugt wird.
    • 2. Die optionale Isolierung der freigesetzten Nukleinsäure-tags erfolgt bevorzugt durch ein auf der Größenselektionierung von DNA-Fragmenten beruhendes Trennverfahren und dient dazu, alle beim Restriktionsverdau erzeugten Nebenprodukte anderer Größe zu entfernen, welche die Regionen zwischen zwei verschiedenen Erkennungs- bzw. Schnittstellen der jeweils eingesetzten BcgI-ähnlichen Restriktionsendonuklease repräsentieren. Hierfür können die üblichen dem Fachmann bekannten Isolations- und/oder Trennverfahren für Nukleinsäurefragmente definierter Größe zur Anwendung kommen, beispielsweise präparative Gelelektrophorese, Gelchromatographie oder größenselektive Präzipitation. Sofern gewünscht, kann die Isolierung der freigesetzten Nukleinsäure-tags auch entfallen.
    • 3. Die erhaltenen Nukleinsäure-tags werden entweder mit oder ohne vorherige Dimerisierung konkatemerisiert, indem die überlappenden (kohäsiven) Enden der Nukleinsäure-tags entweder direkt ligiert werden oder indem die überlappenden Enden zunächst in glatte Enden überführt werden und die Konkatemere anschließend über ihre glatten Enden ligiert werden.
    • 4. Die Konkatemere aus 3d) werden in einen Vektor kloniert.
    • 5. Die Konkatemere werden seriell sequenziert. Bevorzugt ist hierbei das dem Fachmann bekannte Standard-Sequenzierungsverfahren nach Sanger.
  • In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens d kann aus den folgenden Gründen zusätzlich auf die Durchführung eines Dimerisierungsschrittes ("Herstellung eines Ditags") verzichtet werden:
  • Zum einen ermöglicht die umfassendere Sequenzinformation pro tag, die durch die Herstellung längerer Nukleinsäure-tags einheitlicher Länge erreicht wird, auch dann eine eindeutige Identifikation der einzelnen Nukleinsäuren, wenn die Orientierung der einzelnen Nukleinsäure-tags nicht durch den Dimerisierungsschritt definiert ist und daher beide möglichen Orientierungen mit den Datenbanksequenzen abgeglichen werden müssen.
  • Zum anderen sollte die durch den Einsatz BcgI-ähnlicher Restriktionsendonukleasen ermöglichte Herstellung identisch langer Fragmente aus einem Nukleinsäuregemisch auch die Notwendigkeit zur Detektion der unter Nr. 2 beschriebenen relativen Häufigkeitsverschiebungen durch Festphasenkopplung, PCR-Amplifikation oder Klonierungsschritte überflüssig machen.
  • Weiterhin schließlich geht die Erkennungssequenz der jeweils gewählten BcgI-ähnlichen Restriktionsendonuklease bei der tag-Erzeugung in der Regel nicht verloren, sondern bleibt Bestandteil des tags (vgl. Tabelle 1). Daher ist eine Punktuation bereits durch die Sequenz der erzeugten tags gegeben und braucht nicht durch die zusätzliche Einführung künstlicher Sequenzen vorgenommen zu werden.
  • Neben dem erheblichen Vorteil, daß durch die Herstellung längerer Nukleinsäure-tags durch den Einsatz BcgI-ähnlicher Restriktionsendonukleasen genügend Sequenzinformation zur eindeutigen Identifikation der jeweiligen cDNAs geliefert wird, hat diese spezielle Ausführungsform des Verfahrens nach d den zusätzlichen Vorteil, daß sie auf den Verfahrensschritt der Dimerisierung (Herstellung eines Ditags) verzichten kann, was das Verfahren insgesamt schneller, effizienter und weniger fehleranfällig macht.
  • In der weiteren Ausführungsform e, die ebenfalls eine bevorzugte Ausführungsform des Verfahrens nach d darstellt, wird das Verfahren nach d folgendermaßen abgewandelt:
    • 1. Doppelsträngige DNA wird einem Restriktionsverdau bzw. Doppeldau mit einer oder mehreren BcgI-ähnlichen Restriktionsendonukleasen unterworfen zur Herstellung identisch langer Fragmente (Nukleinsäure-tags).
      Als doppelsträngige DNA wird hierbei bevorzugt eine cDNA-Bibliothek eingesetzt, die nach Standardverfahren durch das Umschreiben von Gesamt-RNA oder von mRNA mittels reverser Transkriptase, gefolgt von einer Synthese des cDNA-Zweitstrangs, hergestellt wird. Die Gesamt-RNA oder mRNA wird hierbei vorher nach einer dem Fachmann bekannten Standardmethode aus einer Zelle, einem Zellverband oder einem Gewebe isoliert. Wird eine solche cDNA-Bibliothek mit einer oder mehreren BcgI-ähnlichen Restriktionsendonukleasen geschnitten, so ergibt sich eine Bibliothek von identisch langen Nukleinsäure-tags, die das Genexpressionsmuster der Zelle, des Zellverbands oder des Gewebes wiederspiegeln. In einer zweiten, ebenfalls bevorzugten Variante handelt es sich bei der doppelsträngigen DNA um genomische DNA, so daß eine Bibliothek von statistisch im Genom verteilten Fragmenten genomischer DNA erzeugt wird.
    • 2. Die optionale Isolierung der freigesetzten Nukleinsäure-tags erfolgt bevorzugt durch ein auf der Größenselektionierung von DNA-Fragmenten beruhendes Trennverfahren und dient dazu, alle beim Restriktionsverdau erzeugten Nebenprodukte anderer Größe zu entfernen, welche die Regionen zwischen zwei verschiedenen Erkennungs- bzw. Schnittstellen der jeweils eingesetzten BcgI-ähnlichen Restriktionsendonuklease repräsentieren. Hierfür können die üblichen dem Fachmann bekannten Isolations- und/oder Trennverfahren für Nukleinsäurefragmente definierter Größe zur Anwendung kommen, beispielsweise präparative Gelelektrophorese, Gelchromatographie oder größenselektive Präzipitation. Sofern gewünscht, kann die Isolierung der freigesetzten Nukleinsäure-tags auch entfallen.
    • 3. An die erhaltenen Nukleinsäure-tags werden doppelsträngige DNA-Linkermoleküle ligiert, welche sich durch einen palindromischen sowie einen degenerierten Überhang auszeichnen, wobei der degenerierte Überhang an alle möglichen überhängenden Enden der BcgI-generierten tags ligierbar ist (siehe Fig. 5).
    • 4. Anschließend erfolgt die Phosphorylierung der Linker-Enden und danach die Konkatemerisierung der Linker-flankierten Nukleinsäure-tags über ihre kohäsiven Enden.
    • 5. Anschließend werden die Konkatemere nach 4d) in einen Vektor kloniert.
    • 6. Die Konkatemere werden seriell nach 5d) sequenziert. Bevorzugt ist hierbei das dem Fachmann bekannte Standard-Sequenzierungsverfahren nach Sanger.
  • Besonders bevorzugte Ausführungsformen der erfindungsgemäßen Verfahren a, b, c, d und e liegen darin, daß aus einem Nukleinsäure-Gemisch zwei verschiedene (oder auch mehrere verschiedene) Nukleinsäure-tag-Bibliotheken nach a bis c bzw. Nukleinsäure-tag- Konkatemer-Bibliotheken nach d und e mit jeweils identisch langen Fragmenten unter Einsatz von zwei verschiedenen (oder auch mehreren verschiedenen) BcgI-ähnlichen Restriktionsendonukleasen hergestellt werden.
  • Diese aus dem gleichen Nukleinsäure-Gemisch jeweils mit einer individuellen BcgI- ähnlichen Restriktionsendonuklease erzeugten Nukleinsäure-tag-Bibliotheken bzw. Konkatemer-Bibliotheken werden anschließend unabhängig voneinander jeweils einer parallelen bzw. seriellen Sequenzierung nach (9a), (6b), (5c), (5d) oder (6e) unterworfen.
  • Aus den unterschiedlichen tag-Bibliotheken werden so - unabhängig voneinander - Sequenzdaten gewonnen, die einander ergänzen. Durch die Herstellung und Auswertung von mehreren tag-Bibliotheken, die mit unterschiedlichen BcgI-ähnlichen Restriktionsendonukleasen hergestellt wurden, ist auszuschließen, daß einzelne cDNAs deshalb nicht von dem erfindungsgemäßen Verfahren a) bis e) erfaßt werden, weil sie über keine Erkennungsstelle der eingesetzten BcgI-ähnlichen Restriktionsendonuklease verfügen und tags dieser cDNAs daher nicht in der resultierenden tag-Bibliothek vertreten sind.
  • Durch die Kombination zweier (oder mehrerer) tag-Bibliotheken, die mit unterschiedlichen BcgI-ähnlichen Restriktionsendonukleasen generiert wurden, ist die Wahrscheinlichkeit, daß alle im ursprünglichen cDNA-Gemisch vertretenen cDNAs mehrere, zumindest aber eine, Erkennungsstelle für die verwendeten BcgI-ähnlichen Restriktionsendonukleasen besitzen und damit von mehreren, zumindest aber von einer, tag-Bibliothek erfaßt werden, sehr hoch. So ergab eine Datenbanksuche beispielsweise, daß 84% aller derzeit (August 2001) öffentlich zugänglichen Maus-cDNAs mindestens eine Schnittstelle für mindestens eine der Restriktionsendonukleasen BaeI, BcgI, BpII, BsaXI oder Bsp24I enthalten, während 99,2% aller Maus-cDNAs mindestens eine Schnittstelle für mindestens eines der Enzyme aus der Liste BaeI, BcgI, BplI, BsaXI, Bsp24I, CjeI oder CjePI tragen.
  • Ein weiterer Vorteil liegt darin, daß die Datensätze hinsichtlich der Quantifizierung der einzelnen cDNA-tags, die von zwei oder mehreren tag-Bibliotheken erfaßt werden, zudem miteinander verglichen und damit verifiziert bzw. zum Erhalt genauerer Daten gemittelt werden können.
  • Zur Analyse der gemäß dem erfindungsgemäßen Verfahren erzeugten tag-Bibliotheken, welche bevorzugterweise rechnergestützt erfolgt, kann folgendermaßen vorgegangen werden: Zunächst werden die Sequenz-Rohdaten auf geeignete Weise bearbeitet, so daß die gesamte erhaltene Sequenzinformation in eine Kollektion einzelner tag-Sequenzen überführt wird. Wurde eine parallele Sequenzierung durchgeführt, so bedeutet dies im wesentlichen, daß die von jedem einzelnen tag stammende Sequenzinformation von Vektorsequenzen, Linkersequenzen etc. befreit werden muß. Im Falle einer seriellen Sequenzierung müssen zunächst die einzelnen tag-Sequenzen aus den erhaltenen Konkatemersequenzen extrahiert werden. Hierbei kann man sich der in den tags erhalten gebliebenen Erkennungsstellen der jeweiligen BcgI-ähnlichen Restriktionsendonuklease bedienen: Die Konkatemersequenz wird auf die entsprechende Erkennungssequenz durchsucht (z. B. für BaeI ACNNNNGTAYC bzw. das reverse Komplement hierzu; vgl. Tabelle 1). Dann wird die jeweilige tag-Sequenz rekonstruiert, indem die der Schneidecharakteristik des zur tag-Erzeugung eingesetzten Enzyms entsprechende Zahl von Basen stromabwärts und stromaufwärts an die Erkennungssequenz angefügt wird, beispielsweise für BaeI 10 Basen stromabwärts und 7 Basen stromaufwärts, was dem jeweils doppelsträngigen Bereich einer BaeI-Signatur entspricht. Findet man also beispielsweise als Teilbereich einer Konkatemersequenz die folgende Basenabfolge (BaeI- Erkennungssequenz in Fettdruck):


    so würde die hierin vollständig enthaltene tag-Sequenz


    lauten. Dies wird nun für alle in einem Konkatemer enthaltenen tag-Sequenzen durchgeführt und analog mit allen sequenzierten Konkatemeren wiederholt. Alternativ hierzu kann auch bei einer Durchführung des Verfahrens gemäß Ausführungsform 1e-6e eine Punktuation mittels der eingeführten Linker vorgenommen werden, indem ein tag als die zwischen zwei Linkem liegende Sequenz definiert wird, wobei gegebenenfalls die ersten bzw. die letzen zu einem tag gehörigen Basen, welche unmittelbar nach Behandlung der Ausgangs-DNA in Form eines einzelsträngigen Überhangs vorlagen, unberücksichtigt gelassen werden, um durch Ligation nicht perfekt zueinander komplementärer Überhänge bei der Linkerbefestigung möglicherweise eingeführte Sequenzfehler zu eliminieren.
  • In jedem Fall werden die durch parallele oder serielle Sequenzierung erhaltenen tags aufgelistet, und es wird ermittelt, wie häufig jedes einzelne der tags sequenziert wurde. Da aufgrund der vorteilhaften Länge der nach dem erfindungsgemäßen Verfahren erzeugten tags kleinere Sequenzierfehler (z. B. 1-2 Basen pro tag) toleriert werden, ohne daß eine Fehlzuordnung eines tags zu einem falschen Gen zu befürchten ist, können, sofern gewünscht, bei der Auflistung der tags sequenzähnliche tags, die sich beispielsweise in maximal einer oder in maximal zwei Basen voneinander unterscheiden, zu einem "cluster" zusammengefaßt und gemeinsam gezählt werden. Schließlich werden die erhaltenen tags bzw. die erhaltenen cluster für eine Datenbankabfrage eingesetzt, die der Identifikation des jeweilig zu einem gegebenen tag gehörigen Transkripts bzw. Gens dient. Eine hierfür einsetzbare Software ist beispielsweise das in Fachkreisen allgemein bekannte Programm BLAST. Da das erfindungsgemäße Verfahren eine hohe Linearität über einen großen Bereich aufweist, läßt sich aus der relativen Häufigkeit eines tags bzw. eines clusters auf die Expressionsstärke, d. h. auf die Abundanz der mRNA des zugehörigen Gens schließen: die von Transkripten hoher Abundanz stammenden tags weisen eine höhere relative Häufigkeit als jene tags, welche Transkripte niedrigerer Abundanz repräsentieren.
  • Auf diese Weise wird von dem untersuchten biologischen Material, also beispielsweise einer Zellkultur oder einem Gewebe, ein Katalog der exprimierten Gene bzw. der zugehörigen Transkripte, ggf. einschließlich vorhandener Spleißvarianten, erstellt. Ein solcher Katalog enthält neben der Auflistung der aktiven Gene auch Angaben über die jeweilige Expressionsstärke. Daher können entsprechende Expressionskataloge verschiedener biologischer Materialien, beispielsweise einer Zellkultur vor und nach Behandlung mit einer toxischen Substanz, miteinander verglichen werden und somit differentiell exprimierte Gene anhand ihrer in verschiedenen Proben unterschiedlichen relativen tag-Häufigkeit erkannt werden.
  • Auch aus genomischer DNA können mittels des erfindungsgemäßen Verfahrens Sequenztags erzeugt werden. Beispielsweise erkennt die Restriktionsendonuklease BcgI DNA mit einem durchschnittlichen G/C-Gehalt im Mittel etwa alle 2 kb; dementsprechend würde humane genomische DNA ca. 1,5 Millionen Erkennungsstellen aufweisen, so daß ein vollständiger Verdau mit diesem Enzym die gleiche Zahl an verschiedenen tags gleicher Länge erzeugen würde. Diese tags, welche sich mit einem einzigen oder einigen wenigen Parallelsequenzierungsexperimenten identifizienen lassen, sind zufällig und damit weitgehend gleichmäßig über das Genom verteilt. Somit eignet sich das erfindungsgemäße Verfahren neben der Expressionsanalyse auch zum Vergleich von Genomen, beispielsweise zur Identifikation von Polymorphismen wie beispielsweise SNPs oder zur Identifikation von Deletionen. Da die Häufigkeit von SNPs ca. 1/1000 bp beträgt, würden sich durch Vergleich verschiedener Genome mittels des erfindungsgemäßen Verfahrens und der Restriktionsendonuklease BcgI 1.500.000 × 32 = 48.000.000 individuelle genomische Positionen erfassen lassen, welche ca. 48.000 SNPs enthielten. Eine solche Kollektion von SNPs ließe sich nach dem Fachmann bekannten Verfahren zu Kartierungszwecken etc. einsetzen.
  • Die Erfindung wird durch in den Fig. 1 bis 5 näher erläutert.
  • Es zeigt
  • Fig. 1 die Verwendung von BcgI-generierten tags zur parallelen Sequenzierung mittels klonal beladener Mikropartikel
  • Fig. 2 die Verwendung von Bcgl-generierten tags zur parallelen Sequenzierung mittels Oberflächenamplifikation zu klonalen Inseln
  • Fig. 3 die direkte Konkatemerisierung von BcgI-generierten tags zur seriellen Sequenzierung
  • Fig. 4 die direkte Konkatemerisierung von BcgI-generierten tags zur seriellen Sequenzierung nach Erzeugung glatter Enden
  • Fig. 5 die Konkatemerisierung von BcgI-generierten tags zur seriellen Sequenzierung mittels kurzer Adaptoren
  • Fig. 1 zeigt die Verwendung von BcgI-generierten tags zur parallelen Sequenzierung mittels klonal beladener Mikropartikel, wobei im einzelnen
    • 1. die Behandlung doppelsträngiger cDNA mit der Restriktionsendonuklease BcgI (Erkennungssequenz: CGANNNNNNTGC) sowie die Isolation der so erzeugten BcgI-generierten tags gefolgt von der Entfernung der einzelsträngigen Überhänge zu glatten Enden,
    • 2. die Klonierung der erhaltenen BcgI-generierten tags in einen Hybridisierungs tag- Vektor,
    • 3. die Gewinnung von Konstrukten, umfassend je ein BcgI-generiertes tag sowie ein Hybridisierungs-tag, gefolgt von der partiellen Entferung des "unteren" Strangs zur Freilegung eines terminalen einzelsträngigen Hybrisisierungs-tags,
    • 4. die klonale Beladung von jeweils einer Sorte von anti-tags tragenden Mikropartikeln mit den in (3) erzeugten Konstrukten,
    • 5. die parallele Sequenzierung der BcgI-generierten tags, nachdem die die Konstrukte tragenden Mikropartikel in eine einlagige Schicht überführt wurden
    zeigt.
  • Fig. 2 zeigt die Verwendung von BcgI-generierten tags zur parallelen Sequenzierung mittels Oberflächenamplifikation zu klonalen Inseln, wobei
    • 1. die Behandlung doppelsträngiger cDNA mit der Restriktionsendonuklease BcgI sowie die Isolation der so erzeugten BcgI-generierten tags,
    • 2. die Befestigung von Primerbindungsstellen in Form von doppelsträngigen Adaptoren,
    • 3. die Erzeugung immobilisierter klonaler DNA-Inseln durch Festphasenamplifikation mittels Oberflächen-gebundener Primer,
    • 4. die parallele Sequenzierung der in Form klonaler Inseln vorliegenden DNA durch Primerextension mittels reversibler Abbruchnukleotide
    darstellt.
  • Fig. 3 zeigt die direkte Konkatemerisierung von BcgI-generierter tags zur seriellen Sequenzierung, wobei im einzelnen
    • 1. die Behandlung doppelsträngiger cDNA mit der Restriktionsendonuklease BcgI sowie die Isolation der so erzeugten BcgI-generierten tags,
    • 2. die Konkatemerisierung der in (1) erhaltenen BcgI-generierten tags,
    • 3. die Klonierung der so hergestellten Konkatemere,
    • 4. die serielle Sequenzierung der Konkatemere
    wiedergibt.
  • Fig. 4 stellt die direkte Konkatemerisierung von BcgI-generierten tags zur seriellen Sequenzierung nach Erzeugung glatter Enden dar, wobei
    • 1. die Behandlung doppelsträngiger cDNA mit der Restriktionsendonuklease BcgI sowie die Isolation der so erzeugten BcgI-tags,
    • 2. die Entfernung überhängender Enden,
    • 3. die Konkatemerisierung der in (2) erhaltenen BcgI-tags mit glatten Enden,
    • 4. die Klonierung der Konkatemere,
    • 5. die serielle Sequenzierung der Konkatemere
    darstellt.
  • Fig. 5 zeigt die Konkatemerisierung von BcgI-generierten tags zur seriellen Sequenzierung mittels kurzer Adaptoren. Im einzelnen zeigt
    • 1. die Behandlung doppelsträngiger cDNA mit der Restriktionsendonuklease BcgI sowie die Isolation der so erzeugten BcgI-generierten tags,
    • 2. das Anfügen von Linkermolekülen, welche sich durch einen palindromischen sowie einen degenerierten Überhang auszeichnen, wobei der degenerierte Überhang (schraffiert dargestellt) an alle möglichen überhängenden Enden der BcgIgenerierten tags ligierbar ist,
    • 3. die Phosphorylierung und anschließende Konkatemerisierung der in (2) erhaltenen Linker-flankierten BcgI-tags,
    • 4. die Klonierung der Konkatemere,
    • 5. die serielle Sequenzierung der Konkatemere
    zeigt.
  • Im folgenden wird das erfindungsgemäße Verfahren durch Beispiele erläutert:
  • Beispiel 1 Herstellung doppelsträngiger cDNA
  • Gemäß dem RNeasy-Protokoll (Qiagen GmbH, Hilden) wurde RNA aus Rattenleber isoliert. 50 µg Gesamt-RNA wurde mittels 200 U Superscript II Reverser Transkriptase (Life Technologies) und des eDNA-Primers CP28V (5'-ACC TAC GTG CAG ATT TTT TTT TTT TTT TV-3') in Erststrang-cDNA überführt (vgl. Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, 1987-2001, Unit 5.5.6-5.5.8). Nach erfolgter Erststrang-Synthese (1h bei 42°C) wurde mit 60 U DNA Polymerase I (NEB, Schwalbach) und 1,8 U RNase H (Promega, Madison, WI, USA) in doppelsträngige cDNA überführt. Die so gewonnene cDNA wurde mit Phenol, dann mit Chloroform extrahiert, mit Ethanol gefällt und in Wasser gelöst.
  • Beispiel 2 Parallelsequenzierung von BcgI-generierten tags mittels beladener Partikel
  • Die in Beispiel 1 gewonnene doppelsträngige cDNA wurde in 45 µl 1 × BcgI- Restriktionspuffer/20 µM S-Adenosylmethionin (NEB) aufgenommen, mit 10 U BcgI versetzt und 1,5 h bei 37°C geschnitten. Die Reaktionen wurden mit Phenol, dann mit Chloroform extrahiert, mit Ethanol gefällt und in 13 µl NEbuffer 2 (NEB) gelöst. Nach Zugabe von 2 µl Gelladepuffer (20 mM Tris-HCl pH 7,9/2 mlvi EDTA/50% Glycerol/0,25% Bromphenolblau) wurde zur tag-Isolation neben einer 25 bp-Leiter als Längenstandard auf ein 20%-Polyacrylamidgel geladen (vgl. Current Protocols in Molecular Biology, Unit 2.7). Elektrophorese wurde bei einer Spannung von 2 V/cm durchgeführt und abgebrochen, sobald die Bromphenolblau-Front die Gelunterkante erreicht hatte. Die Apparatur wurde zerlegt, das Gel 30 min. mit Ethidiumbromid-Lösung angefärbt, 10 min. entfärbt und auf einem Transilluminator die die freigesetzten BcgI- Fragmente enthaltende 30 bp-Bande ausgeschnitten. Das erhaltene Polyacrylamid- Stückchen wurde durch mehrfaches Aufziehen durch eine Einwegspritze zerkleinert, mit TE-Puffer überschichtet und 3 h eluiert. Anschließend wurde abzentrifugiert und der Überstand mit Ethanol gefällt. Die Fragmente wurden in 50 µl 1 × T4-Polymerasepuffer mit 100 µM dNTPs gelöst und nach Zugabe von 2 U T4 DNA-Polymerase für 20 min. bei 12°C inkubiert. Die Reaktion wurde mit EDTA abgestoppt, mit Phenol/Chloroform extrahiert und mit Ethanol gefällt. Eine Präparation des mit glatten Enden versehenen, linearisierten modifizierten Hybridisierungs-tag-vektors pLCV2 (Proc. Natl. Acad. Sci. CL S. A. 2000 Feb 15; 97(4): 1665-70) wurde dephosphoryliert und zusammen mit den nach der Behandlung mit T4-Polymerase ebenfalls glatte Enden aufweisenden BcgI-tags zu einem molaren Vektor-Insert-Verhältnis von 1 : 1 in 5 µl einer Ligations-Mixtur (Rapid DNA Ligation kit; Roche, Mannheim) aufgenommen. Es wurde 1h bei Raumtemperatur ligiert und dann in kompetente E. coli TOP 10-Zellen (Invitrogen, Groningen, Niederlande) transformiert. Die weitere Bearbeitung erfolgte wie beschrieben (Nat. Biotechnol. 2000 Jun; 18(6): 630-4).
  • Beispiel 3 Parallelsequenzierung von BcgI-generierten tags mittels Oberflächenamplifikation zu klonalen Inseln
  • Die in Beispiel 1 gewonnene doppelsträngige cDNA wurde wie in Beispiel 2 beschrieben in 45 µl 1 × BcgI-Restriktionspuffer/20 µM S-Adenosylmethionin (NEB) aufgenommen, mit 10 U BcgI versetzt und 1,5 h bei 37°C geschnitten. Die Reaktionen wurden mit Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Aus den Oligonukleotiden BL20NN (5'- TCA CAT GCT AAG TCT CGC GAN1 N2 -3' mit N1, N2 = äquimolare Mischung aus G, A, T und C) und LB20P (5'-Phosphat-TCG CGA GAC TTA GCA TGT GA-3') wurde durch Hybridisierung in 1 × Ligationspuffer ein doppelsträngiger Linker BL2020NN-P hergestellt. Die zuvor gewonnenen BcgI-tags wurden in 20 µl eines Ligationsansatzes gelöst, enthaltend 4 µg Linker BL2020NN-P und 1 U T4 DNA-Ligase (Roche) in 1 × Ligationspuffer (Roche). Die Linkerligation fand über Nacht bei 16°C statt. Nach Zugabe von 2 µl Gelladepuffer (20 mM Tris-HCl pH 7,9/2 mM EDTA/50% Glycerol/0,25% Bromphenolblau) wurde zur Isolation Linker-flankierter tags neben einer 25 bp-Leiter als Längenstandard auf ein 15%-Polyacrylamidgel geladen. Elektrophorese wurde bei einer Spannung von 2 V/cm durchgeführt und abgebrochen, sobald die Bromphenolblau-Front die Gelunterkante erreicht hatte. Die Apparatur wurde zerlegt, das Gel 30 min. mit Ethidiumbromid-Lösung angefärbt, 10 min. entfärbt und auf einem Transilluminator die die gewünschten Ligationsprodukte enthaltende 70 bp-Bande ausgeschnitten. Das erhaltene Polyacrylamid-Stückchen wurde durch mehrfaches Aufziehen durch eine Einwegspritze zerkleinert, mit TE-Puffer überschichtet und 6 h eluiert. Anschließend wurde abzentrifugiert und der Überstand mit Ethanol gefällt. Es wurde eine Primerbindungslösung hergestellt, bestehend aus 19 mg 1-Ethyl-3-(3- dimethylaminopropyl)-carbodiimid (Sigma-Aldrich), 100 µl 1 M 1-Methylimidazol (Sigma-Aldrich), und 20 µl 5'-aminomodifiziertem Primer Amino-T20BL20 (5'-Amino- TTT TTT TTT TTT TTT TTT TTT CAC ATG CTA AGT CTC GCG A-3'). NucleoLink- Gefäße (Nung GmbH & Co-KG, Wiesbaden) wurden gemäß den Angaben des Herstellers mit dem modifizierten Primer beschichtet, die Primerbindungslösung wurde entfernt und die beschichteten NucleoLink-Gefäße wurden nach Herstellerangaben gewaschen. Amplifikation und Sequenzierung erfolgten wie beschrieben (WO 01/48184 bzw. DE 101 06 320.2).
  • Beispiel 4 Serielle Sequenzierung von BcgI-generierten tags
  • Die in Beispiel 1 gewonnene doppelsträngige cDNA wurde in 45 µl 1 × BcgI- Restriktionspuffer/20 µM S-Adenosylmethionin (NEB) aufgenommen, mit 10 U BcgI versetzt und 1,5 h bei 37°C geschnitten. Die Reaktionen wurden mit Phenol, dann mit Chloroform extrahiert, mit Ethanol gefällt und in 13 µl NEbuffer 2 (NEB) gelöst. Nach Zugabe von 2 µl Gelladepuffer (20 mM Tris = HCl pH 7,9/2 mM EDTA/50% Glycerol/0,25% Bromphenolblau) wurde zur tag-Isolation neben einer 25 bp-Leiter als Längenstandard auf ein 20%-Polyacrylamidgel geladen (vgl. Current Protocols in Molecular Biology, Unit 2.7). Elektrophorese wurde bei einer Spannung von 2 V/cm durchgeführt und abgebrochen, sobald die Bromphenolblau-Front die Gelunterkante erreicht hatte. Die Apparatur wurde zerlegt, das Gel 30 min. mit Ethidiumbromid-Lösung angefärbt, 10 min. entfärbt und auf einem Transilluminator die die freigesetzten BcgI- Fragmente enthaltende 30 bp-Bande ausgeschnitten. Das erhaltene Polyacrylamid- Stückchen wurde durch mehrfaches Aufziehen durch eine Einwegspritze zerkleinert, mit TE-Puffer überschichtet und 3 h eluiert. Anschließend wurde abzentrifugiert und der Überstand mit Ethanol gefällt. Die Fragmente wurden in 5 µl eines Rapid DNA Ligation- Ansatzes (Roche) gelöst und 4 h bei Raumtemperatur konkatemerisiert. Es wurde mit Wasser auf 100 µl aufgefüllt, mit Phenol und Chloroform extrahiert und mit Ethanol gefällt. Das Pellet wurde in 50 µl 1 × T4-Polymerasepuffer mit 100 µM dNTPs gelöst und nach Zugabe von 2 U T4 DNA-Polymerase für 20 min. bei 12°C inkubiert. Die Reaktion wurde mit EDTA abgestoppt, mit Phenol/Chloroform extrahiert und mit Ethanol gefällt. Die nunmehr glatte Enden tragenden Konkatemere wurden in mit EcoRV linearisierten dephosphorylierten Vektor pBluescript II (Stratagene, Amsterdam, Niederlande) kloniert. Gemäß blau-weiß-Selektionierung auf IPTG/X-Gal-Platten positive Klone wurden mittels eines ABI 3700 Sequencers gemäß Herstellerangaben sequenziert. SEQUENCE LISTING









Claims (19)

1. Verfahren zur Erzeugung und Sequenzierung von Sequenz-tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren mit den folgenden Schritten:
1. Schneiden der doppelsträngigen DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease,
2. gegebenenfalls Isolierung der freigesetzten Nukleinsäure-tags,
3. Klonierung der erhaltenen Nukleinsäure-tags in einen tag-Vektor,
4. Durchführung einer Plasmid-Präparation,
5. Durchführung einer Fragmentpräparation, wobei die Sequenz der präparierten Fragmente aus den in (4a) erhaltenen Plasmiden, jeweils eines der in (3a) eingesetzten Nukleinsäure-tags sowie eines bereits zuvor im tag- Vektor enthaltenen Hybridisierungs-tags umfaßt,
6. Mindestens partielle Überführung der in der Fragmentpräparation aus (5a) enthaltenen doppelsträngigen Hybridisierungs-tags in einen einzelsträngigen Überhang,
7. Binden der in (6a) gewonnenen teilweise einzelsträngigen Nukleinsäurefragmente durch Hybridisierung an mikroskopische Partikel, welche jeweils eine Art einzelsträngiger Oligonukleotide an ihrer Oberfläche tragen,
8. Überführung der durch Hybridisierung beladenen Partikel aus (7a) in eine einlagige Schicht, und
9. parallele Sequenzierung der an die Partikel gebundenen Nukleinsäure-tags.
2. Verfahren zur Erzeugung und Sequenzierung von Sequenz-tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren mit den folgenden Schritten:
1. Schneiden doppelsträngiger DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease,
2. gegebenenfalls die Isolierung der freigesetzten Nukleinsäure-tags,
3. Anfügen von Bindungsstellen für Amplifikationsprimer an die erhaltenen Nukleinsäure-tags,
4. Amplifikation der mit Primerbindungsstellen versehenen Nukleinsäure-tags, wobei mindestens ein an eine feste Oberfläche gekoppelter Amplifikationsprimer zur Anwendung kommt,
5. gegebenenfalls das halbseitige Lösen der amplifizierten Nukleinsäure-tags von der Oberfläche,
6. parallele Sequenzierung der an die Oberfläche gebundenen amplifizierten Nukleinsäure-tags.
3. Verfahren zur Erzeugung und Sequenzierung von Sequenz-tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren mit den folgenden Schritten:
1. Schneiden der doppelsträngige DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease,
2. gegebenenfalls die Isolierung der freigesetzten Nukleinsäure-tags,
3. Anfügen von Bindungsstellen für Amplifikationsprimer an die erhaltenen Nukleinsäure-tags,
4. Amplifikation von mit Primerbindungsstellen versehenen Nukleinsäuretags,
5. parallele oder serielle Sequenzierung der amplifizierten Nukleinsäure-tags.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß aus einem Nukleinsäure-Gemisch jeweils mindestens zwei verschiedene tag-Bibliotheken mit identisch langen Nukleinsäure-Fragmenten unter Einsatz von jeweils mindestens zwei verschiedenen BcgI-ähnlichen Restriktionsendonukleasen hergestellt werden.
5. Verfahren zur Erzeugung und Sequenzierung von Sequenz-tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren mit den folgenden Schritten:
1. Schneiden der doppelsträngigen DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease,
2. gegebenenfalls die Isolierung der freigesetzten Nukleinsäure-tags,
3. Konkatemerisierung der erhaltenen Nukleinsäure-tags,
4. Klonerung der Konkatemere aus (3d),
5. Sequenzierung der Konkatemere.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Konkatemerisierung in Schritt (3d) ohne vorherige Dimerisierung erfolgt.
7. Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß die mittels Schnitt mit BcgI-ähnlichen Restriktionsendonukleasen erhaltenen Nukleinsäure-tags direkt über die Ligation ihrer überhängenden Enden konkatemerisiert werden.
8. Verfahren nach Anspruch 5 oder 6, dadurch gekennzeichnet, daß die überhängenden Enden der mittels Schnitt mit BcgI-ähnlichen Restriktionsendonukleasen erhaltenen Nukleinsäure-tags in Verfahrensschritt (3d) zunächst in glatte Enden überführt werden und anschließend die Konkatemerisierung durch Ligation dieser glatten Enden der Nukleinsäure-tags erfolgt.
9. Verfahren zur Erzeugung und Sequenzierung von Sequenz-tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren mit den folgenden Schritten:
1. Schneiden doppelsträngiger DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease,
2. gegebenenfalls die Isolierung der freigesetzten Nukleinsäure-tags,
3. Ligation der erhaltenen Nukleinsäure-tags mit doppelsträngigen DNA- Linkermolekülen, welche einen palindromischen sowie einen degenerierten Überhang besitzen, wobei der degenerierte Überhang an alle möglichen überhängenden Enden der BcgI-generierten tags ligierbar ist,
4. Phosphorylierung der Linker-Enden der Linker-flankierten Nukleinsäuretags und die anschließende Konkatemerisierung dieser Linker-flankierten Nukleinsäure-tags über ihre kohäsiven Enden,
5. Klonierung der Konkatemere in einen Vektor,
6. serielle Sequenzierung der Konkatemere.
10. Verfahren zur Erzeugung von Sequenz-tags einheitlicher Länge aus in einem Nukleinsäuregemisch enthaltenen Nukleinsäuren mit den folgenden Schritten:
1. Schneiden der doppelsträngigen DNA mit mindestens einer BcgI-ähnlichen Restriktionsendonuklease,
2. gegebenenfalls die Isolierung der freigesetzten Nukleinsäure-tags,
3. Anfügen von Bindungsstellen für Amplifikationsprimer an die erhaltenen Nukleinsäure-tags,
4. Amplifikation der mit Primerbindungsstellen versehenen Nukleinsäure-tags.
11. Verfahren nach einem der Ansprüche 5 bis 10, dadurch gekennzeichnet, daß aus einem Nukleinsäure-Gemisch jeweils mindestens zwei verschiedene tag-Konkatemer- Bibliotheken mit identisch langen Fragmenten unter Einsatz von jeweils mindestens zwei verschiedenen BcgI-ähnlichen Restriktionsendonukleasen hergestellt werden.
12. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die verwendete BcgI-ähnliche Restriktionsendonuklease ausgewählt ist aus der Gruppe BaeI, BcgI, BplI, BsaXI, Bsp24I, CjeI, CjePI.
13. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die der verwendete BcgI-ähnliche Restriktionsendonukleasen eine Typ IIs Restriktionsendonuklease, insbesondere AlwI, ist.
14. Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die verwendeten Bcgl-ähnlichen Restriktionsendonukleasen eine Kombination aus zwei Typ IIs Restriktionsendonukleasen oder aus einer Typ II- und einer Typ IIs- Restriktionsendonuklease, insbesondere ausgewählt aus der Gruppe MnlI, BseRI, BpmI, BsrI, BsgI und BtsI, sind.
15. Verfahren gemäß einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß als doppelsträngige DNA cDNA oder genomische DNA eingesetzt wird.
16. Verfahren gemäß einem der Ansprüche 1 bis 15, dadurch gekennzeichnet daß es zur Expressionsanalyse eingesetzt wird.
17. Verfahren gemäß einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß es zum Vergleich von Genomen eingesetzt wird.
18. Verfahren gemäß einem der Ansprüche 1 bis 15, dadurch gekennzeichnet, daß es zur Identifikation von Sequenzpolymorphismen, insbesondere zur Identifikation von SNPs, eingesetzt wird.
19. Nukleinsäure-Bibliothek, erhältlich nach den Verfahren gemäß einem der Ansprüche 1 bis 15.
DE10144132A 2001-09-07 2001-09-07 Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge Withdrawn DE10144132A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE10144132A DE10144132A1 (de) 2001-09-07 2001-09-07 Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge
AU2002339526A AU2002339526A1 (en) 2001-09-07 2002-09-06 Identification and quantification of nucleic acids by the production and serial sequencing of sequence tags having a uniform length
PCT/EP2002/010016 WO2003022986A2 (de) 2001-09-07 2002-09-06 Identifikation und quantifizierung von nukleinsäuren durch erzeugung und serielle sequenzierung von sequenz-tags einheitlicher länge

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10144132A DE10144132A1 (de) 2001-09-07 2001-09-07 Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge

Publications (1)

Publication Number Publication Date
DE10144132A1 true DE10144132A1 (de) 2003-03-27

Family

ID=7698218

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10144132A Withdrawn DE10144132A1 (de) 2001-09-07 2001-09-07 Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge

Country Status (3)

Country Link
AU (1) AU2002339526A1 (de)
DE (1) DE10144132A1 (de)
WO (1) WO2003022986A2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004033721A2 (de) * 2002-10-08 2004-04-22 Achim Fischer Hybridisierungsproben reduzierter komplexität
EP1723260A2 (de) * 2004-02-17 2006-11-22 Dana-Farber Cancer Institute Repräsentation von nukleinsäure unter verwendung von spaltprodukten der typ iib restriktionsendonuklease

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2248914A1 (de) * 2009-05-05 2010-11-10 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Die Verwendung von IIB-Restriktionsendonukleasen in Sequenzierungsanwendungen der zweiten Generation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6258533B1 (en) * 1996-11-01 2001-07-10 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5695937A (en) * 1995-09-12 1997-12-09 The Johns Hopkins University School Of Medicine Method for serial analysis of gene expression
US5981190A (en) * 1997-01-08 1999-11-09 Ontogeny, Inc. Analysis of gene expression, methods and reagents therefor
EP1024201B1 (de) * 1999-01-27 2003-11-26 Commissariat A L'energie Atomique Microassay zur Serienanalyse der Genexpression und Anwendungen davon
ATE423845T1 (de) * 1999-03-18 2009-03-15 Complete Genomics As Methoden zur klonierung und herstelung von kettenfragmenten mit lesbarem inhalt an information

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6258533B1 (en) * 1996-11-01 2001-07-10 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004033721A2 (de) * 2002-10-08 2004-04-22 Achim Fischer Hybridisierungsproben reduzierter komplexität
WO2004033721A3 (de) * 2002-10-08 2004-11-11 Achim Fischer Hybridisierungsproben reduzierter komplexität
EP1723260A2 (de) * 2004-02-17 2006-11-22 Dana-Farber Cancer Institute Repräsentation von nukleinsäure unter verwendung von spaltprodukten der typ iib restriktionsendonuklease
EP1723260A4 (de) * 2004-02-17 2008-05-28 Dana Farber Cancer Inst Inc Repräsentation von nukleinsäure unter verwendung von spaltprodukten der typ iib restriktionsendonuklease

Also Published As

Publication number Publication date
AU2002339526A1 (en) 2003-03-24
WO2003022986A3 (de) 2004-01-08
WO2003022986A2 (de) 2003-03-20

Similar Documents

Publication Publication Date Title
EP0743367B2 (de) Verfahren zur Genexpressionsanalyse
DE69627768T2 (de) Reihenanalyse-Verfahren der Genexpression
DE69737450T2 (de) Sequenzierung durch ligation kodierter adapter
DE102008025656B4 (de) Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
DE69738603T2 (de) Verfahren zur Herstellung von Banken vollständiger cDNAs
DE69233719T2 (de) Primer, Sätze und Restriktionsfragmente und deren Benutzung in selektiver Restriktionsfragmentenamplifikation
US5482845A (en) Method for construction of normalized cDNA libraries
DE69825240T2 (de) Verfahren zur subtraktiven hybridisierung und differenziellen analyse
EP1889925B1 (de) Einführung von Sequenzelementen in Nukleinsäuren
DE60213803T2 (de) Happier mapping
EP0597076B1 (de) Simultane sequenzierung von nukleinsäuren
EP0967274A2 (de) Verfahren zur Reinigung von kovalent geschlossenen DNA-Molekülen
AT502823A4 (de) Polynukleotid-amplifikation
EP1109935B1 (de) Zwei farben differential display als verfahren zur detektion regulierter gene
EP1327682A1 (de) Verfahren zur Herstellung von DNA
EP0645449B1 (de) Verfahren zur spezifischen Klonierung von Nukleinsäuren
DE10144132A1 (de) Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge
WO1999042610A1 (de) VERFAHREN ZUR CHARAKTERISIERUNG VON mRNA-MOLEKÜLEN
DE10051564A1 (de) Neue Verfahren zur parallelen Sequenzierung eines Nukleinsäuregemisches an einer Oberfläche
WO2004033721A2 (de) Hybridisierungsproben reduzierter komplexität
EP2706124B1 (de) Zeitgleicher Nachweis verschiedener Micro-RNA-Biogenese-Formen
DE69627862T2 (de) Gleichzeitige sequenzierung von markierten polynukleotiden
DE60318315T2 (de) Nukleinsäure vervielfältigungsverfahren
WO2003072819A2 (de) Analyse von nukleinsäure-fragmentmischungen un genexpressionsanalyse
DE602004008916T2 (de) Verfahren zur herstellung eines genexpressionsprofils

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8139 Disposal/non-payment of the annual fee