DE10060827A1 - Methods of coding hybridization probes - Google Patents

Methods of coding hybridization probes

Info

Publication number
DE10060827A1
DE10060827A1 DE10060827A DE10060827A DE10060827A1 DE 10060827 A1 DE10060827 A1 DE 10060827A1 DE 10060827 A DE10060827 A DE 10060827A DE 10060827 A DE10060827 A DE 10060827A DE 10060827 A1 DE10060827 A1 DE 10060827A1
Authority
DE
Germany
Prior art keywords
encoder
dna fragment
overhanging end
encoders
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE10060827A
Other languages
German (de)
Inventor
Achim Fischer
Dieter Newrzella
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sygnis Pharma AG
Original Assignee
BASF Lynx Bioscience AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Lynx Bioscience AG filed Critical BASF Lynx Bioscience AG
Priority to DE10060827A priority Critical patent/DE10060827A1/en
Priority to AU2002216078A priority patent/AU2002216078A1/en
Priority to PCT/EP2001/014391 priority patent/WO2002046457A2/en
Publication of DE10060827A1 publication Critical patent/DE10060827A1/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

The invention relates to a method for identifying nucleic acids which is characterized by the following steps: (a) providing at least one DNA fragment with one overhang having a known length and an unknown sequence, (b) attaching a determined encoder from a mixture of encoders that also has an overhang to the DNA fragment's overhang having an unknown sequence, the overhang of the attached encoder and the DNA fragment's overhang having an unknown sequence being completely complementary to each other, (c) optionally removing those encoders that were not attached to a DNA fragment in step (b), (d) labeling the attached product from step (b) unless already labeled encoders were used for attachment, (e) hybridizing the labeled attached product to an array of oligonucleotides which are substantially complementary to one of the strands of any encoder from the mixture of encoders or from a selection thereof.

Description

Das vorliegende Verfahren dient zur Codierung kurzer unbekannter Nukleinsäureabschnitte beliebiger Sequenz durch längere, voneinander möglichst stark verschiedene Nukleinsäureabschnitte, welche als Hybridisierungssonden eingesetzt werden können. Weiterer Gegenstand der Erfindung ist eine Anordnung von Oligonukleotiden auf einer Oberfläche, welche im wesentlichen komplementär zu allen möglichen Hybridisierungssonden oder einem Teil davon sind. Bevorzugte Anwendungsbereiche des erfindungsgemäßen Verfahrens sind die Expressionsanalyse sowie die Nukleinsäuresequenzierung.The present method is used to code short unknowns Nucleic acid sections of any sequence by longer, as strong as possible from one another various nucleic acid segments which are used as hybridization probes can. The invention also relates to an arrangement of oligonucleotides a surface that is essentially complementary to all possible Hybridization probes or a part thereof. Preferred areas of application of the Method according to the invention are the expression analysis and the Nucleic acid sequencing.

Aus dem Stand der Technik sind Verfahren bekannt, welche bekannte Sequenzabschnitte (sog. tags) zur Nukleinsäureanalytik einsetzen. Beispielsweise beschreiben Lee et al. (Proc. Natl. Acad. Sci. U.S.A. 1995 Aug 29; 92(18): 8303-7) ein Verfahren, ESTs (expressed sequence tags, also Abschnitte von cDNA-Molekülen) über ihre jeweiligen relativen Häufigkeiten in verschiedenen biologischen Proben zur vergleichenden Expressionsanalyse zu nutzen. Für dieses Verfahren werden jedoch sehr hohe Sequenzierungskapazitäten benötigt, da jedes sequenzierte tag eine individuelle Sequenzierreaktion benötigt. Mit erheblich geringeren Sequenzierungskapazitäten kommt das von Velculescu et al. beschriebene Verfahren des SAGE (serial analysis of gene expression; Science 1995 Oct 20; 270(5235): 484-7) aus, bei dem Restriktionsendonukleasen vom Typ IIs, welche doppelsträngige DNA außerhalb ihrer Erkennungssequenz schneiden können, zur Erzeugung kurzer tags eingesetzt werden. Diese kurzen tags werden dann konkateniert und kloniert, und die erhaltenen Klone werden anschließend sequenziert. Die geringe Länge besagter tags erlaubt die Bestimmung von bis zu etwa 25 tag-Sequenzen in einer einzigen Sequenzierungsreaktion, wodurch der Durchsatz gegenüber der herkömmlichen tag-Sequenzierung deutlich erhöht wird. Methods are known from the prior art which have known sequence sections Use (so-called tags) for nucleic acid analysis. For example, Lee et al. (Proc. Natl. Acad. Sci. U.S.A. 1995 Aug 29; 92 (18): 8303-7) a method, ESTs (expressed sequence tags, i.e. sections of cDNA molecules) via their respective relative frequencies in different biological samples for comparative purposes To use expression analysis. For this procedure, however, are very high Sequencing capacity is required, as each sequenced tag is an individual one Sequencing reaction required. Comes with significantly lower sequencing capacities that of Velculescu et al. SAGE (serial analysis of gene expression; Science 1995 Oct 20; 270 (5235): 484-7), in which Type IIs restriction endonucleases, which contain double-stranded DNA outside of their Cut recognition sequence can be used to generate short tags. These short tags are then concatenated and cloned, and the resulting clones are then sequenced. The short length of said tags allows the determination of up to about 25 tag sequences in a single sequencing reaction, whereby the Throughput compared to conventional tag sequencing is significantly increased.

Andererseits wird die tag-Länge so gewählt (beispielsweise 9 bp), daß jedes erhaltene tag eine ein bestimmtes Transkript eindeutig repräsentierende Sequenz aufweist. So ergeben sich beispielsweise im Falle einer tag-Länge von 9 bp 94 = 262.144 verschiedene Codierungsmöglichkeiten. Ist weiterhin die Position der untersuchten tags innerhalb der zu analysierenden Transkripte bekannt (beispielsweise in unmittelbarer Nachbarschaft der am weitesten zur Polyadenylierungsstelle hin liegenden Schnittstelle für ein weiteres Enzym), so ließen sich theoretisch 262.144 verschiedene Transkripte voneinander unterscheiden. In der Praxis ist diese Zahl allerdings geringer, da in der Natur nicht alle möglichen Sequenzen mit gleicher Häufigkeit auftreten.On the other hand, the tag length is chosen (for example 9 bp) so that each tag obtained has a sequence that uniquely represents a specific transcript. For example, in the case of a tag length of 9 bp 9 4 = 262,144 different coding options. If the position of the examined tags within the transcripts to be analyzed is known (for example in the immediate vicinity of the interface for another enzyme furthest from the polyadenylation site), then theoretically 262,144 different transcripts could be distinguished from one another. In practice, however, this number is lower, since not all possible sequences occur with the same frequency in nature.

Eine besondere Eigenschaft von DNA-Fragmentenden, welche durch Einwirkung einer Typ IIs-Restriktionsendonuklease generiert wurden, ist die Tatsache, daß einerseits Lage und Charakter der Enden (glatt oder überhängend; wenn überhängend, dann auch die Länge des einzelsträngigen Bereichs) bekannt sind, andererseits aber die Sequenz der Enden (terminale Basen sowie bei Überhängen die Sequenz des einzelsträngigen Bereichs) nicht vom Enzym determiniert wird. So erzeugt beispielsweise das Enzym FokI, welches die Sequenz GGATG erkennt, in 9 Basen Entfernung einen Schnitt in demjenigen Strang, der genannte Sequenz erhält, sowie in 13 Basen Entfernung im Gegenstrang einen weiteren Schnitt. Auf diese Weise entsteht ein vierbasiger Überhang durch die Wahl des Enzyms nicht unmittelbar beeinflußter Sequenz.A special property of DNA fragment ends, which by the action of a Type IIs restriction endonuclease generated is the fact that, on the one hand, location and character of the ends (smooth or overhanging; if overhanging, then so too Length of the single-stranded region) are known, but on the other hand the sequence of the Ends (terminal bases and, in the case of overhangs, the sequence of the single-stranded region) is not determined by the enzyme. For example, the enzyme FokI produces which the sequence GGATG recognizes a cut in the strand 9 bases away the sequence mentioned receives, as well as another 13 bases away in the opposite strand Cut. In this way, a four-base overhang is created by the choice of enzyme sequence not directly influenced.

Derartige durch Typ IIs-Enzyme erzeugte Überhänge bekannter Länge, aber unbekannter Sequenz können zur "Indexierung" von Fragmenten über einen Ligationsschritt verwendet werden. Kato beschreibt ein "Molecular Indexing" genanntes Verfahren (Nucleic Acids Res. 1996 Jan 15; 24(2): 394-5), bei welchem alle 64 möglichen Adapter eines Typs mit ihrem überhängenden Ende an die überhängenden Enden von mittels Typ IIs- Restriktionsendonukleasen aus cDNA-Molekülen gewonnenen Fragmenten ligiert werden. Dabei sind drei Basen des vierbasigen Überhangs der Adapter jeweils verschieden (43 = 64); die vierte Base wird degeneriert eingesetzt (Mischung aus allen vier möglichen Basen). Als Enzym wurde E.coli-Ligase gewählt, welche im Vergleich zu T4 DNA-Ligase eine deutlich höhere Diskriminierungsfähigkeit gegenüber "falschen" Ligationsereignissen (also gegenüber der Ligation nicht perfekt zueinander komplementärer Überhänge) besitzt. Kato lehrt die Verwendung "indexierter", von Überhang-spezifischen Adaptoren flankierter Restriktionsfragmente zur Expressionsanalyse, indem die relative Häufigkeit der einzelnen reamplifizierten und elektrophoretisch ihrer Größe nach aufgetrennten Fragmente in verschiedenen RNA-Proben verglichen wird.Such overhangs produced by type IIs enzymes of known length but of unknown sequence can be used to "index" fragments via a ligation step. Kato describes a method called "Molecular Indexing" (Nucleic Acids Res. 1996 Jan 15; 24 (2): 394-5), in which all 64 possible adapters of one type are connected with their overhanging ends by means of type IIs restriction endonucleases fragments obtained from cDNA molecules are ligated. Three bases of the four-base overhang of the adapter are each different (4 3 = 64); the fourth base is used in a degenerate manner (mixture of all four possible bases). E. coli ligase was chosen as the enzyme, which, compared to T4 DNA ligase, has a significantly higher ability to discriminate against "false" ligation events (i.e. overhangs that are not perfectly complementary to one another in the ligation). Kato teaches the use of "indexed" restriction fragments flanked by overhang-specific adapters for expression analysis by comparing the relative frequency of the individual reamplified and electrophoretically separated fragments in different RNA samples.

Zur Identifikation kurzer tags wäre alternativ zu ihrer Sequenzierung wie von Velculescu et al. beschrieben auch eine Hybridisierung denkbar. So könnte beispielsweise ein tag mit 8 Basen Länge in Gestalt eines markierten Oligonukleotids mit einer Kollektion aller 48 = 65.536 möglichen 8mer-Oligonukleotide hybridisiert werden, welche in Form eines DNA-arrays bereitgestellt werden. Zur Herstellung eines solchen arrays könnte man sich etwa der von Pease et al. beschriebenen Photolithographie-Technik bedienen. Ebenfalls möglich wäre eine Deposition separat synthetisierter Oligonukleotide auf einer Membran oder auf Glas, wie sie beispielsweise von Schena et al. (Science 1995 Oct 20; 270(5235): 467-70) beschrieben wird. Theoretisch sollte dann lediglich an derjenigen Stelle des arrays ein Hybridisierungssignal detektierbar sein, an welcher sich ein zum markierten Oligonukleotid vollständig komplementäres Oligonukleotid befindet. Diese Annahme liegt dem Konzept des Sequencing by Hybridization (SBH; Drmanac et al., Science 1993 Jun 11; 260(5114): 1649-52) zugrunde. In der Praxis hat sich allerdings gezeigt, daß die Hybridisierung solch kurzer Oligonukleotide beliebiger Sequenz selten zu hinreichend spezifischen Ergebnissen führt. Dies ergibt sich aus der Abhängigkeit der Schmelztemperatur eines Oligo- wie auch Polynukleotids von seinem G/C-Gehalt wie auch von seiner tatsächlichen Sequenz; so wird etwa ein Oligonukleotid der Sequenz G10T10 eine andere Schmelztemperatur aufweisen als ein Oligonukleotid der Sequenz (GT)10. Daher werden Experimente der oben skizzierten Art dadurch beeinträchtigt, daß neben dem gewünschten, auf spezifische Hybridisierung zurückgehenden Signal zahlreiche "falsch-positive" Signale, welche auf "Kreuzhybridisierung" nicht vollständig zueinander komplementärer Nukleinsäuremoleküle zurückgehen, detektiert werden. Begünstigt wird das Auftreten von Kreuzhybridisierungsereignissen auch durch die Tatsache, daß in einer Kollektion aller möglichen 4n Oligonukleotide der Längen naturgemäß zu jedem individuellen Oligonukleotid jeweils 3n andere Oligonukleotide existieren, von denen sich das betrachtete Oligonukleotid in lediglich genau einer Base unterscheidet und von denen durch Hybridisierung zuverlässig zu diskriminieren weitgehend unmöglich scheint. To identify short tags, an alternative to sequencing them as described by Velculescu et al. described hybridization is also conceivable. For example, a tag with a length of 8 bases in the form of a labeled oligonucleotide could be hybridized with a collection of all 4 8 = 65,536 possible 8-mer oligonucleotides, which are provided in the form of a DNA array. To produce such an array, one could refer to the method described by Pease et al. Use the photolithography technique described. It would also be possible to deposit separately synthesized oligonucleotides on a membrane or on glass, as described, for example, by Schena et al. (Science 1995 Oct 20; 270 (5235): 467-70). Theoretically, a hybridization signal should then only be detectable at that point on the array at which an oligonucleotide that is completely complementary to the labeled oligonucleotide is located. This assumption is based on the concept of sequencing by hybridization (SBH; Drmanac et al., Science 1993 Jun 11; 260 (5114): 1649-52). In practice, however, it has been shown that the hybridization of such short oligonucleotides of any sequence rarely leads to sufficiently specific results. This results from the dependence of the melting temperature of an oligo- and polynucleotide on its G / C content as well as on its actual sequence; For example, an oligonucleotide of the sequence G 10 T 10 will have a different melting temperature than an oligonucleotide of the sequence (GT) 10 . Experiments of the type outlined above are therefore adversely affected by the fact that, in addition to the desired signal due to specific hybridization, numerous "false-positive" signals are detected which are due to "cross-hybridization" of nucleic acid molecules that are not completely complementary to one another. The occurrence of cross-hybridization events is also favored by the fact that in a collection of all possible 4 n oligonucleotides of length there are naturally 3 n other oligonucleotides for each individual oligonucleotide, from which the oligonucleotide in question differs in just one base and from those due to hybridization to discriminate reliably seems largely impossible.

Dementsprechend bestand die Aufgabe der vorliegenden Erfindung darin, Oligonukleotid­ tags auf eine Weise zu codieren, daß für jedes tag einer vorgegebenen Länge eine Nukleinsäure bereitgestellt wird, welche erstens besagtes tag eindeutig definiert und zweitens zur Erzielung spezifischer Hybridisierungsereignisse eine möglichst geringe Tendenz zur Kreuzhybridisierung mit im gleichen Experiment bereitgestellten weiteren Nukleinsäuren aufweist.Accordingly, the object of the present invention was to oligonucleotide to encode tags in such a way that for each tag of a given length one Nucleic acid is provided which, firstly, clearly defines said tag and second, to achieve specific hybridization events as low as possible Tendency to cross-hybridize with others provided in the same experiment Having nucleic acids.

In einer ersten Ausführungsform wird daher ein Verfahren bereitgestellt, bestehend aus den folgenden Schritten:
In a first embodiment, a method is therefore provided, consisting of the following steps:

  • a) Bereitstellung mindestens eines DNA-Fragments mit einem überhängenden Ende bekannter Länge und unbekannter Sequenz,a) Provision of at least one DNA fragment with an overhanging one End of known length and unknown sequence,
  • b) Befestigung eines bestimmten Encoders aus einer Mischung von Encodern mit ebenfalls überhängendem Ende an dem überhängenden Ende unbekannter Sequenz des DNA-Fragments, wobei das überhängende Ende des befestigten Encoders und das überhängende Ende unbekannter Sequenz des DNA-Fragments vollständig komplementär zueinander sind,b) Fixing a specific encoder from a mix of encoders with also overhanging end at the overhanging end of unknown sequence of the DNA fragment, with the overhanging end of the attached encoder and the overhanging end of the unknown sequence of the DNA fragment is complete are complementary to each other,
  • c) gegebenenfalls Abtrennung derjenigen Encoder, welche in Schritt (b) an keinem DNA-Fragment befestigt wurden,c) if necessary, separation of those encoders which in step (b) were not connected to any DNA fragments have been attached,
  • d) Markierung des Befestigungsprodukts aus Schritt (b), sofern nicht bereits markierte Encoder zur Befestigung eingesetzt wurden,d) Marking of the fastening product from step (b), if not already marked Encoders were used for fastening,
  • e) Hybridisierung des markierten Befestigungsprodukts mit einem array von Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Encoder aus der Mischung von Encodern oder einer Auswahl hiervon sind.e) Hybridization of the labeled attachment product with an array of Oligonucleotides that are essentially complementary to one of the strands of all possible encoders from the mix of encoders or a selection of this are.

In einer zweiten Ausführungsform wird ein Verfahren bereitgestellt, bestehend aus den folgenden Schritten (vgl. Fig. 1):
In a second embodiment, a method is provided, consisting of the following steps (see. Fig. 1):

  • 1. Bereitstellung mindestens eines DNA-Fragments mit einem bekannten Ende,1. Provision of at least one DNA fragment with a known end,
  • 2. Befestigung mindestens eines Adaptors an besagtem Ende, wobei das Adaptor- Molekül Erkennungsstellen für mindestens eine erste und eine zweite Restriktionsendonuklease vom Typ IIs aufweist,2. Attachment of at least one adapter to said end, wherein the adapter Molecule recognition sites for at least a first and a second Has type IIs restriction endonuclease,
  • 3. Inkubation mit einer ersten Restriktionsendonuklease vom Typ IIs, welche innerhalb des am Adaptor befestigten DNA-Fragments schneidet und ein erstes überhängendes Ende unbekannter Sequenz erzeugt,3. Incubation with a first type II restriction endonuclease which cuts within the DNA fragment attached to the adapter and a first overhanging end of unknown sequence generated,
  • 4. Befestigung eines bestimmten ersten Encoders aus einer Mischung von ersten Encodern mit ebenfalls überhängendem Ende an das erste überhängende Ende unbekannter Sequenz des geschnittenen Befestigungsprodukts aus DNA-Fragment und Adaptor, wobei das überhängende Ende des befestigten ersten Encoders und das erste überhängende Ende unbekannter Sequenz des DNA-Fragments vollständig komplementär zueinander sind,4. Attachment of a specific first encoder from a mixture of the first Encoders with also overhanging end at the first overhanging end unknown sequence of the cut attachment product from DNA fragment and adapter, wherein the overhanging end of the attached first encoder and the first overhanging end of unknown sequence of the DNA fragment are completely complementary to each other,
  • 5. Inkubation mit einer zweiten Restriktionsendonuklease vom Typ IIs, welche zwischen dem in (b1) befestigten Adaptor und dem in (d1) befestigten Encoder schneidet und ein zweites überhängendes Ende unbekannter Sequenz erzeugt,5. Incubation with a second type II restriction endonuclease which between the adapter attached in (b1) and the encoder attached in (d1) cuts and creates a second overhanging end of unknown sequence,
  • 6. Befestigung eines bestimmten zweiten Encoders aus einer Mischung von zweiten Encodern mit ebenfalls überhängendem Ende an das zweite überhängende Ende unbekannter Sequenz des mit dem ersten Encoder verbundenen Rests des DNA-Fragments zu einem Dicoder, wobei das überhängende Ende des befestigten zweiten Encoders und das zweite überhängende Ende unbekannter Sequenz des Rests des DNA-Fragments vollständig komplementär zueinander sind,6. Attachment of a certain second encoder from a mixture of second encoders with also overhanging end to the second Overhanging end of unknown sequence of the first encoder connected remainder of the DNA fragment to a dicoder, where the overhanging end of the attached second encoder and the second overhanging end of unknown sequence of the remainder of the DNA fragment are completely complementary to each other,
  • 7. optional Proofreading der in (f1) erzeugten Dicoder,7. optional proofreading of the dicoder generated in (f1),
  • 8. Markierung der Dicoder, sofern nicht bereits markierte Encoder zur Befestigung eingesetzt wurden, 8. Marking of the dicoder, if not already marked encoders for fastening were used,
  • 9. Hybridisierung eines der beiden Dicoder-Stränge mit einem array von Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Dicoder oder einer Auswahl hiervon sind,9. Hybridization of one of the two dicoder strands with an array of Oligonucleotides that are essentially complementary to one of the strands are all possible dicoders or a selection of them,
  • 10. Ermittlung derjenigen Oligonukleotide des arrays, mit denen markierte Dicoder-Stränge hybridisiert haben, sowie ggf. eine Quantifizierung der hybridisierten Menge an markierten Dicoder-Strängen,10. Determination of those oligonucleotides of the array with which marked Dicoder strands have hybridized, and possibly a quantification of the hybridized amount of labeled dicoder strands,
  • 11. Zuordnung der in (j1) erhaltenen Information über Hybridisierungsereignisse zu den in (c1) und in (e1) erzeugten unbekannten Fragmentenden sowie Assemblierung der identifizierten Teilsequenzen zu einer das DNA-Fragment aus Schritt (a1) charakterisierenden Sequenz.11. Assignment of the information obtained in (j1) about Hybridization events to the unknowns generated in (c1) and in (e1) Fragment ends and assembly of the identified partial sequences into one the sequence characterizing the DNA fragment from step (a1).

Bei dem DNA-Fragment mit einem bekannten Ende in Schritt (a1) handelt es sich um einen doppelsträngigen Nukleinsäureabschnitt beliebiger Herkunft, welcher mindestens ein eindeutig definiertes Ende aufweist. Eindeutig definiert meint, daß das Ende entweder glatt ist oder einen einzelsträngigen Überhang bekannter Länge und gegebenenfalls bekannter Sequenz aufweist. Beispielsweise kann das DNA-Fragment aus genomischer DNA oder doppelsträngiger cDNA gewonnen werden. Selbstverständlich können auch andere Nukleinsäurearten, beispielsweise Heterohybride aus RNA und DNA oder artifizielle Nukleinsäuren, im erfindungsgemäßen Verfahren eingesetzt werden, vorausgesetzt sie sind mit den durchzuführenden enzymatischen Schritten kompatibel. Jedenfalls wird besagtes bekannte Ende bevorzugterweise durch Behandlung mit einer Restriktionsendonuklease erzeugt, welche entweder einen einzelsträngigen Überhang bekannter Länge und gegebenenfalls bekannter Sequenz oder aber ein glattes Ende erzeugt. Alternativ hierzu kann das Ende auf nicht-sequenzspezifische Weise erzeugt werden, beispielsweise durch mechanische Scherung oder durch Exonuklease-Behandlung, erforderlichenfalls gefolgt von einer Reparatur der Enden zu glatten Enden. In einer bevorzugten Anwendung zur Expressionsanalyse handelt es sich bei dem DNA-Fragment um eine Mischung verschiedener mit einer Restriktionsendonuklease geschnittener doppelsträngiger cDNA- Moleküle. Zur eindeutigen Positionierung der Schnittstelle kann das jeweils vom 3'-Ende oder vom 5'-Ende eines jeden cDNA-Moleküls stammende Restriktionsfragment über Kopplung an eine feste Phase, beispielsweise magnetische Partikel, isoliert werden. The DNA fragment with a known end in step (a1) is a double-stranded nucleic acid segment of any origin, which at least one has a clearly defined end. Clearly defined means that the end is either smooth or a single-stranded overhang of known length and possibly known Having sequence. For example, the DNA fragment from genomic DNA or double-stranded cDNA can be obtained. Of course, others can too Nucleic acid types, for example heterohybrids from RNA and DNA or artificial ones Nucleic acids, are used in the method according to the invention, provided they are compatible with the enzymatic steps to be performed. In any case, it will be said known end preferably by treatment with a restriction endonuclease generated which either a single-stranded overhang of known length and possibly known sequence or a smooth end is generated. Alternatively to this the tail can be generated in a non-sequence specific manner, for example by mechanical shear or exonuclease treatment followed if necessary from repairing the ends to smooth ends. In a preferred application for For expression analysis, the DNA fragment is a mixture different double-stranded cDNA cut with a restriction endonuclease Molecules. To clearly position the interface, this can be done from the 3 'end or restriction fragment derived from the 5 'end of each cDNA molecule Coupling to a solid phase, for example magnetic particles, are isolated.

Außerdem ist es möglich, in parallelen Ansätzen verschiedene Restriktionsenzyme zur Erzeugung von DNA-Fragmenten mit bekanntem Ende einzusetzen. Die Auswertung der mit diesen Parallelansätzen erhaltenen Ergebnisse ermöglicht dann die Erzeugung redundanter Datensätze, welche sich aufeinander beziehen lassen und die Zuordnung bestimmter tags zu dem zugehörigen Nukleinsäuremolekül erleichtern. Wird beispielsweise bei der Anwendung des erfindungsgemäßen Verfahrens zur Expressionsanalyse ein 8mer-tag identifiziert, welches 5-fache Regulation des zugehörigen Gens anzeigt und welches eine Signalstärke von 40% der höchsten gemessenen Signalstärke zeigt, welches aber gemäß den Resultaten einer Datenbanksuche von zwei verschiedenen Genen abstammen könnte, so würden die Ergebnisse eines mit einem anderen Restriktionsenzym durchgeführten Parallelexperiments daraufhin untersucht, welches zweite tag (welches in diesem Fall sehr wahrscheinlich eine andere, unbekannte Sequenz aufweist) dieselben Eigenschaften in Hinblick auf Signalstärke und apparenten Regulationsfaktor aufweist. Beide tags stammen sehr wahrscheinlich vom selben Gen ab und erlauben nunmehr seine eindeutige Identifikation.It is also possible to use different restriction enzymes in parallel approaches Use the generation of DNA fragments with a known end. The evaluation of the The results obtained with these parallel approaches then enable the generation redundant data records that can be related to each other and the assignment certain tags to the associated nucleic acid molecule. Will for example when using the method according to the invention for Expression analysis identified an 8mer tag, which 5-fold regulation of the associated Gens and which has a signal strength of 40% of the highest measured Signal strength shows which but according to the results of a database search of two different genes, the results would be one with one another restriction enzyme carried out parallel experiment examined, which second day (which in this case very likely another, unknown Sequence) has the same properties in terms of signal strength and apparent Has regulation factor. Both tags are most likely derived from the same gene and now allow its unambiguous identification.

In einer weiteren bevorzugten Anwendung zur Sequenzierung durch Hybridisierung (SBH) handelt es sich um ein durch ein bekanntes Verfahren erzeugtes glattes Ende an unbekannter Position (beispielsweise durch Scherung oder Deletionsklonierung erzeugt; vgl. Maniatis et al.) innerhalb der zu analysierenden Nukleinsäuremoleküle, welche in diesem Fall beispielsweise aus cDNA-Klonen oder genomischen Klonen stammen können.In another preferred application for sequencing by hybridization (SBH) it is a smooth end an produced by a known method unknown position (e.g. generated by shear or deletion cloning; cf. Maniatis et al.) within the nucleic acid molecules to be analyzed, which are described in in this case, for example, can originate from cDNA clones or genomic clones.

Bei dem Adptor in Schritt (b1) handelt es sich in der Regel um ein Hybrid zweier mindestens teilweise zueinander komplementärer Nukleinsäurestränge. Hierbei kann es sich etwa um zwei synthetische Oligonukleotide, genauso aber auch um einen Plasmid- oder Phagenvektor handeln. Bevorzugterweise weist der Adaptor ein erstes Ende auf, welches sich am bekannten Ende des DNA-Fragments aus (a1) befestigen läßt, insbesondere durch Ligation, und ein zweites Ende, welches sich unter den gegebenen Bedingungen nicht befestigen läßt. Beispielsweise kann das erste Ende einen zum Ende des DNA-Fragments komplementären Überhang aufweisen, während das zweite Ende glatt ist oder sich durch eine ein- oder mehrbasige Fehlpaarung auszeichnet. Weiterhin weist der Adaptor Erkennungsstellen für mindestens zwei Restriktionsendonukleasen vom Typ IIs auf, welche gegen ihre Erkennungsstellen versetzte überhängende Enden erzeugen. Ein Sonderfall besteht dann, wenn zwei IIs-Restriktionsendonukleasen mit verschiedener Schneidecharakteristik identische Erkennungsstellen besitzen; in diesem Fall fallen beide Erkennungsstellen auf dem Adaptor zusammen. Jedenfalls sind beide Erkennungsstellen derart angeordnet, daß bei Inkubation des durch Befestigung des Adaptors entstandenen Produkts mit jeweils einer der beiden Restriktionsendonukleasen mindestens einer, bevorzugt beide Stränge des aus dem DNA-Fragment stammenden Bereichs des behandelten Nukleinsäuremoleküls geschnitten werden. Dabei ist bevorzugt, daß die durch besagte Schnitte entstehenden unbekannten ersten und zweiten Überhänge nicht miteinander überlappen, und besonders bevorzugt, daß die Überhänge unmittelbar aneinander grenzen. "Nicht überlappen" und "aneinander grenzen" bezieht sich auf die Position der Schnitte auf jedem der beiden Stränge des Doppelstrangs und ist in Fig. 1 illustriert, wo beide Überhänge "MMMM" und "NNNN" aneinander grenzen. Alternativ zur Befestigung eines von Anfang an doppelsträngigen Adaptors wäre denkbar, einzelsträngige Oligonukleotide mit besagtem Überhang des Fragmentendes hybridisieren zu lassen und nach erfolgter Hybridisierung zu befestigen, etwa durch einen Ligationsschritt. In einem nächsten Schritt könnte dann die Ergänzung des Einzelstrangs zu einem Doppelstrang durch eine DNA-Polymerase erfolgen (vgl. Fig. 4). Da viele Polymerasen stark gegen Fehlpaarungen am zu verlängernden 3'-Ende einer Nukleinsäure diskriminieren, wäre auch diese Vorgehensweise gut geeignet, um eine hinreichend hohe Spezifität des Befestigungsschritts zu gewährleisten.The adapter in step (b1) is generally a hybrid of two nucleic acid strands that are at least partially complementary to one another. This can be about two synthetic oligonucleotides, but also a plasmid or phage vector. The adapter preferably has a first end which can be attached to the known end of the DNA fragment from (a1), in particular by ligation, and a second end which cannot be attached under the given conditions. For example, the first end can have an overhang that is complementary to the end of the DNA fragment, while the second end is smooth or is characterized by a one- or multi-base mismatch. Furthermore, the adapter has recognition sites for at least two restriction endonucleases of type IIs, which produce overhanging ends offset from their recognition sites. A special case exists when two IIs restriction endonucleases with different cutting characteristics have identical recognition sites; in this case, both detection points on the adapter coincide. In any case, both recognition sites are arranged in such a way that when the product created by attaching the adapter is incubated with one of the two restriction endonucleases, at least one, preferably both strands of the region of the treated nucleic acid molecule derived from the DNA fragment are cut. It is preferred that the unknown first and second overhangs produced by said cuts do not overlap with one another, and it is particularly preferred that the overhangs directly adjoin one another. "Do not overlap" and "abut" refer to the position of the cuts on each of the two strands of the duplex and is illustrated in Figure 1 where both overhangs "MMMM" and "NNNN" are contiguous. As an alternative to attaching an adapter that is double-stranded from the start, it would be conceivable to allow single-stranded oligonucleotides to hybridize with said overhang of the fragment end and to attach them after hybridization has taken place, for example by a ligation step. In a next step, the single strand could be supplemented to form a double strand using a DNA polymerase (cf. FIG. 4). Since many polymerases strongly discriminate against mismatches at the 3 'end of a nucleic acid to be extended, this procedure would also be well suited to ensure a sufficiently high specificity of the attachment step.

Die Encoder aus Schritt (d1) und (f1) zeichnen sich durch einen doppelsträngigen Bereich sowie einen einzelsträngigen Überhang aus, wobei der einzelsträngige Überhang in der Regel die gleiche Länge aufweist wie der in Schritt (c1) bzw. (e1) erzeugte unbekannte erste bzw. zweite einzelsträngige Überhang der DNA-Fragmente. Ebenfalls wichtig ist die gleichsinnige Orientierung des Überhangs: handelt es sich beim Überhang der DNA- Fragmente um einen 3'-Überhang, so sollen auch die Encoder einen 3'-Überhang besitzen, besitzen die Fragmente einen 5'-Überhang, so müssen sich die Encoder ebenfalls durch einen 5'-Überhang auszeichnen. Sofern gewünscht, kann ein oder können beide Stränge der Encoder markiert sein, beispielsweise durch Fluoreszenzfarbstoffe. Weiterhin können die Encoder erforderlichenfalls für eine Amplifikation erforderliche Sequenzen besitzen, beispielsweise die Sequenz für einen Promotor einer DNA-abhängigen RNA-Polymerase wie etwa T7 RNA-Polymerase oder Primerbindungssequenzen für PCR-Primer. Die Befestigung der Encoder erfolgt bevorzugt durch enzymatische Ligation, wobei die Ligationsbedingungen (Temperatur, Pufferzusammensetzung, Dauer der Ligation, Konzentrationen von Enzym sowie miteinander zu verbindender Nukleinsäuren) derart gewählt werden, daß "unspezifische" Ligationsereignisse (also die Ligation nicht vollständig zueinander komplementärer Überhänge) so weit wie möglich unterdrückt werden. Ein wichtiger Aspekt ist in diesem Zusammenhang auch die Wahl der Ligase; so sind die DNA-Ligasen aus E.coli sowie aus Thermus aquaticus und Thermus thermophilus bekannt für eine höhere Ligationsgenauigkeit als die weit verbreitete DNA-Ligase des Phagen T4. Im übrigen ist es wie oben für den Adaptor beschrieben möglich, zunächst einen Encoder-Einzelstrang an das jeweilige überhängende Ende zu hybridisieren und den entsprechenden Gegenstrang anschließend durch eine Auffüllreaktion zu erzeugen.The encoders from steps (d1) and (f1) are characterized by a double-stranded area and a single-stranded overhang, the single-stranded overhang in the Rule has the same length as the unknown generated in step (c1) or (e1) first or second single-stranded overhang of the DNA fragments. That is also important Orientation of the overhang in the same direction: is the overhang of the DNA Fragments around a 3 'overhang, so the encoders should also have a 3' overhang, if the fragments have a 5 'overhang, the encoders must also get through mark a 5 'overhang. If desired, one or both of the strands can be used the encoder be marked, for example by fluorescent dyes. Furthermore you can the encoders have the sequences required for amplification, if necessary, for example the sequence for a promoter of a DNA-dependent RNA polymerase such as T7 RNA polymerase or primer binding sequences for PCR primers. the The encoder is preferably fastened by enzymatic ligation, the Ligation conditions (temperature, buffer composition, duration of the ligation, Concentrations of enzyme and nucleic acids to be linked) such be chosen that "unspecific" ligation events (i.e. not the ligation completely complementary overhangs) are suppressed as far as possible will. An important aspect in this context is the choice of ligase; so are the DNA ligases from E. coli as well as from Thermus aquaticus and Thermus thermophilus known for a higher ligation accuracy than the widely used DNA ligase des Phage T4. Otherwise, as described above for the adapter, it is initially possible hybridize a single encoder strand to the respective overhanging end and the then generate the corresponding counter-strand by a filling reaction.

Eine Mischung von Encodern besteht aus Encodern mit mehreren, vorzugsweise allen möglichen, verschiedenen Überhängen eines bestimmten Typs (5'-Überhang oder 3'- Überhang) sowie einer bestimmten Länge. Eine Mischung von Encodern mit einem 4- basigen Überhang enthält dementsprechend vorzugsweise 44 = 256 verschiedene Encoder, welche alle möglichen vierbasigen Überhänge des jeweiligen Typs tragen. Hierbei ist für das erfindungsgemäße Verfahren von entscheidender Bedeutung, daß sich in ihrem Überhang unterscheidende Encoder in der Regel auch deutlich in ihrem doppelsträngigen Bereich unterscheiden. Der Begriff "deutlich unterscheiden" meint hierbei, daß unter geeigneten Hybridisierungsbedingungen kein Strang eines Encoders merkliche Doppelstrangbildung mit einem Strang eines anderen Encoders zeigt. Eine weitere bevorzugte Eigenschaft aller eine Mischung bildenden Encoder besteht in ihrer untereinander möglichst ähnlichen Hybridisierungskinetik und Hybridisierungsthermodynamik. Um diese Eigenschaft zu ermöglichen, werden alle eine Mischung bildenden Encoder in der Regel die gleiche Länge und den gleichen G/C-Gehalt, beispielsweise 50%, aufweisen. Einzelsträngige Oligonukleotide, die derartige Eigenschaften aufweisen, wurden beispielsweise von Brenner in der US-A 5,635,400 beschrieben.A mixture of encoders consists of encoders with several, preferably all possible, different overhangs of a certain type (5 'overhang or 3' overhang) and a certain length. A mixture of encoders with a 4-base overhang accordingly preferably contains 4 4 = 256 different encoders, which carry all possible 4-base overhangs of the respective type. It is of decisive importance for the method according to the invention that encoders differing in their overhang generally also differ significantly in their double-stranded area. The term “clearly differentiate” here means that, under suitable hybridization conditions, no strand of an encoder shows noticeable double strand formation with a strand of another encoder. Another preferred property of all encoders forming a mixture consists in their hybridization kinetics and hybridization thermodynamics that are as similar as possible to one another. To enable this property, all encoders forming a mixture will generally have the same length and the same G / C content, for example 50%. Single-stranded oligonucleotides which have such properties have been described, for example, by Brenner in US Pat. No. 5,635,400.

Mit vollständig komplementär ist gemeint, daß mindestens ein zuvor festgelegter Teilbereich beider Überhänge gemäß der bekannten Basenpaarungsregel hybridisieren kann. Eingeschlossen ist hier die Möglichkeit, "degenerierte" Basen (vgl. Kato) oder "universelle" Basen wie beispielsweise Inosin zuzulassen, welche die Hybridisierung mit mehreren verschiedenen Basen des Gegenstrangs erlauben. Um eine ausreichend hohe Ligationstreue zu erreichen, ist es wichtig, die oben beschriebenen Ligationsparameter sorgfältig einzustellen.By fully complementary it is meant that at least one predetermined Hybridize part of both overhangs according to the known base pairing rule can. Included here is the possibility of "degenerate" bases (cf. Kato) or "Universal" bases such as inosine to allow the hybridization with allow several different bases of the opposite strand. To a sufficiently high To achieve ligation fidelity, it is important to use the ligation parameters described above set carefully.

In Schritt (e1) wird ein zweites überhängendes Ende unbekannter Sequenz erzeugt, welches im wesentlichen zwischen dem in Schritt (b1) befestigten Adaptor und dem in Schritt (c1) erzeugten ersten unbekannten überhängenden Ende liegt. Dabei ist es möglich, daß besagtes zweites überhängendes Ende mit der Sequenz des Adaptors und/oder der Sequenz des überhängenden Endes aus Schritt (c1) überlappt oder durch eine oder mehrere Basen von diesen Sequenzen entfernt liegt. Bevorzugt ist jedoch, daß das zweite überhängende Ende aus Schritt (e1) wie in Fig. 1 dargestellt unmittelbar an die Sequenz des ersten überhängenden Endes aus Schritt (c1) grenzt und nicht mit der Sequenz des Adaptors überlappt.In step (e1) a second overhanging end of unknown sequence is generated, which essentially lies between the adapter attached in step (b1) and the first unknown overhanging end generated in step (c1). It is possible that said second overhanging end overlaps with the sequence of the adapter and / or the sequence of the overhanging end from step (c1) or is separated from these sequences by one or more bases. However, it is preferred that the second overhanging end from step (e1), as shown in FIG. 1, directly adjoins the sequence of the first overhanging end from step (c1) and does not overlap with the sequence of the adapter.

Die in (f1) gebildeten doppelsträngigen Dicoder bestehen aus einem Rest des DNA- Fragments aus Schritt (a1), gewöhnlich etwa 4-16 Basenpaare lang, welcher von erstem und zweitem Encoder flankiert ist. Bevorzugterweise wird ein Teil des Rests des DNA- Fragments durch den im Zuge der Befestigung des ersten Encoders in Schritt (d1) zum Doppelstrang ergänzten ersten einzelsträngigen Überhang aus Schritt (c1) und der gesamte übrige Teil durch den im Zuge der Befestigung des zweiten Encoders in Schritt (f1) zum Doppelstrang ergänzten zweiten einzelsträngigen Überhang aus Schritt (e1) gebildet. The double-stranded dicoders formed in (f1) consist of a remainder of the DNA Fragment from step (a1), usually about 4-16 base pairs long, which of the first and the second encoder is flanked. Preferably, part of the remainder of the DNA Fragment through the process of attaching the first encoder in step (d1) to the Double strand added the first single strand overhang from step (c1) and the entire remaining part by the in the course of fastening the second encoder in step (f1) to Double-stranded second single-stranded overhang from step (e1) formed.

Das optionale Proofreading der Dicoder dient zur Unterdrückung auf Hybridisierung nicht vollständig zueinander komplementärer Überhänge in den Schritten (d1) und (f1) zurückgehender Dicoderspezies. Ein bekanntes Verfahren zum Proofreading im Sinne der Eliminierung teilweise fehlgepaarter Sequenzen besteht etwa im Einsatz von MutS, einem Fehlpaarungen erkennenden Protein, mit anschließender Exonuklease-Behandlung (Mutat. Res. 1997 Mar 21; 374(2): 277-85). Der Schritt des Proofreading ist allerdings dann verzichtbar, wenn die in Schritten (d1) und (f1) erzielte Befestigungsspezifität hinreichend groß ist. Ist die Befestigungsspezifität andererseits so gering, daß nach erfolgtem Proofreading ein für die Hybridisierung in Schritt (i1) nicht mehr ausreichender Anteil aller gebildeten Dicoder zur Verfügung steht, so kann eine Amplifikation der keine Fehlpaarungen aufweisenden Dicoder durchgeführt werden. Bevorzugterweise erfolgt die Amplifikation mittels einer RNA-Polymerase durch wiederholtes Umschreiben des Dicoder-Doppelstrangs in einzelsträngige (und in der Regel markierte, siehe Schritt (h1)) RNA. Eine Amplifikation kann aber ebenfalls mittels PCR oder anderer Verfahren vorgenommen werden.The optional proofreading of the dicoder is not used to suppress hybridization completely complementary overhangs in steps (d1) and (f1) declining dicoder species. A well-known method for proofreading in the sense of Elimination of partially mismatched sequences consists, for example, in the use of MutS, a Mismatching protein, with subsequent exonuclease treatment (Mutat. Res. 1997 Mar 21; 374 (2): 277-85). The step of proofreading is then, however dispensable if the fastening specificity achieved in steps (d1) and (f1) is sufficient is great. On the other hand, if the specificity of the attachment is so low that after it has taken place Proofreading is a proportion that is no longer sufficient for the hybridization in step (i1) of all formed dicoders is available, an amplification of none Mismatched dicoders are performed. Preferably takes place Amplification by means of an RNA polymerase by repeated transcription of the Dicoder double strand into single stranded (and usually marked, see step (h1)) RNA. However, amplification can also be carried out using PCR or other methods be made.

Die Markierung der Dicoder in Schritt (h1) kann durch Befestigung mindestens einer nachweisbaren Markierungsgruppe an einem oder beiden Strängen der Dicoder erfolgen. Bevorzugt werden fluoreszierende Markierungsgruppen eingesetzt, aber der Einsatz anderer nicht-radioaktiver oder radioaktiver Markierungsgruppen ist ebenfalls denkbar. Eine Alternative zur Befestigung der Markierungsgruppen an bereits existierende Nukleinsäurestränge besteht in der replikativen Neusynthese von Nukleinsäuresträngen, bei denen die existierenden Nukleinsäurestränge als Template dienen und markierte Nukleinsäurebausteine (Primermoleküle oder Nukleotide) eingesetzt werden. Eine solche Neusynthese kann durch eine DNA-Polymerase (beispielsweise DNA-Polymerase I, Klenow-Enzym oder eine thermostabile DNA-Polymerase) oder eine RNA-Polymerase (z. B. T7 RNA-Polymerase) katalysiert werden; dabei muß bei Verwendung einer RNA- Polymerase dafür gesorgt werden, daß die zu markierenden Dicoder eine geeignete Promotorsequenz aufweisen. Im übrigen ist es aber auch möglich, bereits zur Befestigung markierte Encoder einzusetzen, welche beispielsweise schon im Zuge ihrer Synthese mit Fluoreszenzgruppen versehen worden sind. Dabei wäre naheliegend, bereits über die Wahl der Markierungsgruppe Information zu codieren, beispielsweise die Natur einer ausgewählten Base des Überhangs.The marking of the dicoder in step (h1) can be achieved by attaching at least one detectable marker group on one or both strands of the dicoder. Fluorescent marking groups are preferably used, but the use other non-radioactive or radioactive labeling groups are also conceivable. An alternative to attaching the marking groups to existing ones Nucleic acid strands consists in the replicative new synthesis of nucleic acid strands, in which the existing nucleic acid strands serve as templates and are labeled Nucleic acid building blocks (primer molecules or nucleotides) are used. Such New synthesis can be carried out by a DNA polymerase (e.g. DNA polymerase I, Klenow enzyme or a thermostable DNA polymerase) or an RNA polymerase (e.g. T7 RNA polymerase) are catalyzed; when using an RNA- Polymerase ensures that the dicoder to be labeled has a suitable Have promoter sequence. Otherwise, however, it is also possible already for attachment to use marked encoders, which, for example, already in the course of their synthesis with Fluorescent groups have been provided. It would be obvious to already have a choice the tag group to encode information, for example the nature of a selected base of the overhang.

Bei dem array von Oligonukleotiden in (i1) handelt es sich um eine in bekannter Anordung auf einer Oberfläche vorliegende Kollektion von hybridisierungsfähigen Nukleinsäuren (DNA, RNA, PNA, oder Derivate hiervon), welche an der Oberfläche erzeugt oder dort abgelegt worden sein kann. Besagte Kollektion umfaßt alle zu einem Strang der möglichen Dicoder komplementären Sequenzen oder einen bekannten Teil hiervon.The array of oligonucleotides in (i1) is one in known Arrangement on a surface present collection of hybridizable Nucleic acids (DNA, RNA, PNA, or derivatives thereof) that are on the surface may have been generated or stored there. Said collection includes all to one Strand of the possible dicoder complementary sequences or a known part of this.

Die Hybridisierung und Ermittlung derjenigen Oligonukleotide auf dem array, mit denen markierte Encoder-Stränge hybridisiert haben, können auf bekannte Weise erfolgen (vgl. Schena et al.). Dabei ist bei der Anwendung des erfindungsgemäßen Verfahrens zur Expressionsanalyse eine Quantifizierung der Hybridisierungssignale bevorzugt. Bei der Anwendung zur Sequenzierung durch Hybridisierung hingegen ist eine Quantifizierung meistens nicht erforderlich, obschon hierdurch, falls gewünscht, eine Unterscheidung echt­ positiver Signale von beispielsweise durch Kreuzhybridisierung entstandenen falsch- positiven Signalen vorgenommen werden kann.The hybridization and identification of those oligonucleotides on the array with which have hybridized marked encoder strands, can be done in a known manner (cf. Schena et al.). When using the method according to the invention for Expression analysis a quantification of the hybridization signals is preferred. In the Application for sequencing by hybridization, however, is a quantification mostly not necessary, although this makes a distinction genuine, if desired positive signals from false- positive signals can be made.

Die Zuordnung der über die Hybridisierungsereignisse erhaltenen Informationen zu den in (c1) sowie in (e1) erzeugten unbekannten überhängenden Fragmentenden stellt eine Decodierung dar, nämlich die Umkehr der durch den Schritt der Encoderbefestigung vorgenommenen Codierung der Fragmentenden. Jedes spezifische Hybridisierungsereignis eines bestimmten markierten Dicoders repräsentiert hierbei einen bestimmten, an einem ersten Encoder befestigten ersten Überhang sowie einen bestimmten, an einem zweiten Encoder befestigten zweiten Überhang und somit jeweils eine Teilsequenz des in (a1) bereitgestellten DNA-Fragments, so daß das Ergebnis einer Hybridisierung schließlich die Information über alle in (c1) bzw. (e1) erzeugten und nachfolgend an den zugehörigen Encodern befestigten überhängenden Fragmentenden liefert. Weiterhin kann für jede Fragmentspezies der jeweilige erste Überhang dem jeweiligen zweiten Überhang zugeordnet werden, so daß für jedes DNA-Fragment charakteristische Sequenzinformation gewonnen wird. In einer bevorzugten Ausführungsform grenzen für jedes DNA-Fragment die mittels des ersten Encoders und die mittels des zweiten Encoders erkannten Teilsequenzen unmittelbar aneinander, so daß jedem einzelnen Hybridisierungssignal eine zusammenhängende, das jeweilige Fragment charakterisierende Sequenz, ein tag, zugeordnet werden kann. Wird einem Hybridisierungssignal beispielsweise die durch den ersten Encoder erkannte Sequenz 5'-AACC-3' und die durch den zweiten Encoder erkannte Sequenz 5'-CCTT-3' zugeordnet und grenzen beide Sequenzen im im Dicoder enthaltenen Rest des DNA-Fragments unmittelbar aneinander, so ergibt sich 5'- AACCAAGG-3' als die das entsprechende DNA-Fragment charakterisierende tag- Sequenz. Die so erhaltenen Sequenzen lassen sich immer dann verwenden, wenn DNA- Fragmente anhand kürzerer Teilsequenzen erkannt werden sollen. Dies ist beispielsweise dann der Fall, wenn im Rahmen einer Expressionsanalyse die relative Häufigkeit von Transkripten in verschiedenen biologischen Proben untersucht werden soll. Das erfindungsgemäße Verfahren erlaubt die Identifikation und Quantifizierung von Transkripten über die sie repräsentierenden tags, wobei die relative Quantifizierung über die Messung von Signalstärken nach der Hybridisierung erfolgt.The assignment of the information obtained about the hybridization events to the in (c1) as well as unknown overhanging fragment ends generated in (e1) represents a Decoding, namely the reversal of the step of attaching the encoder made coding of the fragment ends. Any specific hybridization event of a certain marked dicoder represents a certain one on one first encoder attached first overhang and a certain one on a second Encoder attached the second overhang and thus each part of the sequence in (a1) provided DNA fragment, so that the result of a hybridization ultimately the Information about all generated in (c1) or (e1) and subsequently sent to the associated Encoders attached overhanging fragment ends supplies. Furthermore, for each Fragment species the respective first overhang the respective second overhang are assigned, so that sequence information characteristic of each DNA fragment is won. In a preferred embodiment, borders for each DNA fragment those recognized by means of the first encoder and those recognized by means of the second encoder Partial sequences directly to one another, so that each individual hybridization signal one contiguous sequence characterizing the respective fragment, one tag, can be assigned. For example, if a hybridization signal is provided by the sequence 5'-AACC-3 'recognized by the first encoder and the sequence recognized by the second encoder recognized sequence assigned 5'-CCTT-3 'and border both sequences in the dicoder the rest of the DNA fragment contained directly next to one another, the result is 5'- AACCAAGG-3 'as the tag characterizing the corresponding DNA fragment Sequence. The sequences obtained in this way can always be used when DNA Fragments are to be recognized using shorter partial sequences. This is for example then the case when, in the context of an expression analysis, the relative frequency of Transcripts in different biological samples should be examined. That The method according to the invention allows the identification and quantification of Transcripts using the tags they represent, with the relative quantification using the measurement of signal strengths takes place after the hybridization.

Erforderlichenfalls können zwischen einzelnen der oben beschriebenen Verfahrensschritte auf dem Fachmann geläufige Weise zusätzliche Reinigungsschritte bzw. Schritte der Entfernung nicht umgesetzter Edukte oder unerwünschter Reaktionsprodukte vorgenommen werden, beispielsweise die Reinigung von unbefestigt gebliebenen Adaptoren in Schritt (b1) oder unbefestigt gebliebenen Encodern in Schritt (d1) oder (f1). Eine Möglichkeit hierzu besteht in einer Endauffüllungsreaktion, zu der biotinylierte Nukleotide eingesetzt werden, gefolgt von der Kopplung biotinylierter Moleküle an Festphasen-gebundenes Streptavidin. Hierbei muß allerdings gewährleistet sein, daß die gewünschten Ligationsprodukte keine auffüllbaren Enden aufweisen. Unligiert gebliebene Adaptoren oder Encoder können auch durch Bindung des ligierten DNA-Fragments an eine feste Phase, gefolgt von einem oder mehreren Waschschritten, entfernt werden. Auch denkbar wäre ein Aufschmelzen der nicht ligierten Encoder unter Bedingungen, unter denen die Ligationsprodukte noch doppelsträngig vorliegen, gefolgt von physikalischer Trennung von Doppel- und Einzelsträngen, oder durch enzymatischen Abbau von Einzelsträngen.If necessary, you can choose between the individual process steps described above in a manner familiar to those skilled in the art, additional purification steps or steps of Removal of unreacted starting materials or undesired reaction products can be carried out, for example the cleaning of unpaved roads Adapters in step (b1) or unattached encoders in step (d1) or (f1). One way of doing this is to use a final fill-up reaction to which biotinylated Nucleotides are used, followed by the coupling of biotinylated molecules to Solid-phase-bound streptavidin. Here, however, it must be ensured that the desired ligation products do not have any fillable ends. Unligged Adapters or encoders can also be used by binding the ligated DNA fragment to a solid phase followed by one or more washes may be removed. Even A melting of the non-ligated encoder would be conceivable under conditions under where the ligation products are still double-stranded, followed by physical ones Separation of double and single strands, or by enzymatic degradation of Single strands.

In einer dritten Ausführungsform wird ein Verfahren bereitgestellt, bestehend aus den folgenden Schritten (vgl. Fig. 2):
In a third embodiment, a method is provided, consisting of the following steps (see. Fig. 2):

  • 1. Bereitstellung mindestens eines DNA-Fragments mit einem ersten überhängenden Ende bekannter Länge und unbekannter Sequenz,1. Provision of at least one DNA fragment with a first overhanging end of known length and unknown sequence,
  • 2. Befestigung eines bestimmten ersten Encoders aus einer Mischung von ersten Encodern mit ebenfalls überhängendem Ende am ersten überhängenden Ende des DNA-Fragments, wobei das überhängende Ende des befestigten ersten Encoders und das erste überhängende Ende des DNA-Fragments vollständig komplementär zueinander sind und wobei besagter erster Encoder eine Erkennungsstelle für eine überhängende Enden erzeugende Typ IIs Restriktionsendonuklease aufweist, welche derart orientiert und positioniert ist, daß bei Inkubation des Befestigungsprodukts aus erstem Encoder und DNA- Fragment mit besagter Typ IIs Restriktionsendonuklease ein zweites überhängendes Ende erzeugt wird, welches mindestens unter anderem Basen des DNA-Fragments enthält, die kein Bestandteil des überhängenden Endes in Schritt (a2) waren und deren Komplement ebenfalls kein Bestandteil des überhängenden Endes in Schritt (a2) war,2. Attachment of a specific first encoder from a mixture of the first Encoders with an overhanging end at the first overhanging end of the DNA fragment, with the overhanging end of the attached first encoder and the first overhanging end of the DNA fragment completely are complementary to each other and wherein said first encoder is a Identification point for type IIs that produce overhanging ends Has restriction endonuclease which is oriented and positioned in such a way that that upon incubation of the attachment product from the first encoder and DNA A second fragment with said type IIs restriction endonuclease overhanging end is generated, which at least among other bases of the Contains DNA fragment that is not part of the overhanging end in step (a2) and their complement were also not part of the overhanging Ended in step (a2),
  • 3. Inkubation mit einer Typ IIs-Restriktionsendonuklease, die die im ersten Encoder in Schritt (b2) enthaltene Erkennungsstelle erkennt und welche auf die in Schritt (b2) beschriebene Weise schneidet,3. Incubation with a type IIs restriction endonuclease that contains the in the first Encoder detects the identification point contained in step (b2) and which points to the in Step (b2) intersects the manner described,
  • 4. Befestigung eines bestimmten zweiten Encoders aus einer Mischung von zweiten Encodern mit ebenfalls überhängendem Ende am zweiten überhängenden Ende des DNA-Fragments zu einem Dicoder, wobei das überhängende Ende des ligierten zweiten Encoders und das zweite überhängende Ende des DNA-Fragments vollständig komplementär zueinander sind,4. Attachment of a certain second encoder from a mixture of second encoders with also overhanging end at the second overhanging end of the DNA fragment to a dicoder, the overhanging end of the ligated second encoder and the second overhanging End of the DNA fragment are completely complementary to each other,
  • 5. Optional Proofreading der in (d2) erzeugten Dicoder,5. Optional proofreading of the dicoder generated in (d2),
  • 6. Markierung der Dicoder, sofern nicht bereits mindestens ein markierter Encoder zur Befestigung eingesetzt wurde,6. Marking of the dicoder, if not already at least one marked encoder was used for fastening,
  • 7. Hybridisierung eines der beiden Dicoder-Stränge mit einem array von Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Dicoder oder einer Auswahl hiervon sind,7. Hybridization of one of the two dicoder strands with an array of Oligonucleotides that are essentially complementary to one of the strands are all possible dicoders or a selection of them,
  • 8. Ermittlung derjenigen Oligonukleotide des arrays, mit denen markierte Dicoder-Stränge hybridisiert haben, sowie ggf. eine Quantifizierung der hybridisierten Menge an markierten Dicoder-Strängen,8. Determination of those oligonucleotides of the array with which marked Dicoder strands have hybridized, and possibly a quantification of the hybridized amount of labeled dicoder strands,
  • 9. Zuordnung der in (g2) erhaltenen Information über Hybridisierungsereignisse zu den in (a2) bereitgestellten und den in (c2) erzeugten Fragmentenden sowie Assemblierung der identifizierten Teilsequenzen zu einer das DNA-Fragment aus Schritt (a2) charakterisierenden Sequenz.9. Assignment of the information obtained in (g2) about Hybridization events to those provided in (a2) and those in (c2) generated fragment ends and assembly of the identified partial sequences to a sequence characterizing the DNA fragment from step (a2).

Zur Erzeugung des ersten überhängenden Endes bekannter Länge und unbekannter Sequenz in Schritt (a2) könnte das zu untersuchende DNA-Fragment wie in der US-A 5,710,000 beschrieben mit einer Typ IIs-Restriktionsendonuklease behandelt werden. Die dort beschriebene Vorgehensweise hat allerdings den Nachteil, daß die Orientierung und damit die relative Position der Erkennungsstelle zur Schnittstelle unbekannt bleibt. Bevorzugt ist daher, zunächst an einem bekannten Ende gemäß Schritt (a1) wie unter Schritt (b1) beschrieben einen Adaptor zu befestigen, welcher in diesem Fall allerdings lediglich mindestens eine Erkennungsstelle für eine erste Restriktionsendonuklease vom Typ IIs aufweisen muß. Inkubation des Befestigungsprodukts mit dieser Typ IIs- Restriktionsendonuklease erzeugt dann das in Schritt (a2) bereitzustellende Ende. In jedem Fall handelt es sich um einen doppelsträngigen Nukleinsäureabschnitt beliebiger Herkunft, welcher bevorzugterweise an eindeutig definierter Position endet. Beispielsweise kann das DNA-Fragment aus genomischer DNA oder doppelsträngiger cDNA gewonnen werden. Es können auch andere Nukleinsäurearten, beispielsweise Heterohybride aus RNA und DNA oder artifizielle Nukleinsäuren, im erfindungsgemäßen Verfahren eingesetzt werden, vorausgesetzt sie sind mit den durchzuführenden enzymatischen Schritten kompatibel. Neben identischen DNA-Fragmenten können selbstverständlich auch beliebig komplexe Mischungen verschiedener DNA-Fragmente eingesetzt werden, vorausgesetzt obige Eigenschaften treffen auf sie zu. In einer bevorzugten Anwendung handelt es sich bei den DNA-Fragmenten um eine Mischung mit einer Restriktionsendonuklease geschnittener cDNA-Moleküle oder um entsprechend vorbereitete Klone einer cDNA- oder genomischen Bank. Zur eindeutigen Identifikation der Schnittstelle kann das jeweils vom 3'-Ende oder vom 5'-Ende eines jeden cDNA-Moleküls stammende Restriktionsfragment über Kopplung an eine feste Phase, beispielsweise magnetische Partikel, isoliert werden.To create the first overhanging end of known length and unknown Sequence in step (a2) could include the DNA fragment to be examined as in US Pat. No. 5,710,000 described to be treated with a type IIs restriction endonuclease. the However, the procedure described there has the disadvantage that the orientation and so that the relative position of the recognition site to the interface remains unknown. It is therefore preferred initially at a known end in accordance with step (a1) as under Step (b1) describes attaching an adapter, which in this case, however only at least one recognition site for a first restriction endonuclease from Type IIs must have. Incubation of the fixation product with this Type IIs- Restriction endonuclease then generates the end to be provided in step (a2). In each Case it is a double-stranded nucleic acid segment of any origin, which preferably ends at a clearly defined position. For example, this can DNA fragment can be obtained from genomic DNA or double-stranded cDNA. It can also use other types of nucleic acids, for example heterohybrids composed of RNA and DNA or artificial nucleic acids, are used in the method according to the invention, provided they are compatible with the enzymatic steps to be performed. In addition to identical DNA fragments, any number of complexes can of course also be used Mixtures of different DNA fragments are used, provided the above Properties apply to them. In a preferred application, the DNA fragments cleaved by a mixture with a restriction endonuclease cDNA molecules or appropriately prepared clones of a cDNA or genomic Bank. For unambiguous identification of the interface, this can be done from the 3 'end or restriction fragment derived from the 5 'end of each cDNA molecule Coupling to a solid phase, for example magnetic particles, are isolated.

In einer vierten Ausführungsform wird ein Verfahren bereitgestellt, bestehend aus den folgenden Schritten (vgl. Fig. 3):
In a fourth embodiment, a method is provided, consisting of the following steps (see. Fig. 3):

  • 1. Bereitstellung mindestens eines DNA-Fragments mit überhängendem Ende bekannter Länge und unbekannter Sequenz,1. Provision of at least one DNA fragment with a protruding end known length and unknown sequence,
  • 2. Befestigung eines bestimmten Encoders aus einer Mischung von Encodern mit ebenfalls überhängendem Ende am überhängenden Ende des DNA-Fragments, wobei das überhängende Ende des ligierten Encoders und das überhängende Ende des DNA-Fragments vollständig komplementär zueinander sind,2. Fixing a specific encoder from a mix of encoders with also overhanging end at the overhanging end of the DNA fragment, wherein the overhanging end of the ligated encoder and the overhanging end of the DNA fragment are completely complementary to each other,
  • 3. Optional Proofreading der in (b3) erzeugten Befestigungsprodukte,3. Optional proofreading of the fastening products created in (b3),
  • 4. Optional Abtrennung des gesamten DNA-Fragments oder eines Teils davon vom befestigten Encoder durch Behandlung mit einer geeigneten Restriktionsendonuklease,4. Optional separation of all or part of the DNA fragment from the attached encoder by treating it with a suitable Restriction endonuclease,
  • 5. Markierung des Befestigungsprodukts aus (b3), sofern nicht bereits markierte Encoder zur Befestigung eingesetzt wurden, 5. Marking of the fastening product from (b3), if not already marked Encoders were used for fastening,
  • 6. Hybridisierung eines der beiden Encoder-Stränge mit einem array aus Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Encoder oder einer Auswahl hiervon sind,6. Hybridization of one of the two encoder strands with an array Oligonucleotides that are essentially complementary to one of the strands of all possible encoders or a selection of them,
  • 7. Ermittlung derjenigen Oligonukleotide auf dem array, mit denen markierte Encoder-Stränge hybridisiert haben, sowie ggf. eine Quantifizierung der hybridisierten Menge an markierten Encoder-Strängen,7. Determination of those oligonucleotides on the array with which marked Encoder strands have hybridized, and possibly a quantification of the hybridized amount of marked encoder strands,
  • 8. Zuordnung der in (g3) erhaltenen Information über Hybridisierungsereignisse unter Zugrundelegung der Sequenzinformation über die in (b3) eingesetzten ersten Encoder zu dem in (a3) bereitgestellten überhängenden Fragmentende.8. Assignment of the information obtained in (g3) about Hybridization events based on the sequence information about the first encoder used in (b3) to the one provided in (a3) overhanging fragment end.

Die optionale Abtrennung des gesamten DNA-Fragments oder eines Teils davon erfolgt bevorzugterweise mittels einer Restriktionsendonuklease. Diese kann ihre Erkennungsstelle beispielsweise im in Schritt (b3) befestigten Encoder besitzen (vgl. Fig. 3). Die Abtrennung dient zur Erhöhung der Hybridisierungsspezifität in Schritt (f3), da so die Gefahr unerwünschter Kreuzhybridisierung des DNA-Fragments mit Oligonukleotiden des arrays vermieden wird. Dies gilt insbesondere für eine Markierung über Primerextension oder mittels einer RNA-Polymerase, weil die Strangverlängerung der erzeugten Sondenmoleküle dann nur bis zum Ende des vom DNA-Fragment abgetrennten Encoders erfolgen kann (vgl. Abb. 3).The optional separation of the entire DNA fragment or a part thereof is preferably carried out by means of a restriction endonuclease. This can have its identification point, for example, in the encoder attached in step (b3) (cf. FIG. 3). The separation serves to increase the hybridization specificity in step (f3), since in this way the risk of undesired cross-hybridization of the DNA fragment with oligonucleotides of the array is avoided. This applies in particular to labeling via primer extension or by means of an RNA polymerase, because the strand extension of the probe molecules generated can then only take place up to the end of the encoder separated from the DNA fragment (see Fig. 3).

Die Markierung des ligierten Encoders erfolgt analog zum oben über die Markierung der Dicoder in Schritt (h1) gesagten.The ligated encoder is marked analogously to the above using the marking of the Dicoder said in step (h1).

Zur Durchführung der oben beschriebenen Verfahren wird weiterhin ein array zu allen möglichen codierenden Nukleinsäuren komplementärer Nukleinsäuren bereitgestellt, bevorzugt auf einem festen Träger wie beispielsweise Glas oder Kunststoff Weiterer Gegenstand der Erfindung ist die Anwendung wie beschrieben codierter Nukleinsäuren zur Identifikation von tags über Hybridisierung.To carry out the procedure described above, an array is still added to all possible coding nucleic acids of complementary nucleic acids provided, preferably on a solid support such as glass or plastic Another object of the invention is the application encoded as described Nucleic acids for identification of tags via hybridization.

In einer bevorzugten Anwendung wird das erfindungsgemäße Verfahren zur Expressionsanalyse eingesetzt.In a preferred application, the method according to the invention is used for Expression analysis used.

In einer weiteren bevorzugten Anwendung wird das erfindungsgemäße Verfahren zur Sequenzierung durch Hybridisierung (SBH) eingesetzt. In a further preferred application, the method according to the invention is used for Sequencing by hybridization (SBH) used.

Die Erfindung wird durch die Zeichnungen näher erläutert.The invention is explained in more detail by the drawings.

Es zeigtIt shows

Fig. 1 die tag-Codierung mittels zweier Typ IIs-Erkennungsstellen in "Tandem- Anordnung" auf einem Adaptor Fig. 1, the tag-coding by means of two Type IIs recognition sites in "Tandem arrangement" on an adapter

Fig. 2 die tag-Codierung mittels zweier separater Typ IIs-Erkennungsstellen, von denen eine auf einem Adaptor und die andere auf dem ersten Encoder liegt Fig. 2, the tag-coding by two separate type IIs recognition sites, one of which is located on an adapter and the other on the first encoder

Fig. 3 die tag-Codierung mittels einer einzigen Typ IIs-Erkennungsstelle, welche auf einem Adaptor liegt Fig. 3, the tag-coding by means of a single type IIs recognition site, which is located on an adapter

Fig. 4 die tag-Codierung mittels einer einzigen Typ IIs-Erkennungsstelle, welche sich auf dem zu analysierenden DNA-Molekül befindet Fig. 4, the tag-coding by means of a single type IIs recognition site, which is located on the analyte DNA molecule

Fig. 1 zeigt die tag-Codierung mittels zweier separater Typ IIs-Erkennungsstellen, von denen eine auf einem Adaptor und die andere auf dem ersten Encoder liegt, wobei im einzelnen Fig. 1 shows the tag-coding by two separate type IIs recognition sites, one of which is located on an adapter and the other on the first encoder, wherein the individual

11 primärer Restriktionsverdau doppelsträngiger Festphasen-gekoppelter cDNA und Fortwaschen nicht-immobilisierter Fragmente,primary restriction digestion of double-stranded solid phase-coupled cDNA and washing away of non-immobilized fragments, 22 Adaptorligation an die cDNA-3'-Fragmente,Adapter ligation to the cDNA 3 'fragments, 33rd sekundärer Restriktionsverdau mit einer Typ IIs-Endonuklease, deren Erkennungsstelle Adaptor-codiert ist,secondary restriction digest with a type IIs endonuclease whose recognition site is adapter-coded, 44th Ligation eines ersten Encoders,Ligation of a first encoder, 55 tertiärer Restriktionsverdau mit einer Typ IIs-Endonuklease, deren Erkennungsstelle Adaptor-codiert ist,tertiary restriction digestion with a type IIs endonuclease whose recognition site is adapter-coded, 66th Ligation eines zweiten Encoders,Ligation of a second encoder, 77th in vitro-Transkription und Markierung bedeutet.means in vitro transcription and labeling.

Fig. 2 veranschaulicht die tag-Codierung mittels zweier separater Typ IIs- Erkennungsstellen, von denen eine auf einem Adaptor und die andere auf dem ersten Encoder liegt, wobei im einzelnen FIG. 2 illustrates the tag coding by means of two separate type IIs recognition sites, one of which is on an adapter and the other on the first encoder, with in detail

11 primärer Restriktionsverdau doppelsträngiger Festphasen-gekoppelter cDNA und Fortwaschen nicht-immobilisierter Fragmente,primary restriction digestion of double-stranded solid phase-coupled cDNA and washing away of non-immobilized fragments, 22 Ablösung von der Festphase und Adaptor-Ligation,Detachment from the solid phase and adapter ligation, 33rd sekundärer Restriktionsverdau mit einer Typ IIs-Endonuklease, deren Erkennungsstelle Adaptor-codiert ist,secondary restriction digest with a type IIs endonuclease whose recognition site is adapter-coded, 44th Ligation eines ersten Encoders,Ligation of a first encoder, 55 tertiärer Restriktionsverdau mit einer Typ IIs-Endonuklease, deren Erkennungsstelle Encoder-codiert ist,tertiary restriction digestion with a type IIs endonuclease whose recognition site is encoder-coded, 66th Ligation eines zweiten Encoders,Ligation of a second encoder, 77th in vitro-Transkription und Markierung darstellt.represents in vitro transcription and labeling.

Fig. 3 zeigt die tag-Codierung mittels einer einzigen Typ IIs-Erkennungsstelle, welche auf einem Adaptor liegt, wobei im einzelnen Fig. 3 shows the tag coding by means of a single type IIs recognition site, which is located on an adapter, with in detail

11 primärer Restriktionsverdau doppelsträngiger Festphasen-gekoppelter cDNA und Fortwaschen nicht-immobilisierter Fragmente,primary restriction digestion of double-stranded solid phase-coupled cDNA and washing away of non-immobilized fragments, 22 Adaptor-Ligation,Adapter ligation, 33rd sekundärer Restriktionsverdau mit einer Typ IIs-Endonuklease, deren Erkennungsstelle Adaptor-codiert ist,secondary restriction digest with a type IIs endonuclease whose recognition site is adapter-coded, 44th Ablösung von der Festphase und Ligation eines ersten Encoders,Replacement of the solid phase and ligation of a first encoder, 55 tertiärer Restriktionsverdau mit einer Endonuklease, deren Erkennungsstelle Encoder-codiert ist,tertiary restriction digestion with an endonuclease whose recognition site is encoder-coded, 66th in vitro-Transkription und Markierung darstellt.represents in vitro transcription and labeling.

Fig. 4 stellt die tag-Codierung mittels einer einzigen Typ IIs-Erkennungsstelle dar, welche sich auf dem zu analysierenden DNA-Molekül befindet, wobei im einzelnen Fig. 4 illustrates the tag-coding by means of a single type IIs recognition site is which is located on the analyte DNA molecule, wherein the individual

11 die Befestigung eines einzelsträngigen Encoders,the attachment of a single-strand encoder, 22 die Auffüllung zum doppelsträngigen Encoder durch Endauffüllung zeigt.shows the filling to the double-strand encoder by final filling.

Die Erfindung wird im folgenden durch die Beispiele näher erläutert.The invention is illustrated in more detail below by means of the examples.

Beispiel 1example 1 Vorbereitung von 3'-terminalen cDNA-FragmentenPreparation of 3 'terminal cDNA fragments

20 µg Gesamt-RNA aus Rattenleber wurde zur Fällung mit 0,1 Vol. Natriumacetat pH 5,2 versetzt und mit 2,5 Vol. Ethanol gefällt. Das Pellet wurde in 31 µl Wasser und 1 µl 10 µM biotinyliertem cDNA-Primer Bio-CP28 V (5'-Biotin- ACCTACGTGCAGATTTTTTTTTTTTTTTTTTV-3'; ARK, Darmstadt) gelöst, dann 10 Minuten bei 65°C denaturiert und auf Eis gestellt. Die Mischung wurde mit 12 µl 5 × Superscript-Puffer (Life Technologies GmbH, Karlsruhe), 3 µl 10 mM dNTPs, 6 µl 100 mM Dithiothreitol (Life Technologies GmbH), 1,2 µl RNase Inhibitor (40 U/µl; Roche Molecular Biochemicals, Mannheim) und 2 µl Superscript II (200 U/µl, Life Technologies) versetzt und zur Erststrangsynthese 1 Stunde bei 42°C inkubiert. Die Zweitstrangsynthese erfolgte gemäß Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons. Es wurden 96 µl Zweitstrang-Puffer, 300 µl H2O, 7 µl 10 mM dNTPs, 2,4 µl RNaseH (1,5 U/µl, Promega GmbH, Mannheim) und 12 µl DNA Polymerase I (10 U/µl, New England Biolabs GmbH; Schwalbach) hinzugefügt, gemischt, und die Reaktionen wurden 2 Stunden bei 22°C inkubiert. Es wurde mit 150 µl Phenol und mit 150 µl Chloroform extrahiert und mit 0,1 Vol. Natriumacetat pH 5,2 und 2,5 Vol. Ethanol gefällt. Das Pellet wurde in einem Restriktionsansatz aus 15 µl 10 × Universal buffer, 2 µl MboI (4 U/µl; Stratagene, Heidelberg) und 84 µl H2O gelöst und die Reaktion 1 Stunde bei 37°C inkubiert. Es wurde mit 100 µl Phenol und mit 100 µl Chloroform extrahiert und nach der Zugabe von 0,1 Vol. Natriumacetat pH 5,2 mit 2,5 Vol. Ethanol gefällt. Das Pellet wurde in 15 µl eines Ligationsansatz aus 2 µl Adaptor MBF2420 (1 µg/µl), 1,3 µl 10 × Ligationspuffer (Roche Molecular Biochemicals), 2 µl 10 mM ATP (Roche Molecular Biochemicals) und 1 µl T4 DNA Ligase (1 U/µl, Roche Molecular Biochemicals) gelöst und die Ligation über Nacht bei 16°C vorgenommen. Es wurde mit 10 µl Wasser und 25 µl 2 × Binding- and Washing Buffer (Dynal, Oslo) versetzt. Nach Zugabe von 0,2 mg M-280 Streptavidin-Dynabeads (Dynal, Oslo) wurde unter regelmäßigem Invertieren 20 Min. bei Raumtemperatur inkubiert. Es wurde zweimal mit je 50 µl Binding- and Washing Buffer, danach mit 50 µl Wasser gewaschen.For precipitation, 20 μg of total RNA from rat liver were mixed with 0.1 vol. Sodium acetate pH 5.2 and precipitated with 2.5 vol. Ethanol. The pellet was dissolved in 31 μl of water and 1 μl of 10 μM biotinylated cDNA primer Bio-CP28 V (5'-biotin-ACCTACGTGCAGATTTTTTTTTTTTTTTTTTTV-3 '; ARK, Darmstadt), then denatured for 10 minutes at 65 ° C and placed on ice. The mixture was mixed with 12 μl of 5 × Superscript buffer (Life Technologies GmbH, Karlsruhe), 3 μl of 10 mM dNTPs, 6 μl of 100 mM dithiothreitol (Life Technologies GmbH), 1.2 μl of RNase inhibitor (40 U / μl; Roche Molecular Biochemicals, Mannheim) and 2 µl Superscript II (200 U / µl, Life Technologies) and incubated for 1 hour at 42 ° C for first strand synthesis. The second strand synthesis was carried out according to Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons. 96 µl second strand buffer, 300 µl H 2 O, 7 µl 10 mM dNTPs, 2.4 µl RNaseH (1.5 U / µl, Promega GmbH, Mannheim) and 12 µl DNA polymerase I (10 U / µl, New England Biolabs GmbH; Schwalbach), mixed, and the reactions were incubated for 2 hours at 22 ° C. It was extracted with 150 μl of phenol and with 150 μl of chloroform and precipitated with 0.1 vol. Sodium acetate pH 5.2 and 2.5 vol. Ethanol. The pellet was dissolved in a restriction mixture of 15 μl of 10 × universal buffer, 2 μl of MboI (4 U / μl; Stratagene, Heidelberg) and 84 μl of H 2 O and the reaction was incubated at 37 ° C. for 1 hour. It was extracted with 100 μl of phenol and with 100 μl of chloroform and, after the addition of 0.1 vol. Sodium acetate pH 5.2, precipitated with 2.5 vol. Ethanol. The pellet was in 15 µl of a ligation mixture consisting of 2 µl adapter MBF2420 (1 µg / µl), 1.3 µl 10 × ligation buffer (Roche Molecular Biochemicals), 2 µl 10 mM ATP (Roche Molecular Biochemicals) and 1 µl T4 DNA ligase ( 1 U / μl, Roche Molecular Biochemicals) and the ligation was carried out at 16 ° C. overnight. 10 μl of water and 25 μl of 2 × binding and washing buffer (Dynal, Oslo) were added. After adding 0.2 mg of M-280 streptavidin-Dynabeads (Dynal, Oslo), the mixture was incubated for 20 minutes at room temperature with regular inverting. It was washed twice with 50 µl each of binding and washing buffer, then with 50 µl water.

Beispiel 2Example 2 Herstellung von Adaptor und EncodernManufacture of adapters and encoders

Zur Adaptor- bzw. Encoder-Herstellung wurden die jeweils zwei zueinandergehörigen Oligonukleotide (ARK, Darmstadt) in Wasser gelöst und in 1 × T4 DNA-Ligationspuffer auf eine Gesamt-DNA-Konzentration von 1 µg/µl eingestellt. Dann wurde im Heizblock auf 95°C erwärmt, der Heizblock ausgeschaltet und langsam auf Raumtemperatur abgekühlt. Die so hergestellte Doppelstrang-DNA wurde bei -20°C gelagert.For the manufacture of adapters and encoders, the two associated Oligonucleotides (ARK, Darmstadt) dissolved in water and placed in 1 × T4 DNA ligation buffer adjusted to a total DNA concentration of 1 µg / µl. Then it was in the heating block heated to 95 ° C, the heating block switched off and slowly to room temperature cooled down. The double-stranded DNA produced in this way was stored at -20.degree.

Die Oligonukleotide waren:
The oligonucleotides were:

Beispiel 3Example 3 Codierung mittels eines DecodersCoding by means of a decoder

1 µl Bluescript SK+ DNA (1 µg/µl) wurde mit 48 µl NEBuffer 4 (New England Biolabs) versetzt. Nach Zugabe von 1 µl FokI (4 u/µl; New England Biolabs) wurde 1 h bei 37°C inkubiert. Das Enzym wurde 20 min. bei 65°C denaturiert, dann wurde mit je 100 µl Phenol und mit 100 µl Chloroform extrahiert. Nach Zugabe von 0,1 Vol. 3 M Natriumacetat pH 5,2 wurde mit 2,5 Vol. Ethanol gefällt. Es wurde in 9 µl 1 × Taq DNA Ligase-Puffer aufgenommen, welcher je 25 ng der Encoder 2-T7-AATT, 2-T7-CAGG, 2- T7-GCGA und 2-T7-TCGT enthielt. Nach Zugabe von 1 µl Taq DNA Ligase (4 U/µl; New England Biolabs) wurde 15 min. bei 16°C inkubiert. Es wurde mit 90 µl Wasser verdünnt und mit Phenol und Chloroform extrahiert. Zur Abtrennung unligierter Encoder wurde nach Zugabe von 10 µg Glycogen (Roche Molecular Biochemicals) mit 1 Vol. 30% PEG 8000 (Promega)/10 mM MgCl2 gefällt. Das Pellet wurde zur Befreiung von restlichem PEG mehrfach gründlich mit 70%igem Ethanol gewaschen.1 μl of Bluescript SK + DNA (1 μg / μl) was mixed with 48 μl of NEBuffer 4 (New England Biolabs). After adding 1 μl of FokI (4 u / μl; New England Biolabs), the mixture was incubated at 37 ° C. for 1 h. The enzyme was denatured for 20 minutes at 65 ° C., then extracted with 100 μl phenol and 100 μl chloroform. After addition of 0.1 vol. 3 M sodium acetate pH 5.2, 2.5 vol. Ethanol was precipitated. It was taken up in 9 μl of 1 × Taq DNA ligase buffer, which each contained 25 ng of the encoders 2-T7-AATT, 2-T7-CAGG, 2-T7-GCGA and 2-T7-TCGT. After adding 1 μl of Taq DNA ligase (4 U / μl; New England Biolabs), the mixture was incubated at 16 ° C. for 15 minutes. It was diluted with 90 μl of water and extracted with phenol and chloroform. To separate unligated encoders, 10 μg of glycogen (Roche Molecular Biochemicals) were precipitated with 1 volume of 30% PEG 8000 (Promega) / 10 mM MgCl 2. The pellet was washed thoroughly several times with 70% ethanol to free the residual PEG.

Beispiel 4Example 4 Codierung mittels zweier DecoderCoding using two decoders

Die in Beispiel 1 gewonnenen, mit cDNA-Fragmenten beschichteten Streptavidin- Dynabeads wurden in 100 µl vorgewärmtem 1 × NEBuffer 2 (mit BSA auf 200 µg/µl supplementiert) 10 Min. bei 37°C auf einem Überkopf-Mischer (Drehgeschwindigkeit ca. 2 U/min.) vorinkubiert. Nach Zugabe von 15 U BbvI (New England Biolabs) wurde unter langsamer Drehbewegung eine weitere Stunde bei 37°C inkubiert. Das Reaktionsgefäß wurde in einen Magnetständer überführt, und nach Sedimentieren der Dynabeads wurde der Überstand abgenommen. Nach Extraktion mit Phenol und Chloroform (s. oben) wurde mit Ethanol gefällt. Das Pellet wurde auf Eis in 10 µl eines Ligationsansatzes gelöst, bestehend aus 0,5 µl Taq DNA Ligase (4 U/µl; New England Biolabs), je 10 ng der Encoder 1-ACAG, 1-CGAC, 1-GCAC, 1-TACG, in 1 × Taq DNA Ligase-Puffer (New England Biolabs). Zur Ligation wurde für 10 min. bei 16°C inkubiert, auf Eis gestoppt, mit Wasser auf 50 µl aufgefüllt und mit Phenol, dann mit Chloroform extrahiert. Nach Fällung mit Ethanol wurde in 25 µl 1 × EcoPol-Puffer (New England Biolabs) mit je 30 µM Biotin-dATP, Biotin-dCTP, Biotin-dGTP und Biotin-dUTP (NEN Life Science Products, Zaventem, Belgien) aufgenommen. Nach Zugabe von 1 U Klenow Enzym (New England Biolabs) wurde 5 min. bei 25°C inkubiert und auf Eis gestoppt. Endaufgefüllte unligiert gebliebene Nukleinsäuren sowie uninkorporierte Nukleotide wurden durch 10 min. Inkubation mit 0,1 mg M-280 Streptavidin-Dynabeads in 100 µl eiskaltem 1 × Binding- and Washing Buffer abgetrennt. Nach Behandlung mit Phenol und Chloroform und Zugabe von 10 µg Glycogen (Roche Molecular Biochemicals) wurde der Überstand gefällt, und das Pellet wurde in 20 µl NEBuffer 4 aufgenommen. Nach Zugabe von 2 U FokI (New England Biolabs) wurde 1 h bei 37°C inkubiert. Es wurde erneut extrahiert und gefällt und in einem Ligationsansatz wie oben aufgenommen, der nun aber je 10 ng der Encoder 2-T7- AATT, 2-T7-CAGG, 2-T7-GCGA und 2-T7-TCGT enthielt. Es wurde wie oben ligiert und gefällt.The streptavidin coated with cDNA fragments obtained in Example 1 Dynabeads were in 100 µl of prewarmed 1 × NEBuffer 2 (with BSA to 200 µg / µl supplemented) 10 min. at 37 ° C on an overhead mixer (rotation speed approx. 2 rpm) preincubated. After adding 15 U of BbvI (New England Biolabs), under Incubated at 37 ° C for another hour with slow rotation. The reaction vessel was transferred to a magnetic stand, and after sedimentation the Dynabeads became the supernatant decreased. After extraction with phenol and chloroform (see above) precipitated with ethanol. The pellet was dissolved in 10 µl of a ligation mixture on ice, consisting of 0.5 µl Taq DNA ligase (4 U / µl; New England Biolabs), each 10 ng of Encoder 1-ACAG, 1-CGAC, 1-GCAC, 1-TACG, in 1 × Taq DNA ligase buffer (New England Biolabs). The ligation was incubated for 10 min at 16 ° C., stopped on ice, with Water made up to 50 µl and extracted with phenol, then with chloroform. After precipitation with ethanol in 25 μl of 1 × EcoPol buffer (New England Biolabs) with 30 μM each Biotin-dATP, Biotin-dCTP, Biotin-dGTP and Biotin-dUTP (NEN Life Science Products, Zaventem, Belgium). After adding 1 U of Klenow enzyme (New England Biolabs) was incubated for 5 min at 25 ° C. and stopped on ice. End filled unligated Remaining nucleic acids and unincorporated nucleotides were removed for 10 min. Incubation with 0.1 mg M-280 Streptavidin-Dynabeads in 100 µl ice-cold 1 × binding and Washing Buffer separated. After treatment with phenol and chloroform and addition the supernatant was precipitated from 10 μg glycogen (Roche Molecular Biochemicals), and the pellet was taken up in 20 μl NEBuffer 4. After adding 2 U of FokI (New England Biolabs) was incubated at 37 ° C for 1 hour. It was re-extracted and precipitated and recorded in a ligation approach as above, but now 10 ng each of the encoder 2-T7- AATT, 2-T7-CAGG, 2-T7-GCGA and 2-T7-TCGT. It was ligated as above and pleases.

Beispiel 5Example 5 ProbenmarkierungSample marking

Die gefällten Encoder-Ligationsprodukte aus Beispiel 3 bzw. 4 wurden in 17 µl 1 × in vitro-Transkriptionspuffer (Ambion, Austin, Tx) aufgenommen, welcher je 7,5 mM ATP, CTP und GTP sowie 5 mM dTTP und 2,5 mM Cy3-UTP (Amersham-Pharmacia, Freiburg) enthielt. Es wurden 2 µl Enzym-Mix (MEGAscript-Kit, Ambion) sowie 1 µl T7 RNA- Polymerase (1000 U/µl; Epicentre, Madison, WI) hinzugefügt und für 12 h bei 37°C transkribiert. Anschließend wurde mit 1 µl DNase I (2 U/µl; Ambion) versetzt und 15 min. bei 37°C inkubiert. Es wurde mit Wasser auf 100 µl aufgefüllt, mit Phenol/Chloroform extrahiert und mit Ethanol gefällt.The precipitated encoder ligation products from Example 3 and 4 were in 17 μl 1 × in Vitro transcription buffer (Ambion, Austin, Tx) added, which each 7.5 mM ATP, CTP and GTP as well as 5 mM dTTP and 2.5 mM Cy3-UTP (Amersham-Pharmacia, Freiburg) contained. 2 µl enzyme mix (MEGAscript kit, Ambion) and 1 µl T7 RNA Polymerase (1000 U / µl; Epicenter, Madison, WI) added and for 12 h at 37 ° C transcribed. Then 1 μl DNase I (2 U / μl; Ambion) was added and 15 min. incubated at 37 ° C. It was made up to 100 μl with water, with phenol / chloroform extracted and precipitated with ethanol.

Beispiel 6Example 6 Decodierung mittels Array-HybridisierungDecoding using array hybridization

Die am 5'-Ende aminomodifizierten Oligonukleotide 1-16 (s. u.) wurden in Wasser gelöst und auf eine Konzentration von 100 pmol/µl eingestellt. Je 1 µl dieser Lösungen wurde mit 49 µl Bindepuffer (150 mM Na-Phosphat, pH 8,5) vermischt und zur Array-Herstellung auf 3D-Link slides (Surmodics, Eden Prairie, MN) verwendet; hierbei wurden je 0,5 µl pro Oligonukleotid in einer 4 × 4-Matrix mit einer Pipette aufgetragen. Die arrays wurden nach erfolgter Auftragung in eine bei Raumtemperatur mit Wasserdampf gesättigte Reaktionskammer eingebracht und die Kopplungsreaktion für 14 h durchgeführt. Zur Entfernung ungekoppelt gebliebener Oligonukleotide wurden die slides mit 5 × SSC gründlich abgespült. Dann wurde zur Inaktivierung der Oberfläche kurz mit 50 mM Ethanolamin/0,1 M Tris pH 9 abgespült und mit frischer Lösung 15 min. bei 50°C behandelt. Die slides wurden mit Wasser gewaschen, dann wurden 25 µl Prähybridisierungslösung (5 × SSC, 5 × Denhardt's, 0,1% SDS, 0,1 µg/µl Heringssperma- DNA) auf die arrays gegeben und mit einem Deckglas abgedeckt. Es wurde 20 min. bei 50°C prähybridisiert. Die Prähybridisierungslösung wurde mit Wasser abgespült und die slides wurden kurz luftgetrocknet. Die in Beispiel 5 erhaltenen Hybridisierungsproben wurden in 10 µl Prähybridisierungslösung aufgenommen, 2 min. im kochenden Wasserbad denaturiert, auf die arrays gegeben und mit einem Deckglas abgedeckt. Die Hybridisierung erfolgte in einer Wasserdampf-gesättigten Kammer für 12 h bei 37°C (mit einem Encoder gewonnene Sonden nach Beispiel 3) bzw. 45°C (mit zwei Encodern gewonnene Sonden nach Beispiel 4). Nach Abschluß der Hybridisierung wurde das Deckglas entfernt und kurz mit 5 × SSC/0,1% SDS gespült. Danach wurde bei Raumtemperatur 2 × 5 min. mit 2 × SSC/0,1% SDS, dann 1 min. mit 0,2 × SSC/0,1% SDS gewaschen. Die arrays wurden luftgetrocknet und zur Detektion in einem ScanArray 5000-Scanner (GSI Lumonics, Billerica, MA) untersucht. Es wurde mit einer Anregungswellenlänge von 546 nm gescannt, detektiert wurde bei 570 nm. Die Auswertung der Hybridisierungssignale erfolgte mittels des Programms QuantArray, Version 2.0. The oligonucleotides 1-16 amino-modified at the 5 'end (see below) were dissolved in water and adjusted to a concentration of 100 pmol / µl. 1 µl of each of these solutions was mixed with 49 µl binding buffer (150 mM Na phosphate, pH 8.5) mixed and used for array production used on 3D link slides (Surmodics, Eden Prairie, MN); each 0.5 µl per Oligonucleotide applied in a 4 × 4 matrix with a pipette. The arrays were after application in a saturated with water vapor at room temperature Reaction chamber introduced and the coupling reaction carried out for 14 h. To the Removal of uncoupled oligonucleotides were the slides with 5 × SSC rinsed thoroughly. Then, to inactivate the surface, briefly with 50 mM Ethanolamine / 0.1 M Tris pH 9 and rinsed off with fresh solution for 15 min. At 50 ° C treated. The slides were washed with water, then 25 µl Prehybridization solution (5 × SSC, 5 × Denhardt's, 0.1% SDS, 0.1 µg / µl herring sperm DNA) on the arrays and covered with a cover slip. It was 20 min 50 ° C prehybridized. The prehybridization solution was rinsed off with water and the slides were briefly air-dried. The hybridization samples obtained in Example 5 were taken up in 10 µl prehybridization solution, 2 min in a boiling water bath denatured, placed on the arrays and covered with a cover slip. The hybridization took place in a steam-saturated chamber for 12 h at 37 ° C (with an encoder Probes obtained according to Example 3) or 45 ° C. (probes obtained with two encoders according to example 4). After the hybridization was complete, the cover slip was removed and briefly Rinsed with 5 x SSC / 0.1% SDS. This was followed by 2 × 5 minutes at room temperature with 2 × SSC / 0.1% SDS, then washed 1 min with 0.2 x SSC / 0.1% SDS. The arrays were air-dried and for detection in a ScanArray 5000 scanner (GSI Lumonics, Billerica, MA). It was made with an excitation wavelength of 546 nm scanned, detection was carried out at 570 nm. Evaluation of the hybridization signals was done using the program QuantArray, Version 2.0.

Die Oligonukleotide waren:
The oligonucleotides were:

Claims (16)

1. Verfahren zur Identifikation von Nukleinsäuren, gekennzeichnet durch die folgenden Schritte:
  • a) Bereitstellung mindestens eines DNA-Fragments mit einem überhängenden Ende bekannter Länge und unbekannter Sequenz,
  • b) Befestigung eines bestimmten Encoders aus einer Mischung von Encodern mit ebenfalls überhängendem Ende an dem überhängenden Ende unbekannter Sequenz des DNA-Fragments, wobei das überhängende Ende des befestigten Encoders und das überhängende Ende unbekannter Sequenz des DNA-Fragments vollständig komplementär zueinander sind,
  • c) gegebenenfalls Abtrennung derjenigen Encoder, welche in Schritt (b) an keinem DNA-Fragment befestigt wurden,
  • d) Markierung des Befestigungsprodukts aus Schritt (b), sofern nicht bereits markierte Encoder zur Befestigung eingesetzt wurden,
  • e) Hybridisierung des markierten Befestigungsprodukts mit einem array von Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Encoder aus der Mischung von Encodern oder einer Auswahl hiervon sind.
1. A method for the identification of nucleic acids, characterized by the following steps:
  • a) providing at least one DNA fragment with an overhanging end of known length and unknown sequence,
  • b) Attachment of a specific encoder from a mixture of encoders with a likewise overhanging end to the overhanging end of unknown sequence of the DNA fragment, wherein the overhanging end of the attached encoder and the overhanging end of unknown sequence of the DNA fragment are completely complementary to one another,
  • c) if necessary, separation of those encoders which were not attached to any DNA fragment in step (b),
  • d) Marking of the fastening product from step (b), unless already marked encoders have been used for fastening,
  • e) Hybridization of the labeled attachment product with an array of oligonucleotides which are essentially complementary to one of the strands of all possible encoders from the mixture of encoders or a selection thereof.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das überhängende Ende bekannter Länge und unbekannter Sequenz durch eine Restriktionsendonuklease vom Typ IIs erzeugt wird.2. The method according to claim 1, characterized in that the overhanging end known length and unknown sequence by a restriction endonuclease vom Type IIs is generated. 3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die Encoder aus Schritt (b) einen einzelsträngigen sowie einen doppelsträngigen Bereich aufweisen. 3. The method according to claim 1 or 2, characterized in that the encoder from Step (b) have a single-stranded and a double-stranded region. 4. Verfahren nach Anspruch 3, wobei die Mischung von Encodern aus Schritt (b) aus Encodern besteht, die sich in der Sequenz des einzelsträngigen sowie in der Sequenz des doppelsträngigen Bereichs voneinander unterscheiden, wobei die Sequenz des doppelsträngigen Bereichs eines jeden Encoders eindeutig die Sequenz des einzelsträngigen Bereichs codiert.4. The method of claim 3, wherein the mixture of encoders from step (b) Encoders, which are in the sequence of the single-stranded as well as in the sequence of the double-stranded region from each other, the sequence of the double-stranded area of each encoder clearly shows the sequence of the encoded single-stranded area. 5. Verfahren nach Anspruch 4, wobei die doppelsträngigen Bereiche der Encoder einer Mischung von Encodern im wesentlichen die gleiche Schmelztemperatur aufweisen.5. The method of claim 4, wherein the double-stranded areas of the encoder one Mixture of encoders have essentially the same melting temperature. 6. Verfahren nach Anspruch 4 oder 5, wobei die Mischung von Encodern mit einer Länge des einzelsträngigen Bereichs von n Basen 4n verschiedene Encoder enthält.6. The method according to claim 4 or 5, wherein the mixture of encoders with a length of the single-stranded region of n bases contains 4 n different encoders. 7. Verfahren nach einem der Ansprüche 1 bis 6, wobei die Abtrennung der unbefestigt gebliebenen Encoder in Schritt (c) durch Bindung des DNA-Fragments an eine feste Phase erfolgt.7. The method according to any one of claims 1 to 6, wherein the separation of the unsecured Remaining encoder in step (c) by binding the DNA fragment to a solid Phase takes place. 8. Verfahren nach einem der Ansprüche 1 bis 7, wobei sich eine Identifikation der in Schritt (e) hybridisierten Oligonukleotide des arrays anschließt.8. The method according to any one of claims 1 to 7, wherein an identification of the in Step (e) is followed by hybridized oligonucleotides of the array. 9. Verfahren nach Anspruch 8, wobei eine Quantifizierung der in Schritt (e) erhaltenen Hybridisierungssignale vorgenommen wird.9. The method of claim 8, wherein a quantification of the obtained in step (e) Hybridization signals is made. 10. Verfahren nach Anspruch 8 oder 9, wobei eine Zuordnung der Information über mit Oligonukleotiden des arrays hybridisierte Encoderstränge zu der Sequenz der jeweiligen in Schritt (b) befestigten DNA-Fragmentenden vorgenommen wird.10. The method according to claim 8 or 9, wherein an assignment of the information about with Oligonucleotides of the array hybridized encoder strands to the sequence of the respective DNA fragment ends attached in step (b) is made. 11. Verfahren nach einem der Ansprüche 1 bis 10, umfassend folgende Schritte:
  • 1. Bereitstellung mindestens eines DNA-Fragments mit einem bekannten Ende,
  • 2. Befestigung mindestens eines Adaptors an besagtem Ende, wobei das Adaptor- Molekül Erkennungsstellen für mindestens eine erste und eine zweite Restriktionsendonuklease vom Typ IIs aufweist,
  • 3. Inkubation mit einer ersten Restriktionsendonuklease vom Typ IIs, welche innerhalb des am Adaptor befestigten DNA-Fragments schneidet und ein erstes überhängendes Ende unbekannter Sequenz erzeugt,
  • 4. Befestigung eines bestimmten ersten Encoders aus einer Mischung von ersten Encodern mit ebenfalls überhängendem Ende an das erste überhängende Ende unbekannter Sequenz des geschnittenen Befestigungsprodukts aus DNA-Fragment und Adaptor, wobei das überhängende Ende des befestigten ersten Encoders und das erste überhängende Ende unbekannter Sequenz des DNA-Fragments vollständig komplementär zueinander sind,
  • 5. Inkubation mit einer zweiten Restriktionsendonuklease vom Typ IIs, welche zwischen dem in (b1) befestigten Adaptor und dem in (d1) befestigten Encoder schneidet und ein zweites überhängendes Ende unbekannter Sequenz erzeugt,
  • 6. Befestigung eines bestimmten zweiten Encoders aus einer Mischung von zweiten Encodern mit ebenfalls überhängendem Ende an das zweite überhängende Ende unbekannter Sequenz des mit dem ersten Encoder verbundenen Rests des DNA- Fragments zu einem Dicoder, wobei das überhängende Ende des befestigten zweiten Encoders und das zweite überhängende Ende unbekannter Sequenz des Rests des DNA-Fragments vollständig komplementär zueinander sind,
  • 7. optional Proofreading der in (f1) erzeugten Dicoder,
  • 8. Markierung der Dicoder, sofern nicht bereits markierte Encoder zur Befestigung eingesetzt wurden,
  • 9. Hybridisierung eines der beiden Dicoder-Stränge mit einem array von Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Dicoder oder einer Auswahl hiervon sind,
  • 10. Ermittlung derjenigen Oligonukleotide des arrays, mit denen markierte Dicoder- Stränge hybridisiert haben, sowie ggf. eine Quantifizierung der hybridisierten Menge an markierten Dicoder-Strängen,
  • 11. Zuordnung der in (j1) erhaltenen Information über Hybridisierungsereignisse zu den in (c1) und in (e1) erzeugten unbekannten Fragmentenden sowie Assemblierung der identifizierten Teilsequenzen zu einer das DNA-Fragment aus Schritt (a1) charakterisierenden Sequenz.
11. The method according to any one of claims 1 to 10, comprising the following steps:
  • 1. Provision of at least one DNA fragment with a known end,
  • 2. Attachment of at least one adapter to said end, the adapter molecule having recognition sites for at least a first and a second restriction endonuclease of type IIs,
  • 3. Incubation with a first restriction endonuclease of type IIs, which cuts within the DNA fragment attached to the adapter and produces a first protruding end of unknown sequence,
  • 4. Attachment of a specific first encoder from a mixture of first encoders with a likewise overhanging end to the first overhanging end of unknown sequence of the cut fastening product from DNA fragment and adapter, the overhanging end of the fastened first encoder and the first overhanging end of unknown sequence DNA fragments are completely complementary to each other,
  • 5. Incubation with a second restriction endonuclease of type IIs, which cuts between the adapter attached in (b1) and the encoder attached in (d1) and generates a second overhanging end of unknown sequence,
  • 6. Attachment of a certain second encoder from a mixture of second encoders with also overhanging end to the second overhanging end of unknown sequence of the remainder of the DNA fragment connected to the first encoder to form a dicoder, the overhanging end of the attached second encoder and the second protruding ends of unknown sequence of the remainder of the DNA fragment are completely complementary to each other,
  • 7. optional proofreading of the dicoder generated in (f1),
  • 8. Marking of the dicoder, unless marked encoders have already been used for fastening,
  • 9. Hybridization of one of the two dicoder strands with an array of oligonucleotides which are essentially complementary to one of the strands of all possible dicoders or a selection thereof,
  • 10. Determination of those oligonucleotides of the array with which marked dicoder strands have hybridized, and, if necessary, a quantification of the hybridized amount of marked dicoder strands,
  • 11. Assignment of the information obtained in (j1) about hybridization events to the unknown fragment ends generated in (c1) and in (e1) and assembly of the identified partial sequences into a sequence characterizing the DNA fragment from step (a1).
12. Verfahren nach einem der Ansprüche 1 bis 10, umfassend folgende Schritte:
  • 1. Bereitstellung mindestens eines DNA-Fragments mit einem ersten überhängenden Ende bekannter Länge und unbekannter Sequenz,
  • 2. Befestigung eines bestimmten ersten Encoders aus einer Mischung von ersten Encodern mit ebenfalls überhängendem Ende am ersten überhängenden Ende des DNA-Fragments, wobei das überhängende Ende des befestigten ersten Encoders und das erste überhängende Ende des DNA-Fragments vollständig komplementär zueinander sind und wobei besagter erster Encoder eine Erkennungsstelle für eine überhängende Enden erzeugende Typ IIs Restriktionsendonuklease aufweist, welche derart orientiert und positioniert ist, daß bei Inkubation des Befestigungsprodukts aus erstem Encoder und DNA-Fragment mit besagter Typ IIs Restriktionsendonuklease ein zweites überhängendes Ende erzeugt wird, welches mindestens unter anderem Basen des DNA-Fragments enthält, die kein Bestandteil des überhängenden Endes in Schritt (a2) waren und deren Komplement ebenfalls kein Bestandteil des überhängenden Endes in Schritt (a2) war,
  • 3. Inkubation mit einer Typ IIs-Restriktionsendonuklease, die die im ersten Encoder in Schritt (b2) enthaltene Erkennungsstelle erkennt und welche auf die in Schritt (b2) beschriebene Weise schneidet,
  • 4. Befestigung eines bestimmten zweiten Encoders aus einer Mischung von zweiten Encodern mit ebenfalls überhängendem Ende am zweiten überhängenden Ende des DNA-Fragments zu einem Dicoder, wobei das überhängende Ende des ligierten zweiten Encoders und das zweite überhängende Ende des DNA- Fragments vollständig komplementär zueinander sind,
  • 5. Optional Proofreading der in (d2) erzeugten Dicoder,
  • 6. Markierung der Dicoder, sofern nicht bereits mindestens ein markierter Encoder zur Befestigung eingesetzt wurde,
  • 7. Hybridisierung eines der beiden Dicoder-Stränge mit einem array von Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Dicoder oder einer Auswahl hiervon sind,
  • 8. Ermittlung derjenigen Oligonukleotide des arrays, mit denen markierte Dicoder- Stränge hybridisiert haben, sowie ggf. eine Quantifizierung der hybridisierten Menge an markierten Dicoder-Strängen,
  • 9. Zuordnung der in (g2) erhaltenen Information über Hybridisierungsereignisse zu den in (a2) bereitgestellten und den in (c2) erzeugten Fragmentenden sowie Assemblierung der identifizierten Teilsequenzen zu einer das DNA-Fragment aus Schritt (a2) charakterisierenden Sequenz.
12. The method according to any one of claims 1 to 10, comprising the following steps:
  • 1. Provision of at least one DNA fragment with a first protruding end of known length and unknown sequence,
  • 2. Attachment of a specific first encoder from a mixture of first encoders with a likewise overhanging end at the first overhanging end of the DNA fragment, wherein the overhanging end of the attached first encoder and the first overhanging end of the DNA fragment are completely complementary to one another and wherein said first encoder has a recognition site for an overhanging end-producing type IIs restriction endonuclease, which is oriented and positioned in such a way that when the attachment product of the first encoder and DNA fragment is incubated with said type IIs restriction endonuclease, a second overhanging end is produced which at least includes bases of the DNA fragment which were not part of the overhanging end in step (a2) and whose complement was also not a part of the overhanging end in step (a2),
  • 3. Incubation with a type IIs restriction endonuclease which recognizes the recognition site contained in the first encoder in step (b2) and which cuts in the manner described in step (b2),
  • 4. Attachment of a certain second encoder from a mixture of second encoders with an overhanging end at the second overhanging end of the DNA fragment to form a dicoder, the overhanging end of the ligated second encoder and the second overhanging end of the DNA fragment being completely complementary to one another ,
  • 5. Optional proofreading of the dicoder generated in (d2),
  • 6. Marking of the dicoder, if at least one marked encoder has not already been used for fastening,
  • 7. Hybridization of one of the two dicoder strands with an array of oligonucleotides which are essentially complementary to one of the strands of all possible dicoders or a selection thereof,
  • 8. Determination of those oligonucleotides of the array with which marked dicoder strands have hybridized, and, if necessary, a quantification of the hybridized amount of marked dicoder strands,
  • 9. Assignment of the information about hybridization events obtained in (g2) to the fragment ends provided in (a2) and the fragment ends generated in (c2) and assembly of the identified partial sequences into a sequence characterizing the DNA fragment from step (a2).
13. Verfahren nach einem der Ansprüche 1 bis 10, umfassend folgende Schritte:
  • 1. Bereitstellung mindestens eines DNA-Fragments mit überhängendem Ende bekannter Länge und unbekannter Sequenz,
  • 2. Befestigung eines bestimmten Encoders aus einer Mischung von Encodern mit ebenfalls überhängendem Ende am überhängenden Ende des DNA-Fragments, wobei das überhängende Ende des ligierten Encoders und das überhängende Ende des DNA-Fragments vollständig komplementär zueinander sind,
  • 3. Optional Proofreading der in (b3) erzeugten Befestigungsprodukte,
  • 4. Optional Abtrennung des gesamten DNA-Fragments oder eines Teils davon vom befestigten Encoder durch Behandlung mit einer geeigneten Restriktionsendonuklease,
  • 5. Markierung des Befestigungsprodukts aus (b3), sofern nicht bereits markierte Encoder zur Befestigung eingesetzt wurden,
  • 6. Hybridisierung eines der beiden Encoder-Stränge mit einem array aus Oligonukleotiden, welche im wesentlichen komplementär zu einem der Stränge aller möglichen Encoder oder einer Auswahl hiervon sind,
  • 7. Ermittlung derjenigen Oligonukleotide auf dem array, mit denen markierte Encoder-Stränge hybridisiert haben, sowie ggf. eine Quantifizierung der hybridisierten Menge an markierten Encoder-Strängen,
  • 8. Zuordnung der in (g3) erhaltenen Information über Hybridisierungsereignisse unter Zugrundelegung der Sequenzinformation über die in (b3) eingesetzten ersten Encoder zu dem in (a3) bereitgestellten überhängenden Fragmentende.
13. The method according to any one of claims 1 to 10, comprising the following steps:
  • 1. Provision of at least one DNA fragment with a protruding end of known length and unknown sequence,
  • 2. Attachment of a specific encoder from a mixture of encoders with an overhanging end at the overhanging end of the DNA fragment, the overhanging end of the ligated encoder and the overhanging end of the DNA fragment being completely complementary to one another,
  • 3. Optional proofreading of the fastening products created in (b3),
  • 4. Optional separation of the entire DNA fragment or part thereof from the attached encoder by treatment with a suitable restriction endonuclease,
  • 5. Marking of the fastening product from (b3), unless already marked encoders have been used for fastening,
  • 6. Hybridization of one of the two encoder strands with an array of oligonucleotides which are essentially complementary to one of the strands of all possible encoders or a selection thereof,
  • 7. Determination of those oligonucleotides on the array with which the marked encoder strands have hybridized, and, if necessary, a quantification of the hybridized amount of marked encoder strands,
  • 8. Assignment of the information about hybridization events obtained in (g3) based on the sequence information about the first encoder used in (b3) to the overhanging fragment end provided in (a3).
14. Verwendung des Verfahrens nach einem der Ansprüche 1 bis 13 zur Expressionsanalyse.14. Use of the method according to any one of claims 1 to 13 for Expression analysis. 15. Verwendung des Verfahrens nach einem der Ansprüche 1 bis 13 zur Sequenzierung durch Hybridisierung.15. Use of the method according to one of claims 1 to 13 for sequencing by hybridization. 16. Array von Nukleinsäuren im wesentlichen gleicher Länge, welche sich durch im wesentlichen die gleiche Schmelztemperatur auszeichnen, insbesondere indentifiziert in dem Verfahren nach einem der Ansprüche 1 bis 13.16. Array of nucleic acids of essentially the same length, which are divided by im essentially have the same melting temperature, in particular identified in the method according to any one of claims 1 to 13.
DE10060827A 2000-12-07 2000-12-07 Methods of coding hybridization probes Withdrawn DE10060827A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE10060827A DE10060827A1 (en) 2000-12-07 2000-12-07 Methods of coding hybridization probes
AU2002216078A AU2002216078A1 (en) 2000-12-07 2001-12-07 Method for encoding hybridization probes
PCT/EP2001/014391 WO2002046457A2 (en) 2000-12-07 2001-12-07 Method for encoding hybridization probes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10060827A DE10060827A1 (en) 2000-12-07 2000-12-07 Methods of coding hybridization probes

Publications (1)

Publication Number Publication Date
DE10060827A1 true DE10060827A1 (en) 2002-06-13

Family

ID=7666146

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10060827A Withdrawn DE10060827A1 (en) 2000-12-07 2000-12-07 Methods of coding hybridization probes

Country Status (3)

Country Link
AU (1) AU2002216078A1 (en)
DE (1) DE10060827A1 (en)
WO (1) WO2002046457A2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115058469A (en) * 2022-04-25 2022-09-16 深圳大学 Method for labeling 3' -end biotin of short DNA fragment

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5710000A (en) * 1994-09-16 1998-01-20 Affymetrix, Inc. Capturing sequences adjacent to Type-IIs restriction sites for genomic library mapping
GB9618544D0 (en) * 1996-09-05 1996-10-16 Brax Genomics Ltd Characterising DNA
US6232067B1 (en) * 1998-08-17 2001-05-15 The Perkin-Elmer Corporation Adapter directed expression analysis
WO2000060124A2 (en) * 1999-04-06 2000-10-12 Yale University Fixed address analysis of sequence tags
WO2001012855A2 (en) * 1999-08-13 2001-02-22 Yale University Binary encoded sequence tags

Also Published As

Publication number Publication date
WO2002046457A2 (en) 2002-06-13
AU2002216078A1 (en) 2002-06-18
WO2002046457A3 (en) 2002-12-19

Similar Documents

Publication Publication Date Title
DE102008025656B4 (en) Method for the quantitative analysis of nucleic acids, markers therefor and their use
DE69627768T2 (en) Series analysis method of gene expression
EP0743367B1 (en) Gene expression analysis
DE60220025T2 (en) METHODS AND COMPOSITIONS FOR THE MAJORITY OF RNA SEQUENCES
DE69233719T2 (en) Primers, sets and restriction fragments and their use in selective restriction fragment amplification
DE60124363T2 (en) Method for the production of standardized and / or subtracted cDNA
DE60114525T2 (en) Array-based methods for the synthesis of nucleic acid mixtures
DE69333650T2 (en) NEW ARRANGEMENT OF OLIGONUCLEOTIDES AND THEIR BENEFITS FOR SORTING, ISOLATING, SEQUENCING AND MANIPULATING NUCLEIC ACIDS
AT502823B1 (en) POLYNUCLEOTIDE AMPLIFICATION
DE112006002652B4 (en) Method for the isothermal amplification of nucleic acids and method for the detection of nucleic acids by simultaneous isothermal amplification of nucleic acids and signal probe
WO2000024929A9 (en) Linear amplification mediated pcr (lam pcr)
EP1244782A2 (en) Method for carrying out the parallel sequencing of a nucleic acid mixture on a surface
EP0438512A1 (en) Process for analysing length polymorphisms in dna domains
EP1889925A1 (en) Introduction of sequence elements in nucleic acids
EP1109935A2 (en) Two-colour differential display, used as a method for detecting regulated genes
DE602006000713T2 (en) A method for improving the discrimination of a single base mismatch through the use of hurdle DNAs and artificial mismatch probes
DE10060827A1 (en) Methods of coding hybridization probes
DE4332463A1 (en) Process for the specific cloning of nucleic acids
DE19806431C1 (en) New method for the identification and characterization of mRNA molecules
DE10051564A1 (en) Parallel sequencing of nucleic acids in a mixture, useful e.g. for detecting mutations, comprises a series of single-base extension reactions using protected, labeled nucleotides
WO2004033721A2 (en) Hybridization samples having a reduced complexity
DE60109002T2 (en) Method for the detection of transcribed genomic DNA sequences
WO2003022986A2 (en) Identification and quantification of nucleic acids by the production and serial sequencing of sequence tags having a uniform length
DE602004008916T2 (en) METHOD FOR PRODUCING A GENE EXPRESSION PROFILE
DE60318315T2 (en) NUCLEIC ACID REPRODUCTIVE METHOD

Legal Events

Date Code Title Description
8127 New person/name/address of the applicant

Owner name: AXARON BIOSCIENCE AG, 69120 HEIDELBERG, DE

8139 Disposal/non-payment of the annual fee