DE10120797B4 - Method for analyzing nucleic acid chains - Google Patents

Method for analyzing nucleic acid chains Download PDF

Info

Publication number
DE10120797B4
DE10120797B4 DE10120797A DE10120797A DE10120797B4 DE 10120797 B4 DE10120797 B4 DE 10120797B4 DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A DE10120797 A DE 10120797A DE 10120797 B4 DE10120797 B4 DE 10120797B4
Authority
DE
Germany
Prior art keywords
nts
nskfs
polymerase
reaction
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE10120797A
Other languages
German (de)
Other versions
DE10120797A1 (en
Inventor
Dmitri Tcherkassov
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genovoxx GmbH
Original Assignee
Genovoxx GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genovoxx GmbH filed Critical Genovoxx GmbH
Priority to DE10120797A priority Critical patent/DE10120797B4/en
Priority to JP2002585662A priority patent/JP2004529650A/en
Priority to PCT/EP2002/004659 priority patent/WO2002088382A2/en
Priority to EP02732680A priority patent/EP1381698A2/en
Priority to AU2002304705A priority patent/AU2002304705A1/en
Publication of DE10120797A1 publication Critical patent/DE10120797A1/en
Application granted granted Critical
Publication of DE10120797B4 publication Critical patent/DE10120797B4/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Verfahren zur hochparallelen Sequenzanalyse von Nukleinsäuresequenzen oder Nukleinsäureketten (NSKs), bei dem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs mit einem einheitlichen Primer oder mehreren unterschiedlichen Primern in Form von NSKF-Primer-Hybridisierungsprodukten auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell an der Base so modifiziert sind, daß die...
A method for the highly parallel sequence analysis of nucleic acid sequences or nucleic acid chains (NSKs), in which
Fragments (NSKFs) of single-stranded NSKs of about 50 to 1000 nucleotides in length, representing overlapping partial sequences of the total sequences;
the NSKFs binds to a single primer or several different primers in the form of NSKF primer hybridization products on a reaction surface in a random array;
Perform a cyclic assembly reaction of the complementary strand of NSKFs using one or more primers and one or more polymerases by
a) to the immobilized NSKFs a solution containing one or more polymerases and one to four modified nucleotides (NTs *), which are labeled with fluorescent dyes, wherein the simultaneous use of at least two NTs * each on the NTs * fluorescent dyes are chosen so that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * being structurally modified at the base in such a way that the NTs * are structurally modified.

Figure 00000001
Figure 00000001

Description

Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäureketten. Die Grundlage der Methode ist die Detektion von Fluoreszenzsignalen einzelner mit Farbstoffen markierter Nukleotidmoleküle, die durch eine Polymerase in eine wachsende Nukleinsäurekette eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. Auf dieser Oberfläche sind viele einzelne Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure-Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann.The The invention relates to a method for analyzing nucleic acid chains. The basis of the method is the detection of fluorescence signals individual labeled with dye nucleotide molecules, the be incorporated by a polymerase in a growing nucleic acid chain. The reaction is ongoing on a flat surface. On this surface Many single nucleic acid molecules are immobilized. All these nucleic acid molecules are exposed to the same conditions, so that at all nucleic acid molecules simultaneously a build-up reaction can take place.

Das Verfahren umfaßt im wesentlichen folgende Schritte:

  • 1) Immobilisierung der Nukleinsäureketten auf einer planen Oberfläche.
  • 2) Durchführen einer zyklischen Aufbaureaktion, wobei jeder Zyklus aus folgenden Schritten besteht: a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten, b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen, d) Detektion der Signale von einzelnen Molekülen, e) Entfernung der Markierung von den eingebauten Nukleotiden, f) Waschen. Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus.
  • 3) Analyse der detektierten Signale der einzelnen Moleküle.
  • 4) Rekonstruktion der Sequenzen aus den Einzeldaten.
The method essentially comprises the following steps:
  • 1) immobilization of the nucleic acid chains on a plane surface.
  • 2) carrying out a cyclic synthesis reaction, each cycle consisting of the following steps: a) addition of a solution with labeled nucleotides (NTs *) and polymerase to immobilized nucleic acid chains, b) incubation of the immobilized nucleic acid chains with this solution under conditions sufficient to extend the complementary nucleic acid chains C) washing, d) detection of signals from single molecules, e) removal of the label from the incorporated nucleotides, f) washing. If necessary, there is a multiple repetition of the cycle.
  • 3) Analysis of the detected signals of the individual molecules.
  • 4) Reconstruction of the sequences from the individual data.

1. Abkürzungen und Begriffserläuterungen1. Abbreviations and term explanations

  • DNADNA
    – Desoxyribonukleinsäure verschiedenen Ursprungs und unterschiedlicher Länge: (genomische DNA, cDNA, ssDNA, dsDNA)- Deoxyribonucleic acid different Origin and different length: (genomic DNA, cDNA, ssDNA, dsDNA)
    RNARNA
    – Ribonukleinsäure (meist mRNA)- Ribonucleic acid (usually mRNA)
    Polymerasenpolymerases
    – Enzyme, die komplementäre Nukleotide in einen wachsenden DNA- oder RNA-Strang einbauen können (z.B. DNA-Polymerasen, Reverse-Transkriptasen, RNA-Polymerasen)- Enzymes that are complementary nucleotides into a growing DNA or RNA strand (e.g. DNA polymerases, reverse transcriptases, RNA polymerases)
    dNTPdNTP
    – 2'-deoxi-Nucleosid-Triphosphate für DNA-Polymerasen und Reverse-Transkriptasen2'-deoxynucleoside triphosphates for DNA polymerases and reverse transcriptases
    NTPNTP
    – Nukleosid-Triphosphate für RNA-Polymerasen - Nucleoside triphosphates for RNA polymerases
    NTNT
    – natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet.- natural nucleotide, mostly dNTP, if not express otherwise marked.

Abkürzung "NT" wird auch bei der Längenangabe einer Nukleinsäuresequenz verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" für Nukleotid-Monophosphate.Abbreviation "NT" is also used in the length specification a nucleic acid sequence used, e.g. 1,000 NT. In this case, "NT" stands for nucleotide monophosphates.

Im Text wird bei Abkürzungen die Mehrzahl durch Verwendung des Suffixes "s" gebildet, "NT" steht zum Beispiel für "Nukleotid", "NTs" steht für mehrere Nukleotide.

NT*
– modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleotide
NSK
– Nukleinsäurekette. DNA oder RNA in ihrer ursprünglichen Länge
NSKF
– Nukleinsäurekettenfragment, NSKFs – Nukleinsäurekettenfragmente. Fragmente von DNA oder RNA, die nach einem Fragmentierungsschritt entstehen.
In the text, the majority of abbreviations are formed by using the suffix "s", "NT" stands for "nucleotide", for example, "NTs" stands for several nucleotides.
NT *
- modified nucleotide, usually dNTP, unless expressly indicated otherwise. NTs * means: modified nucleotides
NSK
- Nucleic acid chain. DNA or RNA in their original length
NACF
- Nucleic acid chain fragment, NSKFs - nucleic acid chain fragments. Fragments of DNA or RNA arising after a fragmentation step.

Plane Oberfläche: Oberfläche, die vorzugsweise folgende Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Moleküle, vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem jeweiligen gegebenen Objektiv-Oberfläche-Abstand bei einer Objektivposition gleichzeitig zu detektieren. 2) Die immobilisierten einzelnen Moleküle befinden sich in derselben Fokusebene, die reproduzierbar eingestellt werden kann.Plans Surface: Surface, which preferably has the following features: 1) It allows several individual molecules preferably more than 100, more preferably more than 1000, with the respective given lens surface distance to detect simultaneously at a lens position. 2) The immobilized single molecules are in the same focal plane, which are reproducible can be.

Sterisches Hindernis: Sterisch anspruchsvolle Gruppe, die durch ihre chemische Struktur die Eigenschaften der mit dieser Gruppe gekoppelten NTs* so verändert, daß diese durch eine Polymerase in einer Extensionsreaktion nicht nacheinander eingebaut werden können.steric Obstacle: Sterically demanding group, by their chemical Structure the properties of the NTs coupled to this group * so changed, that these by a polymerase in an extension reaction not sequentially can be installed.

Definition der Termination: Als Termination wird in dieser Anmeldung der reversible Stop des Einbaus der modifizierten ungespalteten NTs* bezeichnet.definition Termination: Termination in this application is reversible Stop the installation of modified uncleaved NTs * designated.

Dieser Begriff ist von dem üblichen Gebrauch des Wortes "Termination" durch Dideoxy-NTP bei einer konventionellen Sequenzierung zu trennen.This term is from the common use of the word "termination" by dideoxy-NTP in one separate conventional sequencing.

Die Termination kommt nach dem Einbau eines modifizierten NT* zustande. Das modifizierte eingebaute NT* trägt eine an die Base reversibel gekoppelte sterische Gruppe, die zur Behinderung des Einbaus eines nächsten komplementären NT* in den wachsenden Strang durch eine Polymerase führt.The Termination comes about after the installation of a modified NT *. The modified built-in NT * reverses one to the base coupled steric group, which inhibit the incorporation of a next complementary NT * leads to the growing strand through a polymerase.

Genprodukte – Bei den Genprodukten handelt es sich um die primären Genprodukte der Gene. Im wesentlichen handelt es sich dabei um RNA-Transkripte der genannten Gene, welche auch als Target-Sequenzen (oder Target-Nukleinsäuresequenzen) bezeichnet werden. Diese Target-Sequenzen schließen neben mRNA auch davon abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA ein.Gene Products - At the Gene products are the primary gene products of the genes. in the Essentially, these are RNA transcripts of the mentioned Genes which also act as target sequences (or target nucleic acid sequences) be designated. These target sequences also include mRNA derived therefrom single and double-stranded cDNA, cDNA-derived RNA or cDNA amplified DNA.

SNP – single nucleotide polymorphismSNP - single nucleotide polymorphism

Die Nukleinsäurenketten-Sequenzanalyse ist in vielen Bereichen der Wissenschaft, Medizin und Industrie zu einem wichtigen Werkzeug geworden. Zur Analyse wurden mehrere Verfahren entwickelt.The Nucleic acid chain sequence analysis is in many areas of science, medicine and industry become an important tool. For analysis, several Developed process.

Die bekanntesten Verfahren sind die Ketten-Terminations-Sequenzierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 5463), die auf dem Einbau von Kettenterminatoren basiert, und die Maxam-Gilbert-Methode, die auf Basen-spezifischer Modifikation und Spaltung von Nukleinsäureketten beruht (A. M. Maxam and W. Gilbert PNAS 1977, v. 74 S. 560). Beide Methoden liefern eine Anzahl von Nukleinsäurekettenfragmenten verschiedener Längen. Diese Fragmente werden der Länge nach in einem Gel aufgetrennt. Dabei müssen alle Nachteile der Elektrophorese (wie z.B. lange Laufzeit, relativ kurze Strecken von Sequenzen, die in einem Ansatz bestimmt werden können, begrenzte Anzahl der parallelen Ansätze sowie relativ große Mengen an DNA) in Kauf genommen werden. Diese Methoden sind sehr arbeitsintensiv und langsam.The Best known methods are chain termination sequencing according to Sanger (F. Sanger et al PNAS 1977 v. 74 p 5463), the on based on the incorporation of chain terminators, and the Maxam-Gilbert method, the base-specific modification and cleavage of nucleic acid chains (M.M. Maxam and W. Gilbert PNAS 1977, v. 74 p. 560). Both Methods provide a number of different nucleic acid chain fragments Lengths. These fragments become the length after being separated in a gel. In this case, all the disadvantages of electrophoresis (such as long term, relatively short stretches of sequences, which can be determined in one approach, limited number of parallel approaches as well as relatively large Amounts of DNA) can be accepted. These methods are very labor intensive and slow.

Ein weiteres Verfahren zur Sequenzierung basiert auf der Hybridisierung von Nukleinsäureketten mit kurzen Oligonukleotiden. Dabei wird mit mathematischen Methoden berechnet, wie viele Oligonukleotide einer bestimmten Länge vorhanden sein müssen, um eine komplette Sequenz zu ermitteln (Z. T. Strezoska et al. PNAS 1991 v. 88 S. 10089, R. S. Drmanac et al. Science 1993 v. 260 S. 1649). Auch dieses Verfahren ist mit Problemen behaftet: Es kann nur eine Sequenz in einem Ansatz bestimmt werden, sekundäre Strukturen stören die Hybridisierung und Sequenzwiederholungen verhindern die korrekte Analyse.One another sequencing method based on hybridization of nucleic acid chains with short oligonucleotides. This is done using mathematical methods Calculates how many oligonucleotides of a given length exist have to be to determine a complete sequence (Z.T. Strezoska et al., PNAS 1991 v. Chr. 88 p. 10089, R.S. Drmanac et al. Science 1993 v. Chr. 260 p. 1649). This process also has problems: it can only one sequence can be determined in one approach, secondary structures to disturb the hybridization and repeats prevent the correct one Analysis.

Eine andere Möglichkeit zur Sequenzierung haben Arbeitsgruppen von (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197) entwickelt. Diese Methode wird abgekürzt als BASS (Base Addition Sequencing Scheme) bezeichnet. Dabei wird eine große Anzahl gleicher einzelsträngiger DNA-Stücke an einem definierten Ort auf einer Oberfläche fixiert und das Signal von der Gesamtheit dieser vielen identischen DNA-Stücke analysiert. Zu dieser fixierten DNA wird eine Lösung mit Polymerase und Nukleotiden zugegeben, so daß ein komplementärer Strang synthetisiert werden kann. Dabei soll die Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein einziges Nukleotid eingebaut. Dieses wird detektiert, worauf die Polymerase in einem nächsten Zyklus das nächste Nukleotid einbaut.A different possibility for sequencing, groups of (Dower US Patent 5,547,839, Canard et al. US Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p. 1021, Metzker et al. NAR 1994, v. 22, p. 4259, Welch et al. Nucleosides & nucleotides 1999, v. 18, p. 197). This method is abbreviated as BASS (Base Addition Sequencing Scheme). There will be a size Number of equal single-stranded ones DNA pieces fixed on a surface at a defined location and the signal from analyzed the entirety of these many identical DNA pieces. To this fixed DNA becomes a solution Polymerase and nucleotides added so that a complementary strand can be synthesized. The polymerase should be gradual work: in each step only a single nucleotide is incorporated. This is detected, whereupon the polymerase in a next cycle the next Incorporating nucleotide.

Die Methode hat folgende Nachteile: Beim Aufbau der komplementären Stränge tritt sehr schnell eine Desynchronisation der Synthese auf, so daß bei jedem Schritt die Fehler akkumulieren. Deshalb können nur sehr kurze Fragmente sequenziert werden. Es ist zu betonen, daß alle beschriebenen BASS-Methoden nicht auf der Detektion von einzelnen Molekülen beruhen. Das Signal wird stattdessen von einer großen Anzahl identischer an einem defi nierten Ort immobilisierter Moleküle registriert. Die in diesen Methoden übliche Verwendung der Begriffe "einzelne Moleküle" und "Moleküle" zielt dabei nicht auf individuelle, voneinander getrennte Moleküle, sondern auf eine Population, die aus vielen identischen Molekülen besteht. Identisch heißt in diesem Fall, daß die Moleküle die gleiche Sequenz haben.The Method has the following disadvantages: When building the complementary strands occurs very fast desynchronization of the synthesis, so that at each Step the errors accumulate. Therefore, only very short fragments be sequenced. It should be emphasized that all the BASS methods described not based on the detection of single molecules. The signal is instead of a big one Number of identical molecules registered at a defined place of immobilized molecules. The usual in these methods Use of the terms "individual Molecules "and" Molecules "are not targeted to individual, separate molecules, but to a population, those from many identical molecules consists. Identical means in In this case, that the molecules have the same sequence.

Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein Verfahren zur Sequenzanalyse von Nukleinsäureketten bereitzustellen, das die Nachteile der oben erwähnten Methoden nicht aufweist und vor allem eine billigere, schnellere und effizientere Analyse von Nukleinsäuresequenzen ermöglicht. Insbesondere soll das Verfahren in der Lage sein, viele Sequenzen parallel zu bestimmen, vorzugsweise soll es die Analyse sehr langer Nukleinsäureketten (mehrere Mb) in einem Ansatz ermöglichen.The object of the present invention is therefore to provide a method for sequence analysis of nucleic acid chains, which does not have the disadvantages of the above-mentioned methods and above all allows a cheaper, faster and more efficient analysis of nucleic acid sequences. In particular, the method should be able to determine many sequences in parallel, preferably it should be the analysis allow very long nucleic acid chains (several Mb) in one approach.

3. Kurze Beschreibung3. Short description

Die Aufgabe wird erfindungsgemäß durch ein Verfahren zur Sequenzanalyse von Nukleinsäuresequenzen (Nulcleinsäureketten, NSKs) gelöst, bei dem man Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 μm2 immobilisiert (stationäre Phase), man eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man

  • a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist, man
  • b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, man
  • c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man
  • d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktionsoberfläche bestimmt, man
  • e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluoreszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man
  • f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, man
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,
wobei man die relative Position einzelner NSKFs auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.The object is achieved by a method for sequence analysis of nucleic acid sequences (Nulcleinsäureketten, NSKs), in which one generates fragments (NSKFs) single-stranded NSKs with a length of about 50 to 1000 nucleotides, which are overlapping partial sequences of the total sequences, one the NSKFs on a Reaction surface at a density of 10 to 100 NSKFs per 100 microns 2 immobilized (stationary phase), one carries out a cyclic synthesis reaction of the complementary strand of NSKFs using one or more primers and one or more polymerases by
  • a) to the immobilized NSKFs a solution containing one or more polymerases and one to four modified nucleotides (NTs *), which are labeled with fluorescent dyes, wherein the simultaneous use of at least two NTs * each on the NTs * fluorescent dyes are chosen so that the NTs used can * differ from each other by measuring different fluorescence signals, wherein the NTs * are structurally modified so that the polymerase after incorporation of such NT * in a growing complementary strand is not able to another NT * incorporate into the same strand, wherein the fluorescent dye is cleavable and the structural modification is a cleavable sterically demanding ligand, one
  • b) the stationary phase obtained in step a) is incubated under conditions suitable for extending the complementary strands, the complementary strands being extended by one NT * each;
  • c) washing the stationary phase obtained in stage b) under conditions which are suitable for the removal of non-complementary NTs *
  • d) the individual NTs * incorporated in complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescence signals on the reaction surface;
  • e) for the production of unlabeled (NTs or) NSKFs, the fluorescent dyes and the sterically demanding ligands of the NTs attached to the complementary strand * splits, one
  • f) washing the stationary phase obtained in step e) under conditions suitable for removing the fluorescent dyes and the ligands;
if necessary, the steps a) to f) are repeated several times,
whereby the relative position of individual NSKFs on the reaction surface and the sequence of these NSKFs are determined by specific assignment of the fluorescence signals to the NTs detected in step d) in successive cycles at the respective positions and the overall sequence of the NSKs is determined from the determined overlapping partial sequences.

Die erhaltene Population von überlappenden Teilsequenzen läßt sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammenfügen (Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).The preserved population of overlapping Partial sequences can be with commercially available Assemble programs to the overall sequence of the NSK (Huang et al., Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. Chr. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. Chr. 1 P. 257).

Gemäß einer besonderen Ausführungsform der Erfindung kann das Verfahren durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man

  • a) in jedem Zyklus nur jeweils ein markiertes NT*,
  • b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oder
  • c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs*
einsetzt.According to a particular embodiment of the invention, the process can be carried out by repeatedly repeating steps a) to f) of the cyclic synthesis reaction, wherein
  • a) in each cycle only one marked NT *,
  • b) in each cycle two different marked NTs * or
  • c) four differently marked NTs in each cycle *
starts.

Wenn die NSKs Varianten einer bekannten Referenzsequenz sind kann das Verfahren auch durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz ermittelt.If the NSKs variants of a known reference sequence are the Procedure also performed be, by the stages a) to f) of the cyclic synthesis reaction repeated several times, alternating in each cycle use two differently marked NTs * and two unmarked NTs and the total sequences by comparison with the reference sequence determined.

Gegenstand der vorliegenden Erfindung sind ferner die in den 7e, 7f und 7g dargestellten Nukleotide und die entsprechenden markierten Nukleotide, die beispielsweise an die terminale Aminofunktion angeheftete Fluoreszenzfarbstoffe aufweisen, oder die in den 7h, 7i oder 7j dargestellten markierten Nukleotide.The present invention also relates to the in the 7e . 7f and 7g represented nucleotides and the corresponding labeled nucleotides, which have, for example, attached to the terminal amino function fluorescent dyes, or in the 7h . 7i or 7y shown labeled nucleotides.

Gegenstand der Erfindung ist ferner ein Kit zur Durchführung des Verfahrens das eine Reaktionsoberfläche, zur Durchführung des Verfahrens erforderliche Reaktionslösungen, eine oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*), daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist. Bei den Nukleotiden handelt es sich vorzugsweise um die oben genannten erfindungsgemäßen Nukleotide.object The invention further provides a kit for carrying out the method Reaction surface, to carry out the reaction required, one or more polymerases, and Contains nucleotides (NTs), of which one to four are labeled with fluorescent dyes, the NTs being structurally modified (NT * or NTs *), that the Polymerase after incorporation of such NT * into a growing complementary strand unable to build another NT * in the same strand, wherein the fluorescent dye is cleavable and the structural Modification is a cleavable sterically demanding ligand. The nucleotides are preferably those mentioned above nucleotides according to the invention.

Gemäß einer besonderen Ausführungsform der Erfindung enthält das Kit ferner zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien, einzelsträngige Nukleinsäuremoleküle, die als PBS in die KSKFs eingeführt werden, Oligonukleotid-Primer, zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien und/oder Waschlösungen.According to one particular embodiment of the invention the kit also required to produce single strands of double strands Reagents, single-stranded Nucleic acid molecules that introduced as PBS into the KSKFs be, oligonucleotide primer, to cleave the fluorescent dyes and sterically demanding Ligands required reagents and / or wash solutions.

Die erfindungsgemäße Methode dient zur Ermittlung der Nukleinsäuresequenzen und kann in verschiedenen Bereichen der Genetik eingesetzt werden. Dazu zählen insbesondere die Bestimmung unbekannter, langer Sequenzen, Analysen von Sequenz-Polymorphismen und Punktmutationen sowie die parallele Analyse einer großen Zahl an Gensequenzen.The inventive method serves for the determination of the nucleic acid sequences and can in different Fields of genetics are used. These include in particular the determination unknown, long sequences, analyzes of sequence polymorphisms and point mutations, as well as the parallel analysis of a large number on gene sequences.

Die Vorbereitung des zu analysierenden Materials (einzel- und doppelsträngige Nukleinsäuresequenzen) hängt von der Aufgabestellung ab und hat das Ziel, aus einer langen Nukleinsäurekette eine Population an relativ kleinen, einzelsträngigen Nukleinsäurekettenfragmenten (NSKFs) zu bilden, diese Fragmente mit einem für den Start der Sequenzierungsreaktion geeigneten Primer zu versehen und auf einer planen Oberfläche zu fixieren.The Preparation of the material to be analyzed (single- and double-stranded nucleic acid sequences) depends on the task and has the goal of a long nucleic acid chain a population of relatively small, single-stranded nucleic acid chain fragments (NSKFs) to form these fragments with one for the start of the sequencing reaction appropriate primer and to fix on a flat surface.

Dabei werden einzelne NSKFs auf einer planen Oberfläche in einer solchen Weise fixiert, daß eine enzymatische Reaktion an diesen Molekülen ablaufen kann. Prinzipiell sind verschiedene Arten der Immobilisation möglich, die von der Zielsetzung, der Art der NSK und der für die Reaktion eingesetzten Polymerase abhängen. Die NSKFs werden bei der Immobilisierung zufällig auf der Oberfläche verteilt, d.h. es muß also nicht auf eine exakte Positionierung der einzelnen Ketten geachtet werden. Die Nukleinsäureketten müssen dabei in einer solchen Dichte auf der Oberfläche fixiert werden, daß eine eindeutige Zuordnung der später detektierten Signale zu einzelnen NSKFs gewährleistet ist.there Individual NSKFs will be on a flat surface in such a way fixed that an enzymatic Reaction to these molecules can expire. In principle, different types of immobilization possible, those of the objective, the nature of the NSK and the reaction depend on the polymerase used. The NSKFs are randomly distributed on the surface during immobilization, i.e. it does not have to be pay attention to an exact positioning of the individual chains. The nucleic acid chains have to go with it be fixed in such a density on the surface that a unique Assignment of the later detected signals to individual NSKFs is guaranteed.

Nach der Vorbereitung der NSKFs startet man mit allen auf der Oberfläche immobilisierten Molekülen die Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient die Synthese des komplementären Stranges zu jedem einzelnen immobilisierten NSKF. Dabei werden in den neu synthetisierten Strang markierte NTs* eingebaut. Die Polymerase baut nur ein einziges markiertes NT* in die wachsende Kette ein. Dies wird durch die reversible Ankopplung einer zur Termination führenden, sterisch anspruchsvollen Gruppe an die NTs* erreicht. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht. Diese sterisch anspruchsvolle Gruppe ist vorzugsweise ein Fluoreszenzfarbstoff.To The preparation of the NSKFs starts with all surfaces immobilized on the surface Molecules that Sequencing reaction. The basis of sequencing is the Synthesis of the complementary strand to every single immobilized NSKF. It will be in the new synthesized strand labeled NTs * incorporated. The polymerase builds only a single tagged NT * into the growing chain. This is due to the reversible coupling one for termination leading, sterically demanding group to the NTs * achieved. The installation another marked NT * is thereby made impossible. This steric Sophisticated group is preferably a fluorescent dye.

Die Sequenzierungsreaktion verläuft in mehreren Zyklen. Ein Zyklus umfasst folgende Schritte:

  • a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
  • b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind,
  • c) Waschen,
  • d) Detektion der Signale von einzelnen Molekülen,
  • e) Entfernung der Markierung von den eingebauten Nukleotiden,
  • f) Waschen.
The sequencing reaction proceeds in several cycles. A cycle includes the following steps:
  • a) addition of a solution with labeled nucleotides (NTs *) and polymerase to immobilized nucleic acid chains,
  • b) incubating the immobilized nucleic acid chains with this solution under conditions suitable for extending the complementary strands around an NT,
  • c) washing,
  • d) detection of the signals of individual molecules,
  • e) removal of the label from the incorporated nucleotides,
  • f) washing.

Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus (a–f).Possibly a multiple repetition of the cycle (a-f) takes place.

Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden so gewählt, daß die Polymerasen an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* einbauen können, vorzugsweise an mehr als 90%.The Reaction conditions of step (b) in one cycle become so selected that the Polymerases to more than 50% of those involved in the sequencing reaction NSKFs can install a marked NT * in one cycle, preferably more than 90%.

Die Anzahl der durchzuführenden Zyklen hängt dabei von der jeweiligen Aufgabenstellung ab, ist theoretisch nicht beschränkt und liegt vorzugsweise zwischen 20 und 5000.The Number of performed Cycles depends thereby from the respective task off, is theoretically not limited and is preferably between 20 and 5000.

Danach wird für jedes fixierte NSKF seine spezifische Sequenz aus der Reihenfolge der eingebauten NTs* ermittelt. Aus den überlappenden NSKF-Sequenzen kann die ursprüngliche NSK-Sequenz rekonstruiert werden ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Dabei sucht man in der gesamten Population von NSKF-Sequenzen nach Übereinstimmungen/Überlappungen in den Sequenzen von NSKFs. Durch diese Übereinstimmungen/Überlappungen kann man die NSKF in eine Reihe bringen, z.B.:

Figure 00110001
Then, for each fixed NSKF, its specific sequence is determined from the order of the built-in NTs *. From the overlapping NSKF sequences, the original NSK sequence can be reconstructed ("Automated DNA sequencing and analysis" page 231 et seq., 1994, M. Adams et al., Academic Press, Huang et al., Genom Res., 1999, v. 9 p. 868, Huang Genomics 1996 v. 33 p.21, Bonfield et al NAR 1995 v. 23 pp. 4992, Miller et al., J. Comput. Biol. 1994 v. 1 pp. 257). In the whole population of NSKF sequences one looks for matches / overlaps in the sequences of NSKFs. By these matches / overlaps one can bring the NSKF in a row, eg:
Figure 00110001

In der Praxis hat sich bei einer Sequenzierung von unbekannten Sequenzen bewährt, eine Länge der sequenzierten Stücke von mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung von Genomen aus Eukaryonten im Schrotschuss-Verfahren.In The practice has involved sequencing unknown sequences proven, a length the sequenced pieces of more than 300 bp. This allows sequencing of genomes from eukaryotes in the shot-shot method.

Dabei können die Fehler der Methode mit verschiedenen Mitteln erfasst und korrigiert werden. Sämtliche Schritte des Verfahrens können weitgehend automatisiert werden.there can The errors of the method are detected and corrected by various means become. All Steps of the procedure can be largely automated.

Durch die Arbeit mit einzelnen Molekülen ergeben sich mehrere Vorteile gegenüber der früher beschriebenen BASS-Methode:

  • 1. Da die Moleküle einzeln detektiert werden, besteht keine Gefahr, daß das Signal durch die Desynchronisation in der Population fehlerhaft wird. Für jedes fixierte NSKF wird eine eigene Sequenz erstellt. Daher spielt es keine Rolle, ob an einem benachbarten Molekül die Synthese bereits weiter fortgeschritten oder zurückgeblieben ist:
  • 2. Es ist nicht notwendig, Moleküle in einer definierten Anordnung auf der Oberfläche zu fixieren, da das Signal von einzelnen Molekülen ausgeht und nicht von einer räumlich definierten Population (was bei BASS-Methoden notwendig ist).
Working with single molecules has several advantages over the previously described BASS method:
  • 1. Since the molecules are detected individually, there is no danger that the signal will be corrupted by the desynchronization in the population. For each fixed NSKF a separate sequence is created. Therefore, it does not matter if the synthesis of an adjacent molecule is more advanced or lagging behind:
  • 2. It is not necessary to fix molecules in a defined arrangement on the surface, since the signal emanates from single molecules and not from a spatially defined population (which is necessary in BASS methods).

Kurze Beschreibung der FigurenShort description the figures

1: Allgemeines Prinzip der Sequenzierung einer langen Nukleinsäurekette (schematische Darstellung) 1 General Principle of Sequencing a Long Nucleic Acid Chain (Schematic)

  • 1) Ausgangsmaterial – die zu analysierende lange Nukleinsäuresequenz, Gesamtsequenz1) starting material - the long to be analyzed Nucleic acid sequence overall sequence
  • 2) Fragmente von 50–1000 bp – die im Fragmentierungsschritt aus der Gesamtsequenz erzeugten NSKFs2) Fragments of 50-1000 bp - the NSKFs generated from the overall sequence in the fragmentation step
  • 3) Fragmente mit jeweils einem Primer – NSKF-Primer-Hybridisierungsprodukte3) Fragments with one primer each - NSKF primer hybridization products
  • 4) Immobilisierte Fragmente – an die plane Oberfläche gebundene NSKF-Primer-Hybridisierungsprodukte, in dieser Ausführungsform erfolgt die Bindung am 3'-Ende der NSKFs4) Immobilized fragments - bound to the planar surface NSKF primer hybridization products, in this embodiment the bond is at the 3'-end the NSKFs
  • 5) Zugabe einer Lösung mit Polymerasen und NT*s als erster Schritt in einem Zyklus der Sequenzierungsreaktion5) Add a solution with polymerases and NT * s as a first step in a cycle of sequencing reaction
  • 6) Waschschritt – nach dem Einbauschritt wird die Oberfläche gewaschen6) Washing step - after the installation step, the surface is washed
  • 7) Detektion – die Signale von einzelnen eingebauten NT*s werden detektiert7) Detection - the Signals from individual built-in NT * s are detected
  • 8) Entfernung der Markierung und der zur Terminierung führenden Gruppe – zur Fortsetzung der Sequenzierungs reaktion werden die Markierung und das sterische Hindernis entfernt8) Removal of the mark and that leading to the termination Group - to Continuation of the sequencing reaction, the label and removed the steric barrier

2: Beispiele für die allgemeine Struktur von immbolilisierten Nukleinsäurefragmenten 2 : Examples of the General Structure of Immolubilized Nucleic Acid Fragments

Diese Figur zeigt eine an das 3'-Ende der NSKFs (3) angekoppelte einheitliche Primerbindungsstelle (PBS; 2) und einen an diese PBS gebundenen einheitlichen Primer (1).These Figure shows one to the 3 'end the NSKFs (3) coupled single primer binding site (PBS; 2) and a single primer bound to this PBS (1).

3: Oligonukleotid-Konstruktion mit einer Primerbindungsstelle und blockierten Enden 3 : Oligonucleotide construction with a primer binding site and blocked ends

Ein doppelsträngiger Oligonukleotidkomplex (3a), der eine Primerbindungsstelle (PBS) umfaßt, kann auf einer Seite des Oligonukleotids an beiden Strängen modifiziert sein (3b), damit nur eine PBS an das NSKF ligiert wird. Nach Ligation an die doppelsträngigen NSKFs und nach Denaturierung (3c) entstehen einzelsträngige NSKFs mit einheitlicher PBS und modifizierten Enden (3d).One double Oligonucleotide Complex (3a) Having a Primer Binding Site (PBS) comprises can be modified on one side of the oligonucleotide on both strands (3b), so that only one PBS is ligated to the NSKF. After ligation to the double-stranded ones NSKFs and after denaturation (3c) result in single-stranded NSKFs with uniform PBS and modified ends (3d).

4: Nukleotid-Tailing 4 : Nucleotide tailing

An das 3'-Ende eines einzelsträngigen DNA-Fragmentes (NSKFs) werden durch sogenanntes „Tailing" mit Hilfe einer terminalen Deoxynukleotidyltransferase mehrere Nukleosid-monophosphate angeknüpft (dargestellt sind Guanosin-Monophosphate und das sogenannte (G)n-Tailing). Bei Verwendung einheitlicher Nukleosid-monophosphate entsteht eine einheitliche PBS.To the 3 'end of a single stranded DNA fragment (NSKFs) are indicated by so-called "Tai With the aid of a terminal deoxynucleotidyltransferase, several nucleoside monophosphates are attached (guanosine monophosphates and the so-called (G) n tailing are shown.) Using uniform nucleoside monophosphates, a uniform PBS is formed.

5: Beispiele für die Bindung von NSKFs an eine gelartige Reaktionsoberfläche 5 : Examples of the binding of NSKFs to a gel-like reaction surface

  • a) Auf einer festen Oberfläche (1) haftet ein Gel (2), z.B. ein Polyacrylamidgel. An dessen kontinuierliche Oberfläche binden über an dem Gel gebundene Gruppen (3) (z.B. Streptavidin oder Avidin) NSKFs (4) mit einer funktionellen, zur Immobilisierung geeigneten Gruppe (3), z.B. Biotin.a) A gel (2) adheres to a solid surface (1), e.g. a polyacrylamide gel. At the continuous surface bind over on the Gel bound groups (3) (e.g., streptavidin or avidin) NSKFs (4) with a functional group suitable for immobilization (3), e.g. Biotin.
  • b) Anordnung wie in 5b, jedoch erfolgt die Bindung der NSKFs über eine diskontinuierliche Oberfläche zusammengesetzt aus einer Anzahl von Gelkügelchen (5), z.B. Agarosekügelchen, an die feste Oberfläche.b) arrangement as in 5b However, the binding of NSKFs occurs via a discontinuous surface composed of a number of gel beads (5), eg agarose beads, to the solid surface.

6: Beispiel eines Durchflußsystems 6 : Example of a flow system

Eine gelartige Reaktionsoberfläche (1) ist auf einer für das Anregungs- und Fluoreszenzlicht durchlässigen festen Unterlage (2) befestigt. Sie bildet zusammen den Deckel der Reaktionskammer (z.B. Flow-Cell). Die Flüssigkeiten in der Reaktionskammer können kontrolliert ausgetauscht werden, wobei die Reaktionskammer zusammen mit dem Vorratsbehälter (3), der Pumpe (4) und dem Ventil (5) ein Durchflußsystem bilden. Die Signale der in die auf der Reaktionsoberfläche gebundenen NSKF-Primer-Hybridisierungsprodukte (hier nicht abgebildet) eingebauten NT*s werden über das zur Detektionsapparatur gehörende Objektiv des Mikroskops (6) detektiert.A gelatinous reaction surface (1) is on a for the excitation and fluorescent light permeable solid support (2) attached. It together forms the lid of the reaction chamber (e.g. Flow Cell). The liquids in the reaction chamber can be replaced in a controlled manner, the reaction chamber together with the reservoir (3), the pump (4) and the valve (5) a flow system form. The signals of those bound in the on the reaction surface NSKF primer hybridization products (not shown here) incorporated NT * s will be over the belonging to the detection apparatus Lens of the microscope (6) detected.

7: Allgemeine Strukturen der NT* (markierte 2'-Deoxynukleosidtriphosphate) 7 General Structures of NT * (Labeled 2'-Deoxynucleoside Triphosphates)

  • a) Schematische Darstellung der NT-Struktur der Semitterminatoren, bei denen an der Base über einen spaltbaren Linker (A-E) eine sterische Gruppe (D) und der Fluoreszenzmarker (F) gebunden sind. A,C,E – Verbindungselemente im Linker; A – Linkerrest nach der Spaltung; B – spaltbare Verbindung/Gruppe; D – sterisch anspruchsvolle, zur Termination führende Gruppe; F – Fluoreszenzfarbstoff (Marker).a) Schematic representation of the NT structure semitterminators, where at the base via a cleavable linker (A-E) a steric group (D) and the fluorescent marker (F) bound are. A, C, E connectors in the linker; A - linker residue after the split; B - fissile Compound / group; D - sterically demanding group leading to termination; F - fluorescent dye (Marker).
  • b) Schematische Darstellung der NT-Struktur, bei welcher der Fluoreszenzfarbstoff gleichzeitig die Funktion der sterisch anspruchsvollen Gruppe übernimmt. A,C – Linker; A – Linkerrest nach der Spaltung; B – spaltbare Verbindung/Gruppe; D – sterisch anspruchsvolle, zur Termination führende Gruppe; F – Fluoreszenzfarbstoff (Marker).b) Schematic representation of the NT structure in which the Fluorescent dye simultaneously the function of sterically demanding Group takes over. A, C - linker; A - linker residue after the split; B - fissile Compound / group; D - sterically demanding group leading to termination; F - fluorescent dye (Marker).
  • c) Schematische Darstellung der Struktur von eingebauten NT*s nach dem Abspaltungsschritt. Dargestellt sind zwei NT*s mit dem verbliebenen Linkerrest (A).c) Schematic representation of the structure of built-in NT * s after the cleavage step. Shown are two NT * s with the remaining linker residue (A).
  • d) Schematische Darstellung der NT-Struktur, bei welcher die spaltbare Gruppe, die gleichzeitig die sterisch anspruchsvolle, zur Termination führende Gruppe ist, einen Teil des Linkers darstellt. Diese sterische Gruppe kann eine photolabile Gruppe sein. A,C – Linker; A – Linkerrest nach der Spaltung; B – spaltbare Verbindung/Gruppe; D – sterisch anspruchsvolle, zur Termination führende Gruppe; F – Fluoreszenzfarbstoff (Marker).d) Schematic representation of the NT structure in which the fissile group, which at the same time the sterically demanding, leading to termination Group is, represents a part of the linker. This steric group may be a photolabile group. A, C - linker; A - linker residue after the split; B - fissile Compound / group; D - sterically demanding group leading to termination; F - fluorescent dye (Marker).
  • e) Darstellung von bevorzugten NT-Strukturen, bei denen der Linker an die 5-Position im Pyrimidinring gekoppelt ist (e-1: Uracil; e-2: Cytosin).e) Representation of preferred NT structures in which the Linker is coupled to the 5-position in the pyrimidine ring (e-1: uracil; e-2: cytosine).
  • f) Darstellung weiterer bevorzugter NT-Strukturen, bei denen der Linker an die 5-Position im Pyrimidinring angekoppelt ist (f-1 und f-2 jeweils Uracil; f-3 und f-4 jeweils Cytosin).f) Representation of further preferred NT structures in which the linker is coupled to the 5-position in the pyrimidine ring (f-1 and f-2 each uracil; f-3 and f-4 each cytosine).
  • g) Darstellung von bevorzugten NT-Strukturen, bei denen der Linker an die 7-Position im Purinring gekoppelt ist (g-1: Adenin; g-2: Guanin).g) Representation of preferred NT structures in which the Linker is coupled to the 7-position in the purine ring (g-1: adenine; g-2: guanine).
  • h-j) Beispiele für die Ankopplung von Farbstoffen an den Linker, der an die Base des Nukleotid gekoppelt ist. (7h) dNTP-SS-TRITC; 7i) dNTP-SS-Cy3; 7j) dNTP-SS-TRITC)h-j) Examples of the coupling of dyes to the linker attached to the base of the Nucleotide is coupled. (7h) dNTP-SS-TRITC; 7i) dNTP-SS-Cy3; 7y) dNTP-SS-TRITC)

8 Beispiel für eine Detektionsvorrichtung 8th Example of a detection device

Dargestellt ist eine Weitfeld-Optik-Detektionsvorrichtung mit einer Lichtquelle zur Anregung der Fluoreszenz (1), einem lichtleitendem Teil (2), einem Scanntisch (3), einer Vorrichtung zur Selektion der Spektren (4), einer Detektionsvorrichtung (5), einem Computer mit Steuerungs- und Analysefunktion (6) und einer Oberfläche mit immobilisierten NSFKs (7), die nach dem Einbau von markierten NT*s abgescannt wird, wobei die Fluoreszenzsignale von einzelnen, an die NTs gekoppelten Farbstoffmolekülen detektiert werden.shown is a wide-field optical detection device with a light source for exciting the fluorescence (1), a light-conducting part (2), a scanning table (3), a device for selecting the spectra (4), a detection device (5), a computer with control and analysis function (6) and a surface with immobilized NSFKs (7), which is scanned after installation of marked NT * s, where detects the fluorescence signals from individual dye molecules coupled to the NTs become.

  • a) Schematische Darstellung eines Abschnittes der Reaktionsoberfläche (grau), der schrittweise abgescannt wird. Die Kreise entsprechen jeweils der Aufnahme ei nes 2D-Bildes und repräsentieren die Flächen, von denen die Fluoreszenzsignale detektiert werden.a) Schematic representation of a section the reaction surface (gray), which is scanned step by step. The circles correspond each recording a 2D image and represent the areas of where the fluorescence signals are detected.
  • b) Darstellung einer Aufnahme (ein 2D-Bild) mit Fluoreszenzsignalen der einzelnen, eingebauten NT*s. Es können pro Aufnahme mehrere Signale (beispielsweise 100 bis 10.000) von einzelnen Molekülen gleichzeitig registriert werden.b) Representation of a photograph (a 2D image) with fluorescence signals the single, built-in NT * s. There are several signals per recording (For example, 100 to 10,000) of single molecules simultaneously be registered.
  • c) Ausschnitt aus 8b. Der Ausschnitt zeigt Signale von eingebauten NT*s. Jedem der identifizierten Signale werden die entsprechenden X,Y-Koordinaten zugeordnet. Jedes Signal besitzt charakteristische Eigenschaften und kann aufgrund dieser identifiziert werden (vorzugsweise mit Hilfe eines Computerprogramms).c) detail from 8b , The section shows signals from built-in NT * s. Each of the identified signals are assigned the corresponding X, Y coordinates. Each signal has characteristic properties and can be identified by it (preferably by means of a computer program).

9: Sequenzierungsreaktion auf zwei getrennten Oberflächen 9 : Sequencing reaction on two separate surfaces

Der Durchsatz wird durch Verwendung von zwei getrennten Durchflußsystemen (z.B. Flow-Cells (Mikroflüssigkeitskanäle, MFK)) erhöht. Während auf der einen Oberfläche biochemische und chemische Reaktionen ablaufen, wird auf der anderen die Detektion durchgeführt. Anschließend tauschen die Oberflächen in den Flow-Cells ihre Positionen.Of the Throughput is achieved by using two separate flow systems (e.g., flow cells (microfluidic channels, MFK)) elevated. While on the one surface Biochemical and chemical reactions take place on the other the detection performed. Subsequently swap the surfaces their positions in the flow cells.

4. Detaillierte Beschreibung4. Detailed description

Die Abk. "M", "mM" und "μM" stehen für die Einheiten mol/l, mmol/l bzw. μmol/l.The Abbr. "M", "mM" and "μM" stand for the units mol / l, mmol / l or μmol / l.

4.1 Allgemeine Prinzipien der Reaktion4.1 General principles the reaction

Im folgenden sollen anhand der Sequenzierung eines mehrere Mb langen DNA-Stückes beispielhaft die allgemeinen Prinzipien der Reaktion dargestellt werden (1). Der Sequenzierung und der Rekonstruktion von Nukleinsäurensequenzen liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S.257). Die Sequenz eines langen DNA-Stücks wird dabei durch die Sequenzierung kleiner DNA-Fragmente und nachfolgender Rekonstruktion ermittelt. Das zu analysierende Material (1) wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird (2). Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen (3). Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen Oberfläche fixiert (4). Die nicht gebundenen DNA-Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamtenIn the following, the general principles of the reaction are to be exemplified by the sequencing of a several Mb long piece of DNA ( 1 ). The sequencing and reconstruction of nucleic acid sequences is based on the shotgun principle ("Automated DNA sequencing and analysis" p. 231 et seq., 1994. M. Adams et al., Academic Press, Huang et al., Genome Res. 1999, 9, p.868 , Huang Genomics 1996 v. 33 p.21, Bonfield et al NAR 1995 v. 23 p.4992, Miller et al., J. Comput. Biol. 1994 v. 1 p.257). The sequence of a long piece of DNA is determined by the sequencing of small DNA fragments and subsequent reconstruction. The material (1) to be analyzed is prepared for the sequencing reaction by breaking it up into fragments of preferably 50 to 1000 bp in length (2). Each fragment is then provided with a primer binding site and a primer (3). This mixture of different DNA fragments is now fixed on a flat surface (4). The unbound DNA fragments are removed by a washing step. Thereafter, the sequencing reaction on the entire

Reaktionsoberfläche durchgeführt. Diese Reaktion verläuft zyklisch. Im 1. Schritt des Zyklus wird ein mit einem Fluoreszenzfarbstoff markiertes NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion so gesteuert, daß in jedem Zyklus jeweils nur ein markiertes NT* von einer Polymerase in den wachsenden Strang eingebaut werden kann. Das wird durch die Verwendung von NTs* erreicht, die eine reversibel gekoppelte, zur Termination führende Gruppe tragen. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht. Die Polymerase und die markierten NTs* werden gleichzeitig in die Reaktion eigesetzt (5). Danach wird das Reaktionsgemisch entfernt und die Oberfläche in geeigneter Art und Weise gewaschen (6). Nun folgt ein Detektionsschritt (7): Die Oberfläche wird mit einer für die Einzelmoleküldetektion geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, Kamera, Scantisch, Computer mit Steuerungs- und Bilderkennungs- bzw. Bildverarbeitungssoftware) abgescannt und die Signale der einzelnen, eingebauten markierten NTs* identifiziert. Nach dem Detektionsschritt wird die Markierung und die zur Termination führende Gruppe von allen eingebauten NTs* entfernt (8). Nach einem sich anschließenden Waschschritt kann ein neuer Zyklus beginnen. Zur Rekonstruktion einer größeren ursprünglichen DNA-Sequenz (z.B. mehrere Mb langes DNA-Stück) sollen die DNA-Fragmente einige Hundert NT lang sein, falls man die Rekonstruktion nach dem Shotgun-Prinzip durchführt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 300 Zyklen zur Sequenzierung notwendig.Reaction surface performed. These Reaction proceeds cyclically. In the 1st step of the cycle, one becomes with a fluorescent dye marked NT * incorporated into the growing strand: This is the Reaction controlled so that in each cycle only one labeled NT * of a polymerase can be installed in the growing strand. That is through the Use of NTs * achieved a reversibly coupled, for Termination leading Bear group. The installation of another marked NT * is thereby impossible made. The polymerase and the labeled NTs * become simultaneously into the reaction (5). Thereafter, the reaction mixture removed and the surface washed in a suitable manner (6). Now follows a detection step (7): The surface will be with a for the single molecule detection suitable device (consisting of light source, microscope, camera, Scan table, computer with control and image recognition or image processing software) scanned and the signals of each, built-in marked NTs * identified. After the detection step, the mark and the leading to the termination Group removed from all built-in NTs * (8). After one subsequent Washing step can start a new cycle. For reconstruction a larger original DNA sequence (e.g., several Mb long piece of DNA) the DNA fragments should be a few hundred NT long, if one performs the reconstruction according to the shotgun principle ("automated DNA sequencing and analysis "p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. genome Res. 1999 v. Chr. 9 p. 868, Huang Genomics 1996 v. Chr. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257). Since only one marked NT * is installed per cycle At least 300 cycles are required for sequencing.

4.2 Auswahl des Materials4.2 Selection of the material

Mit Hilfe der erfindungsgemäßen Methode ist es möglich, sowohl vorselektionierte DNA-Sequenzen (z.B. in YAC-, PAC-, oder BAC-Vektoren (R. Anand et al. NAR 1989 v. 17 S. 3425, H. Shizuya et al. PNAS 1992 v. 89 S. 8794, "Construction of bacterial artificial chromosome libraries using the modified PAC system" in "Current Protocols in Human genetics" 1996 John Wiley & Sons Inc.) klonierte Abschnitte eines Genoms) als auch nicht vorselektionierte DNA (z.B. genomische DNA, cDNA-Gemische) zu analysieren. Durch eine Vorselektion ist es möglich, im Vorfeld relevante Informationen, wie z.B. Sequenz-Abschnitte aus einem Genom oder Populationen an Genprodukten, aus der große Menge genetischer Informationen herauszufiltern und damit die Menge der zu analysierenden Sequenzen einzuschränken.With the aid of the method according to the invention, it is possible to use both preselected DNA sequences (eg in YAC, PAC or BAC vectors (Anand, R., et al NAR 1989, 17 pp 3425, H. Shizuya et al., PNAS 1992 v. 89 p. 8794, "Construction of bacterial artificial chromosome libraries using the modified PAC system" in "Cur rented Protocols in Human Genetics "1996 John Wiley & Sons Inc.) as well as non-preselected DNA (eg, genomic DNA, cDNA mixtures) to analyze by pre-selection, in advance relevant information, such as Sequence sections from a genome or populations of gene products, to filter out of the large amount of genetic information and thus to limit the amount of sequences to be analyzed.

4.3 Vorbereitung des Materials4.3 Preparation of the material

Ziel der Materialvorbereitung ist es, immobilisierte einzelsträngige NSKFs mit einer Länge von vorzugsweise 50–1000 NTs, einer einzelnen Primerbindungsstelle und einem hybridisierten Primer zu erhalten. Diese Fragmente haben vorzugsweise die in 2 dargestellte Struktur. Im einzelnen können sehr variable Konstruktionen aus dieser allgemeinen Struktur abgeleitet werden. Zur Verbesserung der Anschaulichkeit folgen nun einige Beispiele, wobei die angeführten Methoden einzeln oder in Kombination eingesetzt werden können.The aim of the material preparation is to obtain immobilized single-stranded NSKFs with a length of preferably 50-1000 NTs, a single primer binding site and a hybridized primer. These fragments preferably have the in 2 illustrated structure. In particular, very variable constructions can be derived from this general structure. To improve the clarity, some examples now follow, the methods given may be used individually or in combination.

4.3.1 Erzeugung kurzer Nukleinsäurekettenfragmente (50–1000 NTs)4.3.1 Generation short Nucleic acid chain fragments (50-1000 NTs)

Wichtig ist, daß die Fragmentierung der NSKs so erfolgt, daß Fragmente erhalten werden, die überlappende Teilsequenzen der Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht, bei denen unterschiedlich lange Fragmente als Spaltprodukte in zufallsmäßiger Verteilung entstehen.Important is that the Fragmentation of the NSKs is done so that fragments are obtained the overlapping Represent partial sequences of the overall sequences. This is done by procedures reached, in which fragments of different lengths as fission products in random distribution arise.

Erfindungsgemäß kann die Erzeugung der Nukleinsäurekettenfragmente (NSKFs) durch mehrere Methoden erfolgen, z.B. durch die Fragmentierung des Ausgangsmaterials mit Ultraschall oder durch Endonukleasen ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press), wie z.B. durch unspezifische Endonukleasegemische. Erfindungsgemäß wird die Ultraschall-Fragmentierung bevorzugt. Man kann die Bedingungen so einstellen, daß Fragmente mit einer durchschnittlichen Länge von 100 bp bis 1 kb entstehen. Diese Fragmente werden anschließend an ihren Enden durch das Klenow-Fragment (E.coli-Polymerase I) oder durch die T4-DNA-Polymerase aufgefüllt ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).According to the invention, the Generation of nucleic acid chain fragments (NSKFs) by several methods, e.g. through the fragmentation of the starting material with ultrasound or by endonucleases ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laboratory Press), e.g. by unspecific Endonukleasegemische. According to the invention, the ultrasound fragmentation prefers. One can adjust the conditions so that fragments with an average length from 100 bp to 1 kb. These fragments are subsequently attached their ends by the Klenow fragment (E. coli polymerase I) or filled by the T4 DNA polymerase ("Molecular cloning" 1989 J. Sambrook et al., Cold Spring Harbor Laboratory Press).

Ausserdem können aus einer langen NSK unter Verwendung randomisierter Primer komplementäre kurze NSKFs synthetisiert werden. Besonders bevorzugt wird diese Methode bei der Analyse der Gen-Sequenzen. Dabei werden an der mRNA einzelsträngige DNA-Fragmente mit randomisierten Primern und einer reversen Transkriptase gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 S. 264, Decraene et al. Biotechniques 1999 v. 27 S. 962).Moreover can from a long NSK using randomized primer complementary short NSKFs are synthesized. This method is particularly preferred in the analysis of gene sequences. In this case, single-stranded DNA fragments are randomized to the mRNA Primers and a reverse transcriptase (Zhang-J et al. Biochem. J. 1999 v. Chr. 337 p. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 p. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 p. 264, Decraene et al. Biotechniques 1999 v. Chr. 27 p. 962).

4.3.2 Einführung einer Primerbindungsstelle in das NSKF.4.3.2 Introduction of a Primary binding site in the NSKF.

Die Primerbindungsstelle ist ein Sequenzabschnitt, der eine selektive Bindung des Primers an das NSKF ermöglichen soll.The Primer binding site is a sequence section that is a selective To allow binding of the primer to the NSKF.

Aus Gründen der Vereinfachung der Analyse ist es günstig, wenn eine möglichst einheitliche Primerbindungsstelle in allen NSKFs vorhanden ist. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Primerbindungsstellen daher in die NSKFs extra eingeführt. Auf diese Weise können Primer mit einheitlicher Struktur für die Reaktion eingesetzt werden.Out establish The simplification of the analysis is favorable, if possible uniform primer binding site is present in all NSKFs. According to one preferred embodiment Therefore, according to the invention, the primer binding sites become the NSKFs extra introduced. That way you can Primers with a uniform structure can be used for the reaction.

Die Zusammensetzung der Primerbindungsstelle ist nicht eingeschränkt. Ihre Länge beträgt vorzugsweise zwischen 20 und 50 NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann z.B. eine Biotingruppe sein.The Composition of the primer binding site is not restricted. Your Length is preferably between 20 and 50 NTs. The primer binding site may be a functional Carrying group for the immobilization of the NSKF. This functional group can e.g. to be a biotin group.

Als Beispiel für die Einführung einer Primerbindungsstelle werden im folgenden die Ligation und das Nukleotid-Tailing an DNA-Fragmente beschrieben.When example for the introduction a primer binding site are the ligation and nucleotide tailing to DNA fragments described.

a) Ligation:a) Ligation:

Dabei wird ein doppelsträngiger Oligonukleotidkomplex mit einer Primerbindungsstelle verwendet (3a). Dieser wird mit kommerziell erhältlichen Ligasen an die DNA-Fragmente ligiert ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). Es ist wichtig, daß nur eine einzige Primerbindungsstelle an das DNA-Fragment ligiert wird. Das erreicht man z.B. durch eine Modifikation einer Seite des Oligonukleotidkomplexes an beiden Strängen (3b). Die Resultate nach der Ligation bzw. nach anschließender Denaturierung sind in 3c und 3d dargestellt. Die modifizierenden Gruppen am Oligonukleotidkompex können zur Immobilisation dienen. Die Synthese und die Modifikation eines solchen Oligonukleotidkomplexes kann nach standardisierten Vorschriften durchgeführt werden. Zur Synthese kann z.B. der DNA-Synthesizer 380 A Applied Biosystems verwendet werden. Oligonucleotide mit einer bestimmten Zusammensetzung mit oder ohne Modifikationen sind aber auch als Auftragssynthese kommerziell erhältlich, z.B. von MWG-Biotech GmbH, Germany.A double-stranded oligonucleotide complex with a primer binding site is used ( 3a ). This is ligated to the DNA fragments with commercially available ligases (Molecular cloning 1989 J. Sambrook et al., Cold Spring Harbor Laboratory Press). It is important that only a single primer binding site be ligated to the DNA fragment. This can be achieved, for example, by modifying one side of the page Oligonucleotide complex on both strands ( 3b ). The results after ligation or subsequent denaturation are in 3c and 3d shown. The modifying groups on the oligonucleotide complex can serve for immobilization. The synthesis and the modification of such an oligonucleotide complex can be carried out according to standardized instructions. For example, the DNA synthesizer 380 A Applied Biosystems can be used for the synthesis. However, oligonucleotides with a specific composition, with or without modifications, are also commercially available as an order synthesis, for example from MWG-Biotech GmbH, Germany.

b) Nukleotid-Tailing:b) nucleotide tailing:

Statt der Ligation mit einem Oligonukleotid kann man mit einer terminalen Deoxynucleotidyltransferase mehrere (z.B. zwischen 10 und 20) Nukleosid-monophosphate an das 3'-Ende eines ss-DNA-Fragments anknüpfen ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v. 303, S. 37–38) (4), z.B. mehrere Guanosin-Monophosphate ((G)n-Tailing genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem Beispiel eines (C)n-Primers, verwendet.Instead of ligation with an oligonucleotide, several (eg between 10 and 20) nucleoside monophosphates can be linked to a terminal deoxynucleotidyltransferase at the 3 'end of an ssDNA fragment ("Molecular cloning" 1989, J. Sambrook et al., Cold Spring Harbor Laboratory Press, "Method in Enzymology" 1999 v. 303, pp. 37-38) ( 4 ), eg several guanosine monophosphates (called (G) n-tailing). The resulting fragment is used to bind the primer, in this example a (C) n primer.

4.3.3 Einzelstrang-Vorbereitung4.3.3 Single-strand preparation

Für die Sequenzierungsreaktion werden einzelsträngige NSKFs benötigt. Falls das Ausgangsmaterial in doppelsträngiger Form vorliegt, gibt es mehrere Möglichkeiten, aus doppelsträngiger DNA eine einzelsträngige Form zu erzeugen (z.B. Hitze-Denaturierung oder Alkali-Denaturierung) ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).For the sequencing reaction become single-stranded NSKFs needed. If the starting material is in double-stranded form, there there are several ways from double-stranded DNA is a single-stranded one Form (e.g., heat denaturation or alkali denaturation) ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laboratory Press).

4.3.4 Primer für die Sequenzierungsreaktion4.3.4 Primer for the sequencing reaction

Dieser hat die Funktion, den Start an einer einzigen Stelle des NSKF zu ermöglichen. Vorzugsweise bindet er an die Primerbindungsstelle im NSKF. Die Zusammensetzung und die Länge des Primers sind nicht eingeschränkt. Außer der Startfunktion kann der Primer auch andere Funktionen übernehmen, wie z.B. eine Verbindung zur Reaktionsoberfläche zu schaffen. Primer sollten so an die Länge und Zusammensetzung der Primerbindungsstelle angepaßt werden, daß der Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase ermöglicht.This has the function to start at a single point of the NSKF enable. Preferably, it binds to the primer binding site in the NSKF. The Composition and the length of the primer are not restricted. Except the start function, the primer can also perform other functions, such as. to create a connection to the reaction surface. Primer should so long and composition of the primer binding site, that the Primer the start of the sequencing reaction with the respective polymerase allows.

Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF dient, vorzugsweise ist eine solche Funktionsgruppe eine Biotingruppe (s. Abschnitt Immobilisierung). Sie soll die Sequenzierung nicht stören. Die Synthese eines solchen Primers kann z.B. mit dem DNA-Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter, z.B. MWG-Biotech GmbH, Germany erstellt werden).Preferably is the length of the primer between 6 and 100 NTs, optimally between 15 and 30 NTs. The primer can carry a functional group that is used for immobilization of the NSKF, preferably such a functional group is one Biotin group (see section Immobilization). She should do the sequencing do not bother. The synthesis of such a primer can e.g. with the DNA synthesizer 380 A Applied Biosystems or as an order synthesis from a commercial supplier, e.g. MWG-Biotech GmbH, Germany).

Der Primer kann vor der Hybridisierung an die zu analysierenden Fragmente auf der Oberfläche mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert werden (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxfoxrd University Press, Fodor et al. Science 1991 v. 285 S. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).Of the Primer may be pre-hybridized to the fragments to be analyzed on the surface fixed with different techniques or synthesized directly on the surface (McGall et al., U.S. Patent 5,411,087, Barrett et al., U.S. Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays "1999 M. Schena Oxfoxd University Press, Fodor et al. Science 1991 v. Chr. 285, p. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. Chr. 15 pp. 5353, Gingeras et al. NAR 1987 v. Chr. 15 pp. 5373, Maskos et al. NAR 1992 v. 20 p. 1679).

Der Primer oder das Primergemisch wird mit NSKFs unter Hybridisierungsbedingungen inkubiert, die ihn selektiv an die Primerbindungsstelle des NSKF binden lassen. Diese Primer-Hybridisierung kann vor, während oder nach der Immobilisierung der NSKFs erfolgen. Die Optimierung der Hybridisierungsbedingungen hängt von der genauen Struktur der Primerbindungsstelle und des Primers ab und läßt sich nach Rychlik et al. NAR 1990 v. 18 S. 6409 berechnen. Im folgenden werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen bezeichnet.Of the Primer or primer mix is used with NSKFs under hybridization conditions which selectively delivers it to the primer binding site of the NSKF let bind. This primer hybridization may be before, during or after immobilization of the NSKFs. The optimization of Hybridization conditions depends on the exact structure of the primer binding site and the primer and lets himself go according to Rychlik et al. NAR 1990 v. Calculate 18 p. 6409. Hereinafter These hybridization conditions are considered as standardized hybridization conditions designated.

Falls eine für alle NSKFs gemeinsame Primerbindungsstelle mit bekannter Struktur durch Ligation eigeführt wird, können Primer mit einheitlicher Struktur eingesetzt werden. Die Primerbindungsstelle kann an ihrem 3'-Ende eine funktionelle Gruppe tragen, die z.B. zur Immobilisation dient. Vorzugsweise ist diese Gruppe eine Biotin-Gruppe. Der Primer hat eine zur Primerbindungsstelle komplementäre Struktur.If one for all NSKFs common primer binding site of known structure introduced by ligation will, can Primers with a uniform structure can be used. The primer binding site can at her 3'-end carry a functional group, e.g. serves for immobilization. Preferably, this group is a biotin group. The primer has a complementary to the primer binding site structure.

Ein Beispiel einer Primerbindungstelle und eines Primers ist nachfolgend dargestellt.One Example of a primer binding site and a primer is below shown.

Figure 00240001
Figure 00240001

4.3.5 Immobilisation4.3.5 Immobilization

Ziel der Immobilisierung ist es, NSKFs auf einer geeigneten planen Oberfläche in einer Art und Weise zu fixieren, daß eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Oberfläche und Reaktionsoberfläche sind in dieser Anmeldung als gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient die Oberfläche einer festen Phase eines beliebigen Materials. Dieses Material ist vorzugsweise enzymatischen Reaktionen gegenüber inert und verursacht keine Störungen der Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole) oder beliebiges anderes Material, das diesen funktionalen Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung der Signale bei der wiederholten Detektion zu rechnen.aim immobilization is to place NSKFs on a suitable planar surface in one Way to fix that one cyclic enzymatic sequencing reaction can proceed. Surface and reaction surface are to be understood as equivalent terms in this application, except if explicit reference is made to another meaning. Serves as a reaction surface the surface a solid phase of any material. This material is preferably enzymatic reactions to inert and causes no disorders the detection. Silicone, glass, ceramic, plastic (e.g., polycarbonates or polystyrenes) or any other material containing this functional Requirements are sufficient can be used. Preferably, the surface is not deformable, because otherwise with a distortion of the signals at to reckon with the repeated detection.

Falls eine gelartige feste Phase verwendet wird, so kann dieses Gel z.B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da frei passierbar (beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% Polyacrylamid Gel verwendet werden). Eine solche Geloberfläche hat anderen festen Oberflächen gegenüber den Vorteil, daß die markierten NSKFs im Gegensatz zu freien NTs* auf der Oberfläche festgehalten werden. Durch die Immobilisation der NSKFs auf der Oberfläche ist die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die Signale von freien NTs* werden nicht detektiert, weil sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das Gel ist vorzugsweise auf einer festen Unterlage befestigt (5a). Die Dicke des Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke muß jedoch größer als die einfache Tiefenschärfe des Objektivs sein, damit unspezifisch an die feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen und damit detektiert werden. Wenn die Tiefenschärfe z.B. 0,3 μm beträgt, so liegt die Geldicke vorzugsweise zwischen 1 μm und 100 μm. Die Oberfläche kann als eine kontinuierliche Oberfläche oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen (z.B. Agarose-Kügelchen) zusammengesetzte Oberfläche hergestellt werden (5b). Die Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl der NSKFs bei entsprechender Dichte immobilisieren zu können. Die Reaktionsoberfläche sollte vorzugsweise nicht größer als 20 cm2 sein.If a gel-like solid phase is used, this gel may be, for example, an agarose or polyacrylamide gel. The gel is preferably freely passable for molecules of molecular mass below 5000 Da (for example, a 1 to 2% agarose gel or 10 to 15% polyacrylamide gel may be used). Such a gel surface has the advantage over other solid surfaces that the labeled NSKFs are retained on the surface as opposed to free NTs *. The immobilization of the NSKFs on the surface makes it possible to detect the fluorescence signals of incorporated NTs *. The signals of free NTs * are not detected because they do not bind to the material of the gel and thus are not immobilized. The gel is preferably attached to a solid support ( 5a ). The thickness of the gel is preferably not more than 0.1 mm. However, the money must be greater than the simple depth of field of the lens, so nonspecifically bound to the solid surface NTs * do not reach the focal plane and thus detected. If the depth of focus is, for example, 0.3 μm, the thickness of the coin is preferably between 1 μm and 100 μm. The surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (eg agarose beads) ( 5b ). The reaction surface must be large enough to be able to immobilize the necessary number of NSKFs with appropriate density. The reaction surface should preferably be no larger than 20 cm 2 .

Die verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen Reaktionslösungen über der Oberfläche. Die Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktionsgefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchflußvorrichtung ermöglicht einen Austausch der Lösungen im Reaktionsgefäß. Der Austausch kann mit einer durch einen Computer gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei ist, daß die Oberfläche nicht austrocknet. Vorzugsweise beträgt das Volumen des Reaktionsgefäßes weniger als 50 μl. Idealerweise beträgt sein Volumen weniger als 1 μl. Ein Beispiel eines solchen Duchflußsystems ist in 6 gegeben.The various cycle steps require an exchange of the different reaction solutions above the surface. The reaction surface is preferably part of a reaction vessel. The reaction vessel is again preferably part of a reaction apparatus with a flow device. The flow device allows an exchange of the solutions in the reaction vessel. The replacement can be done with a computer-controlled pumping device or manually. It is important that the surface does not dry out. The volume of the reaction vessel is preferably less than 50 μl. Ideally, its volume is less than 1 μl. An example of such a flow system is in 6 given.

Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem der beiden Ketten-Enden. Dies kann durch entsprechende kovalente, affine oder andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, S. 138, Allemand et al. Biophysical Journal 1997, v. 73, S. 2064, Trabesinger et al. Analytical Chemistry 1999, v. 71, S. 279, Osborne et al. Analytical Chemistry 2000, v. 72, S. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S.1679).The Immobilization of the NSKFs is preferably carried out on one of the two Chain ends. This can be done by appropriate covalent, affine or other bindings are achieved. There are many examples of immobilization of nucleic acids (McGall et al., US Patent 5412087, Nikiforov et al., US Patent 5610287, US Pat. Barrett et al. U.S. Patent 5,482,867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology "2000 M. Schena Eaton Publishing, "DNA Microarrays "1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, p. 138, Allemand et al. Biophysical Journal 1997, v. Chr. 73 P. 2064, Trabesinger et al. Analytical Chemistry 1999, v. 71, p. 279, Osborne et al. Analytical Chemistry 2000, v. 72, p. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. Chr. 15 pp. 5353, Gingeras et al. NAR 1987 v. Chr. 15 p. 5373, Maskos et al. NAR 1992 v. 20 p.1679).

Die NSKFs werden auf der Oberfläche vorzugsweise in einer Dichte zwischen 10 und 100 NSKFs pro 100 μm2 immobilisiert. Beispielhaft werden im folgenden zwei Methoden zur Immobilisierung näher dargestellt: In einer bevorzugten Ausführungsform erfolgt die Immobilisierung der NSKFs über Biotin-Avidin oder Biotin-Streptavidin-Bindung. Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent gebunden, das 5'-Ende des Primers enthält Biotin. Nach der Hybridisierung der markierten Primer mit den NSKFs werden diese auf der mit Avidin/Streptavidin modifizierten Oberfläche fixiert. Die Konzentration der mit Biotin markierten Hybridisierungs-Produkte sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird so gewählt, daß eine für die Sequenzierung geeignete Dichte erreicht wird.The NSKFs are preferably immobilized on the surface at a density of between 10 and 100 NSKFs per 100 μm 2 . By way of example, two methods of immobilization are described in more detail below: In a preferred embodiment, the immobilization of the NSKFs takes place via biotin-avidin or biotin-streptavidin binding. This avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer contains biotin. After hybridization of the labeled primers with the NSKFs, they are fixed on the avidin / streptavidin-modified surface. The concentration of biotin-labeled hybridization products and the time of incubation of this solution with the surface are chosen to achieve a density suitable for sequencing.

In einer anderen bevorzugten Ausführungsform werden die für die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungsreaktion auf der Oberfläche mit geeigneten Methoden fixiert (s.o.). Die einzelsträngigen NSKFs mit jeweils einer Primerbindungsstelle pro NSKF werden damit unter Hybridisierungsbedingungen inkubiert. Dabei binden sie an die fixierten Primer und werden dadurch immobilisiert. Die Konzentration der einzelsträngigen NSKFs wird so gewählt, daß man eine für die Sequenzie rung geeignete Immobilisationsdichte von 10 bis 100 NSKFs pro 100 μm2 erreicht. Nach der Immobilisierung werden ungebundene NSKFs durch einen Waschschritt entfernt. Falls die Oberfläche einer festen Phase (z.B. Silikon oder Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen für eine Blockierlösung erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert zwischen 8 und 10.In another preferred embodiment, the primers suitable for the sequencing reaction are fixed on the surface by suitable methods before the sequencing reaction (see above). The single-stranded NSKFs with one primer binding site per NSKF are thus incubated under hybridization conditions. They bind to the fixed primer and are thereby immobilized. The concentration of the single-stranded NSKFs is chosen so as to achieve a suitable sequencing tion immobilization density of 10 to 100 NSKFs per 100 microns 2 . After immobilization, unbound NSKFs are removed by a wash step. If the surface of a solid phase (eg silicone or glass) is used for immobilization, preferably a blocking solution is applied to the surface prior to step (a) in each cycle to avoid nonspecific adsorption of NTs * to the surface. These conditions for a blocking solution, for example, meets an albumin solution (BSA) with a pH between 8 and 10.

4.4 Wahl der Polymerase4.4 Choice of polymerase

Als Polymerasen eignen sich prinzipiell alle DNA-abhängigen DNA-Polymerasen ohne 3'-5' Exonuklease-Aktivität (DNA-Replication" 1992 Ed. A. Kornberg, Freeman and company NY), z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia Biotech), 3'-5' exonuklease freies Klenow Fragment der DNA-Polymerase I (Amersham Pharmacia Biotech), Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M., CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile Polymerasen wie Taq-Polymerase (GibcoBRL), proHATM Polymerase (Eurogentech).When Polymerases are in principle suitable for all DNA-dependent DNA polymerases without 3'-5 'exonuclease activity (DNA replication "1992 Ed. A. Kornberg, Freeman and company NY), e.g. modified T7 polymerase type "Sequenase Version 2 "(Amersham Pharmacia Biotech), 3'-5 'exonuclease free Klenow fragment of DNA polymerase I (Amersham Pharmacia Biotech), Polymerase Beta of various origins (Animal Cell DNA Polymerases 1983, Fry M., CRC Press Inc., commercially available in Chimerx) thermostable polymerases such as Taq polymerase (GibcoBRL), proHATM polymerase (Eurogentech).

Polymerasen mit 3'-5' Exonuklease-Aktivität können eingesetzt werden (z.B. Klenow-Fragment der E.coli-Polymerase I), sofern Reaktionsbedingungen gewählt werden, die vorhandene 3'-5' Exonuklease-Aktivität unterdrücken, wie z.B. ein niedriger pH-Wert (pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. Biol. Chem. 1964 v. 239 S. 233). Eine andere Möglichkeit besteht in der Verwendung von NTs* mit einer Phosphorothioate-Verbindung (Kunkel et al. PNAS 1981, v. 78 S. 6734). Dabei werden eingebaute NTs* von der 3'-5' Exonuklease-Aktivität der Polymerase nicht angegriffen. Im folgenden werden all diese Polymerasearten als "Polymerase" bezeichnet.polymerases with 3'-5 'exonuclease activity can be used (e.g., Klenow fragment of E. coli polymerase I), provided that reaction conditions chosen which suppress existing 3'-5 'exonuclease activity, such as e.g. a low pH (pH 6.5) in the Klenow fragment (Lehman and Richardson, J. Biol. Chem. 1964 v. Chr. 239 p. 233). Another possibility is the use of NTs * with a phosphorothioate compound (Kunkel et al PNAS 1981, v. 78 pp. 6734). It will be built-in NTs * of the 3'-5 'exonuclease activity of the polymerase not attacked. In the following, all these types of polymers will be mentioned referred to as "polymerase".

4.5 Chemie4.5 Chemistry

4.5.1 Allgemeines Prinzip4.5.1 General Principle

Für die Sequenzierungsreaktion ist wichtig, daß jedes eingebaute NT* identifiziert wird. Eine Voraussetzung dafür ist, daß nur ein einziges NT* pro Zyklus in die Nukleinsäurekette eingebaut wird. Falls eine Polymerase mehrere NTs* nacheinander im selben Zyklus einbaut, so führt dies zu einem Fehler in der Sequenzermittlung. Aus diesem Grund muß man den Einbau der NTs* steuern. In diesem Zusammenhang sind verschiedene Möglichkeiten der Steuerung der enzymatischen Reaktion denkbar, wie z.B.

  • 1) einzelne Zugabe von NT, so daß die Polymerase nur einen einzigen Schritt macht und stoppt (Substrat Limitierung),
  • 2) Änderungen der äußeren Bedingungen (Temperatur, pH, Salz usw.), so daß die Polymerasen ihre Funktion anders ausüben (s. Optimierung der Reaktionsbedingngen),
  • 3) durch bestimmte kompetetive und nichtkompetetive Inhibitoren (als Beispiel seien antivirale Medikamente genannt)
  • 4) Durch bestimmte Mutationen und andere Veränderungen an der Polymerase als solcher,
  • 5) Durch die Struktur der NT. Diese Strukturänderungen können sein: a) irreversibel (wie z.B. bei dideoxyNTPs) b) reversibel.
It is important for the sequencing reaction that each incorporated NT * be identified. A prerequisite for this is that only a single NT * per cycle is incorporated into the nucleic acid chain. If a polymerase incorporates several NTs * in succession in the same cycle, this leads to an error in the sequence determination. For this reason, one must control the installation of NTs *. In this context, various ways of controlling the enzymatic reaction are conceivable, such as
  • 1) single addition of NT, so that the polymerase only makes a single step and stops (substrate limitation),
  • 2) changes in the external conditions (temperature, pH, salt, etc.), so that the polymerases perform their function differently (see Optimization of Reaktionsbedingngen),
  • 3) by certain competitive and non-competitive inhibitors (for example antiviral drugs)
  • 4) By certain mutations and other changes to the polymerase as such,
  • 5) Through the structure of the NT. These structural changes may be: a) irreversible (such as in dideoxyNTPs) b) reversible.

Vorzugsweise erfolgt die Steuerung durch eine bestimmte Struktur der NTs*, wobei reversible Strukturveränderungen besonders bevorzugt sind. Die reversiblen Strukturveränderungen erfolgen beispielsweise durch Anheftung eines sterisch anspruchsvollen Liganden, d.h. eines Liganden, der die Polymerase vom Einbau eines weiteren NT abhält. Die Steuerung infolge einer sterischen Blockierung der enzymatischen Reaktion durch reversible Semiterminatoren wird unten genauer beschrieben. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Basen durch Ankopplung eines Fluoreszenzfarbstoffs strukturell verändert bzw. modifiziert.Preferably the control is carried out by a specific structure of NTs *, where reversible structural changes are particularly preferred. The reversible structural changes For example, by attaching a sterically demanding Ligands, i. a ligand, the polymerase from the incorporation of a another NT stops. The control as a result of steric blocking of the enzymatic Reaction by reversible semiterminators is described in more detail below. According to one preferred embodiment The invention relates to the bases by coupling a fluorescent dye structurally changed or modified.

Es gibt mehrere prinzipielle Varianten der NT*-Struktur, die zur Behinderung bzw. zum Stop der Extensionsreaktion führt: Z.B. wurden in der BASS-Methode reversible 3'-OH modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197). Die Spaltung soll dabei unter milden Bedingungen photochemisch (Dower US Patent 5.547.839, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197) oder chemisch (Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S.1021) erfolgen.There are several principal variants of the NT * structure which hinder or stop the extension reaction: For example, reversible 3'-OH modified NTs have been described in the BASS method (Dower US Patent 5,547,839, Canard et al., US Pat Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. Chem. 18 p. 1021, Metzker et al. NAR 1994, v. 22, p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197). The cleavage is said to be photochemical under mild conditions (Dower US Patent 5,547,839, Welch et al., Nucleosides & Nucleotides 1999, v. 18, p197) or chemically (Canard et al., US Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p.1021).

Die Synthese der 3'-OH-modifizierten photochemisch spaltbaren NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unterschiedliche Affinität zu diesen Nukleotidanalogen auf, so daß die Nukleinsäuresynthese sehr ungleichmäßig bzw. an manchen DNA-Stellen gar nicht abläuft (Metzker et al. NAR 1994 v. 22 S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18 S. 197). Aus diesem Grund eignen sich diese Analoga nur bedingt für die Sequenzierungsreaktion. Eine spaltbare 3'-Ester-Verknüpfung (Canard et al. US Patent 5.798.210) kommt als Grundlage für eine reversible Termination der Synthese auch nicht in Betracht. Die meisten Polymerasen spalten bei Verfügbarkeit eines nächsten komplementären NT 3'-OH-Ester-Verbindungen, so daß die an die 3'-OH-Gruppe gebundene Markierung in die Lösung freigesetzt wird und nicht mehr als Terminator wirken kann (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v. 18 S. 1021, Canard et al. PNAS 1995 v. 92 S. 10859). In Positionen, an denen eine Polymerase mehrere gleiche NTs* nacheinander einbauen kann, führt das zu einem fehlerhaften Signal.The Synthesis of 3'-OH-modified photochemically cleavable NTs * is very expensive. The polymerases have a very different affinity for these nucleotide analogs on, so that the nucleic acid synthesis very uneven or at some DNA sites does not expire at all (Metzker et al NAR 1994 v. 22 p 4259, Welch et al Nucleosides & Nucleotides 1999, v. 18 p. 197). For this reason, these analogs are only partially suitable for the Sequencing reaction. A cleavable 3'-ester linkage (Canard et al., US Patent 5,798,210) comes as a basis for a reversible termination of the synthesis also not considered. Most polymerases cleave upon availability of a next complementary NT 3'-OH ester compounds, So that the bonded to the 3'-OH group Mark in the solution is released and can no longer act as a terminator (Rasolonjatovo et al. Nucleosides & nucleotides 1999, v. 18 p. 1021, Canard et al. PNAS 1995 v. 92 p. 10859). In Positions where a polymerase several equal NTs * consecutively can install leads that to a faulty signal.

Erfindungsgemäß werden für die Sequenzierung NTs* mit einer sterisch anspruchsvollen Gruppe an der Base verwendet. Eine an die Base. gekoppelte sterisch anspruchsvolle Gruppe kann zur Behinderung der weiteren Synthese führen. Biotin, Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine, Cy3-Farbstoff stellen Beispiele einer solchen sterisch anspruchs vollen Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die Polymerasen können zwar solche NTs* in größeren Abständen einbauen, haben allerdings Schwierigkeiten, diese NTs* nacheinander einzubauen.According to the invention for the Sequencing NTs * with a sterically demanding group at the Base used. One to the base. coupled sterically demanding Group may lead to obstruction of further synthesis. biotin, Digoxigenin and fluorescent dyes such as fluorescein, tetramethylrhodamine, Put Cy3 dye Examples of such a sterically demanding group (Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22 P. 3418, Gebeyehu et al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, p. 166, Heer et al. BioTechniques 1994 16 p. 54). Although the polymerases can incorporate such NTs * at longer intervals, However, they have difficulty installing these NTs * one after the other.

Bei der Sequenzierungsreaktion im erfindungsgemäßen Verfahren werden markierte NTs* mit einer Polymerase und Nukleinsäureketten inkubiert. Die NTs* tragen dabei eine an die Base reversibel gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktionsgemisch, das nur modifizierte NTs* enthält, in der Reaktion eingesetzt wird, dann kann die Polymerase nur ein einziges NT* einbauen. Der Einbau eines nächsten NT* wird sterisch gehemmt. Diese NTs* treten somit als Terminatoren der Synthese auf. Nach der Entfernung der sterisch anspruchsvollen Gruppe kann das nächste komplementäre NT* eingebaut werden. Weil diese NTs* kein absolutes Hindernis zur weiteren Synthese darstellen, sondern nur für den Einbau eines weiteren markierten NT*, werden sie als Semiterminatoren bezeichnet.at the sequencing reaction in the method according to the invention are labeled NTs * incubated with a polymerase and nucleic acid chains. The NTs * carry a reversibly coupled to the base sterisch demanding Group. When a reaction mixture containing only modified NTs * in the Reaction is used, then the polymerase can only a single Install NT *. The installation of a next NT * is sterically inhibited. These NTs * thus act as terminators the synthesis. After the removal of the sterically demanding Group can be the next complementary NT * be installed. Because these NTs * are not an absolute obstacle to represent another synthesis, but only for the incorporation of another marked NT *, they are called Semiterminatoren.

Der Unterschied zur 3'-OH Terminatoren-Methode besteht darin, daß nicht eine Blockade der für die Synthese notwendigen 3'-OH Gruppe angestrebt wird, sondern eine an die Base geknüpfte Gruppe als sterisches Hindernis für den weiteren Einbau genutzt wird. Die 3'-OH Gruppe bleibt dabei die ganze Zeit frei.Of the Difference to the 3'-OH Terminators method is that not a blockade of the for the synthesis necessary 3'-OH Desired group, but a knotted to the base group as a steric hindrance to the further installation is used. The 3'-OH group stays the same all the time free.

4.5.2 Allgemeine Struktur des NT*4.5.2 General structure of the NT *

Die Semiterminatoren können verschiedene Strukturen haben. Ihre gemeinsamen Merkmale sind in 7a dargestellt. Diese Struktur ist dadurch charakterisiert, daß an der Base über einen spaltbaren Linker (A-E) eine sterische Gruppe (D) und der Fluoreszenzmarker (F) gebunden sind.Semiterminators can have different structures. Their common features are in 7a shown. This structure is characterized in that a steric group (D) and the fluorescence label (F) are bound to the base via a cleavable linker (AE).

Als Grundlage für die NTs* dienen Deoxynukleosid-Triphosphate mit Adenosin (A), Guanosin (G), Cytidin (C) und Thymidin (T) als Nukleosidrest. Anstelle von Thymidin wird bevorzugt Uridin als Nukleosidrest verwendet. Anstelle von Guanosin kann Inosin verwendet werden.When basis for the NTs * serve deoxynucleoside triphosphates with adenosine (A), guanosine (G), cytidine (C) and thymidine (T) as the nucleoside residue. Instead of Thymidine is preferably uridine used as a nucleoside residue. Instead of Inosine can be used by guanosine.

4.5.3 Marker, Fluorophore4.5.3 markers, fluorophores

Jede Base ist mit einem für sie charakteristischen Marker (F) markiert (7). Der Marker ist ein fluoreszierender Farbstoff. Mehrere Faktoren beeinflussen die Wahl des Fluoreszenzfarbstoffes. Die Wahl ist nicht eingeschränkt, sofern der Farbstoff folgenden Anforderungen genügt:

  • a) Die verwendete Detektionsapparatur muß diesen Marker als einziges Molekül gebunden an DNA unter milden Bedingungen (vorzugsweise Reaktionsbedingungen) identifizieren können. Die Farbstoffe haben vorzugsweise große Photostabilität. Ihre Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich gequencht.
  • b) Der an das NT gebundene Farbstoff darf keine irreversible Störung der enzymatischen Reaktion verursachen.
  • c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in die Nukleinsäurekette eingebaut werden.
  • d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine beträchtlichen Überlappungen in ihren Emissionsspektren aufweisen.
Each base is labeled with a marker (F) characteristic for it ( 7 ). The marker is a fluorescent dye. Several factors influence the choice of fluorescent dye. The choice is not limited if the dye meets the following requirements:
  • a) The detection apparatus used must be able to identify this marker as a single molecule bound to DNA under mild conditions (preferably reaction conditions). The dyes preferably have high photostability. Their fluorescence is preferably not or only insignificantly quenched by the DNA.
  • b) The dye bound to the NT must not cause irreversible disruption of the enzymatic reaction.
  • c) NTs * labeled with the dye must be incorporated by the polymerase into the nucleic acid chain.
  • d) When labeled with different dyes, these dyes should not have significant overlaps in their emission spectra.

Im Rahmen der vorliegenden Erfindung verwendbare Fluoreszenzfarbstoffe sind in "Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes mit Strukturformeln zusammengestellt. Erfindungsgemäß werden vorzugsweise folgende Farbstoffklassen als Marker eingesetzt: Cyanin-Farbstoffe und deren Abkömmlinge (z.B. Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), Rhodamine und deren Abkömmlinge (z.B. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, s. Handbuch), Xanthene-Derivate (z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US-Patent 6.130.101). Diese Farbstoffe sind kommerziell erhältlich.in the Fluorescent dyes which can be used according to the present invention are in "Handbook of Fluorescent Probes and Research Chemicals "6th ed. 1996, R. Haugland, Molecular Probes assembled with structural formulas. According to the invention preferably the following classes of dyes used as markers: cyanine dyes and their descendants (e.g., Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Wagoner U.S. Patent 5,268,486), rhodamines and their derivatives (e.g., TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, s. Manual), xanthene derivatives (e.g., Alexa 568, Alexa 594, Molecular Probes, Mao et al U.S. Patent 6130101). These dyes are commercially available.

Dabei kann man je nach spektralen Eigenschaften und vorhandener Apparatur entsprechende Farbstoffe auswählen. Die Farbstoffe werden an den Linker z.B. über Thiocyanat- oder Ester-Bindung gekoppelt ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. 278 S. 363, Waggoner Methods in Enzymology 1995 v. 246 S. 362), s. Beispiele 1 und 2.there you can depending on the spectral properties and existing equipment select appropriate dyes. The dyes are added to the linker e.g. via thiocyanate or ester linkage coupled ("Handbook of Fluorescent Probes and Research Chemicals "6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. Chr. 278 p. 363, Wagoner Methods in Enzymology 1995 v. Chr. 246 p. 362), s. Examples 1 and 2.

4.5.4 Natur der sterisch anspruchsvollen Gruppe4.5.4 Nature of the steric demanding group

Die Gruppe (D) (7) stellt ein Hindernis für den Einbau eines weiteren komplementären markierten NT* durch eine Polymerase dar. Biotin, Digoxigenin und Fluoreszenzfarbstoffe stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et l1. Analytical Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die chemische Struktur dieser Gruppe ist nicht eingeschränkt, sofern sie den Einbau des markierten NT*, an das sie geknüpft ist, nicht wesentlich stört und keine irreversible Störung der enzymatischen Reaktion verursacht.The group (D) ( 7 Biotin, digoxigenin, and fluorescent dyes are examples of such a bulky group (Zhu et al., Cytometry 1997, v. 28, p.206, Zhu et al NAR 1994, v. 22, pp. 3418, Gebeyehu et al., NAR 1987, v. 15, pp. 4513, Wiemann et al Analytical Biochemistry 1996, v. 234, p166, Heer et al., BioTechniques 1994 v. 16 p. 54). The chemical structure of this group is not limited provided that it does not significantly interfere with the incorporation of the labeled NT * to which it is attached and does not cause irreversible interference with the enzymatic reaction.

Diese Gruppe kann als selbständiger Teil im Linker (7a) auftreten oder mit dem Farbstoff (7b) oder der spaltbaren Gruppe (7d) identisch sein. Durch die Spaltung des Linkers wird diese sterisch anspruchsvolle Gruppe (D) nach der Detektion des Signals entfernt, so daß die Polymerase ein weiteres markiertes NT* einbauen kann. Bei einer Struktur wie in 7d wird die sterische Gruppe durch die Spaltung beseitigt.These Group can be self-employed Part in the linker (7a) occur or with the dye (7b) or the cleavable Be identical to group (7d). By the cleavage of the linker becomes this sterically demanding group (D) after the detection of the Signal removed, so that the Polymerase can incorporate another labeled NT *. At a Structure as in 7d becomes the steric group through the cleavage eliminated.

In einer bevorzugten Ausführungsform übernimmt der Fluoreszenzfarbstoff die Funktion einer solchen sterisch anspruchsvollen Gruppe, so daß ein markiertes Nukleotid eine in 7b dargestellte Struktur aufweist.In a preferred embodiment, the fluorescent dye performs the function of such a sterically demanding group, so that a labeled nucleotide a in 7b having shown structure.

In einer anderen bevorzugten Ausführungsform übernimmt die photolabile spaltbare Gruppe die Funktion einer solchen sterisch anspruchsvollen Gruppe (7d).In another preferred embodiment, the photolabile cleavable group assumes the function of such a sterically demanding group ( 7d ).

4.5.5 Linker4.5.5 Linker

Der Marker ist an die Base vorzugsweise über einen Abstandhalter unterschiedlicher Länge; einen sog. Linker, gebunden. Beispiele für Linker sind in 7e, f, h, i, j gegeben. Vorzugsweise ist dieser Linker an einer der Stellen an die Base gebunden, die nicht an der Basenpaarung teilnimmt. Im bevorzugten Fall sind die Stellen, an die der Linker gebunden ist: die 5-Position im Pyrimidinring und die 7-Position im Purinring. Beispiele der Ankoppelung eines Linkers an die Base können aus folgenden Quellen entnommen werden (Hobbs et al. US. Patent 5.047.519, Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 1996 v. 274, S. 403, Zhu et al. NAR 1994 v. 22 S. 3418, Herman et al. Methods in Enzymology 1990 v. 184 S. 584).The marker is preferably attached to the base via a spacer of different lengths; a so-called linker, bound. Examples of linkers are in 7e , f, h, i, j. Preferably, this linker is attached to the base at one of the sites that does not participate in base pairing. In the preferred case, the sites to which the linker is attached are the 5-position in the pyrimidine ring and the 7-position in the purine ring. Examples of the coupling of a linker to the base can be seen from the following sources (Hobbs et al., U.S. Patent 5,047,519, Khan et al., U.S. Patent 5,821,356, Hanna M. Method, Enzymology 1996, v. 274, p Zhu et al NAR 1994 v. 22 p 3418, Herman et al., Methods in Enzymology 1990 v. 184 p 584).

Die gesamte Länge des Linkers kann variieren. Sie entspricht der Anzahl der Kohlenstoff-Atome in den Abschnitten A, C, E und liegt vorzugsweise zwischen 3 und 20. Optimalerweise beträgt sie zwischen 4 und 10 Atomen. Die chemische Zusammensetzung des Linkers (Abschnitte A,C,E in 7a) ist nicht eingeschränkt, sofern sie unter Reaktionsbedingungen stabil bleibt und keine Störung der enzymatischen Reaktion verursacht.The entire length of the linker may vary. It corresponds to the number of carbon atoms in sections A, C, E and is preferably between 3 and 20. Optimally, it is between 4 and 10 atoms. The chemical composition of the linker (Sections A, C, E in 7a ) is not limited, provided that it remains stable under reaction conditions and does not cause any disturbance of the enzymatic reaction.

4.5.6 Spaltbare Verbindung, Spaltung4.5.6 Splittable connection, cleavage

Der Linker trägt eine spaltbare Verbindung oder spaltbare Gruppe (B). Diese spaltbare Verbindung ermöglicht die Entfernung des Markers und des sterischen Hindernisses am Ende jedes Zyklus. Ihre Wahl ist nicht eingeschränkt, sofern sie unter den Bedingungen der enzymatischen Sequenzierungsreaktion stabil bleibt, keine irreversible Störung der Polymerase verursacht und unter milden Bedingungen abgespalten werden kann. Unter "milden Bedingungen" sind solche Bedingungen zu verstehen, die den NSKF-Primer-Komplex nicht zerstören, wobei z.B. der pH-Wert vorzugs weise zwischen 3 und 11 liegt, die Temperatur zwischen 0°C und einem Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes (Tm ist "melting Point") und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen eignen sich besonders Disulfid-Verbindungen und photolabile Verbindungen als spaltbare Verbindungen).The linker carries a cleavable or cleavable group (B). This fissile connection he allows removal of the marker and steric obstruction at the end of each cycle. Their choice is not limited provided that it remains stable under the conditions of the enzymatic sequencing reaction, does not cause irreversible disruption of the polymerase and can be cleaved under mild conditions. By "mild conditions" are meant those conditions which do not destroy the NSKF-primer complex, for example the pH preferably being between 3 and 11, the temperature between 0 ° C. and a temperature value (x). This temperature value (x) depends on the Tm of the NSKF primer complex (Tm is "melting point") and is calculated as Tm (NSKF primer complex) minus 5 ° C (eg Tm is 47 ° C, then the maximum temperature at 42 ° C, under these conditions are especially disulfide compounds and photolabile compounds as fissile compounds).

Vorzugsweise gehört die genannte Verbindung zu chemisch oder enzymatisch spaltbaren oder photolabilen Verbindungen. Als Beispiele von chemisch spaltbaren Gruppen sind Ester- und Disulfid-Verbindungen bevorzugt (Herman et al. Method in Enzymology 1990 v. 184 S.584, Lomant et al. J. Mol. Biol. 1976 v. 104 243, "Chemistry of carboxylic acid and esters" S. Patai 1969 Interscience Publ.). Beispiele für photolabile Verbindungen können in folgenden Literaturstellen gefunden werden: "Protective groups in organic synthesis" 1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 S. 1, V. Pillai Org. Photochem. 1987 v. 9 S. 225.Preferably belongs said compound to be chemically or enzymatically cleavable or photolabile compounds. As examples of chemically cleavable Groups are preferably ester and disulfide compounds (Herman et al. Method in Enzymology 1990 v. Chr. 184 p.584, Lomant et al. J. Mol. Biol. 1976 v. Chr. 104 243, "Chemistry of carboxylic acid and esters "S. Patai 1969 Interscience Publ.). Examples of photolabile compounds can in the following references: "Protective groups in organic synthesis" 1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 p. 1, V. Pillai Org. Photochem. 1987 v. Chr. 9 P. 225.

Die Position der spaltbaren Verbindung/Gruppe im Linker ist vorzugsweise nicht weiter als 10 Atome von der Base entfernt, noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt liegt die spaltbare Verbindung oder Gruppe direkt an der Base.The Position of the cleavable compound / group in the linker is preferred not more than 10 atoms away from the base, more preferably not more than 3 atoms. Particularly preferred is the cleavable Compound or group directly at the base.

Der Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vorhanden und muß unter milden Bedingungen (s.o.) verlaufen, so daß die Nukleinsäuren nicht beschädigt oder modifiziert werden.Of the Cleavage and removal step is present in each cycle and must under mild conditions (see above) so that the nucleic acids are not damaged or modified.

Die Spaltung läuft bevorzugt chemisch (z.B. in milder saurer oder basischer Umgebung für eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittel, z.B. Dithiothreitol (Sigma) bei der Spaltung einer Disulfid-Verbindung), siehe Beispiel 1, oder physikalisch (z.B. durch Beleuchtung der Oberfläche mit Licht einer bestimmten Wellenlänge für die Spaltung einer photolabilen Gruppe) ab.The Splitting is going on preferably chemically (e.g., in mild acidic or basic environment for one Ester compound or by adding a reducing agent, e.g. Dithiothreitol (Sigma) in the cleavage of a disulfide compound), see Example 1, or physically (e.g., by illuminating the surface with light of a certain wavelength for the cleavage of a photolabile Group).

Nach der Spaltung verbleibt an der Base ein Linkerrest (A) (7c).After cleavage, a linker residue (A) remains at the base ( 7c ).

Die Synthese eines spaltbaren Linkers wird an Beispielen gezeigt (vgl. Beispiele 1 und 2).The Synthesis of a cleavable linker is shown by way of examples (cf. Examples 1 and 2).

4.5.7 Kombination von Polymerase und NT*4.5.7 Combination of Polymerase and NT *

Insgesamt spielen die Größe, die Ladung und die chemische Struktur des Markers, die Länge des spaltbaren Linkers und des Linker-Rests sowie auch die Wahl der Polymerase eine wichtige Rolle. Sie bestimmen gemeinsam, ob das markierte NT* durch die Polymerase in die wachsende Nukleinsäurekette eingebaut wird, und ob dadurch der Einbau des nächsten markierten NT* verhindert wird. Zwei Bedingungen sind dabei besonders zu berücksichtigen:
Einerseits ist es wichtig, daß die Polymerase die Nukleinsäurekette mit dem eingebauten modifizierten NT* nach der Spaltung des Linkers weiter verlängern kann. Es ist also wichtig, daß der Linkerrest "A" (7c) nach der Spaltung keine wesentliche Störung für die weitere Synthese darstellt. Andererseits müssen eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es können viele für die Reaktion geeignete NTs* synthetisiert werden. Im einzelnen muß für jede Kombination aus Polymerase und NTs* eine Vorversuchsreihe durchgeführt werden, in der die Tauglichkeit eines bestimmten NT*-Typs für die Sequenzierung erprobt wird.
Overall, the size, the charge and the chemical structure of the marker, the length of the cleavable linker and the linker residue as well as the choice of polymerase play an important role. Together, they determine whether the tagged NT * is incorporated into the growing nucleic acid chain by the polymerase and whether it prevents the next labeled NT * from being incorporated. Two conditions must be taken into account:
On the one hand, it is important that the polymerase can further extend the nucleic acid chain with the incorporated modified NT * after cleavage of the linker. So it is important that the linker residue "A" ( 7c ) after cleavage is not a significant disruption to further synthesis. On the other hand, built-in, non-split NTs * must be an obstacle. Many NTs * suitable for the reaction can be synthesized. More specifically, for each combination of polymerase and NTs *, a series of preliminary experiments must be performed in which the suitability of a specific NT * type for sequencing is tested.

Die Pufferbedingungen werden nach Angaben des Polymeraseherstellers gewählt. Die Reaktionstemperatur wird für nicht thermostabile Polymerasen nach Angaben des Herstellers gewählt (z.B. 37°C für Sequenase Version 2), für thermostabile Polymerasen (z.B. Taq-Polymerase) beträgt die Reaktionstemperatur maximal den Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximale Reaktionstemperatur bei 42°C). Diese Pufferbedingungen und Reaktionstemperatur werden weiter als "optimale Puffer- und Temperaturbedingungen" bezeichnet.The Buffer conditions are according to the polymerase manufacturer selected. The reaction temperature is for non-thermostable polymerases selected according to the manufacturer's instructions (e.g. 37 ° C for Sequenase Version 2), for thermostable polymerases (e.g., Taq polymerase) is the reaction temperature maximum temperature value (x). This temperature value (x) depends on the Tm of the NSKF primer complex and is termed Tm (NSKF primer complex) minus 5 ° C calculated (e.g., Tm is 47 ° C, then the maximum reaction temperature is 42 ° C). These Buffer conditions and reaction temperature are further described as "optimal buffer and temperature conditions ".

Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in einem Zyklus) beträgt vorzugsweise weniger als eine Stunde, Idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 min.The Reaction time (corresponds to the duration of the installation step in a Cycle) preferably less than one hour, ideally the reaction time is between 10 sec and 10 min.

Als Beispiele von geeigneten Kombinationen zwischen NT* und Polymerase sind folgende Kombinationen zu nennen:

  • a) NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, 7e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) in Kombination mit Sequenase Version 2, Taq-Polymerase (GibcoBRL), ProHA-DNA-Polymerase (Eurogentec) oder DNA-Polymerase Beta aus Säugetieren (Chimerx).
  • b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, 7f, g, j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase Version 2 oder oder ProHATM-Polymerase (Eurogentech).
As examples of suitable combinations between NT * and polymerase, the following combinations may be mentioned:
  • a) NT * with a short linker residue (for synthesis see Example 2, 7e , h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) in combination with Sequenase version 2, Taq polymerase (GibcoBRL), ProHA DNA polymerase (Eurogentec) or DNA polymerase beta from mammals (Chimerx).
  • b) NT * with a long linker residue (for synthesis see Example 1, 7f , g, j): dNTP-SS-TRITC (L14) in combination with Sequenase version 2 or ProHATM polymerase (Eurogentech).

Die Tauglichkeit eines Linkerrests an der Base (A) für die Reaktion kann man in einem Testsystem prüfen. Dabei werden gespaltene NTs* in eine Nukleinsäurekette nacheinander einbaut. Man verwendet z.B. dUTP* mit dem gewünschten gespaltenen Linkerrest, poly-dA als Matrize, Oligo-dT20-Primer, die gewünschte Polymerase und führt unter für die jeweilige Polymerase geeigneten optimalen Puffer- und Temperaturbedingungen eine Reaktion durch. Die NT*-Konzentration liegt vorzugsweise zwischen 5 μM und 200 μM. Nach der Reaktion wird die Anzahl der in die Nukleinsäurekette eingebauten NTs* analysiert, z.B. durch die Auftrennung der Länge nach in einem Gel. Für die Rückschlüsse auf die Tauglichkeit des Linkerrests kann man folgende Angaben verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kann, so ist dieser Linkerrest für eine Sequenzierungsreaktion geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist diese Kombination aus NT* und Polymerase nicht optimal für die Sequenzierungsreaktion.The Suitability of a linker residue on the base (A) for the reaction can be in to test a test system. In this case, split NTs * are inserted successively into a nucleic acid chain. For example, one uses dUTP * with the desired cleaved linker residue, poly-dA as a template, oligo dT20 primer, the desired polymerase and carries out for the respective polymerase suitable optimal buffer and temperature conditions a reaction through. The NT * concentration is preferably between 5 μM and 200 μM. After the reaction, the number of nucleic acid into the chain built-in NTs *, e.g. by the separation of the length in a gel. For the conclusions the suitability of the linker residue can be used as follows: If the polymerase can incorporate more than 20 NTs *, it is Linkerrest for a sequencing reaction suitable. When installing less than 20 cleaved NTs * is this combination of NT * and polymerase not optimal for the sequencing reaction.

Wenn ein passender Linkerrest feststeht, muß man in einem weiteren Testsystem prüfen, ob die markierten, nicht gespaltenen NTs* als Semiterminatoren funktionieren. Das wird geprüft, indem die markierten NTs* unter für die Reaktion geeigneten optimalen Puffer- und Temperaturbedingungen mit der Polymerase und einer Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugsweise zwischen 5 μM und 200 μM. Die Matrize ist so zu wählen, daß der Einbau mehrerer NTs* nacheinander zu erwarten wäre, z.B. für dUTP* kann man polydA, wie im oben dargestellten Beispiel verwenden. Idealerweise baut die Polymerase nur ein einziges NT* ein.If a suitable linker residue is established, one must in another test system check, whether the marked, uncleaved NTs * function as semiterminators. That's being checked by selecting the marked NTs * under optimal for the reaction Buffering and temperature conditions with the polymerase and a template be incubated. The NT * concentration is preferably between 5 μM and 200 μM. The matrix is to be chosen that the Installation of multiple NTs * would be expected sequentially, e.g. For dUTP * you can use polydA, like use in the example above. Ideally, the builds Polymerase only a single NT * one.

Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen durch eine Polymerase mehrere NTs* nacheinander eingebaut werden, kann man die Reaktionsparameter (z.B. NT*-Konzentration, Reaktionstemperatur) verändern und der jeweiligen Kombination aus Polymerase und NT* anpassen. Das wichtigste dabei ist, daß die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.If at given optimum buffer and temperature conditions a polymerase several NTs * can be installed one after the other the reaction parameters (e.g., NT * concentration, reaction temperature) change and the respective combination of polymerase and NT *. The most important thing is that the Polymerase in the given time (preferably between 10 sec and 10 min) does not install a second NT *.

Erfindungsgemäß erfolgt diese Anpassung in einer Ausführungsform durch die Veränderung der Reaktionstemperatur. Die anderen Parameter der Reaktion werden dabei konstant gehalten.According to the invention this adaptation in one embodiment through the change the reaction temperature. The other parameters of the reaction will be kept constant.

Als Polymerasen werden beipielsweise Polymerasen verwendet, die Polymerasen ohne 3'-5'-Endonukleaseaktivität sind, vorzugsweise aus der Gruppe bestehend aus viralen Polymerasen vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten, und thermostabilen Polymerasen. Insbesondere kommen Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder ProHATM-Polymerase in Betracht.When Polymerases are used, for example, polymerases, the polymerases without 3'-5'-endonuclease activity, preferably from the group consisting of viral polymerases from Sequenase type, beta polymerases from eukaryotes, and thermostable polymerases. In particular, come Sequenase version 2, mammalian polymerase beta, Taq polymerase or ProHATM polymerase into consideration.

Die NT*-Konzentration liegt bei diesen Experimenten üblicherweise zwischen 5 μM und 200 μM, vorzugsweise zwischen 10 und 100 μM. Die Konzentration der Polymerase und die Pufferbedingungen werden nach Angaben vom Hersteller gewählt. Die Dauer der Reaktion kann variieren und liegt vorzugsweise zwischen 10 sec und 10 min, was der Dauer des Einbau-Schrittes (a) in einem Zyklus entsprechen würde. Bei nicht thermostabilen Polymerasen wie z.B. Sequenase Version 2 (Amersham Pharmacia Biotech), exonuclease free Klenow-Fragment der DNA Polymerase I (Amersham Pharmacia Biotech) wird die Reaktionsthemperatur von konventionellen 37°C vorzugsweise auf 20°C bis 30°C reduziert. Bei thermostabilen Polymerasen wie z.B. Taq-Polymerase (GibcoBRL), ProHATM-Polymerase (Eurogentech) wird die Reaktionstemperatur von konventionellen 70–75°C vorzugsweise auf Werte reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen. Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt der Temperaturwert (x) bei 42°C).The NT * concentration in these experiments is usually between 5 μM and 200 μM, preferably between 10 and 100 μM. The concentration of the polymerase and the buffer conditions become low Information chosen by the manufacturer. The duration of the reaction can vary and is preferably between 10 sec and 10 min, which is the duration of the installation step (a) in one Cycle would correspond. For non-thermostable polymerases, e.g. Sequenase version 2 (Amersham Pharmacia Biotech), exonuclease free Klenow fragment of DNA Polymerase I (Amersham Pharmacia Biotech) becomes the reaction temperature from conventional 37 ° C preferably at 20 ° C up to 30 ° C reduced. For thermostable polymerases, e.g. Taq polymerase (GibcoBRL), ProHATM polymerase (Eurogentech) becomes the reaction temperature from conventional 70-75 ° C preferably reduced to values between 30 ° C and the temperature value (x). This temperature value (x) depends from the Tm of the NSKF primer complex and is calculated as Tm (NSKF primer complex) minus 5 ° C (e.g., Tm is 47 ° C, then the temperature value (x) is 42 ° C).

In einer anderen bevorzugten Ausführungsform der Erfindung erfolgt die Anpassung der Reaktionsbedingungen durch die Verminderung der NT*-Konzentration auf unter 5 μM, die anderen Parameter der Reaktion (Pufferbedingungen, Temperaturbedingungen) werden konstant gehalten. Die Konzentration der NT* liegt vorzugsweise bei dieser Anpassung zwischen 0,5 und 5 μM. Die Dauer der Reaktion liegt zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*-Konzentration ist, daß die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.In another preferred embodiment The invention is carried out by adjusting the reaction conditions the reduction of the NT * concentration to below 5 μM, the others Parameters of the reaction (buffer conditions, temperature conditions) are kept constant. The concentration of NT * is preferably with this adjustment between 0.5 and 5 μM. The duration of the reaction is between 10 sec and 10 min. The most important in the choice of NT * concentration is that the Polymerase in the given time (preferably between 10 sec and 10 min) does not install a second NT *.

Nach Optimierung der Reaktionsbedingungen für den Einbau eines einzelnen NT* muß man die Reaktion mit gespaltenen NTs* wiederholen. Unter entsprechend geänderten Reaktionsparameter muß Polymerase die gespaltenen NTs* nacheinander einbauen können.After optimizing the reaction conditions for the incorporation of a single NT * one must repeat the reaction with cleaved NTs *. Under appropriately changed reaction parameters must Polyme rase the split NTs * can install successively.

Die Optimierungsreaktion korreliert mit dem Einbauschritt, Schritt (b), in einem Zyklus. Die für die Optimierungsreaktion ermittelten Bedingungen, die Temperatur, die Konzentration an NT*, die Pufferbedingungen, die Dauer der Reaktion werden für die Reaktion auf der Oberfläche übernommen.The Optimization reaction correlates with the installation step, step (b), in a cycle. The for the optimization reaction determined conditions, the temperature, the concentration of NT *, the buffer conditions, the duration of the reaction be for taken over the reaction on the surface.

Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in die NSKFs vorzugsweise so, daß an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. Das hängt damit zusammen, daß an manchen Nukleinsäureketten. die Reaktion sehr langsam abläuft. Ein Einbau der NTs* an jeder komplementären Position in jedem Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur die erfolgreichen Einbaureaktionen detektiert und ausgewertet werden; eine verzögerte Reation im Nachfolgenden Zyklus führt nicht zu einem Sequenzierungsfehler.Under These reaction conditions, the incorporation of NT * in the NSKFs preferably such that on more than 50% of the NSKFs involved in the sequencing reaction in one cycle a marked NT * is incorporated, preferably more than 90%. That depends together with that some nucleic acid chains. the reaction is very slow. An installation of the NTs * at each complementary position in each cycle is sought, but not required, because only the successful Installation reactions are detected and evaluated; a delayed reaction in the following cycle leads not a sequencing error.

Vorzugsweise wird für alle NTs* dieselbe Polymerase verwendet. Es können aber auch verschiedene Polymerasen für verschiedene NTs* eingesetzt werden.Preferably is for all NTs * use the same polymerase. But it can also be different polymerases for different NTs * are used.

4.5.8 Farbiges Kodierungsschema, Anzahl der Farbstoffe4.5.8 Colored coding scheme, Number of dyes

Einen Zyklus kann man durchführen mit:

  • a) vier verschieden markierten NT*s
  • b) zwei verschieden markierten NT*s
  • c) einem markierten NT*
  • d)zwei verschieden markierten NT*s und zwei unmarkierten NTs, d.h.
  • a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht man die Sequenzierung einer Nukleinsäurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe müssen in jedem Zyklus identifiziert werden.
  • b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen gewählt werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden markiert sind, z.B. A und G tragen die Markierung "X", C und U tragen die Markierung "Y". In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt, z.B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n + 1) werden dann U* und G* zugegeben.
  • c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NT* einsetzen.
  • d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s/2NTs-Methode). Diese Ausführungsform kann verwendet werden, um Varianten (z.B. Mutationen, oder alternativ gespleißte Gene) einer bereits bekannten Sequenz zu ermitteln.
One cycle can be done with:
  • a) four differently labeled NT * s
  • b) two different marked NT * s
  • c) a marked NT *
  • d) two differently labeled NT * s and two unlabelled NTs, ie
  • a) One can mark all 4 NTs with different coloring materials and insert all 4 at the same time in the reaction. It achieves the sequencing of a nucleic acid chain with a minimum number of cycles. However, this variant of the invention makes high demands on the detection system: 4 different dyes must be identified in each cycle.
  • b) To simplify the detection, a label with two dyes can be selected. In this case, two pairs of NTs * are formed, which are each marked differently, eg A and G carry the mark "X", C and U carry the mark "Y". In the reaction in one cycle (s) 2 differently labeled NTs * are used simultaneously, eg C * in combination with A *, and in the next cycle (n + 1) then U * and G * are added.
  • c) It is also possible to use only one dye to mark all 4 NTs * and use only one NT * per cycle.
  • d) In a technically simplified embodiment, two differently marked NT * s are used per cycle and two unmarked NTs (so-called 2NT * s / 2NTs method). This embodiment can be used to detect variants (eg, mutations, or alternatively spliced genes) of an already known sequence.

4.6 Detektionsapparatur4.6 detection apparatus

Einzelne Moleküle auf einer Oberfläche kann man mit verschiedenen Methoden untersuchen. Es sind mehrere Verfahren bekannt: z.B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahfeld-Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR-Mikroskopie usw. (Science 1999 v. 283 1667, Unger et al. BioTechniques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S.161, Dickson et al. Science 1996 v. 274 S. 966, Xie et al. Science 1994 v. 265 S. 361, Nie et al. Science 1994 v. 266 S. 1018, Betzig et al. Science 1993 v. 262 S. 1422).Separate molecules on a surface can be examined with different methods. There are several Method known: e.g. AtomForce Microscopy, Electron Microscopy, Near field fluorescence microscopy, wide field fluorescence microscopy, TIR microscopy etc. (Science 1999 v. 283 1667, Unger et al., BioTechniques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. Chr. 92 p.161, Dickson et al. Science 1996 v. Chr. 274, p. 966, Xie et al. Science 1994 v. Chr. 265 p. 361, Nie et al. Science 1994 v. Chr. 266 p. 1018, Betzig et al. Science 1993 v. 262 p. 1422).

Erfindungsgemäß werden Fluoreszenz-Signale einzelner in die Nukleinsäurekette eingebauter NTs* vorzugsweise mit einem Weitfeld-Fluoreszenz-Mikroskop oder einem Laser-Scanning-Mikroskop oder einem TIRF-Microskop (Total Internal Reflection Fluorescence Microscope).According to the invention Fluorescence signals of individual NTs incorporated in the nucleic acid chain * preferably with a wide-field fluorescence microscope or a laser scanning microscope or a TIRF microscope (Total Internal Reflection Fluorescence Microscope).

Es sind verschiedene Varianten der Konstruktion einer solchen Apparatur möglich (Weston et al. J. Chem. Phys. 1998 v. 109 S.7474, Trabesinger et al. Anal Chem. 1999 v. 71 S. 279, Adachi et al. Journal of Microscopy 1999 v. 195 S.125, Unger et al. BioTechniques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161, Dickson et al. Science 1996 v. 274 S. 966, Tokunaga et al. Bichem. Biophys. Res. Com. 1997 v. 235 S. 47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press ). Unterschiede in ihrem konkreten Aufbau ergeben sich aus der Variation ihrer Einzelteile. Die Vorrichtung für das Anregungslicht kann z.B. auf der Basis eines Lasers, einer Lampe oder von Dioden funktionieren. Für die Detektionsvorrichtung können sowohl CCD-Kameras als auch PMT dienen. Andere Beispiele für technische Details siehe ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Es ist nicht die Aufgabe dieser Erfindung, alle möglichen technischen Varianten einer Detektionsvorrichtung aufzuzählen. Der prinzipielle Aufbau einer geeigneten Apparatur wird in einem Schema 8 erläutert. Sie besteht aus folgenden Elementen:
Lichtquelle zur Anregung der Fluoreszenz (1)
Lichtleitender Teil (2)
Scantisch (3)
Vorrichtung zur Selektion von Spektren (4)
Detektionsvorrichtung (5)
Computer mit Steuerungs- und Analysefunktionen (6)
Various variants of the construction of such an apparatus are possible (Weston et al., J. Chem. Phys., 1998, 109, p.7474, Trabesinger et al., Anal Chem., 1999, 71, 279, Adachi et al., Journal of Microscopy 1999 v. 195 p.125, Unger et al BioTechniques 1999 v. 27 p 1008, Ishijaima et al Cell 1998 v. 92 p 161, Dickson et al Science 1996 v. 274 p 966, Tokunaga et Bichem, Biophys., Res. Com., 1997, pp 235 p. 47, "Confocal Laser Scanning Microscopy" 1997, Ed., Sheppard, BIOS Scientific Publishers, "New Techniques of Optical Microscopy and Microspectroscopy" 1991, Ed., R. Cherry CRC Press , Inc., "Fluorescence mic roscopy "1998. 2. Herman BIOS Scientific Publishers," Handbook of biological confocal microscopy "1995 J. Pawley Plenary Press) .Differences in their concrete structure arise from the variation of their individual parts.The device for the excitation light can eg based on Both CCD cameras and PMTs can be used for the detection device, for other examples of technical details see "Confocal Laser Scanning Microscopy" 1997 Ed Sheppard, BIOS Scientific Publishers, "New Techniques of Optical microscopy and microspectroscopy "1991 Ed. R. Cherry CRC Press, Inc.," Fluorescence microscopy "1998. 2. Herman BIOS Scientific Publishers," Handbook of biological confocal microscopy "1995 J. Pawley Plenary Press.) It is not the task The basic structure of a suitable apparatus is shown in a diagram 8th explained. It consists of the following elements:
Light source for excitation of fluorescence (1)
Light conducting part (2)
Scan table (3)
Device for selecting spectra (4)
Detection device (5)
Computer with control and analysis functions (6)

Diese Elemente der Apparatur können kommerziell erworben werden (Mikroskop-Firmen: Zeiss, Leica, Nikon).These Elements of the apparatus can be acquired commercially (microscope companies: Zeiss, Leica, Nikon).

Im folgenden soll beispielsweise eine für die Detektion einzelner Moleküle geeignete Kombination aus diesen Elementen vorgestellt werden:
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksilberdampflampe
Objektiv Planneofluar 100x, NA 1.4 (Zeiss)
Kamera Photometrix
Computer mit Software zur Steuerung und Analyse
In the following, for example, a combination of these elements suitable for the detection of individual molecules is to be presented:
Wide field fluorescence microscope Axioplan 2 (Zeiss) with mercury vapor lamp
Lens Planneofluar 100x, NA 1.4 (Zeiss)
Camera Photometrix
Computer with software for control and analysis

Nachfolgend soll die Vorgehensweise bei der Detektion erläutert werden. Man beachte dabei die allgemeinen Regeln der Fluoreszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press).following the procedure for the detection should be explained. Please note the general rules of fluorescence microscopy ("Confocal Laser Scanning Microscopy "1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of Optical Microscopy and microspectroscopy "1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy "1998 2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley plenum Press).

Die Detektion umfaßt folgende Phasen:

  • 1) Vorbereitung zur Detektion
  • 2) Durchführung eines Detektionsschrittes in jedem Zyklus, wobei jeder Detektionsschritt als Scanvorgang abläuft und folgende Operationen umfaßt: a) Einstellung der Position des Objektivs (X,Y-Achse), b) Einstellung der Fokusebene (Z-Achse), c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF, d) Verschiebung zur nächsten Position auf der Oberfläche.
The detection comprises the following phases:
  • 1) Preparation for detection
  • 2) carrying out a detection step in each cycle, each detection step being carried out as a scanning operation and comprising the following operations: a) adjustment of the position of the objective (X, Y-axis), b) adjustment of the focal plane (Z-axis), c) detection of the Signals of single molecules, assignment of the signal to NT * and assignment of the signal to the respective NSKF, d) shift to the next position on the surface.

Die Signale von in die NSKFs eingebauten NTs* werden durch das Abscannen der Oberfläche registriert. Der Scanvorgang kann in verschiedener Weise ausgeführt werden ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Vorzugsweise wird ein diskontinuierlicher Scanvorgang gewählt. Dabei wird das Objektiv schrittweise über die Oberfläche bewegt (8a), so daß von jeder Oberflächenposition ein zweidimensionales Bild (2D-Bild) entsteht (8b, c).The signals from NTs * built into the NSKFs are registered by scanning the surface. Scanning may be accomplished in a variety of ways ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of Optical Microscopy and Microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenary Press). Preferably, a discontinuous scan is selected. The lens is moved stepwise over the surface ( 8a ), so that a two-dimensional image (2D image) arises from each surface position ( 8b , c).

Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: z.B. durch den Laser-Scan einer Position des Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an einer Position (vgl. Handbücher der Mikroskopie). Als Beispiel wird die Detektion einzelner Moleküle mit einer CCD-Kamera beschrieben.This 2D image can be created by various methods: e.g. by the laser scan of a position of the microscope field (laser scanning microscopy) or by a camera recording at a position (see manuals of the Microscopy). As an example, the detection of single molecules with a CCD camera described.

Die Detektion wird am Beispiel der Sequenzierung eines 1 Mb langen DNA-Stücks erläutert:The Detection is explained using the example of sequencing a 1-Mb DNA piece:

1) Vorbereitung zur Detektion:1) Preparation for detection:

Am Anfang wird festgelegt, wie viele NSKFs zur Rekonstruktion der ursprünglichen Sequenz analysiert werden müssen. Im Fall einer Rekonstruktion nach dem Schrotschuß-Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF wird bei der Sequenzierung eine Sequenz von ca. 300–500 NTs bestimmt. 2) Die Gesamtlänge der zu analysierenden Sequenz ist wichtig. 3) Bei der Sequenzierung muß ein bestimmtes Maß an Redundanz erreicht werden, um die Genauigkeit zu steigern und eventuelle Fehler zu korrigieren. Insgesamt ist zur Rekonstruktion des größten Teils der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d.h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb Rohsequenzdaten gebraucht. Bei einer durchschnittlichen Sequenzlänge von 400 bp pro NSKF benötigt man entsprechend 25.000 bis 250.000 DNA-Fragmente.At the Beginning determines how many NSKFs to reconstruct the original Sequence must be analyzed. In the case of a reconstruction according to the shotgun method ("Automated DNA sequencing and analysis "p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. genome Res. 1999 v. Chr. 9 p. 868, Huang Genomics 1996 v. Chr. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257) the following factors play a role: 1) Of each NSKF will sequencing a sequence of about 300-500 NTs certainly. 2) The total length the sequence to be analyzed is important. 3) In the sequencing has to be certain degree Redundancy can be achieved to increase accuracy and eventuality Correct mistakes. Overall, to the reconstruction of the largest part the original one Sequence requires about 10 to 100 times the amount of crude sequences, i.e. in this example with an Mb, 10 to 100 Mb becomes raw sequence data second hand. With an average sequence length of 400 bp per NSKF one needs corresponding to 25,000 to 250,000 DNA fragments.

2) Durchführung eines Detektionsschrittes in jedem Zyklus2) implementation of a Detection step in each cycle

Zur Sequenzierung müssen die Positionen der NSKFs bestimmt werden, damit man eine Grundlage für die Zuordnung der Signale hat. Die Kenntnis dieser Positionen erlaubt eine Aussage darüber, ob die Signale einzelner Moleküle von eingebauten NTs* stammen oder von zufällig an die Oberfläche gebundenen NTs*. Diese Positionen können mit verschiedenen Methoden identifiziert werden.to Need sequencing The positions of the NSKFs are determined to provide a basis for assignment has the signals. The knowledge of these positions allows a statement about that, whether the signals of individual molecules come from built-in NTs * or from randomly bound to the surface NTs *. These positions can be identified with different methods.

In einer bevorzugten Ausführungsform werden die Positionen immobilisierter NSKF während der Sequenzierung identifiziert. Dabei wird die Tatsache genutzt, daß die Signale von den in die Nukleinsäurekette eingebauten NTs* immer dieselben Koordinaten haben. Das ist durch die Fixierung der Nukleinsäureketten gewährleistet. Die unspezifisch gebundenen NTs* binden zufällig an verschieden Stellen der Oberfläche.In a preferred embodiment The positions of immobilized NSKF are identified during sequencing. The fact is used that the signals of the in the Nucleic acid chain installed NTs * always have the same coordinates. That's because of the fixation the nucleic acid chains guaranteed. The nonspecifically bound NTs * bind randomly at different sites the surface.

Zur Identifizierung der Positionen von fixierten NSKFs werden die Signale auf Übereinstimmung ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen überprüft. Das kann z.B. am Anfang der Sequenzierung erfolgen. Die übereinstimmende Koordinaten werden als Koordinaten der DNA-Fragmente bewertet und gespeichert.to Identifying the positions of fixed NSKFs will be the signals on agreement checked their coordinates from several consecutive cycles. The can e.g. done at the beginning of the sequencing. The matching Coordinates are evaluated and stored as coordinates of the DNA fragments.

Das Scan-System muß reproduzierbar über mehrere Zyklen die Oberfläche abscannen können. X,Y und Z-Achsen-Einstellungen an jeder Oberflächenposition können von einem Computer kontrolliert werden. Stabilität und Reproduzierbarkeit der Einstellung von Objektivpositionen in jedem Scanvorgang entscheiden über die Qualität der Detektion und somit über die Identifizierung der Signale einzelner Moleküle.The Scan system must be reproducible over several Cycles the surface can scan. X, Y and Z-axis settings at each surface position can be from controlled by a computer. Stability and reproducibility of the Setting lens positions in each scan decide on the quality the detection and thus over the identification of the signals of individual molecules.

a.) Einstellung der Position des Objektivs (X,Y-Achse)a.) Setting the position of the lens (X, Y axis)

Die mechanische Instabilität der kommerziell erhältlichen Scantische und die geringe Reproduzierbarkeit der wiederholten Einstellung derselben X,Y-Positionen machen eine präzise Analysen der Signale einzelner Moleküle über mehrere Zyklen schwierig. Es existieren viele Möglichkeiten, eine Übereinstimmung der Koordinaten bei wiederholten Einstellungen zu verbessern bzw. mögliche Abweichungen zu kontrollieren. Als Beispiel wird eine Kontrollmöglichkeit angeführt. Nach einer groben mechanischen Einstellung der Objektivposition wird ein Kontrollbild von einem mit der Oberfläche fest verbundenen Muster gemacht. Auch wenn die mechanische Einstellung nicht exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 μm sind durchaus möglich), kann man mittels optischer Kontrolle eine Korrektur vornehmen. Das Kontrollbild vom Muster dient als Koordinatensystem für das Bild mit Signalen von eingebauten NTs*. Eine Voraussetzung für eine solche Korrektur ist, daß keine weiteren Bewegungen der Oberfläche zwischen diesen beiden Aufnahmen gemacht werden. Signale von einzelnen Molekülen werden in Relation zum Muster gesetzt, so daß eine X,Y-Abweichung in der Musterposition gleiche X,Y-Abweichung in der Position der Signale einzelner Moleküle bedeutet. Das Kontrollbild vom Muster kann vor, während oder nach der Detektion einzelner Moleküle gemacht werden. Ein solches Kontrollbild muß entsprechend bei jeder Einstellung auf einer neuen Oberflächenposition gemacht werden.The mechanical instability the commercially available Scant and the low reproducibility of repeated adjustment the same X, Y positions make a precise analysis of the signals of individual Molecules over several Cycles difficult. There are many possibilities, a match the coordinates in repeated settings to improve or possible To control deviations. As an example, a check option cited. After a rough mechanical adjustment of the lens position becomes a control image of a pattern firmly attached to the surface made. Even if the mechanical adjustment is not exactly the same Coordinates (deviations of up to 10 μm are possible), you can make a correction by means of optical control. The control picture of the pattern serves as a coordinate system for the image with signals from built-in NTs *. A prerequisite for such a correction is that no further movements of the surface be made between these two shots. Signals from individual molecules are set in relation to the pattern so that an X, Y deviation in the Pattern position same X, Y deviation in the position of the signals of individual molecules. The control picture from the pattern can before, during or after the detection of individual molecules. Such Control image must be correspondingly be made on a new surface position at each setting.

b) Einstellung der Fokusebene (Z-Achse)b) Setting the focal plane (Z-axis)

Die Oberfläche ist nicht absolut plan und weist verschiedene Unebenheiten auf. Dadurch verändert sich der Oberfläche-Objektiv-Abstand beim abscannen benachbarter Stellen. Diese Unterschiede im Abstand können dazu führen, daß einzelne Moleküle die Fokusebene verlassen und so der Detektion entgehen.The surface is not absolutely flat and has various bumps. This is changing the surface-to-lens distance when scanning neighboring bodies. These differences in distance can do this to lead, that individual molecules leave the focal plane and thus escape the detection.

Aus diesem Grund ist es wichtig, daß beim Abscannen der Oberfläche eine reproduzierbare Einstellung der Fokusebene an jeder Objektivposition erreicht wird.Out For this reason, it is important that when Scan the surface a reproducible adjustment of the focal plane at each lens position is reached.

Es gibt verschiedene Möglichkeiten, die Fokusebene reproduzierbar einzustellen. Beispielsweise kann folgende Methode angewendet werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer Fluoreszenz führen kann, wird auf die Oberfläche ein Marker aufgebracht, der zur Einstellung der Fokusebene dient. Danach erfolgt die Detektion der Signale einzelner Moleküle. Der Marker kann beliebiger Natur sein (z.B. Farbstoff oder Muster), darf aber die Detektion und die Reaktion nicht beeinträchtigen.It are different ways to adjust the focal plane reproducibly. For example, can The following method can be used: Since the excitation of individual molecules to extinguish their Lead to fluorescence can, will on the surface a marker applied, which serves to adjust the focal plane. Thereafter, the detection of the signals of individual molecules. Of the Marker can be of any nature (e.g., dye or pattern), but must not interfere with the detection and the reaction.

c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF.c) detection of the signals single molecules, Assignment of the signal to NT * and assignment of the signal to the respective one NACF.

Das mit Hilfe des Detektionssystems erzeugte zweidimensionale Bild der Reaktionsoberfläche enthält die Signalinformationen von in die NSKFs eingebauten NT*s. Diese müssen vor der weiteren Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit geeigneten Methoden extrahiert werden. Die dazu notwendigen Algorithmen zur Skalierung, Transformation und Filterung der Bildinformationen zählen zum Standardrepertoir der digitalen Bildverarbeitung und Mustererkennung (Haberäcker P. "Praxis der Digitalen Bildverarbeitung und Mustererkennung". Hanser-Verlag, München, Wien, 1995; Galbiati L. J. "Machine vision and digital image processing fundamentals". Prentice Hall, Englewood Cliffs, New Jersey, 1990). Die Signalextraktion erfolgt vorzugsweise über ein Grauwertbild, das die Helligkeitsverteilung der Reaktionsoberfläche für den jeweiligen Fluoreszenzkanal abbildet. Wenn bei der Sequenzierungsreaktion mehrere Nukleotide mit unterschiedlichen Fluoreszenz-Farbstoffen verwendet werden, kann zunächst für jedes verwendete fluoreszenzmarkierte Nukleotid (A,T,C,G oder U) ein separates Grauwert-Bild erzeugt werden. Dafür können prinzipiell 2 Verfahren angewendet werden:

  • 1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersätze) wird für jeden Fluoreszenzkanal ein Grauwertbild erzeugt.
  • 2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines geeigneten Algorithmus durch ein Bildverarbeitungsprogramm die relevanten Farbkanäle extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer Farb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt: GBN = (s(x,y)) einkanaliges Grauwertbild N = {1, ..., Anzahl der Fluoreszenzkanäle}. M = {0,1, ..., 255} Grauwertmenge S = (s(x,y)) Bildmatrix des Grauwertbildes x = 0, 1, ..., L-1 Bildzeilen y = 0, 1, ..., R-1 Bildspalten (x,y) Ortskoordinaten eines Bildpunktes s(x,y) ∊ M Grauwert des Bildpunktes.
The two-dimensional image of the reaction surface generated with the aid of the detection system contains the signal information of NT * s incorporated in the NSKFs. These must be extracted from the total data volume of the image information with suitable methods before further processing. The necessary algorithms for scaling, transforming and filtering the image information belong to the standard repertoire of digital image processing and pattern recognition (Haberäcker P. "Practice of Digital Image Processing and Pattern Recognition." Hanser-Verlag, Munich, Vienna, 1995; Galbiati LJ "Machine vision and digital image processing fundamentals. "Prentice Hall, Englewood Cliffs, New Jersey, 1990). The signal extraction preferably takes place via a gray scale image, which images the brightness distribution of the reaction surface for the respective fluorescence channel. If several nucleotides with different fluorescent dyes are used in the sequencing reaction, a separate gray scale image can first be generated for each fluorescently labeled nucleotide (A, T, C, G or U) used. In principle, 2 methods can be used:
  • 1. By using suitable filters (Zeiss filter sets), a halftone image is generated for each fluorescence channel.
  • 2. From a recorded multichannel color image, the relevant color channels are extracted by means of a suitable algorithm by an image processing program and further processed individually as a gray value image. For channel extraction, a color threshold algorithm specific to the respective channel is used. Thus, first of all, gray-scale images 1 to N result from a multichannel color image. These images are defined as follows: GB N = (s (x, y)) single-channel gray value image N = {1,..., Number of fluorescence channels}. M = {0,1, ..., 255} Gray value set S = (s (x, y)) Image matrix of the gray scale image x = 0, 1, ..., L-1 Image lines y = 0, 1, ... , R-1 image columns (x, y) spatial coordinates of a pixel s (x, y) ε M gray value of the pixel.

Aus dieser Datenmenge wird nun durch ein geeignetes Programm die relevante Bildinformation extrahiert. Ein solches Programm sollte folgende Arbeitsschritte realisieren:
Für GB1 bis GBN durchführen:

  • I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa durch Grauwertglättung.
  • II. Prüfung jedes Bildpunkt (x,y) des Grauwertbildes, ob dieser Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter anderem von der verwendeten Detektionsapparatur und der Auflösung des Grauwertbildes ab. Sie können beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der Bildsegmentierung reichen von einfachen Schwellwertverfahren bis hin zur Verwendung neuronaler Netze.
From this data set, the relevant image information is now extracted by a suitable program. Such a program should realize the following steps:
Perform for GB 1 to GB N :
  • I. Pre-processing of the image, so for example, if necessary, reduction of the image noise resulting from the digitization of the image information, such as gray scale smoothing.
  • II. Examination of each pixel (x, y) of the gray value image, whether this point fulfills the properties of a fluorescence spot in connection with the immediate and more distant neighboring pixels surrounding it. Among other things, these properties depend on the detection apparatus used and the resolution of the gray value image. For example, they can represent a typical distribution pattern of brightness intensity values over a matrix surrounding the pixel. The methods of image segmentation that can be used range from simple threshold procedures to the use of neural networks.

Erfüllt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein Vergleich mit den Koordinaten von in bisher durchgeführten Sequenzierungszyklen identifizierten NSKFs. Bei einer Übereinstimmung erfolgt die Zuordnung des Signals mit dem aus dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem NSKF. Signale mit nicht übereinstimmenden Koordinaten werden als Hintergrundsignale bewertet und verworfen. Die Analyse der Signale kann parallel zum Scanvorgang erfolgen.Meets one Pixel (x, y) these requirements, then follows a comparison with the coordinates of previously performed sequencing cycles identified NSKFs. If there is a match, the Assignment of the signal with that from the respective fluorescence channel resulting nucleotide to this NSKF. Signals with mismatched Coordinates are scored as background signals and discarded. The analysis of the signals can be carried out parallel to the scanning process.

In einer beispielhaften Ausführung wurde ein 8-Bit-Grauwertbild mit einer Auflösung von 1317 × 1035 Pixel verwendet. Um die durch die Digitalisierung entstandenen Veränderungen am Bild zu reduzieren, erfolgte zunächst eine Vorverarbeitung des Gesamtbildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung entsteht dadurch ein für einen Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt mit dem größten Helligkeitswert und Nachbarbildpunkten mit nach allen Seiten hin abfallenden Helligkeiten. Erfüllte ein Bildpunkt diese Kritierien und Überschritt der zentrifugale Helligkeitsabfall einen bestimmten Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte), dann wurde dieser zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes gewertet.In an exemplary embodiment, an 8-bit gray-scale image with a resolution of 1317 × 1035 was used Pixel used. In order to reduce the changes in the image caused by digitization, the entire image was first preprocessed: each pixel was assigned the average brightness of its 8 neighbors. At the selected resolution, this produces a typical pattern for a fluorescence spot of a central pixel with the greatest brightness value and neighboring pixels with brightnesses that decrease in all directions. If one pixel fulfilled these criteria and the centrifugal brightness decrease exceeded a certain threshold (to exclude weak fluorescence spots), then this central pixel was considered to be a coordinate of a fluorescence spot.

d) Verschiebung des Objektivs zur nächsten Position auf der Oberfläche. Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer anderen Position der Oberfläche positioniert.d) displacement of the lens to the next Position on the surface. After the detection of the signals of individual molecules, the lens is above a other position of the surface positioned.

Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der X,Y-Position, der Einstellung der Fokusebene und mit der Detektion einzelner Moleküle bei jeder neuen Objektivposition gemacht werden. Diese Schritte können durch einen Computer gesteuert werden.All in all For example, a sequence of recordings with the control of X, Y position, focal plane adjustment and detection single molecules be done with every new lens position. These steps can be controlled by a computer.

4.7 Zeitlicher Ablauf der Verfahrensschritte4.7 Timing the process steps

Der Scanvorgang sowie die biochemische Reaktion nehmen eine gewisse Zeit in Anspruch. Wenn man diese Vorgänge nacheinander schaltet, kann man eine optimale Leistung der Apparatur erreichen. In einer bevorzugten Ausführung wird die Reaktion auf zwei getrennten Oberflächen durchgeführt (9).The scanning process and the biochemical reaction take some time. By switching these processes one after another, one can achieve optimal performance of the apparatus. In a preferred embodiment, the reaction is carried out on two separate surfaces ( 9 ).

Als Beispiel kann eine Oberfläche mit immobilisierten NSKFs in 2 räumlich isolierte Teile getrennt werden, so daß Reaktionen auf diesen beiden Teilen unabhängig voneinander ablaufen können. In einem anderen Beispiel können NSKFs auch von vornherein auf 2 getrennten Oberflächen immobilisiert werden.When Example can be a surface with immobilized NSKFs in 2 spatially isolated parts are separated so that reactions to these two Share independently can run away from each other. In another example NSKFs also immobilized from the outset on 2 separate surfaces become.

Danach wird die Reaktion gestartet. Das Prinzip dabei ist, daß während auf einem Teil der Oberfläche die Reaktions- und Waschschritte ablaufen, der zweite Teil abgescannt wird. Dadurch kann man einen kontinuierlichen Ablauf der Analyse erreichen und die Geschwindigkeit der Sequenzierung steigern.After that the reaction is started. The principle is that while on a part of the surface the Reaction and washing steps take place, the second part is scanned becomes. This allows one to have a continuous process of analysis achieve and increase the speed of sequencing.

Die Anzahl der Oberflächen, auf denen die Reaktion abläuft, kann auch größer als 2 sein. Das erscheint dann sinnvoll, wenn die Reaktion als zeitlich limitierender Schritt auftritt, d.h. die Detektion der Signale auf der Oberfläche schneller als die Reaktions- und Waschschritte abläuft. Um die Gesamtdauer der Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne Schritt der Reaktion auf einer einzelnen Oberfläche mit einer zeitlichen Verzögerung im Vergleich zur nächsten Oberfläche ablaufen.The Number of surfaces, on which the reaction takes place, can also be bigger than Be 2. This makes sense if the reaction is timed limiting step occurs, i. the detection of the signals the surface faster than the reaction and washing steps. Around adjust the total duration of the reaction to the detection duration, Every single step of the reaction can be on a single surface with a time delay compared to the next surface expire.

Die Erfindung wird nachfolgend anhand von Beispielen verdeutlicht.The The invention is illustrated below by way of examples.

BeispieleExamples

Beispiel 1:Example 1:

Modifiziertes dUTP mit einem langen spaltbaren Linker (7f-1) Als Ausgangssubstanzen dienen 5-(3-Aminoallyl)-2'-deoxyuridin-5'-triphosphat, AA-dUTP, (Sigma), 3,3'-Dithio-bis(propionsäure-N-Nydroxysuccinimidester), DTBP-NHS, (Sigma), 2-Mercaproethanolamin, MEA, (Sigma). Zu 100 μl 50 mM Lösung von AA-dUTP in 100 mM Borat-Puffer pH 8.5 werden 3 Äquivalente an DTBP-NHS in DMF (25 μl 0.4 M Lösung) zugegeben. Das Reaktionsgemisch wird 4 Stunden bei RT. inkubiert. Anschließend wird konz. Ammoniumacetat-Lösung (pH 9) zugegeben bis die Gesamtkonzentration an CH3COONH4 in der Reaktionslösung 100 mM ist, und die Reaktion wird eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch 200 μl 1 M MEA-Lösung, pH 9, zugegeben und eine Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in 0.3 M KI-Lösung zugetropft, bis die Iodfarbe bestehen bleibt. Die modifizierten Nukleotide werden auf einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient (pH 8.5) von anderen Reaktionsprodukten abgetrennt. Isolierung des Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An diesen Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, S.362, Jameson et al. Method in Enzymology 1997, v. 278, S. 363).Modified dUTP with a long cleavable linker ( 7f-1 ) Starting materials are 5- (3-aminoallyl) -2'-deoxyuridine-5'-triphosphate, AA-dUTP, (Sigma), 3,3'-dithio-bis (propionic acid N-hydroxysuccinimide ester), DTBP-NHS, (Sigma), 2-mercaproethanolamine, MEA, (Sigma). To 100 μl of 50 mM solution of AA-dUTP in 100 mM borate buffer pH 8.5, 3 equivalents of DTBP-NHS in DMF (25 μl 0.4 M solution) are added. The reaction mixture is at RT for 4 hours. incubated. Subsequently, conc. Ammonium acetate solution (pH 9) is added until the total concentration of CH 3 COONH 4 in the reaction solution is 100 mM, and the reaction is incubated for an additional hour. Thereafter, 200 .mu.l 1 M MEA solution, pH 9, are added to this mixture and incubated for one hour at RT. Subsequently, a saturated solution of I 2 in 0.3 M KI solution is added dropwise to this mixture until the iodine color persists. The modified nucleotides are separated on a DEAE cellulose column in ammonium carbonate gradient (pH 8.5) from other reaction products. Isolation of the nucleotide with the cleavable linker is carried out on RP-HPLC. Dyes can now be coupled to this linker by various methods ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Wagoner Method in Enzymology 1995 v. 246, p.362, Jameson et al. Method in Enzymology 1997, v. 278, p. 363).

Auch andere Nukleotidanaloga (z.B. nach Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356) können in die Reaktion eingesetzt werden, so daß Nukleotidanaloga mit Strukturen in 7f-2, 3, 4 und 7g-1, 2 erzeugt werden können.Other nucleotide analogues (for example, according to Hobbs et al., US Patent 5,047,519, Khan et al., US Patent 5,821,356) can be used in the reaction, so that nucleotide analogues having structures in 7f-2 , 3, 4 and 7g-1 , 2 can be generated.

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat) angegeben (NT*-Struktur 7j)As an example of the coupling of a dye to the linker, the coupling of TRITC (tetramethylrhodamine isothiocyanate) is indicated (NT * structure 7y )

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 μl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*). Dazu werden 10 μl 10 mM TRITC in Dimethylformamid (DMF) gegeben und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.The modified with the cleavable linker dNTP (300 nmol) is in 30 ul 100 mM Sodium borate buffer pH 9 dissolved (10 mM NT *). This will be 10 ul 10 mM TRITC in dimethylformamide (DMF) and incubated for 4 h at RT. The dye modified NT * is purified by RP-HPLC in a methanol-water gradient.

Beispiel der Spaltung der Disulphidverbindung im modifizierten NT*. Die Spaltung erfolgt durch eine Zugabe von 20 bis 50 mM Dithiothreitol-Lösung DTT (Sigma) Lösung pH 8 auf die Reaktionsoberfläche. Die Oberfläche wird 10 min. mit dieser Lösung inkubiert, danach wird die Lösung entfernt und die Oberfläche mit einer Pufferlösung zur Entfernung von DTT-Resten gewaschen.example the cleavage of the disulphide compound in the modified NT *. The split is done by adding 20 to 50 mM dithiothreitol solution DTT (Sigma) solution pH 8 on the reaction surface. The surface will be 10 min. with this solution incubated, then the solution removed and the surface with a buffer solution washed to remove DTT residues.

Beispiel 2Example 2

Modifiziertes dUTP (dUTP-SS-CH2CH2NH2) mit einem kurzen spaltbaren Linker (7e-1). Als Ausgangssubstanzen dienen: Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, v. 180, S. 383), 2-Mercaptoethanolamin (MEA) (Sigma).Modified dUTP (dUTP-SS-CH 2 CH 2 NH 2 ) with a short cleavable linker ( 7e-1 ). The starting substances used are: bis-dUTP, synthesized according to Hanna (Method in Enzymology 1989, v. 180, p. 383), 2-mercaptoethanolamine (MEA) (Sigma).

Zu 400 μl 100 mM Bis-dUTP in 40 mM Boratpuffer pH 8.5 werden 100 μl 100 mM MEA-Lösung pH 8.5 in H2O zugegeben und 1 Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in 0.3 M KI-Lösung zugetropft, bis die Iodfarbe bestehen bleibt. Die Nukleotide (Bis-dUTP und dUTP-SS-CH2CH2NH2) können z.B. durch eine Ethanol-Präzipitation oder auf einer DEAE-Cellulose-Säule im Ammoniumcarbonat-Gradienten (pH 8.5) von anderen Reaktionsprodukten abgetrennt werden. Bis-dUTP stört bei der anschließenden Ankopplung eines Farbstoffs an die Aminogruppe des Linkers nicht, so daß die Abtrennung des dUTP-SS-CH2CH2NH2 von bis-dUTP im Endreinigungsschritt erfolgen kann.100 μl of 100 mM MEA solution pH 8.5 in H 2 O are added to 400 μl of 100 mM Bis-dUTP in 40 mM borate buffer pH 8.5 and incubated for 1 hour at RT. Subsequently, a saturated solution of I 2 in 0.3 M KI solution is added dropwise to this mixture until the iodine color persists. The nucleotides (bis-dUTP and dUTP-SS-CH 2 CH 2 NH 2 ) can be separated from other reaction products, for example by ethanol precipitation or on a DEAE cellulose column in the ammonium carbonate gradient (pH 8.5). Bis-dUTP does not interfere with the subsequent coupling of a dye to the amino group of the linker, so that the separation of the dUTP-SS-CH 2 CH 2 NH 2 from bis-dUTP can take place in the final purification step.

In einer ähnlichen Weise kann auch dCTP (7-e2) modifiziert werden, dabei dient Bis-dCTP als Ausgangssubstanz (synthetisiert nach Hanna et al. Nucleic Acid Research 1993, v. 21, S.2073).In a similar way, dCTP ( 7-e2 ), whereby bis-dCTP serves as the starting substance (synthesized according to Hanna et al., Nucleic Acid Research 1993, v. 21, p.2073).

An den Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in Enzymology 1997, v. 278, S.363).At the linker can now dyes can be coupled with different methods ("Handbook of Fluorescent Probes and Research Chemicals "6th ed. 1996, R. Haugland, Molecular Probes, Wagoner Method in Enzymology 1995 v. 246, p. 362, Jameson et al. Method in Enzymology 1997, v. Chr. 278, p. 363).

Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung des FluoroLinkTM Cy3 monofunktional dye (Amersham Pharmacia biotech) (NT*-Struktur 7i) angegeben. Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstoff. Die Reaktion wird nach Angaben des Herstellers durchgeführt:
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 μl 100 mM Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird Farbstoff (300 nmol) gegeben und 1h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
As an example of the coupling of a dye to the linker, the coupling of the FluoroLink Cy3 monofunctional dye (Amersham Pharmacia biotech) (NT * structure 7i ). This is a monofunctional NHS ester fluorescent dye. The reaction is carried out according to the manufacturer's instructions:
The cleavable linker-modified dNTP (300 nmol) is dissolved in 300 μl of 100 mM sodium borate buffer pH 8.5. For this purpose, dye (300 nmol) is added and incubated for 1 h at RT. The dye-modified NT * is purified by RP-HPLC in a methanol-water gradient.

Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5-isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC 7h).Another example of the coupling of a dye to the linker is the coupling of TRITC (tetramethylrhodamine-5-isothiocyanate, Molecular Probes) (dUTP-SS-TRITC 7h ).

Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 μl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*). Dazu werden 10 μl 10 mM TRITC in DMF gegeben und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.The modified with the cleavable linker dNTP (300 nmol) is in 30 ul 100 mM Sodium borate buffer pH 9 dissolved (10 mM NT *). This will be 10 ul 10 mM TRITC in DMF and incubated for 4 h at RT. The cleaning of the modified with the dye NT * via RP-HPLC in a methanol-water Gradient.

Beispiel 3:Example 3:

Sequenzanalyse mit 4 markierten NTs*Sequence analysis with 4 marked NTs *

Bei einer bevorzugten Ausführungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenzfarbstoffen markiert.at a preferred embodiment all four NTs used in the reaction are labeled with fluorescent dyes.

3A. 3A.

Rekonstruktion der ursprünglichen Sequenzen nach dem Schrotschuß-Prinzip ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). (Dieses Prinzip ist insbesondere bei der Analyse neuer, unbekannter Sequenzen geeignet.)Reconstruction of the original sequences according to the shotgun principle (Automated DNA sequencing and analysis, page 231 et seq., 1994, M. Adams et al., Academic Press, Huang et al., Genom Res., 1999, v. 9 P. 868, Huang Genomics 1996 BC. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. Chr. 1 p. 257). (This principle is particularly useful in the analysis of new, unknown sequences.)

3A-1 Sequenzierung eines langen DNA-Stücks (1)3A-1 Sequencing of a long piece of DNA ( 1 )

Im folgenden soll anhand der Sequenzierung eines 1 Mb langen DNA-Stückes schematisch die Sequenzierung langer Nukleinsäureketten dargestellt werden (1). Der Sequenzierung liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Das zu analysierende Material wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird. Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen. Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen Oberfläche fixiert. Die nicht gebundenen DNA-Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktionsoberfläche durchgeführt. Zur Rekonstruktion einer 1 Mb langen DNA-Sequenz sollten die Sequenzen von NSKFs vorzugsweise länger als 300 NTs sein, durchschnittlich ca. 400 bp.In the following, the sequencing of a 1 Mb long piece of DNA will schematically illustrate the sequencing of long nucleic acid chains ( 1 ). The sequencing is based on the shotgun principle ("Automated DNA sequencing and analysis", page 231 et seq., 1994, M. Adams et al., Academic Press, Huang et al., Gen. Res., 1999, 9, 868, Huang Genomics, 1996, p 33, p.21, Bonfield et al., NAR 1995, v. 23, p.4992, Miller et al., J. Comput., Biol., 1994, v. 1, p. The material to be analyzed is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length. Each fragment is then provided with a primer binding site and a primer. This mixture of different DNA fragments is now fixed on a flat surface. The unbound DNA fragments are removed by a washing step. Thereafter, the sequencing reaction is carried out on the entire reaction surface. To reconstruct a 1 Mb DNA sequence, the sequences of NSKFs should preferably be longer than 300 NTs, on average about 400 bp.

Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 400 Zyklen zur Sequenzierung notwendig.There Only one marked NT * is installed per cycle, are at least 400 cycles necessary for sequencing.

Insgesamt ist zur Rekonstruktion der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d.h. 10 bis 100 Mb. Bei einer durchschnittlichen Sequenzlänge von ca. 400 bp pro NSKF benötigt man entsprechend 25.000 bis 250.000 DNA-Fragmente, um mehr als 99,995% der Gesamtsequenz abzudecken.All in all is for the reconstruction of the original one Sequence requires about 10 to 100 times the amount of crude sequences, i.e. 10 to 100 Mb. With an average sequence length of about 400 bp per NSKF needed correspondingly 25,000 to 250,000 DNA fragments, by more than 99.995% to cover the entire sequence.

Die ermittelten NSKF-Sequenzen stellen eine Population von überlappenden Teilsequenzen dar, die sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammenfügen lassen ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).The detected NSKF sequences represent a population of overlapping Partial sequences dealing with commercially available programs to the overall sequence put together the NSK ("Automated DNA sequencing and analysis "S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genome Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. Chr. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. Chr. 1 P. 257).

3A-2 Sequenzierung der Genprodukte am Beispiel der cDNA-Sequenzierung3A-2 Sequencing of Gene products using the example of cDNA sequencing

In einer bevorzugten Ausführungsform können statt einer Sequenz mehrere Sequenzen in einem Ansatz analysiert werden. Die ursprünglichen Sequenzen können aus den gewonnen Rohdaten z.B. nach dem Schrotschuß-Prinzip rekonstruiert werden.In a preferred embodiment can Instead of a sequence, several sequences were analyzed in one approach become. The originals Sequences can from the obtained raw data e.g. after the shotgun principle be reconstructed.

Zunächst werden NSKFs erzeugt. Man kann z.B. mRNA in eine doppelsträngige cDNA überführen und diese cDNA mit Ultraschall fragmentieren. Anschließend werden diese NSKFs mit einer Primerbindungsstelle versehen, denaturiert, immobilisiert und mit einem Primer hybridisiert. Zu beachten ist bei dieser Variante der Probenvorbereitung, daß die cDNA-Moleküle unvollständige mRNA-Sequenzen darstellen können (Method in Enzymology 1999, v. 303, S. 19 und andere Artikel in diesem Band, "cDNA library protocols" 1997 Humana Press).First, be NSKFs generated. One can e.g. Convert mRNA into a double-stranded cDNA and this Fragment cDNA with ultrasound. Subsequently, these NSKFs with provided a primer binding site, denatured, immobilized and hybridized with a primer. Please note this variant the sample preparation that the cDNA molecules incomplete mRNA sequences can represent (Method in Enzymology 1999, v. 303, p. 19 and other articles in this volume, "cDNA library protocols "1997 Humana Press).

Eine andere Möglichkeit bei der Generierung einzelsträngiger NSKFs von mRNA besteht in der reversen Transkription der mRNA mit randomisierten Primern. Dabei werden viele relativ kurze antisense DNA-Fragmente gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 S. 264, Decraene et l1. Biotechniques 1999 v. 27 S. 962). Diese Fragmente können anschließend mit einer Primerbindungstelle versehen werden (s.o). Weitere Schritte entsprechen oben beschriebenen Vorgängen. Mit dieser Methode können komplette mRNA-Sequenzen (vom 5'- bis zum 3'-Ende) analysiert werden, da die randomisierten Primer über die gesamte Länge der mRNA binden.A different possibility in the generation of single-stranded NSKFs of mRNA is involved in the reverse transcription of mRNA randomized primers. There are many relatively short antisense DNA fragments (Zhang-J et al., Biochem., J., 1999, v., 337, p. 231, Ledbetter et al. J. Biol. Chem. 1994 v. Chem. 269 p. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 p. 264, decraene et l1. Biotechniques 1999 v. Chr. 27 p. 962). These fragments can subsequently be provided with a primer binding site (s.o). Further steps correspond to the procedures described above. With this method can complete mRNA sequences (from the 5 ' until the 3'-end) be analyzed as the randomized primers across the entire length of the mRNA tie.

Immobilisierte NSKFs werden mit einer der oben angeführten Ausführungsformen der Sequenzierung analysiert. Da mRNA-Sequenzen wesentlich weniger repetitive Sequenzen aufweisen als z.B. genomische DNA, kann die Anzahl der detektierten Signale der eingebauten NTs* von einem NSKF geringer als 300 sein und liegt vorzugsweise zwischen 20 und 1000. Die Anzahl der NSKFs, die analysiert werden müssen, errechnet sich nach denselben Prinzipien wie bei einer Schrotschuß-Rekonstruktion einer langen Sequenz.immobilized NSKFs are analyzed by one of the above sequencing embodiments. Because mRNA sequences have significantly fewer repetitive sequences than e.g. genomic DNA, the number of detected signals of the built-in NTs * of a NSKF is less than 300 and is preferably between 20 and 1000. The number of NSKFs that need to be analyzed is calculated following the same principles as a shotgun reconstruction a long sequence.

Aus NSKF-Sequenzen werden nach den Prinzipien des Schrotschuß-Verfahrens die ursprünglichen Gensequenzen rekonstruiert.NSKF sequences become the original ones according to the principles of the shotgun method Reconstructed gene sequences.

Diese Methode erlaubt die gleichzeitige Sequenzierung von vielen mRNAs ohne vorherige Klonierung.These Method allows the simultaneous sequencing of many mRNAs without prior cloning.

3B. Analyse von Sequenzvarianten3B. Analysis of sequence variants

Die Bestätigung einer bereits bekannten Sequenz oder der Nachweis von Varianten dieser Sequenz stellt sehr viel geringere Ansprüche an die Länge und Redundanz der ermittelten NSKFs. Auch die Sequenzbearbeitung ist in diesem Fall einfacher. Die Vollsequenz braucht nicht neu rekonstruiert zu werden. Die NSKF-Sequenzen werden vielmehr mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z.B. BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).The confirmation an already known sequence or the detection of variants this sequence puts much less demands on length and Redundancy of the ascertained NSKFs. The sequence processing is easier in this case. The full sequence does not need to be reconstructed too become. The NSKF sequences are rather using a commercial available Program assigned to the full sequence and possible deviations detected. Such a program may e.g. BLAST or FASTA algorithm underlying ("Introduction to computational Biology "1995 M. S. Waterman Chapman & Hall).

Die zu analysierende Sequenz wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequenziert. Anschließend werden die ermittelten Sequenzen von NSKFs nicht nach dem Schrotschuß-Verfahren zusammengestzt, sondern mit der Referenzsequenz verglichen und auf diese Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei kann es sich um genomische oder cDNA-Sequenzen handeln.The sequence to be analyzed is in NSKFs with one of the above Shared method. These NSKFs are obtained by the method according to the invention sequenced. Subsequently The detected sequences of NSKFs are not by the shotgun method but compared with the reference sequence and on assigned this way to their positions in the full sequence. there they may be genomic or cDNA sequences.

Im Gegensatz zu einer Rekonstruktion nach dem Schrotschuß-Verfahren braucht man für die Analyse einer Sequenzvariante erheblich weniger Rohsequenzdaten. So kann die 5- bis 10-fache Rohsequenzmenge ausreichend für die Wiederherstellung einer neuen Variante einer Vollsequenz sein. Mit dem Schrotschuß-Verfahren wird für eine Wiederherstellung eine 10- bis 100-fache Menge an Rohsequenzen benötigt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).in the Contrary to a reconstruction after the shotgun method needs one for one the analysis of a sequence variant significantly less crude sequence data. So that can be 5 to 10 times Raw sequence quantity sufficient for the restoration of a new variant of a full sequence. With the shotgun method is for a restore a 10 to 100 times the amount of raw sequences needed ("Automated DNA sequencing and analysis "S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. genome Res. 1999 v. Chr. 9 p. 868, Huang Genomics 1996 v. Chr. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257).

Die Länge der ermittelten NSKF-Sequenzen soll für eine eindeutige Zuordnung zu einer bestimmten Position in der Referenzsequenz ausreichend sein, so können z.B bereits Sequenzen mit einer Länge von 20 NTs (z.B. aus nicht repetitiven Abschnitten im menschlichen Genom) eindeutig identifiziert werden. Für die Vergleichsanalyse der repetitiven Abschnitte werden längere Sequenzen benötigt. Die genaue Länge der Sequenzen hängt dabei von der Aufgabenstellung ab. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs.The Length of determined NSKF sequences intended for unambiguous assignment sufficient for a given position in the reference sequence be, so can For example, already sequences with a length of 20 NTs (for example, not from repetitive sections in the human genome) become. For the comparative analysis of the repetitive sections become longer sequences needed. The exact length the sequences depends thereby from the task from. Preferably, the length of the determined NSKF sequences in the analysis of non-repetitive sections more than 20 NTs. For the analysis of the repetitive sections is preferably more than 500 NTs.

Die Zielsetzungen bei der Sequenzierung neuer Varianten einer bereits bekannten Vollsequenz können sehr unterschiedlich sein. Meist wird ein Vergleich der neu ermittelten Sequenz mit der bekannten Vollsequenz/Referenzsequenz angestrebt. Dabei können die beiden Sequenzen aus evolutionär unterschiedlich weit auseinanderliegenden Spezies stammen. Verschiedene Parameter der Zusammensetzung dieser beiden Sequenzen können verglichen werden. Als Beispiele für eine solche Analyse dienen: Mutations- oder Polymorphismusanalysen und die Analyse von alternativ gespleißten Genprodukten.The Objectives in the sequencing of new variants of an already known full sequence can be very different. Mostly a comparison of the newly determined Sequence sought with the known full sequence / reference sequence. It can the two sequences from evolutionary different far apart Species originate. Various parameters of the composition of this both sequences can be compared. Examples of such an analysis are: Mutation or polymorphism analyzes and the analysis of alternative spliced Gene products.

Nachfolgend soll beispielhaft ein Vergleich der zu untersuchenden Sequenz mit einer Referenzsequenz ohne vorherige Rekonstruktion der zu analysierenden Sequenz betrachtet werden. Ein solcher Vergleich kann z.B. zur Mutations- oder SNP-Analyse dienen.following By way of example, a comparison of the sequence to be examined with a reference sequence without prior reconstruction of the analyte Sequence can be considered. Such a comparison may e.g. to the mutation or SNP analysis.

3B-13B-1

Eine lange, zu analysierende Sequenz, z.B. 1 Mb, wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequenziert. Die ermittelten Sequenzen von jedem einzelnen NSKF werden direkt mit der Referenzsequenz verglichen. Die Referenzsequenz dient dabei als Grundlage für die Zuordnung ermittelter NSKF-Sequenzen, so daß die aufwendige Rekonstruktion nach dem Schrotschuß-Verfahren entfällt. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht-repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs. Die Anzahl der zu analysierenden NSKFs richtet sich dabei nach der Gesamtlänge der zu untersuchenden Sequenz, der durchschnittlichen Länge der NSKF-Sequenzen und der notwendigen Genauigkeit der Sequen zierung. Bei einer durchschnittlichen Länge der ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlänge der zu untersuchenden Sequenz von 1 Mb und einer Genauigkeit, die der Rohsequenzermittlung entspricht (d.h. jede Stelle soll möglichst nur einmal sequenziert werden) benötigt man z.B. die ca. 5-fache Menge an Rohsequenzen, d.h. 5 Mb, weil die Verteilung der NSKFs über die Gesamtsequenz zufällig erfolgt. Insgesamt müssen 50.000 NSKFs analysiert werden, um mehr als 99% der Gesamtstrecke abzudecken.A long sequence to be analyzed, eg 1 Mb, is divided into NSKFs using one of the above methods. These NSKFs are sequenced using the method according to the invention. The determined sequences of each individual NSKF are compared directly with the reference sequence. The reference sequence serves as the basis for the assignment of determined NSKF sequences, so that the complex reconstruction according to the shotgun method is omitted. Preferably, the length of the detected NSKF sequences in the analysis of non-repetitive sections is more than 20 NTs. For the analysis of the repetitive sections, it is preferably more than 500 NTs. The number of NSKFs to be analyzed depends on the total length of the sequence to be examined, the average length of the NSKF sequences and the necessary accuracy of the sequencing. With an average length of the determined NSKF sequence of 100 NTs, a total length of the sequence to be examined of 1 Mb and an accuracy which corresponds to the raw sequence determination (ie each site should preferably only be sequenced once) one needs, for example, about 5-fold Amount of raw sequences, ie 5 Mb, because the distribution of NSKFs over the Total sequence happens at random. In total, 50,000 NSKFs need to be analyzed to cover more than 99% of the total distance.

Anschließend werden die ermittelten NSKF-Sequenzen mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z.B. BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).Then be the determined NSKF sequences using a commercially available Program assigned to the full sequence and possible deviations detected. Such a program may e.g. BLAST or FASTA algorithm underlying ("Introduction to computational Biology "1995 M. S. Waterman Chapman & Hall).

Beispiel 4:Example 4:

Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs (2NTs*/2NTs-Methode).Sequence analysis with 2 marked NTs * and 2 unmarked NTs (2NTs * / 2NTs method).

In einer anderen Ausführungsform werden für die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs eingesetzt.In another embodiment be for the analysis of the sequences 2 modified NTs * and 2 unmodified NTs used.

Diese Methode eignet sich besonders zur Analyse der Sequenzvarianten (z.B. SNP- oder Mutationsanalyse) und setzt die Kenntnis einer Referenzsequenz voraus. Dabei wird die Vollsequenz nicht rekonstruiert, sondern die ermittelten Sequenzen werden mit Hilfe eines Programms der Referenzsequenz zugeordnet und eventuelle Abweichungen registriert. Einem solchen Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).These Method is particularly suitable for analyzing sequence variants (e.g. SNP or mutation analysis) and sets the knowledge of a reference sequence ahead. The full sequence is not reconstructed, but the sequences determined are determined by means of a program of the reference sequence assigned and possible deviations registered. Such a Program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational biology "1995 M. S. Waterman Chapman & Hall).

Diese Ausführungsform beruht auf dem Prinzip, daß eine Abfolge aus 2 Signalen (markierte NT*s) genügend Informationen zur Identifizierung einer Sequenz enthalten kann. Die ermittelte Sequenz wird mit der Referenzsequenz verglichen und einer bestimmten Position zugeordnet, z.B.:

Figure 00580001
This embodiment is based on the principle that a sequence of 2 signals (labeled NT * s) can contain enough information to identify a sequence. The determined sequence is compared with the reference sequence and assigned to a specific position, eg:
Figure 00580001

Die unbekannte, zu analysierende Variante der Referenzsequenz wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK wird in NSKFs überführt, diese werden mit PBS ligiert, anschließend mit einem Primer hybridisiert und auf Reaktionsoberfläche immobilisiert). Auf diese Weise vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode sequenziert. Man erhält NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge aus 2NTs* darstellt. Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen mehr als 40 NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, ist die Gesamtlänge des synthetisierten komplementären Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 40 detektierten NTs* beträgt die Gesamtlänge z.B. durchschnittlich 80 NTs).The unknown variant of the reference sequence to be analyzed will be like described above for sequencing (NSK is transferred to NSKFs, this are ligated with PBS, then hybridized with a primer and on reaction surface immobilized). This way, NSKFs prepared with 2NTs * / 2NTs method sequenced. You get NSKF sequences, each NSKF sequence representing a sequence of 2NTs *. To a clear assignment of the determined sequence to a known To allow reference sequence must this Be long enough for the sequence. Preferably, the length of the detected NSKF sequences is more than 40 NT * s. Since 2 marked NTs * represent only part of the sequence, is the total length of the synthesized complementary Strand approximately twice as long as the sequence of detected NTs * (at 40 detected NTs * is the total length e.g. average of 80 NTs).

Zur Synthese eines komplementären Stranges werden 4 Nukleotide benötigt. Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden Erfindung als Semiterminatoren auftreten, d.h. die Termination ausschließlich bei Verfügbarkeit modifizierter NTs* auftritt, müssen unmodifizierte NTs in einem zusätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue Position dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei ist, daß die markierten NTs* und die unmodifizierte NTs getrennt verwendet werden.to Synthesis of a complementary Stranges require 4 nucleotides. As marked with a fluorescent dye NTs * in the present Invention as semiterminators, i. the termination exclusively at Availability modified NTs * occurs unmodified NTs in an additional Step in each cycle to be added to the reaction. The exact The position of this step in the cycle can vary. Important it is that the marked NTs * and the unmodified NTs are used separately.

Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgendermaßen aussehen:

  • a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten NSKFs
  • b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind
  • c) Waschen
  • d) Detektion der Signale von einzelnen, modifizierten und in die den NSKFs komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülen
  • e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotiden
  • f) Waschen
  • g) Zugabe von 2 unmodifizierten NTs und Polymerasen
  • h) Waschen.
A cycle in this embodiment may look like this, for example:
  • a) Addition of a solution with modified NTs * and polymerases to the surface with the provided NSKFs
  • b) incubation of the immobilized nucleic acid chains with this solution under conditions suitable for extension of the complementary strands around an NT
  • c) washing
  • d) Detection of the signals of individual, modified and incorporated into the NSKFs complementary Neusynthetisierten strands NTs * molecules
  • e) Removal of the label and the terminating group in the incorporated nucleotides
  • f) washing
  • g) addition of 2 unmodified NTs and polymerases
  • h) washing.

Die Konzentration der NTs liegt vorzugsweise unter 1 mM, idealerweise unter 10 μM.The Concentration of the NTs is preferably below 1 mM, ideally below 10 μM.

Diese 2NT*s/2NTs-Methode eignet sich beispielsweise für die SNP-Analyse einer genomischen Strecke eines Gens oder für doppelsträngige cDNA-Analyse. Ihr liegen folgende Prinzipien zugrunde:

  • 1) Die genetische Information in jedem der beiden komplementären DNA-Stränge ist identisch, so daß fehlende Informationen in einem Strang durch die Information aus dem anderen Strang vervollständingt werden können.
  • 2) Durch bestimmte Paarkombinationen markierter NTs* kann man mit nur 2 NTs* die komplette Information aus einer doppelsträngigen DNA erhalten. Zulässige Kombinationen von NT*s bei dieser Ausführungsform sind: A*C*; A*G*; C*T*/C*U*; G*T*/G*U*. Bevorzugt wird die Kombination C* und U*.
  • 3) Als Grundlage der Analyse dient eine bereits bekannte Referenzsequenz.
  • 4) Die NSKFs stammen von beiden Strängen der zu analysierenden NSK und die ermittelten NSKF-Sequenzen decken die gesamte Länge der zu analysierenden Sequenz ab.
This 2NT * s / 2NTs method is useful, for example, for the SNP analysis of a genomic stretch of a gene or for double-stranded cDNA analysis. It is based on the following principles:
  • 1) The genetic information in each of the two complementary DNA strands is identical, so that missing information in one strand can be completed by the information from the other strand.
  • 2) By pair combinations of labeled NTs *, complete information can be obtained from a double-stranded DNA with only 2 NTs *. Permissible combinations of NT * s in this embodiment are: A * C *; A * G *; C * T * / C * U *; G * T * / G * U *. The combination C * and U * is preferred.
  • 3) The basis of the analysis is an already known reference sequence.
  • 4) The NSKFs are derived from both strands of the NSK to be analyzed and the determined NSKF sequences cover the entire length of the sequence to be analyzed.

Am folgenden Beispiel wird erklärt, wie die Information aus einem doppelsträngigen DNA-Fragment mit nur 2 markierten NTs* gewonnen wird und wie die Unterschiede zur ursprünglichen oder nicht mutierten Sequenz (Referenzsequenz/Vergleichsequenz) festgestellt werden können. Sequenzen unter (1) und (2) sind bis auf eine Stelle identisch (unterstrichen). A* und C* sind markiert.At the the following example is explained like the information from a double-stranded DNA fragment with only 2 marked NTs * is won and how the differences to the original or unmutated sequence (reference sequence / comparison sequence) can be determined. Sequences under (1) and (2) are identical except for one place (underlined). A * and C * are marked.

1) zu prüfende Sequenz:1) sequence to be tested:

Die zu prüfende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert, so daß eine Population an NSKF-Sequenzen (ermittelte NSKF-Sequenzen(n)) entsteht. Diese ermittelten NSKF-Sequenzen enthalten Information von jedem Strang:

Figure 00600001
The sequence to be tested is sequenced by 2NT * s / 2NTs method, resulting in a population of NSKF sequences (detected NSKF sequences (n)). These detected NSKF sequences contain information from each strand:
Figure 00600001

2) Vergleichsequenz:2) Comparison sequence:

Zur Analyse ist eine Vergleichsequenz (Referenzsequenz) erforderlich:

Figure 00600002
For analysis, a comparison sequence (reference sequence) is required:
Figure 00600002

3) Vergleichsequenz mit angepaßten ermittelten NSKF-Sequenzen:3) Comparison sequence with matched determined NSKF sequences:

Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen bestimmten Stellen in der Vergleichsequenz zugeordnet und eventuelle Abweichungen detektiert:

Figure 00610001
Using a program, determined NSKF sequences are assigned to specific points in the comparison sequence and possible deviations are detected:
Figure 00610001

Mit dieser Ausführungsform kann man eine doppelsträngige Nukleinsäure auf SNP oder Mutationen untersuchen. Dabei werden die ermittelten NSKF-Sequenzen mit einer Referenzsequenz verglichen. Die Grundregeln des Vergleichs einer Teilsequenz und einer kompletten Sequenz bei der Analyse mit nur 2 markierten NTs unterscheiden sich nicht prinzipiell von denen, die bei dem Vergleich der Sequenzen anhand aller 4 markierten NTs* gelten. Näheres s. Sequenzvergleich bei Mutationsanalyse und SNP-Analyse mit 4NTs* (Beispiel 3B).With this embodiment, one can examine a double-stranded nucleic acid for SNP or mutations. The determined NSKF sequences are compared with a reference sequence. The basic rules of the comparison of a partial sequence and a complete sequence in the analysis with only 2 labeled NTs do not differ in principle from those which apply when comparing the sequences on the basis of all 4 marked NTs *. For details see Sequence comparison in mutation analysis and SNP analysis with 4NTs * (Example 3B).

SEQUENZPROTOKOLL

Figure 00620001
SEQUENCE LISTING
Figure 00620001

Figure 00630001
Figure 00630001

Claims (43)

Verfahren zur hochparallelen Sequenzanalyse von Nukleinsäuresequenzen oder Nukleinsäureketten (NSKs), bei dem man Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man die NSKFs mit einem einheitlichen Primer oder mehreren unterschiedlichen Primern in Form von NSKF-Primer-Hybridisierungsprodukten auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, man eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell an der Base so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist, man b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, man c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktionsoberfläche bestimmt, man e) zur Erzeugung unmarkierter NTs oder NSKFs die Fluoreszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, man die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, wobei man die relative Position einzelner NSKFs auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs be stimmt.A method for the highly parallel sequence analysis of nucleic acid sequences or nucleic acid chains (NSKs), in which Generating fragments (NSKFs) of single stranded NSKs of about 50 to 1000 nucleotides in length which are overlapping partial sequences of the total sequences, one randomly assembles the NSKFs with a single primer or several different primers in the form of NSKF primer hybridization products on a reaction surface one carries out a cyclic assembly reaction of the complementary strand of NSKFs using one or more primers and one or more polymerases by a) adding to the immobilized NSKFs a solution containing one or more polymerases and one to four modified nucleotides (NTs * ), which are labeled with fluorescent dyes, wherein the simultaneous use of at least two NTs * each located on the NTs * fluorescent dyes are selected so that the NTs used * can be distinguished by measuring different fluorescence signals from each other, the N Ts * are structurally modified at the base so that the polymerase after incorporation of such NT * in a growing complementary strand is not able to incorporate another NT * in the same strand, the fluorescent dye is cleavable and the structural modification of a cleavable sterically demanding ligand, b) the stationary phase obtained in step a) are incubated under conditions suitable for extending the complementary strands, the complementary strands being extended by one NT * each, c) obtained in step b) washing stationary phase under conditions suitable for the removal of NTs * not incorporated in a complementary strand, d) detecting the individual NTs * incorporated in complementary strands by measuring the signal characteristic of the respective fluorescent dye, simultaneously determining the relative position of the NTs * individual fluorescence signals on the reaction surface (e) to generate unlabelled NTs or NSKFs, cleaving the fluorescent dyes and bulky ligands from the NTs * attached to the complementary strand, f) washing the stationary phase obtained in step e) under conditions effective to remove the fluorescent dyes and the ligands are suitable, the steps a) to f) are optionally repeated several times, wherein the relative position of individual NSKFs on the reaction surface and the sequence of these NSKFs by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions determine the NTs and one of the determined overlapping partial sequences, the total sequence of NSKs be true. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 μm2 gebunden werden (stationäre Phase).Process according to Claim 1, characterized in that the NSKFs are bound to a reaction surface at a density of 10 to 100 NSKFs per 100 μm 2 (stationary phase). Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils ein markiertes NT* einsetzt.Method according to claim 1, characterized in that that he the steps a) to f) of the cyclic synthesis reaction are repeated several times, whereby in each cycle only one marked NT * is used. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* einsetzt.Method according to claim 1, characterized in that that he the steps a) to f) of the cyclic synthesis reaction are repeated several times, in each case two different marked in each cycle NTs * uses. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils vier unterschiedlich markierte NTs* einsetzt.Method according to claim 1, characterized in that that he the steps a) to f) of the cyclic synthesis reaction are repeated several times, in each cycle four are marked differently NTs * uses. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die NSKs Varianten einer bekannten Referenzsequenz sind und man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz ermittelt.Method according to claim 1, characterized in that that the NSKs variants of a known reference sequence are and you the Steps a) to f) of the cyclic synthesis reaction are repeated several times, whereby in the cycles alternately two different marked NTs * and two unmarked NTs are used and the overall sequences determined by comparison with the reference sequence. Verfahren nach den Ansprüchen 1 bis 5, dadurch gekennzeichnet, daß man in die NSKFs jeweils eine Primerbindungsstelle (PBS) einführt, wobei man bei doppelsträngigen NSKs an beiden komplementären Einzelsträngen jeweils eine PBS einführt und wobei die Primerbindungsstellen für alle NSKFs jeweils gleiche oder verschiedene Sequenzen aufweisen.Process according to claims 1 to 5, characterized that he in each of the NSKFs introduces a primer binding site (PBS), wherein one with double-stranded one NSKs on both complementary single strands each introduces a PBS and wherein the primer binding sites are the same for all NSKFs or have different sequences. Verfahren nach den Ansprüchen 1 bis 7, dadurch gekenn zeichnet, daß man die NSKFs mit Primern in einer Lösung unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen, und man die gebildeten NSKF-Primer-Hybridisierungsprodukte anschließend auf der Reaktionsoberfläche bindet.Process according to claims 1 to 7, characterized marked, that he the NSKFs with primers in a solution under conditions that are favorable for the hybridization of Primers to the primer binding sites (PBSs) of the NSKFs are suitable, where the primers are mutually identical or different sequences and the NSKF primer hybridization products formed subsequently on the reaction surface binds. Verfahren nach den Ansprüchen 1 bis 7, dadurch gekennzeichnet, daß man die NSKFs zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit Primern unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wodurch NSKF-Primer-Hybridisierungsprodukte gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.Process according to claims 1 to 7, characterized that he the NSKFs first on the reaction surface immobilized and only afterwards with primers under conditions that bring about hybridization the primer to the primer binding sites (PBSs) of the NSKFs suitable which forms NSKF primer hybridization products, where the primers are mutually identical or different sequences exhibit. Verfahren nach den Ansprüchen 1 bis 7, dadurch gekennzeichnet, daß man die Primer zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit NSKFs unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wodurch NSKFs an die Oberfläche gebunden und NSKF-Primer-Hybridisierungsprodukte gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.Process according to claims 1 to 7, characterized that he the primer first on the reaction surface immobilized and only afterwards interact with NSKFs under conditions conducive to hybridization the primer to the primer binding sites (PBSs) of the NSKFs suitable which causes NSKFs to surface and NSKF primer hybridization products are formed, wherein the primers with each other the same or different Have sequences. Verfahren nach den Ansprüchen 1 bis 10, dadurch gekennzeichnet, daß der zur strukturellen Modifikation verwendete sterisch anspruchsvolle Ligand der zur Markierung verwendete Fluoreszenzfarbstoff ist.Process according to claims 1 to 10, characterized that the used for structural modification sterically demanding Ligand of the fluorescent dye used for labeling. Verfahren nach den Ansprüchen 1 bis 11, dadurch gekennzeichnet, daß die Reaktionsoberfläche aus der Gruppe bestehend aus Silikon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.Process according to claims 1 to 11, characterized that the reaction surface from the group consisting of silicone, glass, ceramics, plastics, Gels selected is. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die Kunststoffe Polycarbonate oder Polystyrole sind.Method according to claim 12, characterized in that that the plastics Polycarbonates or polystyrenes are. Verfahren nach Anspruch 12, dadurch gekennzeichnet, daß die Gele Agarose- oder Polyacrylamidgele sind.Method according to claim 12, characterized in that that the Gels are agarose or polyacrylamide gels. Verfahren nach Anspruch 14, dadurch gekennzeichnet, daß die Gele 1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamidgele sind.Method according to claim 14, characterized in that that the Gels are 1 to 2% agarose gels or 10 to 15% polyacrylamide gels. Verfahren nach den Ansprüchen 1 bis 15, dadurch gekennzeichnet, daß die DNA-Polymerase eine DNA-Polymerase ohne 3'-5'-Endonukleaseaktivität ist.Process according to claims 1 to 15, characterized that the DNA polymerase is a DNA polymerase without 3'-5 'endonuclease activity. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die Polymerase aus der Gruppe bestehend aus viralen DNA-Polymerasen vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten und thermostabilen Polymerasen ausgewählt ist.Method according to claim 16, characterized in that that the Polymerase from the group consisting of Sequenase-type viral DNA polymerases, Beta polymerases from eukaryotes and thermostable polymerases selected is. Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß die DNA-Polymerase Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder ProHA-DNA-Polymerase ist.Method according to claim 17, characterized in that that the DNA Polymerase Sequenase Version 2, Polymerase Beta from Mammals, Taq polymerase or ProHA DNA polymerase. Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß die DNA-Polymerase Sequenase Version 2 ist.Method according to claim 17, characterized in that that the DNA Polymerase Sequenase Version 2 is. Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß die DNA-Polymerase Taq-Polymerase ist.Method according to claim 17, characterized in that that the DNA polymerase Taq polymerase is. Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß die DNA-Polymerase ProHa-DNA-Polymerase ist.Method according to claim 17, characterized in that that the DNA polymerase is ProHa DNA polymerase. Verfahren nach Anspruch 17, dadurch gekennzeichnet, daß die DNA-Polymerase DNA-Polymerase Beta aus Säugetieren ist.Method according to claim 17, characterized in that that the DNA polymerase DNA polymerase beta from mammals. Verfahren nach den Ansprüchen 1 bis 15, dadurch gekennzeichnet, daß die NTs* alpha-Phosphorothioat-NTs* sind und die Polymerase das Klenow-Fragment von E.coli-Polymerase I oder T4-DNA-Polymerase ist.Process according to claims 1 to 15, characterized that the NTs * alpha phosphorothioate NTs * and the polymerase are the Klenow fragment of E. coli polymerase I or T4 DNA polymerase. Verfahren nach Anspruch 23, dadurch gekennzeichnet, daß das NT* ein Nukleotid der Formel
Figure 00690001
ist.
A method according to claim 23, characterized in that the NT * is a nucleotide of the formula
Figure 00690001
is.
Verfahren nach Anspruch 23, dadurch gekennzeichnet, daß das NT* ein Nukleotid der Formel
Figure 00690002
Figure 00700001
ist.
A method according to claim 23, characterized in that the NT * is a nucleotide of the formula
Figure 00690002
Figure 00700001
is.
Verfahren nach Anspruch 23, dadurch gekennzeichnet, daß das NT* ein Nukleotid der Formel
Figure 00710001
ist.
A method according to claim 23, characterized in that the NT * is a nucleotide of the formula
Figure 00710001
is.
Verfahren nach den Ansprüchen 24 bis 26, dadurch gekennzeichnet, daß an die terminale Aminogruppedes Nukleotids ein Fluoreszenzfarbstoff angeheftet ist.Process according to claims 24 to 26, characterized that on the terminal amino group of the nucleotide is a fluorescent dye is attached. Verfahren nach Anspruch 23, dadurch gekennzeichnet, daß das NT* ein Nukleotid der Formel 7h) dNTP-SS-TRITC (L7)
Figure 00710002
ist.
Process according to Claim 23, characterized in that the NT * is a nucleotide of the formula 7h) dNTP-SS-TRITC (L7)
Figure 00710002
is.
Verfahren nach Anspruch 23, dadurch gekennzeichnet, daß das NT* ein Nukleotid der Formel 7i) dNTP-SS-Cy3 (L11)
Figure 00720001
ist.
Process according to Claim 23, characterized in that the NT * is a nucleotide of the formula 7i) dNTP-SS-Cy3 (L11)
Figure 00720001
is.
Verfahren nach Anspruch 23, dadurch gekennzeichnet, daß das NT* ein Nukleotid der Formel 7j) dNTP-SS-TRITC (L14)
Figure 00720002
ist.
Process according to claim 23, characterized in that the NT * is a nucleotide of the formula 7j) dNTP-SS-TRITC (L14)
Figure 00720002
is.
Verfahren nach den Ansprüchen 1 bis 30, dadurch gekennzeichnet, daß die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten ausgewählt sind.Process according to claims 1 to 30, characterized that the Fluorescent dyes selected from the group consisting of cyanine dyes, Rhodamine, xanthene and their derivatives are selected. Kit zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 31, dadurch gekennzeichnet, daß es eine Reaktionsoberfläche (einen festen Träger), zur Durchführung des Verfahrens erforderliche Reaktionslösungen, ein oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die markierten NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*), daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist.Kit to carry out the method according to the claims 1 to 31, characterized in that it has a reaction surface (a solid support), to carry out required reaction solutions, one or more polymerases, and nucleotides (NTs), of which one to four are labeled with fluorescent dyes, wherein the labeled NTs are further structurally modified (NT * or NTs *) that the Polymerase after incorporation of such NT * into a growing complementary strand unable to build another NT * in the same strand, wherein the fluorescent dye is cleavable and the structural Modification is a cleavable sterically demanding ligand. Kit nach Anspruch 32, dadurch gekennzeichnet, daß der zur strukturellen Modifikation verwendete sterisch anspruchsvolle Ligand der zur Markierung verwendete Fluoreszenzfarbstoff ist.Kit according to claim 32, characterized in that the structural modification used bulky ligand the fluorescent dye used for labeling is. Kit nach Anspruch 24 oder 25, dadurch gekennzeichnet, daß es ferner Bestandteile enthält: a) zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien, b) Nukleinsäuremoleküle, die als PBS in die NSKFs eingeführt werden, c) Oligonukleotid-Primer, d) zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien, und/oder e) Waschlösungen.Kit according to claim 24 or 25, characterized that it further contains components: a) for the production of single strands from double strands required reagents, b) Nucleic acid molecules encoding PBS in the NSKFs introduced become, c) oligonucleotide primer, d) to split off the Fluorescent dyes and sterically demanding ligands required Reagents, and / or e) washing solutions. Kit nach den Ansprüchen 32 bis 34, dadurch gekennzeichnet, daß die Reaktionsoberfläche aus der Gruppe bestehend aus Silikon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.Kit according to claims 32 to 34, characterized that the reaction surface from the group consisting of silicone, glass, ceramics, plastics, Gels selected is. Kit nach Anspruch 35, dadurch gekennzeichnet, daß die Kunststoffe Polycarbonate oder Polystyrole sind.Kit according to claim 35, characterized in that the plastics Polycarbonates or polystyrenes are. Kit nach Anspruch 35, dadurch gekennzeichnet, daß die Gele Agarose- oder Polyacrylamidgele sind.Kit according to claim 35, characterized in that the gels Agarose or polyacrylamide gels. Kit nach Anspruch 37, dadurch gekennzeichnet, daß die Gele 1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamidgele sind.Kit according to claim 37, characterized in that the gels 1 to 2% agarose gels or 10 to 15% polyacrylamide gels. Kit nach den Ansprüchen 32 bis 38, dadurch gekennzeichnet, daß die DNA-Polymerase eine DNA-Polymerase ohne 3'-5'-Endonukleaseaktivität ist.Kit according to claims 32 to 38, characterized that the DNA polymerase is a DNA polymerase without 3'-5 'endonuclease activity. Kit nach Anspruch 39, dadurch gekennzeichnet, daß die Polymerase aus der Gruppe bestehend aus viralen DNA-Polymerasen vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten und thermostabilen DNA-Polymerasen ausgewählt ist.Kit according to claim 39, characterized in that the polymerase from the group consisting of Sequenase-type viral DNA polymerases, beta-polymerases is selected from eukaryotes and thermostable DNA polymerases. Kit nach Anspruch 40, dadurch gekennzeichnet, daß die DNA-Polymerase Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder ProHa-DNA-Polymerase ist.Kit according to claim 40, characterized in that the DNA polymerase Sequenase Version 2, Polymerase Beta from Mammals, Taq polymerase or ProHa DNA polymerase. Kit nach den Ansprüchen 32 bis 38, dadurch gekennzeichnet, daß die NTs* alpha-Phosphorothioat-NTs* sind und die Polymerase das Klenow-Fragment von E.coli-Polymerase I oder T4-DNR-Polymerase ist.Kit according to claims 32 to 38, characterized that the NTs * alpha phosphorothioate NTs * and the polymerase are the Klenow fragment of E. coli polymerase I or T4 DNR polymerase is. Kit nach den Ansprüchen 32 bis 42, dadurch gekennzeichnet, daß die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten ausgewählt sind.Kit according to claims 32 to 42, characterized that the Fluorescent dyes selected from the group consisting of cyanine dyes, Rhodamine, xanthene and their derivatives are selected.
DE10120797A 2001-04-27 2001-04-27 Method for analyzing nucleic acid chains Expired - Lifetime DE10120797B4 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE10120797A DE10120797B4 (en) 2001-04-27 2001-04-27 Method for analyzing nucleic acid chains
JP2002585662A JP2004529650A (en) 2001-04-27 2002-04-26 Analysis method of nucleic acid strand
PCT/EP2002/004659 WO2002088382A2 (en) 2001-04-27 2002-04-26 Method for analysing nucleic acid chains
EP02732680A EP1381698A2 (en) 2001-04-27 2002-04-26 Method for analysing nucleic acid chains
AU2002304705A AU2002304705A1 (en) 2001-04-27 2002-04-26 Method for analysing nucleic acid chains

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10120797A DE10120797B4 (en) 2001-04-27 2001-04-27 Method for analyzing nucleic acid chains

Publications (2)

Publication Number Publication Date
DE10120797A1 DE10120797A1 (en) 2002-11-21
DE10120797B4 true DE10120797B4 (en) 2005-12-22

Family

ID=7683014

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10120797A Expired - Lifetime DE10120797B4 (en) 2001-04-27 2001-04-27 Method for analyzing nucleic acid chains

Country Status (5)

Country Link
EP (1) EP1381698A2 (en)
JP (1) JP2004529650A (en)
AU (1) AU2002304705A1 (en)
DE (1) DE10120797B4 (en)
WO (1) WO2002088382A2 (en)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
AU2001296645A1 (en) 2000-10-06 2002-04-15 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding dna and rna
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
DE10239504A1 (en) * 2001-08-29 2003-04-24 Genovoxx Gmbh Parallel sequencing of nucleic acid fragments, useful e.g. for detecting mutations, comprises sequential single-base extension of immobilized fragment-primer complex
US20050227231A1 (en) * 2001-10-04 2005-10-13 Dimitri Tcherkassov Device for sequencing nucleic acid molecules
DE10149786B4 (en) * 2001-10-09 2013-04-25 Dmitry Cherkasov Surface for studies of populations of single molecules
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
DE10214395A1 (en) * 2002-03-30 2003-10-23 Dmitri Tcherkassov Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide
US11008359B2 (en) 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
GB2395953A (en) 2002-08-23 2004-06-09 Solexa Ltd Labelled nucleotides
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
WO2004018497A2 (en) 2002-08-23 2004-03-04 Solexa Limited Modified nucleotides for polynucleotide sequencing
US8637650B2 (en) 2003-11-05 2014-01-28 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
EP1716254B1 (en) 2004-02-19 2010-04-07 Helicos Biosciences Corporation Methods for analyzing polynucleotide sequences
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US20090291440A1 (en) * 2006-05-24 2009-11-26 Ken Hirano Method for synthesizing nucleic acid using dna polymerase beta and single molecule sequencing method
EP2024512A4 (en) 2006-06-14 2009-12-09 Artemis Health Inc Methods for the diagnosis of fetal abnormalities
EP2071927A2 (en) 2006-09-28 2009-06-24 Illumina, Inc. Compositions and methods for nucleotide sequencing
WO2008069973A2 (en) 2006-12-01 2008-06-12 The Trustees Of Columbia University In The City Of New York Four-color dna sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
EP2725107B1 (en) 2007-10-19 2018-08-29 The Trustees of Columbia University in the City of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified ddNTPs and nucleic acid comprising inosine with reversible terminators
WO2009051807A1 (en) 2007-10-19 2009-04-23 The Trustees Of Columbia University In The City Of New York Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis
JP4621926B2 (en) * 2008-07-24 2011-02-02 国立大学法人九州大学 Enzyme substrate-modified nucleoside triphosphate, nucleic acid probe, multilabeled nucleic acid probe, method for producing multilabeled nucleic acid probe, and method for detecting target nucleic acid
JP5146785B2 (en) * 2008-07-24 2013-02-20 国立大学法人九州大学 Enzyme substrate modified nucleoside triphosphate derivatives
US10174368B2 (en) 2009-09-10 2019-01-08 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
US10072287B2 (en) 2009-09-10 2018-09-11 Centrillion Technology Holdings Corporation Methods of targeted sequencing
EP2494073B1 (en) 2009-10-26 2017-11-29 AGCT GmbH Nucleotide conjugates and methods of uses thereof
PL2496720T3 (en) 2009-11-06 2021-01-11 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
JP5704481B2 (en) * 2010-01-22 2015-04-22 国立大学法人九州大学 Nucleic acid detection kit
US9646134B2 (en) 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
CA2797645C (en) 2010-05-25 2020-09-22 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
ES2687761T3 (en) 2011-01-31 2018-10-29 F. Hoffmann-La Roche Ag Methods of identification of multiple epitopes in cells
US20120252682A1 (en) 2011-04-01 2012-10-04 Maples Corporate Services Limited Methods and systems for sequencing nucleic acids
US9994894B2 (en) 2011-04-27 2018-06-12 Agct Gmbh Method and components for detecting nucleic acid chains
WO2012150035A1 (en) 2011-05-04 2012-11-08 Genovoxx Gmbh Nucleoside-triphosphate conjugate and methods for the use thereof
EP2776962A4 (en) 2011-11-07 2015-12-02 Ingenuity Systems Inc Methods and systems for identification of causal genomic variants
CN105264088B (en) 2012-08-08 2018-12-28 豪夫迈·罗氏有限公司 Improve the dynamic range of multiple epitopes in identification of cell
CN105121661B (en) 2013-02-01 2018-06-08 加利福尼亚大学董事会 The method of phase is determined for genome assembling and haplotype
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
WO2014144883A1 (en) 2013-03-15 2014-09-18 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
BR112015022448B1 (en) 2013-03-15 2020-12-08 Illumina Cambridge Limited modified nucleotide or nucleoside molecule, methods for preparing the growth of polynucleotide complementary to single-stranded target polynucleotide in sequencing reaction and to determine the sequence of single-stranded target polynucleotide and kit
EP3415626B1 (en) 2013-03-15 2020-01-22 Lineage Biosciences, Inc. Methods and compositions for tagging and analyzing samples
CN103484106B (en) * 2013-09-05 2015-08-19 上海交通大学 Four look fluorescent mark Reversible terminal and the purposes in DNA sequencing thereof
CN105829589B (en) 2013-11-07 2021-02-02 小利兰·斯坦福大学理事会 Cell-free nucleic acids for analysis of human microbiome and components thereof
EP3080605B1 (en) 2013-12-11 2019-02-20 The Regents of the University of California Method for labeling dna fragments to reconstruct physical linkage and phase
CA2956925C (en) 2014-08-01 2024-02-13 Dovetail Genomics, Llc Tagging nucleic acids for sequence assembly
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
JP6777966B2 (en) 2015-02-17 2020-10-28 ダブテイル ゲノミクス エルエルシー Nucleic acid sequence assembly
GB2554572B (en) 2015-03-26 2021-06-23 Dovetail Genomics Llc Physical linkage preservation in DNA storage
KR20180096586A (en) 2015-10-19 2018-08-29 더브테일 제노믹스 엘엘씨 Methods for Genome Assembly, Haplotype Paging and Target Independent Nucleic Acid Detection
EP3420108A4 (en) 2016-02-23 2019-11-06 Dovetail Genomics LLC Generation of phased read-sets for genome assembly and haplotype phasing
CN109477101B (en) 2016-05-13 2022-11-18 多弗泰尔基因组学有限责任公司 Recovery of long range linkage information from stored samples
AU2018256358A1 (en) 2017-04-18 2019-11-07 Dovetail Genomics, Llc Nucleic acid characteristics as guides for sequence assembly
WO2018237209A1 (en) 2017-06-21 2018-12-27 Bluedot Llc Systems and methods for identification of nucleic acids in a sample
WO2019060716A1 (en) 2017-09-25 2019-03-28 Freenome Holdings, Inc. Methods and systems for sample extraction
US20200370096A1 (en) 2018-01-31 2020-11-26 Dovetail Genomics, Llc Sample prep for dna linkage recovery
US11166996B2 (en) 2018-12-12 2021-11-09 Flagship Pioneering Innovations V, Inc. Anellovirus compositions and methods of use

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000050642A1 (en) * 1999-02-23 2000-08-31 Caliper Technologies Corp. Sequencing by incorporation
WO2000070073A1 (en) * 1999-05-19 2000-11-23 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
WO2001025247A1 (en) * 1999-10-05 2001-04-12 Quiatech Ab Compounds for protecting hydroxyls and methods for their use

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9208733D0 (en) * 1992-04-22 1992-06-10 Medical Res Council Dna sequencing method
US5986076A (en) * 1994-05-11 1999-11-16 Trustees Of Boston University Photocleavable agents and conjugates for the detection and isolation of biomolecules
WO1998033939A1 (en) * 1997-01-31 1998-08-06 Hitachi, Ltd. Method for determining nucleic acid base sequence and apparatus therefor
AU3199699A (en) * 1998-03-23 1999-10-18 Invitrogen Corporation Modified nucleotides and methods useful for nucleic acid sequencing
DE19844931C1 (en) * 1998-09-30 2000-06-15 Stefan Seeger Procedures for DNA or RNA sequencing
AU3174600A (en) * 1999-03-10 2000-09-28 Asm Scientific, Inc. A method for direct nucleic acid sequencing
GB0013276D0 (en) * 2000-06-01 2000-07-26 Amersham Pharm Biotech Uk Ltd Nucleotide analogues

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000050642A1 (en) * 1999-02-23 2000-08-31 Caliper Technologies Corp. Sequencing by incorporation
WO2000070073A1 (en) * 1999-05-19 2000-11-23 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
WO2001025247A1 (en) * 1999-10-05 2001-04-12 Quiatech Ab Compounds for protecting hydroxyls and methods for their use

Also Published As

Publication number Publication date
WO2002088382A2 (en) 2002-11-07
AU2002304705A1 (en) 2002-11-11
EP1381698A2 (en) 2004-01-21
DE10120797A1 (en) 2002-11-21
WO2002088382A3 (en) 2003-08-28
JP2004529650A (en) 2004-09-30

Similar Documents

Publication Publication Date Title
DE10120797B4 (en) Method for analyzing nucleic acid chains
DE10239504A1 (en) Parallel sequencing of nucleic acid fragments, useful e.g. for detecting mutations, comprises sequential single-base extension of immobilized fragment-primer complex
DE10120798B4 (en) Method for determining gene expression
DE112007002932B4 (en) Four-color DNA sequencing by synthesis using cleavable, reversible, fluorescent nucleotide terminators
DE69837913T2 (en) PROCESS FOR THE MAKING OF NUCLEIC ACID
DE69928683T2 (en) PROCESS FOR THE AMPLIFICATION AND SEQUENCING OF NUCLEIC ACIDS
DE69433487T2 (en) METHODS AND COMPOSITIONS FOR EFFICIENT NUCLEIC ACID SEQUENCING
DE69927343T2 (en) METHOD AND MEANS FOR ANALYZING THE NUCLEOTIDE SEQUENCE OF NUCLEIC ACIDS
DE10246005A1 (en) Automated nucleic acid sequencer, useful e.g. for analyzing gene expression, based on parallel incorporation of fluorescently labeled terminating nucleotides
DE69916877T2 (en) LIGATION-ASSISTED ASSEMBLY AND DETECTION OF POLYNUCLEOTIDES ON A SOLID CARRIER
DE60208278T2 (en) System and method for testing nucleic acid molecules
DE60125243T2 (en) POLYNUCLEOTIDE SEQUENCE ASSAY
DE69720763T2 (en) SETS OF, WITH FLUORESCENT ENERGY TRANSFER CONNECTIONS, MARKED PRIMERS AND THEIR USE IN MULTI-COMPONENT ANALYSIS
DE69636895T2 (en) The use of the 3 'essential processing efficiency of DNA polymerase
EP1204765B1 (en) Method for relative quantization of methylation of cytosin-type bases in dna samples
DE69924140T2 (en) DETERMINATION OF THE LENGTH OF REPETITIVE NUCLEIC ACID SEQUENCES BY A DISCONTINUOUS PRIMER EXTENSION
DE102004025744A1 (en) Surface of a solid support, useful for multiple parallel analysis of nucleic acids by optical methods, having low non-specific binding of labeled components
DE10149786B4 (en) Surface for studies of populations of single molecules
DE10214395A1 (en) Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide
DE102004025745A1 (en) Surface of solid phase, useful for parallel, optical analysis of many nucleic acids, has reduced non-specific binding of labeled components
DE102004025694A1 (en) Optical fluorescent ultra-high parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex
DE102004025695A1 (en) Optical fluorescent parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex
EP2074133A2 (en) Components and method for enzymatic synthesis of nucleic acids
DE102004025696A1 (en) Ultra-high parallel analysis process to analyse nucleic acid chains in which a sample solid is bound and substrate material
DE102004025746A1 (en) Parallel sequencing of nucleic acids by optical methods, by cyclic primer-matrix extension, using a solid phase with reduced non-specific binding of labeled components

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R071 Expiry of right