WO2002088381A2 - Method for determining gene expression - Google Patents

Method for determining gene expression Download PDF

Info

Publication number
WO2002088381A2
WO2002088381A2 PCT/EP2002/004657 EP0204657W WO02088381A2 WO 2002088381 A2 WO2002088381 A2 WO 2002088381A2 EP 0204657 W EP0204657 W EP 0204657W WO 02088381 A2 WO02088381 A2 WO 02088381A2
Authority
WO
WIPO (PCT)
Prior art keywords
nts
polymerase
gene products
reaction
primer
Prior art date
Application number
PCT/EP2002/004657
Other languages
German (de)
French (fr)
Other versions
WO2002088381A3 (en
Inventor
Dmitri Tcherkassov
Original Assignee
Genovoxx Gmbh
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genovoxx Gmbh filed Critical Genovoxx Gmbh
Priority to AU2002312859A priority Critical patent/AU2002312859A1/en
Publication of WO2002088381A2 publication Critical patent/WO2002088381A2/en
Publication of WO2002088381A3 publication Critical patent/WO2002088381A3/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/02Identifying library members by their fixed physical location on a support or substrate
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/10Methods of screening libraries by measuring physical properties, e.g. mass
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/06Libraries containing nucleotides or polynucleotides, or derivatives thereof
    • C40B40/08Libraries containing RNA or DNA which encodes proteins, e.g. gene libraries

Definitions

  • the invention describes a method for parallel analysis of the expression of a large number of genes. This method is based on the analysis of sequences on many bound nucleic acid chains. To do this, short sequence sections are determined from each of these chains. The subsequent evaluation and comparison with gene sequences in databases allows statements about the expressed genes and the strength of their expression.
  • DNA - deoxyribonucleic acid of different origins and different lengths (genomic DNA, cDNA, ssDNA, dsDNA) RA - ribonucleic acid (mostly RNA)
  • Gene products - mRNA transcripts or nucleic acid chains derived from the mRNA e.g. single-stranded cDNAs, double-stranded cDNAs, RNA derived from cDNA or DNA amplified from cDNA).
  • cDNA - complementary DNA e.g. single-stranded cDNAs, double-stranded cDNAs, RNA derived from cDNA or DNA amplified from cDNA.
  • Polymerases - enzymes that can incorporate complementary nucleotides into a growing DNA or RNA strand e.g. DNA polymerases, reverse transcriptases, RNA polymerases
  • dNTP - 2 deoxy nucleoside triphosphates, substrates for DNA polymerases and reverse transcriptases
  • NTP - nucleoside triphosphates substrates for RNA polymerases NT - natural nucleotide, usually dNTP, unless expressly stated otherwise.
  • NT is also used when specifying the length of a nucleic acid sequence, e.g. NT 1,000.
  • NT stands for nucleoside monophosphates.
  • NT stands for “nucleotide”
  • NTs stands for several nucleotides.
  • NT * - modified nucleotide, usually dNTP, if not explicitly marked otherwise.
  • NTs * means: modified nucleotides
  • Flat surface surface which preferably has the following features: 1) It allows several individual molecules, preferably more than 100, more preferably more than 1000, to be detected simultaneously with the given objective-surface distance at one objective position. 2) The immobilized or bound individual molecules are in the same focal plane, which can be set reproducibly.
  • Steric obstacle Sterically demanding group, whose chemical structure changes the properties of the NTs * coupled with this group in such a way that they cannot be successively incorporated into one extension reaction by a polymerase.
  • termination is the reversible stop in the installation of the modified, uncleaved NTs * . This term is to be separated from the usual use of the word "termination" by dideoxy-NTP in conventional sequencing.
  • the termination comes after the installation of a modified NT * .
  • the modified built-in NT * carries a steric group which is reversibly coupled to the base and which prevents the incorporation of a next complementary NT * into the growing strand by a polymerase.
  • Wide-field optical detection system - detection system which can simultaneously detect fluorescence signals from individual molecules distributed over an area, the area being approximately 100 ⁇ m 2 and larger.
  • An example of wide-field detection optics is the Axiovert 200 or Axioplan 2e (Zeiss) fluorescence microscope with a Planeofluar objective 10Ox NA 1.4 oil immersion (Zeiss), or a planapochromatic objective lOOx NA 1.4 oil immersion (Zeiss);
  • the fluorescence can be excited using a lamp, for example a mercury vapor lamp, or a laser or diode. Both epifluorescence mode and total reflection Fluorescence microscopy mode (total internal reflection fluorescence microscopy, TIRF microscopy) or laser scanning microscopy mode can be used. This wide field detection optics is used in this application.
  • the analysis of gene expression is a complex task: the number of genes active in a cell type can be several thousand. However, the analysis should consider all genes contained in the genome of the species in question (approximately 32,000 in humans). In addition, the genes active in the respective cell type are first of all mostly not yet completely known and secondly they are expressed to different extents.
  • the major disadvantages of the hybridization method include: The production of the oligonucleotides bound to the surface is expensive. The analysis is limited to genes whose sequences are already known. Multiple mismatch controls increase the number of oligonucleotides that need to be immobilized.
  • the present invention describes a method for the parallel analysis of a large number of nucleic acid chain molecules. It is based on the detection of fluorescence signals from individual molecules. By simultaneous sequencing of individual gene product molecules, the method has several advantages over the prior art:
  • the gene products can bind to the surface in any arrangement. A previous complex synthesis of different oligonucleotides at certain positions (such as in the hybridization method) is therefore not necessary.
  • the material can be analyzed on a standardized surface.
  • mRNA from a single cell can be sufficient for the analysis.
  • the invention describes a method for parallel analysis of gene expression, in which
  • the gene products are bound to a reaction surface in a random arrangement using one or more different primers in the form of gene product-primer complexes;
  • a solution is added to the gene product-primer complexes bound on the surface which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * fluorescent dyes on the NTs * are selected so that the NTs * used differ from one another by measuring different fluorescence signals.
  • the NTs * are structurally modified on the base so that the polymerase after installing such an NT * in a growing complementary strand is unable to incorporate another NT * in the same strand, whereby the fluorescent dye is cleavable and the structural modification is a cleavable, sterically demanding ligand, one
  • stage b) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
  • stage b) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
  • the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
  • step f) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
  • stages a) to f) are repeated several times, if necessary,
  • the gene products are the primary gene products of the genes whose expression is to be analyzed. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to mRNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
  • the gene products or target sequences can either be isolated as mRNAs directly from a biological sample (e.g. cell extract, tissue extract or extract from whole organisms) or obtained as cDNAs by reverse transcription of the mRNAs.
  • a highly parallel analysis is understood to mean the simultaneous sequence analysis of many gene product molecules (for example at least approximately 100,000, preferably at least approximately 500,000, but in particular at least approximately 1,000,000 to approximately 10,000,000), these gene product molecules being a complex heterogeneous Represent population, for example corresponds to a complete expression profile or an expression spectrum of a tissue.
  • the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
  • the method can also be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, alternately using two differently labeled NTs * and two unlabeled NTs in the cycles and comparing the identity of the gene products with the reference sequences determined.
  • the present invention furthermore relates to the nucleotides shown in FIGS. 6e, 6f and 6g and the corresponding labeled nucleotides, which have, for example, fluorescent dyes attached to the terminal amino function, or the labeled nucleotides shown in FIGS. 6h, 6i or 6j.
  • the present invention furthermore relates to the use of the nucleotides shown in FIGS. 6e, 6f and 6g and the corresponding nucleotides marked with a fluorescent dye for the method according to the invention.
  • the present invention furthermore relates to the use of the NT * s modified on the base (for examples see FIGS. 6k, 6L and 6m) and the corresponding nucleotides marked with a fluorescent dye for the process according to the invention.
  • the method is based on several principles:
  • Short nucleotide sequences (10-50 NTs) contain enough information to identify the corresponding gene if the gene sequence itself is already contained in a database.
  • a sequence of, for example, 10 NTs can form more than 10 6 different combinations. This is, for example, for most genes in the human genome, which is currently estimated at 32,000 Contains genes, sufficient. The sequence can be even shorter for organisms with fewer genes.
  • the method is based on a new method for sequencing individual nucleic acid chain molecules.
  • Nucleic acid chain is analyzed.
  • mRNAs or nucleic acid chains derived from the mRNA can be used to investigate gene expression. Regardless of the exact composition, they are referred to below as gene products. Partial sequences of these gene products are also referred to below as gene products.
  • the synthesis is based on the synthesis of a strand that is complementary to the gene product.
  • the aim of the preparation is to provide gene product-primer complexes which are bound in a random manner on a flat surface and on which the incorporation of NT * s by the polymerase can take place (gene product-primer complexes which can be extended).
  • the sequencing reaction is carried out with these bound gene product-primer complexes.
  • a cycle comprises the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to bound gene product-primer complexes, b) incubation of the bound gene product-primer complexes with this solution under conditions which are suitable for extending the complementary strands by one NT, c) washing, d) detection of the signals from individually modified NTs incorporated into the newly synthesized strands * - Molecules, e) removal of the label from the built-in nucleotides, f) washing.
  • This cycle can be repeated several times, so that preferably 10 to 50 NTs are determined for each gene product-primer complex participating in the sequencing reaction.
  • the nucleic acid sequences are then reconstructed from the detected signals.
  • the determined sequences of the bound gene products are compared with one another to determine the abundances and are assigned to specific genes by comparison with gene sequences in databases.
  • a mixture of mRNA molecules serves as the starting material.
  • the material to be analyzed (1) is bound (2) on a suitable flat surface.
  • the oligo-dT primers previously bound to the surface mediate the binding of gene products to the surface.
  • the gene products are bound to the primers by hybridization (annealing).
  • the unbound mRNA molecules are removed by a washing step.
  • the sequencing reaction is then carried out on the entire reaction surface, with labeled NT * s being incorporated into the gene product-primer complexes which can be extended. This reaction is cyclical. In the 1st step of the cycle, a labeled NT * is built into the growing strand: The reaction is controlled so that only one labeled NT * from a polymerase in each cycle
  • Reverse transcriptase can be built into the growing strand. This is achieved by using NTs * which carry a reversibly coupled group leading to termination. This prevents the installation of another marked NT * .
  • the polymerase and the labeled NTs * are used simultaneously in the reaction (3).
  • the reaction mixture is then removed and the surface is washed in a suitable manner (4).
  • a detection step (5) now follows. The surface is scanned with a device suitable for single-molecule detection (consisting, for example, of a light source, microscope, camera, scanning table, computer with control and image recognition or image processing software) and the signals of the individual, built-in marked NTs * are identified. After the detection step, the marker and the group leading to the termination are removed from all installed NTs * (6). The removal can take place chemically, physically or enzymatically. After a subsequent washing step, a new cycle can begin.
  • Gene products can come from various biological objects, e.g. of individual cells, cell populations, a tissue or of entire organisms.
  • Biological fluids such as blood, sputum or cerebrospinal fluid can also serve as a source of the gene products.
  • the methods for obtaining the gene products from the various biological objects can be found, for example, in the following literature sources: "Molecular cloning” 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, “Method in Enzymology” 1999, v303, "cDNA library protocols” 1997, Ed. I. G. Cowell, Humana Press Inc.
  • Sequencing reaction can be used.
  • the amount of gene products to be analyzed can be determined by preselection to reduce.
  • the preselection can be carried out, for example, by molecular biological methods such as, for example, PCR amplification, gel separation or hybridization with other nucleic acid chains ("Molecular cloning” 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, “Method in Enzymology” 1999, v303, “cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.)
  • the entirety of the gene products is preferably chosen as the starting material.
  • the aim of the preparation of the material is to form extensible gene product-primer complexes bound to the surface from the starting material. These then preferably have the structure shown in FIG. 2. Whereby only a maximum of one primer should bind per gene product.
  • Each gene product preferably has only one primer binding site.
  • a primer binding site is a sequence section which is intended to enable selective binding of the primer to the gene product.
  • Sections in the nucleic acid sequence that naturally occur in the sequences to be analyzed can serve as primer binding sites (e.g. polyA stretches in mRNA).
  • a primer binding site can also be introduced into the gene product (Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory,” Method in Enzymology “1999, v303,” cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc. ).
  • primer binding site that is as uniform as possible in all gene products. Then primers with a uniform structure can be used in the reaction.
  • the composition of the primer binding site is not limits. Their length is preferably between 10 and 100 NTs.
  • the primer binding site can carry a functional group, for example to bind the gene product to the surface. This functional group can be, for example, a biotin or digoxigenin group.
  • nucleotide tailing of antisense cDNA fragments is described as an example of the introduction of a primer binding site into the gene products.
  • cDNAs are synthesized from mRNAs.
  • the result is a population of cDNA molecules that represent a copy of the mRNA population, so-called antisense cDNA.
  • antisense cDNA Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory,” Method in Enzymology “1999, v303,” cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.).
  • a terminal deoxynucleotide transferase one can do several ( for example between 10 and 20) attach nucleoside monophosphates to the 3 'end of this antisense cDNA, for example several adenosine monophosphates (called ((dA) n-tail).
  • the resulting fragment is used to bind the primer, in this example one (dT ) n-primers used ("Molecular cloning” 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology” 1999 v.303, pp. 37-38) (Fig. 3).
  • the composition and the length of the primer are not restricted. In addition to the start function, the primer can also perform other functions, such as creating a connection between the gene product-primer complexes and the reaction surface. Primers should be adapted to the length and composition of the primer binding site so that the primer enables the sequencing reaction to be started with the respective polymerase.
  • the length of the primer is preferably between 6 and 100 NTs, optimally between 15 and 30 NTs.
  • the primer can carry a functional group which is used, for example, to bind the primer to the surface, for example such a functional group is a biotin group (see section Immobilization).
  • synthesis of such a primer can be carried out, for example, using the 380 A Applied Biosystems DNA synthesizer, or else as a custom synthesis from a commercial supplier, 10 for example MWG-Biotech GmbH, Germany.
  • primers can also be used, a defined primer set, or a primer mixture.
  • the primer Before priming, the primer can be fixed to the fragments to be analyzed on the surface using various techniques or synthesized directly on the surface, for example according to (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734,
  • the primers are bound on the surface in a density between 10 to 100 per 100 ⁇ m 2 , 100 to 10,000 per 100 ⁇ m, 10,000 to 1,000,000 per 100 ⁇ m 2 or greater than 1,000,000 per 100 ⁇ m 2 30.
  • the primer or mixture of primers is incubated with gene products under hybridization conditions that selectively bind it to the primer binding site of each gene product.
  • This primer hybridization (annealing) can take place before (1), during (2) or after (3) the binding of the gene products to the surface. If gene products as double-stranded nucleic acids are present, they are denatured by heat before hybridization ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).
  • the optimization of the hybridization conditions depends on the exact structure of the primer binding site and the primer and can be done according to Rychlik et al. (NAR 1990 v.18 p.6409). In the following, these hybridization conditions are referred to as standardized hybridization conditions.
  • an oligo-dT primer can be used.
  • a primer mixture consisting of 12 different primers with the following general structure 5 '(K) n MN3' can also be used. Where (n) is between 10 and 50, preferably between 20 and 30. "K” stands for dT or you, "M” and “N” each stand for dA, dT or du, dC, dG
  • Such a primer mixture enables an exact start of the sequencing reaction at the end of the polyA segment or the poly-dA segment (anchored primer).
  • the aim of the fixation is to fix gene product-primer complexes on a suitable flat surface in such a way that a cyclic enzymatic sequencing reaction can take place. This can be done, for example, by binding the primer (see above) or the gene product to the surface.
  • the order of the steps in the binding of gene product-primer complexes can be variable: 1) The gene product-primer complexes can first be formed in a solution by hybridization (annealing) and then bound to the surface. 2) Primers can first be bound to a surface and gene products can then be hybridized to the bound primers, producing gene product-primer complexes (gene products indirectly bound to the surface) 3) The gene products can first be bound to the surface (gene products directly the surface bound) and in the subsequent step the primers are hybridized to the bound gene products, producing gene product-primer complexes. The gene products can therefore be immobilized on the surface by direct or indirect binding.
  • the surface and the reaction surface are to be understood as equivalent terms, unless explicitly referred to another meaning.
  • the surface of a solid phase of any material serves as the reaction surface. This material is preferably inert towards enzymatic reactions and does not cause any interference with the detection. Silicon, glass, ceramics, plastics (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material that meets these functional requirements can be used.
  • the surface is preferably not deformable, since otherwise the signals are likely to be distorted upon repeated detection.
  • this gel can e.g. be an agarose or polyacrylamide gel.
  • the gel is preferably freely passable for molecules with a molecular mass below 5000 Da
  • Polyacrylamide gel can be used). Such a gel surface has the advantage over other solid surfaces that there is a significantly lower non-specific binding of NT * s to the surface. By binding the gene product-primer complexes on the surface, the detection of the fluorescence signals from built-in NTs * is possible. The signals from Free NTs * are not detected because they do not bind to the material of the gel and are therefore not immobilized.
  • the gel is preferably attached to a solid surface (Fig. 4).
  • This solid base can be silicone, glass, ceramic, plastic (for example polycarbonate or polystyrene), metal (gold, silver or aluminum) or any other material.
  • the thickness of the gel is preferably not more than 0.1 mm. However, the gel thickness is preferably greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not reach the focal plane and are therefore detected. If the depth of focus is 0.3 ⁇ m, for example, the gel thickness is preferably between 1 ⁇ m and 100 ⁇ m.
  • the surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (for example agarose balls) (FIG. 4 a, b). The reaction surface must be large enough to be able to bind the necessary number of gene products with the appropriate density. The reaction surface should preferably not be larger than 20 cm 2 .
  • the different cycle steps require an exchange of the different reaction solutions above the surface.
  • the reaction surface is preferably part of a reaction vessel.
  • the reaction vessel is in turn preferably part of a reaction apparatus with a flow device.
  • the flow device enables the solutions in the reaction vessel to be exchanged.
  • the exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out.
  • the volume of the reaction vessel is preferably less than 50 ⁇ l. Ideally, its volume is less than 1 ⁇ l. An example of such a flow system is given in FIG. 5.
  • Fixation can also be achieved by non-specific binding, for example by drying out the sample containing gene products on the flat surface.
  • the gene products are on the surface in a density between 10 and 100 per 100 ⁇ m 2 , 100 to 10,000 per 100 ⁇ m 2 , 10,000 to 1000,000 per 100 ⁇ m 2
  • the density of extensible gene product-primer complexes required for the detection is approx. 10 to 100 per 100 ⁇ m 2 . It can be achieved before, during or after the hybridization of primer 5 to the gene products.
  • the binding of the gene product 0 primer complexes takes place via biotin-avidin or biotin-streptavidin binding.
  • Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer is modified with biotin.
  • the modified primers After the modified primers have hybridized with the gene products (in solution), they are fixed on the surface coated with avidin / streptavidin.
  • the concentration of the gene product-primer complexes labeled with biotin and the time of incubation of this solution with the surface is chosen so that a density suitable for sequencing is achieved.
  • the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above).
  • the single-stranded gene products, each with one primer binding site per gene product molecule, are thus incubated under hybridization conditions (annealing). They bind to the fixed primers and are thus bound to the surface (indirect binding).
  • the concentration of the single-stranded gene products and the hybridization parameters eg temperature, time, buffer
  • the concentration of the single-stranded gene products and the hybridization parameters are chosen so that a density of approximately 10 to 100 gene product-primer complexes capable of extension per 100 ⁇ m 2 is achieved, which is suitable for sequencing.
  • unbound gene products are removed by a washing step.
  • a surface with a high primer density is preferred, for example approximately 1,000,000 primers per 100 ⁇ m 2 or even higher, since the desired density of gene product-primer complexes is reached more quickly, the gene products binding only to a part of the primers ,
  • the gene products are bound directly to the surface (see above) and then incubated with primers under hybridization conditions.
  • primers At a density of approx. 10 to 100 gene products per 100 ⁇ m 2 , attempts will be made to provide all available gene products with a primer and to make them available for the sequencing reaction. This can be achieved by high primer concentration, for example 1 to 100 mmol / 1. At a higher density the fixed
  • the density of the gene product-primer complexes required for optical detection can be achieved during the primer hybridization.
  • Hybridization conditions e.g. temperature, time, buffer,
  • Primer concentrate so that the primers are only Bind part of the immobilized gene products, see Example 5.
  • a blocking solution is preferably applied to the surface before step (a) in each cycle, in order to avoid non-specific adsorption of NTs * on the surface serves.
  • RNA or DNA The type of immobilized nucleic acid (RNA or DNA) used plays a decisive role in the choice of polymerase:
  • RNA-dependent DNA polymerases can be used, e.g. AMV reverse transcriptase (Sig a), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNAse activity. All reverse transcriptases must be largely free of RNAse activity ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory).
  • DNA is used as a gene product (eg cDNA), in principle all DNA-dependent DNA polymerases without 3 '-5' exonuclease activity (DNA replication "1992 Ed. A. Kornberg, Freeman and Company NY) are suitable as polymerases, eg modified T7 polymerase of the type "Sequenase Version 2" (Amersham Pharmacia Biotech), Klenow fragment of DNA polymerase I without 3 '-5' exonuclease activity (Amersham Pharmacia Biotech), polymerase beta of various origins (Animal Cell DNA Polymerases "1983, Fry M., CRC Press Inc., commercially available from Chimerx) thermostable polymerases such as Taq polymerase (GibcoBRL), proHA DNA polymerase (Eurogentec). 4.4 Nucleotide structure
  • reversible 3'-OH modified NTs have been described in the BASS method (Dower US Patent 5,547,839, Canard et al. US Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v.18 p.1021, Metzker et al. NAR 1994, v.22, p.4259, Welch et al. Nucleosides & Nucleotides 1999, v.18, p.197).
  • the cleavage is said to be photochemical under mild conditions (Dower US Patent 5,547,839, Welch et al.
  • nucleotides 1999, v.18 p.1021 With this method, a large number of identical single-stranded DNA pieces are fixed at a defined location on a surface and the signal from all of these many identical DNA pieces is analyzed. A solution with polymerase and nucleotides is added to this fixed DNA so that a complementary strand can be synthesized. The polymerase should work step by step: only one nucleotide is incorporated in each step. This is detected, whereupon the polymerase incorporates the next nucleotide in a next cycle. In this method, modified nukeotides were used on the 3 ⁇ -OH group of the deoxyribose.
  • NTs * with a sterically demanding group on the base are used for sequencing.
  • Biotin, digoxigenin and fluorescent dyes such as fluorescein, tetramethylrhodamine and Cy3 dye
  • labeled NTs * are incubated with a polymerase and nucleic acid chains.
  • the NTs * carry a sterically demanding group that is reversibly coupled to the base. If a reaction mixture containing only modified NTs * is used in the reaction, the polymerase can only incorporate a single NT * .
  • the installation of a next NT * is sterically inhibited. These NTs * thus act as terminators of the synthesis. After removing the sterically demanding group, the next complementary NT * can be installed. Because these NTs * do not represent an absolute obstacle to further synthesis, but only for the installation of another marked NT * , they are called semiterminators.
  • Fig. 6a, b, d This structure is characterized in that a steric group (D) and the fluorescent marker (F) are bound to the base via a cleavable linker (A-E).
  • D steric group
  • F fluorescent marker
  • Deoxynucleoside triphosphates with adenosine (A), guanosine (G), cytidine (C) and uridine (U) serve as the basis for the NTs * .
  • Inosine can be used instead of guanosine.
  • Each base is marked with a marker (F) which is characteristic of it (FIG. 6).
  • the marker is a fluorescent dye. Several factors influence the choice of the fluorescent dye. The choice is not restricted if the dye meets the following requirements:
  • the detection apparatus used must be able to identify this marker as the only molecule bound to DNA under mild conditions (preferably reaction conditions).
  • the dyes preferably have great photostability. Their fluorescence is preferably not quenched by the DNA or only to a minor extent.
  • Fluorescent dyes which can be used in the context of the present invention are compiled with structural formulas in "Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes.
  • the following dye classes are preferably used as markers: cyanine dyes and their derivatives (for example Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US Pat. No. 5,268,486), rhodamines and their derivatives (for example TAMRA, TRITC, RG6, R110 , ROX, Molecular Probes), xanthene derivatives (e.g. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US Pat.
  • cyanine dyes and their derivatives for example Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US Pat. No. 5,268,486)
  • rhodamines and their derivatives for example TAMRA, TRITC
  • dyes are commercially available. Depending on the spectral properties and the equipment available, appropriate dyes can be selected.
  • the dyes are coupled to the linker, for example via a thiocyanate or ester bond ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v.278 P.363, Waggoner Methods in Enzymology 1995 v.246 p.362), p. Examples 1 and 2.
  • Biotin, digoxigenin and fluorescent dyes such as fluorescein, tetramethylrhodamine and Cy3 dye are examples of such a sterically demanding group (Zhu et al. Cytometry 1997, v.28, p.206, Zhu et al. NAR 1994, v.22, P.3418, Gebeyehu et al., NAR 1987, v.15, p.4513, Wiemann et al. Analytical Biochemistry 1996, v.234, p.166, Heer et al. BioTechniques 1994 v.16 p.54).
  • the chemical structure of this group is not restricted provided that it does not significantly interfere with the incorporation of the labeled NT * to which it is attached and does not cause an irreversible disturbance in the enzymatic reaction.
  • This . Group can appear as an independent part in the linker (6a) or can be identical to the dye (6b) or the cleavable group (6d).
  • this sterically demanding group (D) is removed after detection of the signal, so that the polymerase can incorporate another labeled NT * .
  • the steric group is removed by the cleavage.
  • the fluorescent dye takes over the function of such a sterically demanding group, so that a labeled nucleotide is one in FIG. 6b, k, l structure shown.
  • the photolabile cleavable group takes over the function of such a sterically demanding group (FIG. 6d).
  • the marker (fluorescent dye) is preferably attached to the base via a spacer of different lengths, a so-called linker.
  • linkers are given in Fig. 6e, f, g, h, i, j, k, l, m.
  • Examples of coupling a linker to the base can be found in the following sources (Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356, Klevan et al. US Patent 4,828,979, Hanna M. Method in Enzymology 1996 v.274, p.403, Zhu et al. NAR 1994 v.22 p.3418, Herman et al.
  • the total length of the linker can vary. It corresponds to the number of carbon atoms in sections A, C, E (FIGS. 6a, b, d) and is preferably between 3 and 20. Optimally, it is between 4 and 10 atoms.
  • the chemical composition of the linker (sections A, C, E in FIGS. 6a, b, d) is not restricted, provided that it remains stable under reaction conditions and does not cause any disturbance in the enzymatic reaction.
  • the linker carries a fissile connection or fissile Group (section (B) in Fig. 6a, b, d and section (C) in Fig. 6k, 1).
  • This fissile connection enables the marker and steric obstacle to be removed at the end of each cycle.
  • Your choice is not restricted as long as it remains stable under the conditions of the enzymatic sequencing reaction, does not cause an irreversible disturbance of the polymerase and can be split off under mild conditions.
  • “Mild conditions” are understood to mean those conditions which do not destroy the gene product-primer complex, the pH value, for example, preferably being between 3 and 11 and the temperature between 0 ° C. and a temperature value (x).
  • This temperature value (x) depends on the Tm of the gene product-primer complex (Tm is "melting point”) and is calculated, for example, as Tm (gene product-primer complex) minus 5 ° C (eg Tm is 47 ° C, then lies the maximum temperature at 42 ° C; under these conditions, ester, thioester, disulfide compounds and photolabile compounds are particularly suitable as cleavable compounds).
  • the compound mentioned preferably belongs to chemically or enzymatically cleavable or photolabile compounds.
  • chemically cleavable groups ester, thioester and disulfide compounds are preferred (Fig. 6k, 1) ("Chemistry of protein conjugation and crosslinking" Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v.184 p.584, Lomant et al. J. Mol.Biol. 1976 v.104 243, "Chemistry of carboxylic acid and esters" S.Patai 1969 Interscience Publ.).
  • photolabile compounds Fig.
  • the position of the fissile link / group in the linker is preferably no more than 10 atoms from the base, more preferably no more than 3 atoms.
  • the cleavable compound or group is particularly preferably located directly on the base.
  • the cleavage and removal step is present in every cycle and must be carried out under mild conditions (see above) so that the nucleic acids are not damaged or modified.
  • the cleavage preferably takes place chemically (for example in a mild acidic or basic environment for an ester compound or by adding a reducing agent, for example dithiothreitol or mercaptoethanol (Sigma) when cleaving a disulfide compound), see Example 1, or physically (for example by lighting the surface with light of a certain wavelength for the cleavage of a photolabile group, thesis "New photolabile protective groups for light-controlled oligonucleotide synthesis" H. Giegrich, 1996, Constance).
  • a reducing agent for example dithiothreitol or mercaptoethanol (Sigma)
  • the size, the charge and the chemical structure of the marker, the length of the cleavable linker and the linker residue and also the choice of polymerase play an important role. Together they determine whether the labeled NT * is incorporated into the growing nucleic acid chain by the polymerase and whether this prevents the incorporation of the next labeled NT * becomes. Two conditions are particularly important:
  • the polymerase can further extend the nucleic acid chain with the built-in modified NT * after the linker has been cleaved. It is therefore important that the linker residue "A" (FIG. 6c) after cleavage does not represent a significant disturbance for the further synthesis.
  • built-in, non-split NTs * must be an obstacle. Many NTs * suitable for the reaction can be synthesized. In particular, a preliminary test series must be carried out for each combination of polymerase and NTs * , in which the suitability of a particular NT * type for sequencing is tested.
  • the buffer conditions are chosen according to the polymerase manufacturer.
  • the reaction temperature is selected for non-thermostable polymerases according to the manufacturer (e.g. 37 ° C for Sequenase version 2), for thermostable polymerases (e.g. Taq polymerase) the reaction temperature is at most the temperature value (x).
  • This temperature value (x) depends on the Tm of the gene product-primer complex and is e.g. calculated as Tm (gene product primer complex) minus 5 ° C (e.g. Tm is 47 ° C, then the maximum is
  • the reaction time (corresponds to the duration of the installation step in one cycle) is preferably less than one hour, ideally the reaction time is between 10 seconds and 10 minutes.
  • DNA eg cDNA
  • NT * with a short linker residue synthesis see Example 2, Fig. 6e, h, i: dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (Lll) and / or NT * with a long linker residue
  • Fig. 6f, g, j dNTP-SS-TRITC (L14) in combination with Sequenase Version 2, Taq polymerase (GibcoBRL), ProHA-DNA- 5 polymerase (Eurogentec) or Klenow fragment of DNA polymerase I from E. coli without 3 '- 5 'exonuclease activity (Amersham Pharmacia Biotech) can be used.
  • RNA eg mRNA
  • NT * with a short linker residue synthesis see Example 2, Fig. 6e, h, i): dNTP-SS-TRITC (L7), dNTP-SS- Cy3 (III) and / or NT * with a long linker residue
  • dUTP * with the desired cleaved linker residue poly-dA as a template for DNA polymerases such as Sequenase version 2, Taq polymerase, or poly-A as a template for reverse transcriptases such as AMV reverse
  • NT * concentration is preferably between 5 ⁇ mol / l and
  • the number of NTs * incorporated into the nucleic acid chain is analyzed, for example by lengthwise separation in a gel. The following information can be used to draw conclusions about the suitability of the linker residue: If the polymerase can incorporate more than 20 NTs * ,
  • this linker residue is suitable for a sequencing reaction.
  • this combination of NT * and polymerase is not optimal for them Sequencing reaction.
  • NT * function as semiterminators. This is checked by incubating the labeled NTs * with the polymerase and a template under optimal buffer and temperature conditions suitable for the reaction.
  • the NT * concentration is preferably between 5 ⁇ mol / l and 200 ⁇ mol / l.
  • the matrix must be selected so that the installation of several NTs * would be expected one after the other, e.g. for dUTP * you can use polydA or poly-A, as in the example shown above.
  • the polymerase incorporates only a single NT * .
  • NT * concentration, reaction temperature e.g. 10 * concentration, reaction temperature
  • this adaptation takes place in one embodiment by changing the reaction temperature.
  • the other parameters of the reaction are kept constant.
  • polymerases can be used as polymerases, for example, polymerases which are DNA polymerases without 3 '-5' exonuclease activity, preferably from the group consisting of viral DNA polymerases from sequenase -Type, bacterial DNA polymerases I, thermostable DNA polymerases and their modifications. Sequenase version 2, Klenow fragment of DNA polymerase I from E. coli without 3 '-5' exonuclease activity, Taq polymerase or ProHA DNA polymerase are particularly suitable. If RNA is included as a gene product (e.g.
  • RNA-dependent DNA polymerases can be used, for example AMV reverse transcriptase (Sigma), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNase activity.
  • the NT * concentration is usually between 5 ⁇ mol / l and 200 ⁇ mol / l, preferably between 10 ⁇ mol / l and 100 ⁇ mol / l.
  • the concentration of the polymerase and the buffer conditions are selected according to the manufacturer.
  • the duration of the reaction can vary and is preferably between 10 sec and 10 min, which is the duration of the
  • Installation step (b) would correspond to one cycle.
  • non-thermostable polymerases such as Sequenase version 2
  • reaction temperature is reduced from conventional 37 ° C, preferably to 20 ° C to 30 ° C.
  • thermostable polymerases such as Taq polymerase (GibcoBRL), ProHA DNA
  • the reaction temperature from conventional 70-75 ° C is preferably reduced to values between 30 ° C and the temperature value (x).
  • This temperature value (x) depends on the Tm of the gene product primer complex and is calculated as Tm (gene product primer complex) minus 5 ° C (eg Tm is 47 ° C, then the temperature value (x) is 42 ° C ).
  • the reaction conditions are adjusted by reducing the NT * concentration to below 5 ⁇ mol / l, the other parameters of the reaction (buffer conditions, temperature conditions) are kept constant.
  • the concentration of the NT * s is preferably between 0.5 and 5 ⁇ mol / l.
  • the duration of the reaction is between 10 sec and 10 min. The most important thing when choosing the NT * - Concentration is that the polymerase does not incorporate a second NT * in the specified time (preferably between 10 sec and 10 min).
  • the reaction After optimizing the reaction conditions for the installation of a single NT * , the reaction must be repeated with split NTs * . If the reaction parameters are changed accordingly, the polymerase must be able to incorporate the cleaved NTs * one after the other.
  • the optimization reaction correlates with the installation step, step (b), in one cycle.
  • the conditions determined for the optimization reaction, the temperature, the concentration of NT * , the buffer conditions and the duration of the reaction are adopted for the reaction on the surface.
  • the incorporation of NT * into the strands complementary to gene products preferably takes place in such a way that a labeled NT * is preferably incorporated in more than 50% of the gene products involved in the sequencing reaction (gene product-primer complexes which can be extended) in one cycle more than 90%. This is due to the fact that the reaction on some nucleic acid chains is very slow. An installation of the NTs * at every complementary position in each cycle is aimed for, but is not necessary because only the successful installation reactions are detected and evaluated; a delayed reaction in the subsequent cycle does not lead to a sequencing error.
  • the same polymerase is preferably used for all NTs * .
  • different polymerases can also be used for different NTs * . 4.4.8 Color coding scheme, number of dyes
  • a cycle can be carried out with:
  • a label with two dyes can be selected. Two pairs of NTs * are formed, each marked differently, eg A and G are marked "X”, C and U are marked "Y”. Two differently labeled NTs * are used simultaneously in the reaction in one cycle (s), for example C * in combination with A * , and U * and G * are then added in the subsequent cycle (n + 1).
  • fluorescence signals of individual NTs * built into the nucleic acid chain are preferably measured using a wide-field fluorescence microscope (epifluorescence) or a laser scanning microscope or a TIRF microscope (Total Internal Reflection Fluorescence Microscope) (wide-field optical detection system).
  • the device for the excitation light can function, for example, on the basis of a laser, a lamp or diodes. Both CCD cameras and PMT can be used for the detection device.
  • Light source for exciting fluorescence (1) Light-guiding part (2) Scanning table (3)
  • the detection comprises the following phases:
  • each detection step running as a scanning process and comprising the following operations: a) adjusting the position of the lens (X, Y axis), b) adjusting the focal plane (Z axis), c) detecting the Signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective gene product, d) shift to the next position on the surface.
  • the signals from NTs * built into the strands complementary to the gene products are registered by scanning the surface.
  • the scanning process can be carried out in various ways ("Confocal Laser Scanning Microscopy” 1997 Ed. Sheppard, BIOS Scientific Publishers, “New Techniques of optical microscopy and microspectroscopy” 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy” 1998 2. ed. Herman BIOS Scientific Publishers, “Handbook of biological confocal microscopy” 1995 J. Pavley Plenum Press).
  • a discontinuous scanning process is selected.
  • the objective is moved step by step over the surface (FIG. 8a), so that a two-dimensional image (2D image) is created from each surface position (FIG. 8b, c), for experimental arrangement see FIG. Example 5.
  • This 2D image can be created using various methods: for example, by laser scanning a position of the microscope field (laser scanning microscopy) or by taking a camera image at a position (cf. microscopy manuals).
  • laser scanning microscopy or by taking a camera image at a position
  • camera image at a position
  • microscopy manuals One example is the detection of individual molecules with a CCD camera described.
  • the exact number depends e.g. on the relative presence of the gene products in the approach and on the desired accuracy of the analysis.
  • the number of gene products analyzed is preferably between 1000 and 10,000,000. For highly expressed genes, the number of gene products analyzed can be low, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or even further. For example, 100,000 individual gene products are analyzed at the same time.
  • Weakly expressed genes e.g. with approx. 100 mRNA molecules / cell, which corresponds to approx. 0.02% total mRNA are also represented in the reaction with an average of 20 identified gene products.
  • the positions of the gene product-primer complexes must be determined for sequencing, so that one has a basis for the assignment of the signals. Knowing these positions allows a statement to be made as to whether the signals of individual molecules come from built-in NTs * or from randomly bound NTs * . These positions can be identified using various methods.
  • the positions of immobilized gene products are identified during sequencing. This makes use of the fact that the signals from the NTs * built into the nucleic acid chain always have the same coordinates. This is ensured by fixing the nucleic acid chains. The non-specifically bound NTs * bind randomly at different points on the surface.
  • the signals are checked for their coordinates from several successive cycles. This can be done, for example, at the beginning of the sequencing.
  • the matching coordinates are evaluated and stored as coordinates of the gene products.
  • the scan system must be able to scan the surface reproducibly over several cycles.
  • X, Y and Z axis settings at each surface position can be controlled by a computer.
  • the stability and reproducibility of the setting of lens positions in each scanning process determine the quality of the detection and thus the identification of the signals of individual molecules.
  • Signals from individual molecules are placed in relation to the pattern, so that an X, Y deviation in the pattern position means the same X, Y deviation in the position of the signals of individual molecules.
  • the A control picture of the pattern can be taken before, during or after the detection of individual molecules. Such a control picture must be made accordingly with each setting on a new surface position.
  • the surface is not absolutely flat and has various bumps. This changes the surface-lens distance when scanning neighboring locations. These differences in distance can lead to individual molecules leaving the focal plane and thus avoiding detection.
  • the following method can be used: Since the excitation of individual molecules can lead to the extinction of their fluorescence, a marker is applied to the surface, which serves to adjust the focal plane. The signals of individual molecules are then detected.
  • the marker can be of any nature (e.g. dye or pattern), but must not interfere with the detection and the reaction.
  • the two-dimensional image of the reaction surface generated with the aid of the detection system contains the signal information from NT * s built into the gene products. Before further processing, these must be extracted from the total amount of image information using suitable methods.
  • the necessary algorithms for scaling, transformation and Filtering of image information is part of the standard repertoire of digital image processing and pattern recognition (Haberburger P. "Practice of digital image processing and pattern recognition”. Hanser-Verlag, Kunststoff, Vienna, 1995; Galbiati LJ "Machine vision and digital image processing fundamentals”. Prentice Hall, Englewood Cliffs, New Jersey, 1990).
  • the signal extraction is preferably carried out via a gray value image, which depicts the brightness distribution of the reaction surface for the respective fluorescence channel.
  • a separate gray value image can first be generated for each fluorescence-labeled nucleotide (A, T, C, G or U).
  • A, T, C, G or U fluorescence-labeled nucleotide
  • a gray value image is generated for each fluorescence channel by using suitable filters (Zeiss filter sets).
  • Image processing program extracts the relevant color channels and processes them individually as gray-scale images.
  • a channel-specific coloring threshold algorithm is used for channel extraction.
  • Individual gray value images 1 to N are thus initially created from a multi-channel color image. These images are defined as follows:
  • Preprocessing of the image for example, if necessary, reducing the image noise caused by the digitization of the image information, for example by gray value smoothing.
  • an image point (x, y) fulfills these requirements, then a comparison with the coordinates of gene products identified in previous sequencing cycles follows. If there is a match, the signal is associated with the nucleotide emerging from the respective fluorescence channel to this gene product. Signals with mismatched coordinates are evaluated as background signals and rejected. The signals can be analyzed in parallel with the scanning process.
  • an eight-bit gray-scale image with a resolution of 1317 x 1035 pixels was used.
  • the overall image was first preprocessed: the average value of the brightness of its 8 neighbors was assigned to each pixel. With the selected resolution, this creates one for a fluorescence point typical pattern of a central pixel with the greatest brightness value and neighboring pixels with brightness falling towards all sides. If a pixel met these criteria and the centrifugal drop in brightness exceeded a certain threshold value (to exclude fluorescence spots that were too weak), this central pixel was evaluated as the coordinate of a fluorescence spot.
  • a sequence of recordings can be made with the control of the X, Y position, the adjustment of the focal plane and with the detection of individual molecules at each new lens position. These steps can be controlled by a computer.
  • the scanning process and the biochemical reaction take a certain amount of time. If you switch these processes one after the other, you can achieve an optimal performance of the equipment. In a preferred embodiment, the reaction is carried out on two separate surfaces (FIG. 9).
  • a surface with bound gene products can be separated into two spatially isolated parts, so that reactions on these two parts can take place independently of one another.
  • gene products can also be immobilized on two separate surfaces from the outset.
  • the reaction is then started.
  • the principle is that while the reaction and washing steps take place on part of the surface, the second part is scanned. Thereby you can achieve a continuous flow of analysis and increase the speed of sequencing.
  • the number of surfaces on which the reaction takes place can also be greater than 2. This makes sense if the reaction occurs as a time-limiting step, i.e. the detection of the signals on the surface is faster than the reaction and washing steps. In order to adapt the total duration of the reaction to the detection duration, each individual step of the reaction can take place on a single surface with a time delay compared to the next surface.
  • the data obtained are compared using a program with known gene sequences.
  • a program can e.g. based on a BLAST or FASTA algorithm ("Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall).
  • the choice of the method for material preparation determines, among other things, in which sections of the gene products the sequences are determined and to which strand (sense or antisense) they belong. For example, are determined when using the polyA stretches as primer binding sites in mRNA sequences from NTRs (non-translating regions). When using the method with antisense cDNA as a template, the sequences determined come, inter alia, from the protein-coding regions of the gene products.
  • the gene expression is only determined qualitatively. Only the fact that certain genes are expressed is important.
  • one is quantitative determination of the relationships between individual gene products in the approach of interest. It is known that the activity of a gene in a cell is represented by a population of identical mRNA molecules. Many genes are active in a cell at the same time and are expressed to different extents, which leads to the presence of many different mRNA populations with different strengths.
  • the abundances (frequencies) of individual gene products in the sequencing reaction are determined for a quantitative analysis of the gene expression.
  • the products of highly expressed genes are more frequently represented in the sequencing reaction than the poorly expressed genes.
  • the proportion or number of sequences determined for each individual gene or gene product is determined. Genes with strong expression have a higher proportion of the total population of gene products than genes with weak expression.
  • the number of gene products analyzed is preferably between 1000 and 10,000,000.
  • the exact number of gene products to be analyzed depends on the task. It can be low for highly expressed genes, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or higher.
  • RNA control samples are used in the sequence analysis of the mRNA samples, and corresponding DNA control samples are used in the analysis of the cDNA samples. These samples are preferably carried along in all steps. You can e.g. added after mRNA isolation. In general, the control samples are prepared for sequence analysis in the same way as the gene products to be analyzed.
  • control sequences are added to the gene products to be analyzed in known, fixed (predetermined) concentrations.
  • Concentrations of the control samples can be different, preferably these concentrations (i.e. the total concentration of the control sequences) are between 0.01% and 10% of the total concentration of the sample to be analyzed (100%). For example, if the concentration of the mRNA is 10ng / ⁇ l, the concentrations of control samples are between 1pg / ⁇ l and 1ng / ⁇ l.
  • the change in the level of expression of a particular gene can occur as a result of the change in the transcription rate of that gene or as a result of a global change in gene expression in the cell.
  • the expression of the so-called "house keeping genes" If there is a lack of important metabolites, for example, the general level of expression in the cell is low, so that constitutively expressed genes also have a low level of expression.
  • all constitutively expressed genes can serve as "house-keeping genes". Examples include the transferrin receptor gene or the beta actin gene. The expression of these house-keeping genes thus serves as a reference for the analysis of the expression of other genes.
  • the sequence determination and quantification of the expression of the house keeping genes is preferably a component of the analysis program for gene expression.
  • Modified dUTP with a long cleavable linker (Fig. 6f-1) 5- (3-aminoallyl) -2 'deoxyuridine-5' triphosphate, AA-dUTP, (Sigma), 3, 3 '- serve as starting substances Dithio-bis (propionic acid-N-hydroxysuccinimide ester), DTBP-NHS, (Sigma), 2-mercaptoethylamine, MEA, (Sigma).
  • DTBP-NHS 2-mercaptoethylamine
  • MEA 2-mercaptoethylamine
  • Dyes can now be coupled to this linker using various methods ("Handbook of Fluorescent Probes and Research Chemicals” 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v.246, p.362, Jameson et al. Method in Enzymology 1997, v.278, p.363).
  • nucleotide analogs for example according to Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356 can also be used in the reaction, so that nucleotide analogs with structures in FIGS. 6f-2,3,4 and 6g-1,2 can be generated.
  • TRITC tetramethylrhodamine-5-isothiocyanate, Molecular Probes
  • the dNTP (300 nmol) modified with the cleavable linker is dissolved in 30 ⁇ l 100 mmol / l sodium borate buffer, pH 9
  • the NT * produced in this way fulfills the requirements for incorporation into the DNA strand, fluorescence detection and chain termination after the incorporation and removal of the inhibition, which are necessary for the success of the method according to the invention.
  • Example of cleavage of disulfide compound in modified NT * The cleavage is carried out by adding 20 to 50 mmol / l DTT or mercaptoethanol (Sigma) solution pH 8 to the Reaction surface. The surface is 10 min. incubated with this solution, then the solution is removed and the surface is washed with a buffer solution to remove DTT or mercaptoethanol residues.
  • dUTP-SS-CH 2 CH 2 NH 2 Modified dUTP
  • Fig. 6e-l Modified dUTP
  • the starting substances are: bis-dUTP, synthesized according to Hanna (Method in Enzymology 1989, v.180, p.383), 2-mercaptoethylamine, MEA, (Sigma).
  • DCTP (Fig. 6-e2) can be modified in a similar way, bis-dCTP serving as the starting substance (synthesized according to Hanna et al. Nucleic Acid Research 1993, v.21, p.2073).
  • NT * (dUTP * and dCTP * ) with a short linker residue can be synthesized in a similar manner, NT * for example having the following structures (FIG. 6e): dUTP-SS- (CH 2 ) n -NH 2 , FIG .6e-1, dCTP-SS- (CH 2 ) n -NH 2 , Fig. 6e-2, where n is between 2 and 6, preferably between 2 and 4, dUTP-SS- (CH 2 ) n -X-CO- (CH 2 ) m -Z, Fig.
  • Z NH 2 , OH, dye where (n + m) is between 4 and 10, preferably between 4 and
  • the coupling of the FluoroLinkTM Cy3 monofunctional dye (Amersham Pharmacia biotech) (NT * structure Fig. 6i) is given as an example of coupling a dye to the linker. It is a monofunctional NHS ester fluorescent dye.
  • the reaction is carried out according to the manufacturer's instructions: The dNTP (300 nmol) modified with the cleavable linker is dissolved in 300 ⁇ l 100 mmol / l sodium borate buffer pH 8.5. For this, dye (300 nmol) is added and incubated for 1 h at RT. The NT * modified with the dye is cleaned by RP-HPLC in a methanol-water gradient.
  • TRITC tetramethylrhodamine-5-isothiocyanate, Molecular Probes
  • the dNTP (300 nmol) modified with the cleavable linker is dissolved in 30 ⁇ l 100 mmol / l sodium borate buffer pH 9 (10 mmol / l NT * ). 10 ⁇ l of 10 mmol / l of TRITC are added to DMF and incubated at RT for 4 h.
  • the NT * modified with the dye is cleaned by RP-HPLC in a methanol water Gradient.
  • the NT * produced in this way fulfills the requirements for incorporation into the DNA strand, fluorescence detection and chain termination after the incorporation and removal of the inhibition, which are necessary for the success of the method according to the invention.
  • Example of cleavage of the disulfide compound in the modified NT * The cleavage is carried out by adding 20 to 50 mmol / l dithiothreitol solution (DTT) or mercaptoethanol solution (Sigma), pH 8, to the reaction surface. The surface is 10 min. incubated with this solution, then the solution is removed and the surface is washed with a buffer solution to remove DTT or mercaptoethanol residues.
  • DTT dithiothreitol solution
  • Sigma mercaptoethanol solution
  • FIGS. 6k, 1, m Further examples of NT structures that can be used in the method according to the invention are shown in FIGS. 6k, 1, m.
  • FIGS. 6k, 1, m For the individual synthesis steps, see for example J.L. Ruth et al. Molecular Pharmacology 1981 v.20 p.415, L. ⁇ tvös et al. NAR 1987 v.15 p.1763, G.E.right et al. Pharmac Ther. 1990 v.47, p.447, "Nucleotide Analogs; Synthesis and Biological Function "KH Scheit 1980, Wiley-Interscience Publication," Nucleic acid chemistry "Ed. LBTownsend, v.1-4, Wiley-Interscience Publication," Chemistry of Nucleosides and Nucleotides "Ed. LBTownsend, v.1 -3, Plenum Press.
  • all four NTs * used in the reaction are labeled with fluorescent dyes.
  • the number of NTs found for each Sequence from a gene product is between 5 and 100, ideally between 20 and 50. These sequences are compared with a known program in gene databases using a program and assigned to appropriate genes. Such a program can be based, for example, on the BLAST or FASTA algorithm ("Introduction to Computational Biology” 1995 MS Waterman Chapman & Hall).
  • a cycle has the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to immobilized nucleic acid chains, b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) Washing d) detection of signals from individual molecules, e) removal of the label from the built-in nucleotides, f) washing.
  • NTs * labeled nucleotides
  • 2 modified NTs * and 2 unmodified NTs are used for the analysis of the sequences.
  • This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence.
  • the determined sequence is compared with the reference sequence and assigned to a specific position, for example:
  • A-C C-AAA-A-C-A-C-CC (assigned determined sequence) ATCATCGTTCGAAATATCGATCGCCTGATGCC (reference sequence)
  • sequences determined are preferably assigned to the reference sequence with the aid of a program.
  • a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology” 1995 M.S. Waterman Chapman & Hall).
  • the gene products are prepared for sequencing as described above and sequenced using the 2NTs * / 2NTs method. Sequence sections are obtained from gene products, each sequence representing a sequence of 2NTs * .
  • Known gene sequences serve as reference sequences. In order to enable the determined sequence to be clearly assigned to a known reference sequence, this sequence must be long enough.
  • the length of the sequences determined is preferably more than 20 NT * s. Since 2 marked NTs * represent only part of the sequence, the total length of the complementary strand synthesized is approximately twice as long as the sequence of the detected NTs * (with 20 detected NTs * , the total length is, for example, an average of 40 NTs).
  • NTs * marked with a fluorescent dye appear as semiterminators in the present invention, ie the termination occurs only when modified NTs * are available , unmodified NTs must be added to the reaction in an additional step in each cycle. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs are used separately.
  • a cycle in this embodiment may look as follows, for example: a) adding a solution with modified NTs * and polymerases to the surface with the gene products provided b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) washing d) detecting the signals from individual, modified NTs * molecules built into the newly synthesized strands complementary to the gene products e) removal of the label and the terminating group in the built-in nucleotides f) washing g) addition of 2 unmodified NTs and polymerases h) washing.
  • the polyacrylamide gel for the analysis of reactions with individual molecules is prepared according to general rules of gel preparation for electrophoretic separation ("Electrophoresis” A.T. Andrews, Oxford science publications 1995).
  • the polymerization reaction can e.g. be carried out by UV light or by radical formers.
  • ammonium persulfate (APS) and TEMED (tetramethylethylene diamine) are used for the radical reaction, e.g. TEMED 0.01% v / v and APS 0.04% w / v.
  • the component composition can vary widely, the concentrations of individual components are in the following ranges (calculated for the ready-to-use aqueous AA to AA solution):
  • Acrylamide monomer (AA) from 3 to 30%, ideally between 10 and 20% Bis-acrylamide (bis-AA) in relation to the acrylamide monomer 1:10 to 1:50, preferably 1:20.
  • a glass plate (PI) is preferably pretreated with a water-repellent reagent, e.g. Repelsilane, dimethyldichlorosilane solution, Amersham Pharmacia-Biotech.
  • P2 serves as a solid carrier for the gel and can be used with yellow-binding reagents e.g. Bind silane, methacryloxypropyltrimethoxysilane, Amersham Pharmacia-Biotech, are pretreated so that there is a covalent bond between the gel and the glass surface.
  • P2 pretreatment with yellowing reagents is useful when several reactions with immobilized molecules have to be carried out. With a smaller number of reactions, such pretreatment is not necessary. In these cases, a clean glass surface is sufficient for P2 so that the gel adheres to the glass surface solely by adhesive forces.
  • the finished polymerization solution (AA / bisAA solution with radical formers) is poured between P1 and P2, so that a layer with a thickness of approx. 5 to 30 ⁇ m results.
  • the thickness of the gel can e.g. be checked by spacers. After hardening, Pl is removed. The gel sticks to P2. It is washed with deionized water.
  • the gel can be used directly or can be dried and stored at various stages of manufacture. Before a reaction with labeled molecules, the gel is usually swollen in the reaction buffer solution for a few minutes and only then used for the reaction.
  • Nucleic acid chains are immobilized on a gel surface prepared in this way by drying out.
  • a solution (approximately 1 ⁇ l) of a plasmid DNA (linearized with Hind III) was converted into single-stranded by heat Form converted pMOS blue plasmid DNA about 3400 NT long, concentration O.l ⁇ g / ⁇ l) was dropped on about 10mm 2 of the gel surface and brought to dryness at 90.degree.
  • the calculated density of the immobilized plasmid molecules was approximately 1000 per 1 ⁇ m 2 .
  • the oligonucleotide 5 '-AGTGAATTCGAGCTCGGTAC-3' was used as primer.
  • the primer binding site (hereinafter bold) together with the extension relevant for the analysis has the following sequence: 5 '-ATCCCCGGGTACCGAGCTCGAATTCACT-3'
  • a flow cell (microfluidic channel, MFK) with the reaction surface as a lid was assembled.
  • MFK microfluidic channel
  • the primer (calculated Tm 45.3 ° C, 0.1 ⁇ mol / l in 50mmol / l Tris-HCl pH 8.7) was hybridized at 45 ° C for 10 minutes with the plasmid DNA on the surface (annealing). After a washing step, the density of the plasmid-primer complexes was checked. The control was carried out by incorporating dCTP-Cy3 (Amersham Pharmacia Biotech) using Klenow fragment (2 units per 50 ⁇ l in 20 mmol / l Tris-HCl buffer, pH 8.5, with 5 mmol / l MgCl 2 for 15 minutes 30 ° C). Only a single dCMP-Cy3 is built into the growing strand.
  • the signal density of the individual built-in dCMP-Cy3 molecules corresponds to the density of the plasmid-primer complexes which can be extended. Under the conditions mentioned, the density of the plasmid-primer complexes averaged approximately 15 per 100 ⁇ m 2 and was thus of the desired order (FIGS. 8a-c).
  • a cyclic sequencing reaction is carried out on a second surface prepared in the same way (pMOS blue plasmid DNA linearized with Hind III and converted into single-stranded form by heat for about 3400 NT, Concentration O.l ⁇ g / ⁇ l with hybridized primers), a cyclic sequencing reaction is carried out.
  • dUTP-SS-CH 2 CH 2 NH-R-Cy3 dUTP *
  • dCTP-SS-CH 2 CH 2 NH-R-Cy3 (see Example 2) are used as reversible terminators.
  • the detection apparatus is the same as in the preliminary test.
  • the installation reactions with marked NT * s were carried out at 30 ° C. for 15 minutes.
  • a reaction solution with dCTP * was added.
  • a detection step was carried out, single-molecule signals with the assigned x, y coordinates being registered on the surface (a total of approximately 11,200 signals).
  • the marker was then removed from the built-in NT * s (room temperature, 10 minutes) and the surface was washed.
  • Cycles 1 to 3 were repeated three times, with a total of approximately 9900 CCU target sequences being determined. These sequences can be clearly assigned to the primer.
  • the analysis is based on the sequencing of short sections of mRNA.
  • each gene product has one uniform primer binding site (PBS) at its 3 'end, so that a uniform primer can bind to this PBS.
  • PBS uniform primer binding site
  • PBS uniform primer binding site
  • NTs are coupled to the 3 'end of the single-stranded gene products (a so-called 5 "tailing").
  • Using a uniform NT results in a uniform PBS.
  • a gel layer (2) adheres to a solid base (1), e.g. a polyacrylamide gel (Fig. 4a), or many gel beads (5), e.g. Agarose beads (Fig. 4b).
  • Gene products (4) are bound to the surface of the gel.
  • the gene products carry a functional group, e.g. Biotin, and are bound to the gel via streptavidin or avidin (3).
  • Example of a flow device A gel-like reaction surface (1) is on one for the
  • Detection apparatus (6) detected.
  • FIG. 6 structures of 2'-deoxynucleoside triphosphates which can be used in the process.
  • Fig. 6a Schematic representation of the NT structure, in which the cleavable group and the sterically demanding group leading to the termination form parts of the linker.
  • the linker is the connection between nucleobase and fluorescent dye.
  • Fig. 6b Schematic representation of the NT structure, the cleavable group being part of the linker and the fluorescent dye simultaneously representing the sterically demanding group leading to the termination.
  • A, B, C - linker A - the linker residue after cleavage, B - cleavable group, D - sterically demanding group leading to termination, F - fluorescent dye.
  • Fig. 6c Schematic representation of the structure of installed NT * s after the cleavage step. Two NT * s are shown with the remaining link remainder (A).
  • Fig. 6d Schematic representation of the NT structure, wherein the cleavable group, which is also the sterically demanding group leading to termination, is part of the linker.
  • A, B, C, D - linker A - the linker residue after cleavage, B - cleavable group, D - sterically demanding group leading to termination, F - fluorescent dye.
  • Fig. 6e representation of preferred NT structures in which the linker is coupled to the 5-position in the pyrimidine ring.
  • Fig. 6g representation of preferred NT structures, in which the linker is coupled to the 7-position in the purine ring.
  • the linker is coupled to the 5-position of the pyrimidine ring.
  • the substituents R ⁇ , 2,3, can be selected and can occur independently of one another.
  • the Z group represents the connection between the linker and the base. It can be selected and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
  • the E group represents one internal part of the linker. In another embodiment (6k-2) it represents the connection between the linker and the base. This group is selectable and can be a straight-chain alkyl or alkenyl chain with a number of carbon atoms, preferably between 1 and 5 , his.
  • the E group can also be an alkyl or alkenyl chain with an internal amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino bond.
  • the C group is a chemically cleavable group.
  • 6k-1,2) it represents an internal part of the linker.
  • 6k-3) it represents the connection between the linker and the base.
  • This group is selectable and can be an ester, Be thioester and disulfide compound.
  • the Y group represents an internal part of the linker, which creates the connection between the cleavable group (C) and the fluorescent dye (F).
  • This group is selectable and can be a branched or unbranched alkyl or
  • the X group is the connection between the fluorescent dye and the linker, and this connection can be derived from both the linker and the fluorescent dye (F). It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
  • the Z group represents the connection between the linker and the base. It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
  • the E group represents an internal part of the linker. In another embodiment (6L-2) it represents the connection between the linker and the base.
  • This group is selectable and can be a straight-chain alkyl - Or alkenyl chain with a number of carbon atoms, preferably between 1 and 5.
  • the E group can also be an alkyl or alkenyl chain with an internal amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino bond.
  • the C group is a chemically cleavable group.
  • 6L-1,2) it represents an internal part of the linker.
  • 6L-3) it represents the connection between the linker and the base.
  • This group is selectable and can be an ester, Be thioester and disulfide compound.
  • the Y group represents an internal part of the linker, which creates the connection between the cleavable group (C) and the fluorescent dye (F).
  • This group can be selected and can be a branched or unbranched alkyl or alkenyl chain or else a substituted or unsubstituted aryl group.
  • Another possible alternative is an alkyl or alkenyl chain with an internal amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino bond.
  • the X group is the connection between the fluorescent dye and the linker, this connection being formed by both the linker and the fluorescent dye (F) can be derived. It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
  • the linker is coupled to the 5-position of the pyrimidine ring.
  • the substituents R 1 # 2,3,4 can be selected and can occur independently of one another.
  • the Y group represents an internal part of the linker, which is the connection between the cleavable group (C) and the
  • Fluorescent dye (F) produces.
  • This group is selectable and can be a branched or unbranched alkyl or
  • the X group is the connection between the fluorescent dye and the linker, and this connection can be derived from both the linker and the fluorescent dye (F). It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
  • a wide-field optical detection system is shown. After the installation of marked NT * s, the surface (7) is scanned, the fluorescence signals from individual to the NTs coupled dye molecules can be detected.
  • Fig. 8a Schematic representation of a portion of the reaction surface (gray) that is scanned.
  • the circles each correspond to the recording of a 2D image and represent the areas from which the fluorescence signals are detected. There are several signals per recording
  • reaction surface (e.g. 100 to 10,000) of individual molecules registered simultaneously.
  • the reaction surface is scanned in each cycle, several images being taken from different locations on the surface during the scanning process. Up to several million signals can be recorded by built-in NT * s.
  • the high degree of parallelism is the basis for the speed of the process.
  • Fig. 8b A recording (a 2D image) with signals from individual, built-in NT * s. See example 5 for a description of the experiment.
  • Fig. 8c detail from Figure 8b.
  • the section shows signals from four built-in NTs. Each signal has characteristic properties of the individual molecule signals (see description) and can be identified on the basis of these (preferably with the aid of a computer program). The corresponding X, Y coordinates are assigned to each of the identified signals.
  • the throughput is determined by using two separate flow cells (microfluidic channels, MFK) increased. While biochemical and chemical reactions take place in one flow cell, detection is carried out in the other. The flow cells then swap positions.
  • MFK microfluidic channels

Abstract

The invention relates to a method for analyzing gene expression, i.e. for parallel analysis of the expression of a large number of genes. Said method is based on analysis of sequences on a large number of bound chains. Short sequence sections from each of these chains are determined, followed by evaluation and comparison with gene sequences in data banks, providing information about the genes thus expressed and the intensity of said expression.

Description

Verfahren zur Bestimmung der Genexpression Method of determining gene expression
Zusammenfassung:Summary:
Die Erfindung beschreibt ein Verfahren zur parallelen Analyse der Expression einer großen Anzahl von Genen. Diese Methode basiert auf der Analyse von Sequenzen an vielen gebundenen Nu- kleinsäureketten. Dazu werden kurze Sequenzabschnitte aus jeder dieser Ketten ermittelt . Die anschließende Auswertung und der Vergleich mit Gensequenzen in Datenbanken erlaubt Aussagen über die exprimierten Gene und die Stärke ihrer Expression.The invention describes a method for parallel analysis of the expression of a large number of genes. This method is based on the analysis of sequences on many bound nucleic acid chains. To do this, short sequence sections are determined from each of these chains. The subsequent evaluation and comparison with gene sequences in databases allows statements about the expressed genes and the strength of their expression.
1. Abkürzungen und Begriffserläuterungen1. Abbreviations and explanations of terms
DNA - Desoxyribonukleinsäure verschiedenen Ursprungs und unterschiedlicher Länge: (genomische DNA, cDNA, ssDNA, dsDNA) RA - Ribonukleinsäure (meist RNA)DNA - deoxyribonucleic acid of different origins and different lengths: (genomic DNA, cDNA, ssDNA, dsDNA) RA - ribonucleic acid (mostly RNA)
Genprodukte - mRNA- ranskripte oder von der mRNA abgeleitete Nukleinsäureketten (z.B. einzelsträngige cDNAs, doppelsträngige cDNAs, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA) . cDNA - komplementäre DNAGene products - mRNA transcripts or nucleic acid chains derived from the mRNA (e.g. single-stranded cDNAs, double-stranded cDNAs, RNA derived from cDNA or DNA amplified from cDNA). cDNA - complementary DNA
Polymerasen - Enzyme, die komplementäre Nukleotide in einen wachsenden DNA- oder RNA-Strang einbauen können ( z.B. DNA- Polymerasen, Reverse-Transcriptasen, RNA-Polymerasen)Polymerases - enzymes that can incorporate complementary nucleotides into a growing DNA or RNA strand (e.g. DNA polymerases, reverse transcriptases, RNA polymerases)
dNTP - 2 ' -deoxi-Nucleosid-Triphosphate, Substrate für DNA- Polymerasen und Reverse-TranscriptasendNTP - 2 'deoxy nucleoside triphosphates, substrates for DNA polymerases and reverse transcriptases
NTP - Nukleosid-Triphosphate, Substrate für RNA-Polymerasen NT - natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet.NTP - nucleoside triphosphates, substrates for RNA polymerases NT - natural nucleotide, usually dNTP, unless expressly stated otherwise.
Abkürzung "NT" wird auch bei der Längenangabe einer Nukleinsäu- resequenz verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" für Nukleosid-Monophosphate.Abbreviation "NT" is also used when specifying the length of a nucleic acid sequence, e.g. NT 1,000. In this case "NT" stands for nucleoside monophosphates.
Im Text wird bei Abkürzungen die Mehrzahl durch Verwendung des Suffixes "s" gebildet, »NT" steht zum Beispiel für "Nukleotid", "NTs" steht für mehrere Nukleotide.The majority of abbreviations in the text are formed by using the suffix "s", for example, " NT" stands for "nucleotide", "NTs" stands for several nucleotides.
NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrück- lieh anders gekennzeichnet. NTs* bedeutet: modifizierte NukleotideNT * - modified nucleotide, usually dNTP, if not explicitly marked otherwise. NTs * means: modified nucleotides
Plane Oberfläche: Oberfläche, die vorzugsweise folgende Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Moleküle, vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem jeweiligen gegebenen Objektiv-Oberfläche-Abstand bei einer Objektivposition gleichzeitig zu detektieren. 2) Die immobilisierten bzw. gebundenen einzelnen Moleküle befinden sich in derselben Fokusebene, die reproduzierbar eingestellt werden kann.Flat surface: surface which preferably has the following features: 1) It allows several individual molecules, preferably more than 100, more preferably more than 1000, to be detected simultaneously with the given objective-surface distance at one objective position. 2) The immobilized or bound individual molecules are in the same focal plane, which can be set reproducibly.
Sterisches Hindernis: Sterisch anspruchsvolle Gruppe, die durch ihre chemische Struktur die Eigenschaften der mit dieser Gruppe gekoppelten NTs* so verändert, dass diese durch eine Polymerase in einer Extensionsreaktion nicht nacheinander eingebaut werden können.Steric obstacle: Sterically demanding group, whose chemical structure changes the properties of the NTs * coupled with this group in such a way that they cannot be successively incorporated into one extension reaction by a polymerase.
Definition der Termination: Als Termination wird in dieser Anmeldung der reversible Stop des Einbaus der modifizierten unge- spalteten NTs* bezeichnet. Dieser Begriff ist von dem üblichen Gebrauch des Wortes "Termi- nation" durch Dideoxy-NTP bei einer konventionellen Sequenzierung zu trennen.Definition of termination: In this application, termination is the reversible stop in the installation of the modified, uncleaved NTs * . This term is to be separated from the usual use of the word "termination" by dideoxy-NTP in conventional sequencing.
Die Termination kommt nach dem Einbau eines modifizierten NT* zustande. Das modifizierte eingebaute NT* trägt eine an die Base reversibel gekoppelte sterische Gruppe, die zur Behinderung des Einbaus eines nächsten komplementären NT* in den wachsenden Strang durch eine Polymerase führt.The termination comes after the installation of a modified NT * . The modified built-in NT * carries a steric group which is reversibly coupled to the base and which prevents the incorporation of a next complementary NT * into the growing strand by a polymerase.
SNP - single nucleotide polymorphismSNP - single nucleotide polymorphism
PBS - PrimerbindungsstellePBS - primer binding site
Weitfeld-Optik-Detektionssystem - Detektionssystem, das gleichzeitig Fluoreszenzsignale von einzelnen, auf einer Fläche verteilten Molekülen detektieren kann, wobei die Fläche ca. 100 μm2 und größer ist. Ein Beispiel für Weitfeld- Detektionsoptik stellt Fluoreszenzmikroskop Axiovert 200 oder Axioplan 2e (Zeiss) mit einem Planneofluar-Objektiv 10Ox NA 1.4 Ölimmersion (Zeiss), oder einem Planapochromat-Objektiv lOOx NA 1.4 Ölimmersion (Zeiss) dar; die Anregung der Fluoreszenz kann dabei mit einer Lampe, z.B. Quecksilberdampflampe, oder einem Laser oder Dioden erfolgen. Sowohl Epifluoreszenzmodus als auch Totalreflexions- Fluoreszenzmikroskopie-Modus (total internal reflection fluorescence microscopy, TIRF-Microscopy) oder Laser-Scanning- Mikroskopie-Modus können verwendet werden. In dieser Anmeldung wird Gebrauch von dieser Weitfeld-Detektionsoptik gemacht.Wide-field optical detection system - detection system which can simultaneously detect fluorescence signals from individual molecules distributed over an area, the area being approximately 100 μm 2 and larger. An example of wide-field detection optics is the Axiovert 200 or Axioplan 2e (Zeiss) fluorescence microscope with a Planeofluar objective 10Ox NA 1.4 oil immersion (Zeiss), or a planapochromatic objective lOOx NA 1.4 oil immersion (Zeiss); The fluorescence can be excited using a lamp, for example a mercury vapor lamp, or a laser or diode. Both epifluorescence mode and total reflection Fluorescence microscopy mode (total internal reflection fluorescence microscopy, TIRF microscopy) or laser scanning microscopy mode can be used. This wide field detection optics is used in this application.
2. Stand der Technik:2. State of the art:
Die Analyse des Genexpressions-Spektrums ist zu einem wichtigen Werkzeug in der Wissenschaft geworden. Der Vergleich der Genexpressions-Spektren zwischen verschiedenen Zelllinien, Geweben oder Entwicklungsstadien erlaubt Rückschlüsse auf die darin ablaufenden spezifischen biologischen Prozesse. So kann man z.B. erwarten, dass der Vergleich zwischen Tumorzellen und gesunden Zellen gleicher Herkunft Auskunft über die am Tumorgeschehen beteiligten Gene gibt. Dabei ist wichtig, dass die Aktivität möglichst vieler oder aller Gene gleichzeitig analysiert wird.Analysis of the gene expression spectrum has become an important tool in science. The comparison of the gene expression spectra between different cell lines, tissues or developmental stages allows conclusions to be drawn about the specific biological processes taking place in them. So you can e.g. expect the comparison between tumor cells and healthy cells of the same origin to provide information about the genes involved in the tumor process. It is important that the activity of as many or all genes as possible is analyzed at the same time.
Die Analyse der Genexpression ist eine komplexe Aufgabe: Die Anzahl der in einem Zelltyp aktiven Gene kann mehrere Tausend betragen. Die Analyse sollte aber möglichst alle im Genom der betreffenden Art enthaltenen Gene (etwa 32000 beim Menschen) berücksichtigen. Hinzu kommt, dass die im jeweiligen Zelltyp aktiven Gene erstens meist noch nicht komplett bekannt sind und zweitens unterschiedlich stark exprimiert werden.The analysis of gene expression is a complex task: the number of genes active in a cell type can be several thousand. However, the analysis should consider all genes contained in the genome of the species in question (approximately 32,000 in humans). In addition, the genes active in the respective cell type are first of all mostly not yet completely known and secondly they are expressed to different extents.
Es wurden bereits viele Methoden zur Genexpressionsanalyse entwickelt, so z.B. Differential Display (Nature 1984, v.308 S.149, Science 1992 v.257 S.967), Expressed Sequence Tags (EST)Many methods for gene expression analysis have already been developed, e.g. Differential Display (Nature 1984, v.308 p.149, Science 1992 v.257 p.967), Expressed Sequence Tags (EST)
(Science 1991 v.252, S.1656, Nature Genetics 1992, v.2 S.173),(Science 1991 v.252, p.1656, Nature Genetics 1992, v.2 p.173),
Northern blotting oder RT-PCR (PNAS 1977, v.74, S.5350, CellNorthern blotting or RT-PCR (PNAS 1977, v.74, p.5350, Cell
1983 v.34 S.865, "The PCR Technique, RT-PCR" 1998, Ed. Paul1983 v.34 p.865, "The PCR Technique, RT-PCR" 1998, Ed. Paul
Suebert, Eaton Publishing) . Alle diese Methoden können nur eine sehr begrenzte Anzahl an Genen pro Reaktion analysieren und sind zum Teil sehr arbeitsintensiv. Die am weitesten verbreitete Methode zur parallelen Analyse der Genexpressionsmuster ist die Hybridisierung eines zu analysierenden Gemischs von cDNA-Molekülen mit an eine Oberfläche gebundenen Oligonukleotiden, die in einer bestimmten Anordnung, meist als "Microarray" fixiert sind ("Microarray Biochip Technology" 2000, Ed. M.Schena, Eaton Publishing, Zhao et al. Gene 1995, v. 156, S.207, Schena et al. Science 1995 v.270, S.467, Lockhart et al . US Patent 6.040.138, Wang US Patent 6.004.755, Arlinghaus et al . US Patent 5.821.060, Southern US Patent 5.700.637, Fodor et al . US Patent 5.871.928) .Suebert, Eaton Publishing). All of these methods can only analyze a very limited number of genes per reaction and are sometimes very labor-intensive. The most widespread method for parallel analysis of the gene expression patterns is the hybridization of a mixture of cDNA molecules to be analyzed with oligonucleotides bound to a surface, which are fixed in a certain arrangement, usually as a "microarray"("Microarray Biochip Technology" 2000, Ed M.Schena, Eaton Publishing, Zhao et al. Gene 1995, v. 156, p.207, Schena et al. Science 1995 v.270, p.467, Lockhart et al. US Patent 6,040,138, Wang US Patent 6,004,755, Arlinghaus et al. US Patent 5,821,060, Southern US Patent 5,700,637, Fodor et al. US Patent 5,871,928).
Zu den großen Nachteilen der Hybridisierungsmethode zählen: Die Fertigung der an die Oberfläche gebundenen Oligonukleotide ist teuer. Die Analyse beschränkt sich auf Gene, deren Sequenzen bereits bekannt sind. Mehrere Mismatch-Kontrollen vergrößern die Anzahl der Oligonukleotide, die immobilisiert werden müssen.The major disadvantages of the hybridization method include: The production of the oligonucleotides bound to the surface is expensive. The analysis is limited to genes whose sequences are already known. Multiple mismatch controls increase the number of oligonucleotides that need to be immobilized.
Die vorliegende Erfindung beschreibt eine Methode zur parallelen Analyse einer großen Anzahl von Nukleinsäurekettenmolekülen. Sie basiert auf der Detektion der Fluoreszenzsignale von einzelnen Molekülen. Durch eine gleichzeitige Sequenzierung einzelner Genproduktmoleküle erhält die Methode mehrere Vorteile gegenüber dem Stand der Technik:The present invention describes a method for the parallel analysis of a large number of nucleic acid chain molecules. It is based on the detection of fluorescence signals from individual molecules. By simultaneous sequencing of individual gene product molecules, the method has several advantages over the prior art:
1) Die Genprodukte können in einer beliebigen Anordnung auf der Oberfläche binden. Eine vorherige aufwendige Synthese von verschiedenen Oligonukleotiden an bestimmten Positionen (wie beispielsweise bei der Hybridisierungsmethode) ist somit nicht notwendig.1) The gene products can bind to the surface in any arrangement. A previous complex synthesis of different oligonucleotides at certain positions (such as in the hybridization method) is therefore not necessary.
2) Das Material kann auf einer standardisierten Oberfläche analysiert werden.2) The material can be analyzed on a standardized surface.
3) Auch die Expression noch unbekannter Gene kann ermittelt werden, weil alle im Ansatz enthaltenen Genprodukte analysiert werden. Dies ist mit konventionellen DNA-Arrays nicht möglich.3) The expression of still unknown genes can also be determined because all gene products contained in the mixture are analyzed become. This is not possible with conventional DNA arrays.
4) Die große Anzahl der analysierten Moleküle erlaubt auch die Detektion schwach exprimierter Gene.4) The large number of molecules analyzed also allows the detection of poorly expressed genes.
5) Kleinste Mengen an Ausgangsmaterial können eingesetzt werden: mRNA aus einer einzelnen Zelle kann für die Analyse ausreichend sein.5) Smallest amounts of starting material can be used: mRNA from a single cell can be sufficient for the analysis.
6) Sämtliche Schritte des Verfahrens können weitgehend automatisiert werden.6) All steps of the process can be largely automated.
3. Kurze Beschreibung:3. Short description:
Die Erfindung beschreibt ein Verfahren zur parallelen Analyse der Genexpression, bei dem manThe invention describes a method for parallel analysis of gene expression, in which
einzelsträngige Genprodukte bereitstellt, manprovides single-stranded gene products, one
die Genprodukte unter Verwendung eines einheitlichen oder mehrerer unterschiedlicher Primer in Form von Genprodukt- Primer-Komplexen auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, manthe gene products are bound to a reaction surface in a random arrangement using one or more different primers in the form of gene product-primer complexes;
eine zyklische Aufbaureaktion des komplementären Stranges der Genprodukte unter Verwendung einer oder mehrerer Polymerasen durchführt, indem manperform a cyclic assembly reaction of the complementary strand of the gene products using one or more polymerases by
a) zu den auf der Oberfläche gebundenen Genprodukt-Primer- Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, dass sich die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale vonein- ander unterscheiden lassen, wobei die NTs* strukturell an der Base so modifiziert sind, dass die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist, mana) a solution is added to the gene product-primer complexes bound on the surface which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * fluorescent dyes on the NTs * are selected so that the NTs * used differ from one another by measuring different fluorescence signals. differentiate, the NTs * are structurally modified on the base so that the polymerase after installing such an NT * in a growing complementary strand is unable to incorporate another NT * in the same strand, whereby the fluorescent dye is cleavable and the structural modification is a cleavable, sterically demanding ligand, one
b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, manb) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended in each case by one NT * , man
c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktionsoberfläche bestimmt, mand) the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface
e) zur Erzeugung unmarkierter, (NTs oder) Genprodukte die Fluoreszenzfarbstoffe und die sterisch anspruchsvollene) for the generation of unlabelled (NTs or) gene products the fluorescent dyes and the sterically demanding
Liganden von den am komplementären Strang angefügten NTs* abspaltet, manCleaves ligands from the NTs * attached to the complementary strand, man
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz- farbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner Genprodukt-Primer- Komplexe auf der Reaktionsoberfläche und die Sequenz dieser Genprodukte durch spezifische Zuordnung der in Stufe d) in auf- einanderfolgenden Zyklen an den jeweiligen Positionen detek- tierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten Teilsequenzen die Identität der Genprodukte bestimmt .whereby the relative position of individual gene product-primer complexes on the reaction surface and the sequence of these gene products by specific assignment of the in step d) in successive cycles at the respective positions of the detected fluorescence signals to the NTs are determined and the identity of the gene products is determined from the partial sequences determined.
Bei den Genprodukten handelt es sich um die primären Genprodukte der Gene, deren Expression analysiert werden soll. Im wesentlichen handelt es sich dabei um RNA-Transkripte der genannten Gene, welche auch als Target-Sequenzen (oder Target- Nukleinsäuresequenzen) bezeichnet werden. Diese Target- Sequenzen schließen neben mRNA auch davon abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA ein.The gene products are the primary gene products of the genes whose expression is to be analyzed. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to mRNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
Die Genprodukte oder Target-Sequenzen können entweder als mRNAs direkt aus einer biologischen Probe (z.B. Zellextrakt, Gewebeextrakt oder Extrakt von ganzen Organismen) isoliert oder als cDNAs durch reverse Transkription der mRNAs erhalten werden.The gene products or target sequences can either be isolated as mRNAs directly from a biological sample (e.g. cell extract, tissue extract or extract from whole organisms) or obtained as cDNAs by reverse transcription of the mRNAs.
Unter einer hoch parallelen Analyse wird in diesem Zusammenhang die gleichzeitige Sequenzanalyse vieler Genprodukt-Moleküle verstanden (beispielsweise mindestens etwa 100.000, vorzugsweise mindestens etwa 500.000, insbesondere aber mindestens etwa 1.000.000 bis etwa 10.000.000), wobei diese Genprodukt-Moleküle eine komplexe heterogene Population darstellen, die z.B. einem kompletten Expressionsprofil bzw. einem Expressionsspektrum eines Gewebes entspricht.In this context, a highly parallel analysis is understood to mean the simultaneous sequence analysis of many gene product molecules (for example at least approximately 100,000, preferably at least approximately 500,000, but in particular at least approximately 1,000,000 to approximately 10,000,000), these gene product molecules being a complex heterogeneous Represent population, for example corresponds to a complete expression profile or an expression spectrum of a tissue.
Gemäß einer besonderen Ausführungsform der Erfindung kann das Verfahren durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei manAccording to a particular embodiment of the invention, the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
a) in jedem Zyklus nur jeweils ein markiertes NT*, b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oder c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs* einsetzt .a) only one marked NT * in each cycle, b) two differently marked NTs * in each cycle or c) four differently marked NTs * in each cycle starts.
Das Verfahren kann auch durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Identität der Genprodukte durch Vergleich mit den Referenzsequenzen ermittelt .The method can also be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, alternately using two differently labeled NTs * and two unlabeled NTs in the cycles and comparing the identity of the gene products with the reference sequences determined.
Gegenstand der vorliegenden Erfindung sind ferner die in den Figuren 6e, 6f und 6g dargestellten Nukleotide und die entsprechenden markierten Nukleotide, die beispielsweise an die terminale Aminofunktion angeheftete Fluoreszenzfarbstoffe aufweisen, oder die in den Figuren 6h, 6i oder 6j dargestellten markierten Nukleotide.The present invention furthermore relates to the nucleotides shown in FIGS. 6e, 6f and 6g and the corresponding labeled nucleotides, which have, for example, fluorescent dyes attached to the terminal amino function, or the labeled nucleotides shown in FIGS. 6h, 6i or 6j.
Gegenstand der vorliegenden Erfindung ist ferner die Verwendung der in Figuren 6e,6f und 6g dargestellten Nukleotide und der entsprechenden mit einem Fluoreszenzfarbstoff markierten Nukleotide für das erfindungsgemäßen Verfahren.The present invention furthermore relates to the use of the nucleotides shown in FIGS. 6e, 6f and 6g and the corresponding nucleotides marked with a fluorescent dye for the method according to the invention.
Gegenstand der vorliegenden Erfindung ist ferner die Verwendung der an der Base modi izierten NT*s (Beispiele siehe Figuren 6k, 6L und 6m) und der entsprechenden mit einem Fluoreszenzfarbstoff markierten Nukleotide für das erfindungsgemäße Verfahren.The present invention furthermore relates to the use of the NT * s modified on the base (for examples see FIGS. 6k, 6L and 6m) and the corresponding nucleotides marked with a fluorescent dye for the process according to the invention.
Die Methode basiert auf mehreren Prinzipien:The method is based on several principles:
1. Kurze Nukleotidsequenzen (10-50 NTs) enthalten genügend Informationen zur Identifizierung des korrespondierenden Gens, wenn die Gensequenz selbst bereits in einer Datenbank enthalten ist. Eine Sequenz aus beispielsweise 10 NTs kann mehr als 106 verschiedene Kombinationen bilden. Das ist z.B. für die meisten Gene im menschlichen Genom, das nach heutiger Schätzung 32000 Gene enthält, ausreichend. Für Organismen mit weniger Genen kann die Sequenz noch kürzer sein.1. Short nucleotide sequences (10-50 NTs) contain enough information to identify the corresponding gene if the gene sequence itself is already contained in a database. A sequence of, for example, 10 NTs can form more than 10 6 different combinations. This is, for example, for most genes in the human genome, which is currently estimated at 32,000 Contains genes, sufficient. The sequence can be even shorter for organisms with fewer genes.
2. Der Methode liegt ein neues Verfahren zur Sequenzierung einzelner Nükleinsäurekettenmoleküle zugrunde.2. The method is based on a new method for sequencing individual nucleic acid chain molecules.
3. Es können Nukleinsäureketten-Gemische untersucht werden.3. Mixtures of nucleic acid chains can be examined.
4. Die Sequenzierungsreaktion läuft an vielen Molekülen gleich- zeitig ab, wobei die Sequenz jeder einzelnen gebundenen4. The sequencing reaction takes place simultaneously on many molecules, the sequence of each individual being bound
Nukleinsäurekette analysiert wird.Nucleic acid chain is analyzed.
Es ist bekannt, dass zur Untersuchung der Genexpression mRNAs oder von der mRNA abgeleitete Nukleinsäureketten (z.B. einzelsträngige cDNAs, doppelsträngige cDNAs, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA) eingesetzt werden kann. Unabhängig von der genauen Zusammensetzung werden sie im folgenden als Genprodukte bezeichnet. Auch Teilsequenzen dieser Genprodukte werden im folgenden als Genprodukte bezeichnet.It is known that mRNAs or nucleic acid chains derived from the mRNA (e.g. single-stranded cDNAs, double-stranded cDNAs, cDNA-derived RNA or cDNA-amplified DNA) can be used to investigate gene expression. Regardless of the exact composition, they are referred to below as gene products. Partial sequences of these gene products are also referred to below as gene products.
Diese Genprodukte stellen ein Gemisch aus verschiedenen Nukleinsäureketten dar.These gene products are a mixture of different nucleic acid chains.
Als Grundlage der Analyse dient die Synthese eines zum Genprodukt komplementären Stranges.The synthesis is based on the synthesis of a strand that is complementary to the gene product.
Das Ziel der Vorbereitung ist, auf einer planen Oberfläche in zufälliger Weise gebundene Genprodukt-Primer-Komplexe bereitzustellen, an denen der Einbau von NT*s durch die Polymerase stattfinden kann (extensionsfähige Genprodukt- Primer-Komplexe) .The aim of the preparation is to provide gene product-primer complexes which are bound in a random manner on a flat surface and on which the incorporation of NT * s by the polymerase can take place (gene product-primer complexes which can be extended).
Mit diesen gebundenen Genprodukt-Primer-Komplexen wird die Sequenzierungsreaktion durchgeführt .The sequencing reaction is carried out with these bound gene product-primer complexes.
Sie verläuft in mehreren Zyklen. Pro Zyklus wird jeweils nur ein einziges markiertes NT* in den wachsenden Strang eingebaut . Ein Zyklus umfasst folgende Schritte: a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu gebundenen Genprodukt-Primer-Komplexen, b) Inkubation der gebundenen Genprodukt-Primer-Komplexe mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen, d) Detektion der Signale von einzelnen modifizierten, in die neu synthetisierten Stränge eingebauten NTs*-Molekülen, e) Entfernung der Markierung von den eingebauten Nukleotiden, f) Waschen.It runs in several cycles. Only one marked NT * per cycle is installed in the growing strand. A cycle comprises the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to bound gene product-primer complexes, b) incubation of the bound gene product-primer complexes with this solution under conditions which are suitable for extending the complementary strands by one NT, c) washing, d) detection of the signals from individually modified NTs incorporated into the newly synthesized strands * - Molecules, e) removal of the label from the built-in nucleotides, f) washing.
Dieser Zyklus kann mehrmals wiederholt werden, so dass von jedem an der Sequenzierungsreaktion teilnehmenden Genprodukt- Primer-Komplex vorzugsweise 10 bis 50 NTs ermittelt werden. Danach erfolgt die Rekonstruktion der Nukleinsäuresequenzen aus den detektierten Signalen. Die ermittelten Sequenzen der gebundenen Genprodukte werden zur Bestimmung der Abundanzen untereinander verglichen und durch Vergleich mit Gensequenzen in Datenbanken bestimmten Genen zugeordnet.This cycle can be repeated several times, so that preferably 10 to 50 NTs are determined for each gene product-primer complex participating in the sequencing reaction. The nucleic acid sequences are then reconstructed from the detected signals. The determined sequences of the bound gene products are compared with one another to determine the abundances and are assigned to specific genes by comparison with gene sequences in databases.
Diese allgemeinen Prinzipien der Reaktion werden anhand eines Beispiels erklärt (Fig.l):These general principles of the reaction are explained using an example (Fig.l):
Als Ausgangsmaterial dient ein Gemisch aus mRNA-Molekülen (Genprodukte) . Das zu analysierende Material (1) wird auf einer geeigneten planen Oberfläche gebunden (2) . Dabei vermitteln die zuvor auf der Oberfläche gebundenen Oligo-dT-Primer die Bindung von Genprodukten an die Oberfläche. Die Genprodukte werden durch Hybridisierung (Annealing) an die Primer gebunden. Die nicht gebundenen mRNA-Moleküle werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktionsoberfläche durchgeführt, wobei in die extensionsfähigen Genprodukt-Primer-Komlexe markierte NT*s eingebaut werden. Diese Reaktion verläuft zyklisch. Im 1. Schritt des Zyklus wird ein markiertes NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion so gesteuert, dass in jedem Zyklus jeweils nur ein markiertes NT* von einer PolymeraseA mixture of mRNA molecules (gene products) serves as the starting material. The material to be analyzed (1) is bound (2) on a suitable flat surface. The oligo-dT primers previously bound to the surface mediate the binding of gene products to the surface. The gene products are bound to the primers by hybridization (annealing). The unbound mRNA molecules are removed by a washing step. The sequencing reaction is then carried out on the entire reaction surface, with labeled NT * s being incorporated into the gene product-primer complexes which can be extended. This reaction is cyclical. In the 1st step of the cycle, a labeled NT * is built into the growing strand: The reaction is controlled so that only one labeled NT * from a polymerase in each cycle
(Reverse Transcriptase) in den wachsenden Strang eingebaut werden kann. Das wird durch die Verwendung von NTs* erreicht, die eine reversibel gekoppelte, zur Termination führende Gruppe tragen. Der Einbau eines weiteren markierten NT* wird dadurch verhindert. Die Polymerase und die markierten NTs* werden gleichzeitig in die Reaktion eingesetzt (3) . Danach wird das Reaktionsgemisch entfernt und die Oberfläche in geeigneter Art und Weise gewaschen (4) . Nun folgt ein Detektionsschritt (5) . Die Oberfläche wird mit einer für die Einzelmoleküldetektion geeigneten Vorrichtung (bestehend z.B. aus Lichtquelle, Mikroskop, Kamera, Scantisch, Computer mit Steuerungs- und Bild- erkennungs- bzw. Bildverarbeitungssoftware) abgescannt und die Signale der einzelnen, eingebauten markierten NTs* identifiziert. Nach dem Detektionsschritt wird die Markierung und die zur Termination führende Gruppe von allen eingebauten NTs* entfernt (6) . Die Entfernung kann chemisch, physikalisch oder enzymatisch erfolgen. Nach einem sich anschließenden Waschschritt kann ein neuer Zyklus beginnen.(Reverse transcriptase) can be built into the growing strand. This is achieved by using NTs * which carry a reversibly coupled group leading to termination. This prevents the installation of another marked NT * . The polymerase and the labeled NTs * are used simultaneously in the reaction (3). The reaction mixture is then removed and the surface is washed in a suitable manner (4). A detection step (5) now follows. The surface is scanned with a device suitable for single-molecule detection (consisting, for example, of a light source, microscope, camera, scanning table, computer with control and image recognition or image processing software) and the signals of the individual, built-in marked NTs * are identified. After the detection step, the marker and the group leading to the termination are removed from all installed NTs * (6). The removal can take place chemically, physically or enzymatically. After a subsequent washing step, a new cycle can begin.
4. Detaillierte Beschreibung4. Detailed description
4.1 Auswahl des Materials:4.1 Selection of the material:
Genprodukte können von verschiedenen biologischen Objekten stammen, so z.B. von einzelnen Zellen, Zellpopulationen, einem Gewebe oder von kompletten Organismen. Auch biologische Flüssigkeiten wie Blut, Sputum oder Liquor können als Quelle der Genprodukte dienen. Die Methoden zur Gewinnung der Genprodukte aus den verschiedenen biologischen Objekten sind bespielsweise folgenden Literaturquellen zu entnehmen: "Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc..Gene products can come from various biological objects, e.g. of individual cells, cell populations, a tissue or of entire organisms. Biological fluids such as blood, sputum or cerebrospinal fluid can also serve as a source of the gene products. The methods for obtaining the gene products from the various biological objects can be found, for example, in the following literature sources: "Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I. G. Cowell, Humana Press Inc.
Es kann sowohl die Gesamtheit der isolierten Genprodukte als auch ein durch eine Vorselektion ausgewählter Teil davon in dieBoth the entirety of the isolated gene products and a part of them selected by preselection can be included in the
Sequenzierungsreaktion eingesetzt werden. Durch Vorselektion kann man die Menge der zu analysierenden Genprodukte reduzieren. Die Vorselektion kann beispielsweise durch molekularbiologische Verfahren wie z.B. PCR-Amplifikation, Gel- Auftrennung oder Hybridisierung mit anderen Nukleinsäureketten erfolgen ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.) Vorzugsweise wird die Gesamtheit der Genprodukte als Ausgangs- material gewählt.Sequencing reaction can be used. The amount of gene products to be analyzed can be determined by preselection to reduce. The preselection can be carried out, for example, by molecular biological methods such as, for example, PCR amplification, gel separation or hybridization with other nucleic acid chains ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory, "Method in Enzymology" 1999, v303, "cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.) The entirety of the gene products is preferably chosen as the starting material.
4.2 Vorbereitung des Materials:4.2 Preparation of the material:
Ziel der Vorbereitung des Materials ist es, aus dem Ausgangsmaterial an die Oberfläche gebundene, extensionsfähige Genprodukt-Primer-Komplexe zu bilden. Diese haben dann vorzugsweise die in Fig. 2 dargestellte Struktur. Wobei pro Genprodukt maximal nur ein Primer binden sollte.The aim of the preparation of the material is to form extensible gene product-primer complexes bound to the surface from the starting material. These then preferably have the structure shown in FIG. 2. Whereby only a maximum of one primer should bind per gene product.
4.2.1 Primerbindungsstelle (PBS) :4.2.1 Primer binding site (PBS):
Jedes Genprodukt hat vorzugsweise nur eine Primerbindungsstelle. Eine Primerbindungsstelle ist ein Sequenzabschnitt, der eine selektive Bindung des Primers an das Genprodukt ermöglichen soll.Each gene product preferably has only one primer binding site. A primer binding site is a sequence section which is intended to enable selective binding of the primer to the gene product.
Als Primerbindungsstellen können Abschnitte in der Nukleinsäuresequenz dienen, die in den zu analysierenden Sequenzen natürlicherweise vorkommen (z.B. polyA-Strecken in mRNA) . Eine Primerbindungsstelle kann auch zusätzlich in das Genprodukt eingeführt werden (Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.).Sections in the nucleic acid sequence that naturally occur in the sequences to be analyzed can serve as primer binding sites (e.g. polyA stretches in mRNA). A primer binding site can also be introduced into the gene product (Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory," Method in Enzymology "1999, v303," cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc. ).
Aus Gründen der Vereinfachung der Analyse kann es wichtig sein, dass eine möglichst einheitliche Primerbindungsstelle in allen Genprodukten vorhanden ist. Dann können Primer mit einheitlicher Struktur in die Reaktion eingesetzt werden. Die Zusammensetzung der Primerbindungsstelle ist nicht einge- schränkt. Ihre Länge beträgt vorzugsweise zwischen 10 und 100 NTs . Die Primerbindungsstelle kann eine funktioneile Gruppe tragen, beispielsweise zur Bindung des Genprodukts an die Oberfläche. Diese funktionelle Gruppe kann z.B. eine Biotin- oder Digoxigenin-Gruppe sein.In order to simplify the analysis, it may be important to have a primer binding site that is as uniform as possible in all gene products. Then primers with a uniform structure can be used in the reaction. The composition of the primer binding site is not limits. Their length is preferably between 10 and 100 NTs. The primer binding site can carry a functional group, for example to bind the gene product to the surface. This functional group can be, for example, a biotin or digoxigenin group.
Als Beispiel für die Einführung einer Primerbindungsstelle in die Genprodukte wird das Nukleotid-Tailing von antisense cDNA- Fragmenten beschrieben.The nucleotide tailing of antisense cDNA fragments is described as an example of the introduction of a primer binding site into the gene products.
Als erstes werden einzelsträngige cDNAs von mRNAs synthetisiert. Es resultiert eine Population an cDNA-Molekülen, die eine Kopie der mRNA-Population darstellen, sogenannte antisense-cDNA. (Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory , "Method in Enzymology" 1999, v303, "cDNA library protocols" 1997, Ed. I.G. Cowell, Humana Press Inc.). Mit einer terminalen Deoxynucleotidyltransferase kann man mehrere (z.B. zwischen 10 und 20) Nukleosid-monophosphate an das 3 ' -Ende dieser antisense cDNA anknüpfen, z.B. mehrere Adenosin-Monophosphate ((dA)n-Tail genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem Beispiel eines (dT)n-Primers, verwendet ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v.303, S.37-38) (Fig. 3).First, single-stranded cDNAs are synthesized from mRNAs. The result is a population of cDNA molecules that represent a copy of the mRNA population, so-called antisense cDNA. (Molecular cloning "1989, Ed. Maniatis, Cold Spring Harbor Laboratory," Method in Enzymology "1999, v303," cDNA library protocols "1997, Ed. IG Cowell, Humana Press Inc.). With a terminal deoxynucleotide transferase, one can do several ( for example between 10 and 20) attach nucleoside monophosphates to the 3 'end of this antisense cDNA, for example several adenosine monophosphates (called ((dA) n-tail). The resulting fragment is used to bind the primer, in this example one (dT ) n-primers used ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v.303, pp. 37-38) (Fig. 3).
4.2.2 Primer für die Sequenzierungsreaktion4.2.2 Primers for the sequencing reaction
Dieser hat die Funktion, den Start an einer einzigen Stelle des Genprodukts zu ermöglichen. Vorzugsweise bindet er an die Primerbindungsstelle im Genprodukt. Die Zusammensetzung und die Länge des Primers sind nicht eingeschränkt. Außer der Startfunktion kann der Primer auch andere Funktionen übernehmen, wie z.B. eine Verbindung der Genprodukt-Primer- Komlexe zur Reaktionsoberfläche zu schaffen. Primer sollten so an die Länge und Zusammensetzung der Primerbindungsstelle angepaßt werden, dass der Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase ermöglicht. Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine funktioneile Gruppe tragen, die beispielsweise zur Bindung des Primers an die Oberfläche dient, beispielsweise ist eine 5 solche funktioneile Gruppe eine Biotingruppe (s. Abschnitt Immobilisierung) . Sie soll die Sequenzierung nicht stören. Die Synthese eines solchen Primers kann z.B. mit dem DNA- Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter, 10 z.B. MWG-Biotech GmbH, Deutschland, erstellt werden.This has the function of making it possible to start at a single point in the gene product. It preferably binds to the primer binding site in the gene product. The composition and the length of the primer are not restricted. In addition to the start function, the primer can also perform other functions, such as creating a connection between the gene product-primer complexes and the reaction surface. Primers should be adapted to the length and composition of the primer binding site so that the primer enables the sequencing reaction to be started with the respective polymerase. The length of the primer is preferably between 6 and 100 NTs, optimally between 15 and 30 NTs. The primer can carry a functional group which is used, for example, to bind the primer to the surface, for example such a functional group is a biotin group (see section Immobilization). It should not interfere with sequencing. The synthesis of such a primer can be carried out, for example, using the 380 A Applied Biosystems DNA synthesizer, or else as a custom synthesis from a commercial supplier, 10 for example MWG-Biotech GmbH, Germany.
Es können auch unterschiedliche Primer verwendet werden, ein definierter Primersatz, oder ein Primergemiseh.Different primers can also be used, a defined primer set, or a primer mixture.
15 Der Primer kann vor der Hybridisierung an die zu analysierenden Fragmente auf der Oberfläche mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert werden beispielsweise nach (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al . US Patent 5981734,15 Before priming, the primer can be fixed to the fragments to be analyzed on the surface using various techniques or synthesized directly on the surface, for example according to (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734,
20 "Microarray biochip technology" 2000 M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v.285 S.767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al. NAR 1987 v.15 S.5353, Gingeras et al. NAR 1987 v.15 S.5373, Maskos et al. NAR20 "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v.285 p.767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 p.3142, Ghosh et al. NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR
25 1992 V.20 S.1679) .25 1992 V.20 p.1679).
Die Primer werden auf der Oberfläche in einer Dichte zwischen 10 bis 100 pro 100 μm2, 100 bis 10.000 pro 100 μm , 10.000 bis 1.000.000 pro lOOμm2 oder größer als 1.000.000 pro 100 μm2 30 gebunden.The primers are bound on the surface in a density between 10 to 100 per 100 μm 2 , 100 to 10,000 per 100 μm, 10,000 to 1,000,000 per 100 μm 2 or greater than 1,000,000 per 100 μm 2 30.
Der Primer oder das Primergemisch wird mit Genprodukten unter Hybridisierungsbedingungen inkubiert, die ihn selektiv an die Primerbindungsstelle jedes Genprodukts binden lassen. Diese 35 Primer-Hybridisierung (Annealing) kann vor (1) , während (2) oder nach (3) der Bindung der Genprodukte an die Oberfläche erfolgen. Falls Genprodukte als doppelsträngige Nukleinsäuren vorliegen, werden sie vor der Hybridisierung durch Hitze denaturiert ("Molecular cloning" 1989 J.Sambrook et al. Cold Spring Harbor Laborotary Press) . Die Optimierung der Hybridisierungsbedingungen hängt von der genauen Struktur der Primerbindungsstelle und des Primers ab und läßt sich nach Rychlik et al. (NAR 1990 v.18 S.6409) berechnen. Im folgenden werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen bezeichnet .The primer or mixture of primers is incubated with gene products under hybridization conditions that selectively bind it to the primer binding site of each gene product. This primer hybridization (annealing) can take place before (1), during (2) or after (3) the binding of the gene products to the surface. If gene products as double-stranded nucleic acids are present, they are denatured by heat before hybridization ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). The optimization of the hybridization conditions depends on the exact structure of the primer binding site and the primer and can be done according to Rychlik et al. (NAR 1990 v.18 p.6409). In the following, these hybridization conditions are referred to as standardized hybridization conditions.
Falls das Ausgangsmaterial eine poly-A-Strecke oder eine poly- dA-Strecke aufweist (z.B. mRNA, sense cDNA oder antisense-cDNA mit (dA)n-Tail) kann man einen oligo-dT-Primer verwenden. Es kann allerdings auch ein Primergemisch bestehend aus 12 verschiedenen Primern mit folgender allgemeiner Struktur 5'(K)nMN3' verwendet werden. Wobei (n) zwischen 10 und 50 liegt, vorzugsweise zwischen 20 und 30. "K" steht für dT oder du, "M" und "N" stehen jeweils für dA, dT oder du, dC, dGIf the starting material has a poly-A stretch or a poly-dA stretch (for example mRNA, sense cDNA or antisense cDNA with (dA) n -Tail), an oligo-dT primer can be used. However, a primer mixture consisting of 12 different primers with the following general structure 5 '(K) n MN3' can also be used. Where (n) is between 10 and 50, preferably between 20 and 30. "K" stands for dT or you, "M" and "N" each stand for dA, dT or du, dC, dG
( z .B .5 -dTdTdTdTdTdTdTdTdTdT10dTdTdTdTdTdTdTdTdTdT20dAdG-3 " ) . Ein solches Primergemisch ermöglicht einen exakten Start der Sequenzierungsreaktion am Ende der polyA-Strecke oder der poly- dA-Strecke (geankerter Primer) .(eg .5 -dTdTdTdTdTdTdTdTdTdT 10 dTdTdTdTdTdTdTdTdTdT 20 dAdG-3 "). Such a primer mixture enables an exact start of the sequencing reaction at the end of the polyA segment or the poly-dA segment (anchored primer).
4.2.3 Fixierung von Genprodukt-Primer-Komplexen an die Oberfläche (Bindung bzw. Immobilisierung von Genprodukten) .4.2.3 Fixation of gene product-primer complexes to the surface (binding or immobilization of gene products).
Ziel der Fixierung (Bindung, Immobilisierung) ist es, Genprodukt-Primer-Komplexe auf einer geeigneten planen Oberfläche in einer Art und Weise zu fixieren, dass eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Dies kann beispielsweise durch Bindung des Primers (s.o.) oder des Genprodukts an die Oberfläche erfolgen.The aim of the fixation (binding, immobilization) is to fix gene product-primer complexes on a suitable flat surface in such a way that a cyclic enzymatic sequencing reaction can take place. This can be done, for example, by binding the primer (see above) or the gene product to the surface.
Die Reihenfolge der Schritte bei der Bindung von Genprodukt- Primer-Komplexen kann variabel sein: 1) Die Genprodukt-Primer-Komplexe können zunächst in einer Lösung durch Hybridisierung (Annealing) gebildet und anschließend an die Oberfläche gebunden werden. 2) Primer können zunächst auf einer Oberfläche gebunden werden und Genprodukte anschließend an die gebundenen Primer hybridisiert werden, wobei Genprodukt-Primer-Komplexe entstehen (Genprodukte indirekt an die Oberfläche gebunden) 3) Die Genprodukte können zunächst an die Oberfläche gebunden werden (Genprodukte direkt an die Oberfläche gebunden) und im anschließenden Schritt die Primer an die gebundenen Genprodukte hybridisiert werden, wobei Genprodukt-Primer- Komplexe entstehen. Die Immobilisierung der Genprodukte an die Oberfläche kann daher durch direkte oder indirekte Bindung erfolgen.The order of the steps in the binding of gene product-primer complexes can be variable: 1) The gene product-primer complexes can first be formed in a solution by hybridization (annealing) and then bound to the surface. 2) Primers can first be bound to a surface and gene products can then be hybridized to the bound primers, producing gene product-primer complexes (gene products indirectly bound to the surface) 3) The gene products can first be bound to the surface (gene products directly the surface bound) and in the subsequent step the primers are hybridized to the bound gene products, producing gene product-primer complexes. The gene products can therefore be immobilized on the surface by direct or indirect binding.
Oberfläche und Reaktionsoberfläche sind in dieser Anmeldung als gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient die Oberfläche einer festen Phase eines beliebigen Materials . Dieses Material ist vorzugsweise enzymatischen Reaktionen gegenüber inert und verursacht keine Störungen der Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole) , Metall (Gold, Silber, oder Aluminium) oder beliebiges anderes Material, das diesen funktionalen Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung der Signale bei der wiederholten Detektion zu rechnen.In this application, the surface and the reaction surface are to be understood as equivalent terms, unless explicitly referred to another meaning. The surface of a solid phase of any material serves as the reaction surface. This material is preferably inert towards enzymatic reactions and does not cause any interference with the detection. Silicon, glass, ceramics, plastics (e.g. polycarbonates or polystyrenes), metal (gold, silver, or aluminum) or any other material that meets these functional requirements can be used. The surface is preferably not deformable, since otherwise the signals are likely to be distorted upon repeated detection.
Falls eine gelartige feste Phase (Oberfläche eines Gels) verwendet wird, so kann dieses Gel z.B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da frei passierbarIf a gel-like solid phase (surface of a gel) is used, this gel can e.g. be an agarose or polyacrylamide gel. The gel is preferably freely passable for molecules with a molecular mass below 5000 Da
(beispielsweise kann ein 1 bis 2% Agarose-Gel oder 5 bis 15%(for example, 1 to 2% agarose gel or 5 to 15%
Polyacrylamid Gel verwendet werden) . Eine solche Geloberfläche hat anderen festen Oberflächen gegenüber den Vorteil, dass es zu einer wesentlich geringeren unspezifischen Bindung von NT*s an die Oberfläche kommt. Durch die Bindung der Genprodukt- Primer-Komplexe auf der Oberfläche ist die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die Signale von freien NTs* werden nicht detektiert, weil sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das Gel ist vorzugsweise auf einer festen Unterlage befestigt (Fig. 4) . Diese feste Unterlage kann Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate oder Polystyrole), Metall (Gold, Silber, oder Aluminium) oder beliebiges anderes Material sein.Polyacrylamide gel can be used). Such a gel surface has the advantage over other solid surfaces that there is a significantly lower non-specific binding of NT * s to the surface. By binding the gene product-primer complexes on the surface, the detection of the fluorescence signals from built-in NTs * is possible. The signals from Free NTs * are not detected because they do not bind to the material of the gel and are therefore not immobilized. The gel is preferably attached to a solid surface (Fig. 4). This solid base can be silicone, glass, ceramic, plastic (for example polycarbonate or polystyrene), metal (gold, silver or aluminum) or any other material.
Die Dicke des Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke ist jedoch vorzugsweise größer als die einfache Tiefenschärfe des Objektivs, damit unspezifisch an die feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen und damit detektiert werden. Wenn die Tiefenschärfe z.B. 0,3 μm beträgt, so liegt die Geldicke vorzugsweise zwischen 1 μm und 100 μm. Die Oberfläche kann als eine kontinuierliche Oberfläche oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen (z.B. Agarose-Kugelchen) zusammengesetzte Oberfläche hergestellt werden (Fig. 4 a,b) . Die Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl der Genprodukte bei entsprechender Dichte binden zu können. Die Reaktions- oberflache sollte vorzugsweise nicht größer als 20 cm2 sein.The thickness of the gel is preferably not more than 0.1 mm. However, the gel thickness is preferably greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not reach the focal plane and are therefore detected. If the depth of focus is 0.3 μm, for example, the gel thickness is preferably between 1 μm and 100 μm. The surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (for example agarose balls) (FIG. 4 a, b). The reaction surface must be large enough to be able to bind the necessary number of gene products with the appropriate density. The reaction surface should preferably not be larger than 20 cm 2 .
Die verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen Reaktionslösungen über der Oberfläche. Die Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktionsgefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchflußvorrichtung ermöglicht einen Austausch der Lösungen im Reaktionsgefäß. Der Austausch kann mit einer durch einen Computer gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei ist, dass die Oberfläche nicht austrocknet. Vorzugsweise beträgt das Volumen des Reaktionsgefäßes weniger als 50 μl. Idealerweise beträgt sein Volumen weniger als 1 μl. Ein Beispiel eines solchen Duchflußsystems ist in Fig. 5 gegeben.The different cycle steps require an exchange of the different reaction solutions above the surface. The reaction surface is preferably part of a reaction vessel. The reaction vessel is in turn preferably part of a reaction apparatus with a flow device. The flow device enables the solutions in the reaction vessel to be exchanged. The exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out. The volume of the reaction vessel is preferably less than 50 μl. Ideally, its volume is less than 1 μl. An example of such a flow system is given in FIG. 5.
Falls die Fixierung der Genprodukt-Primer-Komplexe auf der Oberfläche über die Genprodukte erfolgt, kann dies beispielsweise durch die Bindung der Genprodukte an einem der beiden Ketten-Enden erfolgen. Dies kann durch entsprechende kovalente, affine oder andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall et al. US Patent 5412087, Nikiforov et al . US 5 Patent 5610287, Barrett et al . US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M.Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v.198, S.138, Allemand et al . Biophysical JournalIf the gene product-primer complexes are fixed on the surface via the gene products, this can be done, for example, by binding the gene products to one of the both chain ends. This can be achieved by appropriate covalent, affine or other bonds. Many examples of immobilization of nucleic acids are known (McGall et al. US Patent 5412087, Nikiforov et al. US 5 Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v.198, p.138, Allemand et al. Biophysical Journal
10 1997, v.73, S.2064, Trabesinger et al . Analytical Chemistry 1999, v.71, S.279, Osborne et al . Analytical Chemistry 2000, v.72, S.3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 S.3142, Ghosh et al . NAR 1987 v.15 S.5353, Gingeras et al . NAR 1987 v.15 S.5373, Maskos et al . NAR 1992 v.20 S.1679). Die10 1997, v.73, p.2064, Trabesinger et al. Analytical Chemistry 1999, v.71, p.279, Osborne et al. Analytical Chemistry 2000, v.72, p.3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.24 p.3142, Ghosh et al. NAR 1987 v.15 p.5353, Gingeras et al. NAR 1987 v.15 p.5373, Maskos et al. NAR 1992 v.20 p.1679). The
15 Fixierung kann auch durch eine unspezifische Bindung, wie z.B. durch Austrocknung der Genprodukte enthaltenden Probe auf der planen Oberfläche erreicht werden. Die Genprodukte werden auf der Oberfläche in einer Dichte zwischen 10 und 100 pro 100 μm2, 100 bis 10.000 pro 100 μm2, 10.000 bis 1000.000 pro lOOμ 2 15 Fixation can also be achieved by non-specific binding, for example by drying out the sample containing gene products on the flat surface. The gene products are on the surface in a density between 10 and 100 per 100 μm 2 , 100 to 10,000 per 100 μm 2 , 10,000 to 1000,000 per 100 μm 2
20 gebunden.20 bound.
Die für die Detektion notwendige Dichte von extensionsfähigen Genprodukt-Primer-Komplexen beträgt ca. 10 bis 100 pro 100 μm2. Sie kann vor, während oder nach der Hybridisierung der Primer 5 an die Genprodukte erreicht werden.The density of extensible gene product-primer complexes required for the detection is approx. 10 to 100 per 100 μm 2 . It can be achieved before, during or after the hybridization of primer 5 to the gene products.
Beispielhaft werden im folgenden einige Methoden zur Bindung näher dargestellt :Some binding methods are described in more detail below:
In einer Ausführungsform erfolgt die Bindung der Genprodukt- 0 Primer-Komplexe über Biotin-Avidin oder Biotin-Streptavidin- Bindung. Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent gebunden, das 5 ' -Ende des Primers ist mit Biotin modifiziert. Nach der Hybridisierung der modifizierten Primer mit den Genprodukten (in Lösung) werden diese auf der mit Avi- 5 din/Streptavidin beschichteten Oberfläche fixiert. Die Konzentration der mit Biotin markierten Genprodukt-Primer-Komplexe sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird so gewählt, dass eine für die Sequenzierung geeignete Dichte erreicht wird.In one embodiment, the binding of the gene product 0 primer complexes takes place via biotin-avidin or biotin-streptavidin binding. Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer is modified with biotin. After the modified primers have hybridized with the gene products (in solution), they are fixed on the surface coated with avidin / streptavidin. The concentration of the gene product-primer complexes labeled with biotin and the time of incubation of this solution with the surface is chosen so that a density suitable for sequencing is achieved.
In einer anderen Ausführungsform werden die für die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungsreaktion auf der Oberfläche mit geeigneten Methoden fixiert (s.o.). Die einzelsträngigen Genprodukte mit jeweils einer Primerbindungsstelle pro Genproduktmolekül werden damit unter Hybridisierungsbedingungen inkubiert (Annealing) . Dabei binden sie an die fixierten Primer und werden dadurch an die Oberfläche gebunden (indirekte Bindung) . Die Konzentration der einzelsträngigen Genprodukte und die Hybridisierungsparameter (z.B. Temperatur, Zeit, Puffer) werden so gewählt, dass man eine für die Sequenzierung geeignete Dichte von ca. 10 bis 100 extensionsfähigen Genprodukt-Primer- Komplexen pro 100 μm2 erreicht. Nach der Hybridisierung werden ungebundene Genprodukte durch einen Waschschritt entfernt. Bei dieser Ausführungsform wird eine Oberfläche mit einer hohen Primerdichte bevorzugt, z.B. ca. 1.000.000 Primer pro lOOμrn2 oder noch höher, da die gewünschte Dichte an Genprodukt-Primer- Komplexen schneller erreicht wird, wobei die Genprodukte nur an einen Teil der Primer binden.In another embodiment, the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above). The single-stranded gene products, each with one primer binding site per gene product molecule, are thus incubated under hybridization conditions (annealing). They bind to the fixed primers and are thus bound to the surface (indirect binding). The concentration of the single-stranded gene products and the hybridization parameters (eg temperature, time, buffer) are chosen so that a density of approximately 10 to 100 gene product-primer complexes capable of extension per 100 μm 2 is achieved, which is suitable for sequencing. After hybridization, unbound gene products are removed by a washing step. In this embodiment, a surface with a high primer density is preferred, for example approximately 1,000,000 primers per 100 μm 2 or even higher, since the desired density of gene product-primer complexes is reached more quickly, the gene products binding only to a part of the primers ,
In einer anderen Ausführungsform werden die Genprodukte an die Oberfläche direkt gebunden (s.o.) und anschließend mit Primern unter Hybridisierungsbedingungen inkubiert. Bei einer Dichte von ca. 10 bis 100 Genprodukte pro lOOμrn2 wird man versuchen alle verfügbaren Genprodukte mit einem Primer zu versehen und für die Sequenzierugnsreaktion verfügbar zu machen. Dies kann durch hohe Primerkonzentration beispielsweise 1 bis 100 mmol/1 erreicht werden. Bei einer höheren Dichte der fixiertenIn another embodiment, the gene products are bound directly to the surface (see above) and then incubated with primers under hybridization conditions. At a density of approx. 10 to 100 gene products per 100 μm 2 , attempts will be made to provide all available gene products with a primer and to make them available for the sequencing reaction. This can be achieved by high primer concentration, for example 1 to 100 mmol / 1. At a higher density the fixed
Genprodukte auf der Oberfläche, beispielsweise 10.000 bisGene products on the surface, for example 10,000 to
1.000.000 pro lOOμm2, kann die für die optische Detektion notwendige Dichte der Genprodukt-Primer-Komplexe während der Primer-Hybridisierung erreicht werden. Dabei sind die1,000,000 per 100 μm 2 , the density of the gene product-primer complexes required for optical detection can be achieved during the primer hybridization. Here are the
Hybridisierungsbedingungen (z.B. Temperatur, Zeit, Puffer,Hybridization conditions (e.g. temperature, time, buffer,
Primerkonzentratin) so zu wählen, dass die Primer nur an einen Teil der immobilisierten Genprodukte binden, s. Beispiel 5. Falls die Oberfläche einer festen Phase (z.B. Silikon oder Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen für eine Blockierlδsung erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert zwischen 8 und 10.Primer concentrate) so that the primers are only Bind part of the immobilized gene products, see Example 5. If the surface of a solid phase (eg silicone or glass) is used for immobilization, a blocking solution is preferably applied to the surface before step (a) in each cycle, in order to avoid non-specific adsorption of NTs * on the surface serves. An albumin solution (BSA) with a pH between 8 and 10, for example, fulfills these conditions for a blocking solution.
4.3 Wahl der Polymerase4.3 Choice of polymerase
Bei der Wahl der Polymerase spielt die Art der verwendeten immobilisierten Nukleinsäure (RNA oder DNA) eine entscheidende Rolle:The type of immobilized nucleic acid (RNA or DNA) used plays a decisive role in the choice of polymerase:
Falls RNA als Genprodukt (z.B. mRNA) in die Sequenzierungs- reaktion eingesetzt wird, können handelsübliche RNA-abhängige DNA-Polymerasen eingesetzt werden, z.B. AMV-Reverse Transcriptase (Sig a) , M-MLV Reverse Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNAse-Aktivität. Alle Reverse Transcriptasen müssen von RNAse-Aktivität weitgehend frei sein ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory) .If RNA is used as a gene product (e.g. mRNA) in the sequencing reaction, commercially available RNA-dependent DNA polymerases can be used, e.g. AMV reverse transcriptase (Sig a), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNAse activity. All reverse transcriptases must be largely free of RNAse activity ("Molecular cloning" 1989, Ed. Maniatis, Cold Spring Harbor Laboratory).
Falls DNA als Genprodukt (z.B. cDNA) verwendet wird, eignen sich als Polymerasen prinzipiell alle DNA-abhängigen DNA- Polymerasen ohne 3' -5' Exonuklease-Aktivität (DNA-Replication" 1992 Ed. A.Kornberg, Freeman and Company NY) , z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia Biotech), Klenow Fragment der DNA-Polymerase I ohne 3' -5' Exonukleaseaktivität (Amersham Pharmacia Biotech) , Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M. , CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile Polymerasen wie beispielsweise Taq- Polymerase (GibcoBRL) , proHA-DNA-Polymerase (Eurogentec) . 4.4 NukleotidstrukturIf DNA is used as a gene product (eg cDNA), in principle all DNA-dependent DNA polymerases without 3 '-5' exonuclease activity (DNA replication "1992 Ed. A. Kornberg, Freeman and Company NY) are suitable as polymerases, eg modified T7 polymerase of the type "Sequenase Version 2" (Amersham Pharmacia Biotech), Klenow fragment of DNA polymerase I without 3 '-5' exonuclease activity (Amersham Pharmacia Biotech), polymerase beta of various origins (Animal Cell DNA Polymerases "1983, Fry M., CRC Press Inc., commercially available from Chimerx) thermostable polymerases such as Taq polymerase (GibcoBRL), proHA DNA polymerase (Eurogentec). 4.4 Nucleotide structure
4.4.1 Allgemeines Prinzip4.4.1 General principle
Für die hoch parallele Genexpressionsanalyse mit einzelnen Molekülen (parallele Sequenzanalyse von bis zu 10.000.000 Genproduktmolekülen) ist wichtig, dass jedes eingebaute NT* während der Sequezierungsreaktion identifiziert wird. Eine Voraussetzung dafür ist, dass nur ein einziges NT* pro Zyklus in die Nukleinsäurekette eingebaut wird. Falls eine Polymerase mehrere NTs* nacheinander im selben Zyklus einbaut, so führt dies zu einem Fehler in der Sequenzermittlung. Aus diesem Grund muß man den Einbau der NTs* steuern.For highly parallel gene expression analysis with individual molecules (parallel sequence analysis of up to 10,000,000 gene product molecules), it is important that each NT * that is incorporated is identified during the sequencing reaction. A prerequisite for this is that only one NT * is integrated into the nucleic acid chain per cycle. If a polymerase incorporates several NTs * in succession in the same cycle, this leads to an error in the sequence determination. For this reason you have to control the installation of the NTs * .
Beispielsweise wurden in der BASS-Methode reversible 3 ' -OH modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v.18 S.1021, Metzker et al . NAR 1994, v.22, S.4259, Welch et al . Nucleosides & Nucleotides 1999, v.18, S.197). Die Spaltung soll dabei unter milden Bedingungen photochemisch (Dower US Patent 5.547.839, Welch et al .For example, reversible 3'-OH modified NTs have been described in the BASS method (Dower US Patent 5,547,839, Canard et al. US Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v.18 p.1021, Metzker et al. NAR 1994, v.22, p.4259, Welch et al. Nucleosides & Nucleotides 1999, v.18, p.197). The cleavage is said to be photochemical under mild conditions (Dower US Patent 5,547,839, Welch et al.
Nucleosides & Nucleotides 1999, v.18, S.197) oder chemischNucleosides & Nucleotides 1999, v.18, p.197) or chemically
(Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides &(Canard et al. U.S. Patent 5,798,210, Rasolonjatovo Nucleosides &
Nucleotides 1999, v.18 S.1021) erfolgen. Bei dieser Methode wird eine große Anzahl gleicher einzelsträngiger DNA-Stücke an einem definierten Ort auf einer Oberfläche fixiert und das Signal von der Gesamtheit dieser vielen identischen DNA-Stücke analysiert. Zu dieser fixierten DNA wird eine Lösung mit Polymerase und Nukleotiden zugegeben, so dass ein komplementärer Strang synthetisiert werden kann. Dabei soll die Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein einziges Nukleotid eingebaut. Dieses wird detektiert, worauf die Polymerase in einem nächsten Zyklus das nächste Nukleotid einbaut. Bei dieser Methode wurden an der 3^-OH-Gruppe der Deoxyribose modifizierte Nukeotide verwendet.Nucleotides 1999, v.18 p.1021). With this method, a large number of identical single-stranded DNA pieces are fixed at a defined location on a surface and the signal from all of these many identical DNA pieces is analyzed. A solution with polymerase and nucleotides is added to this fixed DNA so that a complementary strand can be synthesized. The polymerase should work step by step: only one nucleotide is incorporated in each step. This is detected, whereupon the polymerase incorporates the next nucleotide in a next cycle. In this method, modified nukeotides were used on the 3 ^ -OH group of the deoxyribose.
Trotz des Gelingens einiger einzelner Schritte dieser Methode wurde sie nicht zu einem funktionsfähigen Verfahren entwickelt. Dies kann beispielsweise auf folgenden Tatsachen beruhen: Beim Aufbau der komplementären Stränge tritt sehr schnell eine Desynchronisation der Synthese auf, so dass bei jedem Schritt die Fehler akkumulieren. Deshalb können nur sehr kurze Fragmente sequenziert werden. Es ist zu betonen, dass alle beschriebenen BASS-Methoden nicht auf der Detektion von einzelnen Molekülen beruhen. Das Signal wird stattdessen von einer großen Anzahl identischer an einem definierten Ort immobilisierter Moleküle registriert. Die in diesen Methoden übliche Verwendung der Begriffe "einzelne Moleküle" und "Moleküle" zielt dabei nicht auf individuelle, voneinander getrennte Moleküle, sondern auf eine Population, die aus vielen identischen Molekülen besteht. Identisch heißt in diesem Fall, dass die Moleküle die gleiche Sequenz haben.Despite the success of some of the steps in this method it was not developed into a functional process. This can be based, for example, on the following facts: When the complementary strands are built up, the synthesis is desynchronized very quickly, so that the errors accumulate with each step. Therefore only very short fragments can be sequenced. It should be emphasized that all BASS methods described are not based on the detection of individual molecules. Instead, the signal is registered by a large number of identical molecules immobilized at a defined location. The customary use of the terms “individual molecules” and “molecules” in these methods does not aim at individual, separate molecules, but at a population consisting of many identical molecules. In this case, identical means that the molecules have the same sequence.
Ein weiteres Problem stellen die an 3"-Position modifizierten Nukleotide dar.Another problem is the modified nucleotides at the 3 "position.
Die Synthese der 3 ' -OH-modifizierten photochemisch spaltbaren NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter- schiedliche Affinität zu diesen Nukleotidanalogen auf, so dass die Nukleinsäuresynthese sehr ungleichmäßig bzw. an vielen DNA- Stellen gar nicht abläuft (Metzker et al. NAR 1994 v.22 S.4259, Welch et al. Nucleosides & Nucleotides 1999, v.18 S.197). Aus diesem Grund eignen sich diese Analoga nicht oder nur sehr eingeschränkt für die Sequenzierungsreaktion. Eine spaltbare 3 ' -Ester-Verknüpfung (Canard et al. US Patent 5.798.210) kommt als Grundlage für eine reversible Termination der Synthese auch nicht in Betracht. Die meisten Polymerasen spalten bei Verfügbarkeit eines nächsten komplementären NT 3 ' -OH-Ester- Verbindungen, so dass die an die 3 ' -OH-Gruppe gebundene Markierung in die Lösung freigesetzt wird und nicht mehr als Terminator wirken kann (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v.18 S.1021, Canard et al. PNAS 1995 v.92 S.10859). In Positionen, an denen eine Polymerase mehrere gleiche NTs* nacheinander einbauen kann, führt das zu einem fehlerhaften Signal. Im Abschlußbericht des BMBF- Verbundsprojekts „Sequenzierung mit Multiplexfarbstoffen und Kapillarelektrophorese" G. Sagner, 1999, wurde berichtet, dass Modifikationen der 3 '-Position von Nukleotiden zur Aufhebung ihrer Substrateigenschaften für Polymerasen geführt haben.The synthesis of the 3 'OH-modified photochemically cleavable NTs * is very complex. The polymerases have a very different affinity for these nucleotide analogs, so that nucleic acid synthesis is very uneven or does not take place at many DNA sites (Metzker et al. NAR 1994 v.22 p.4259, Welch et al. Nucleosides & Nucleotides 1999, v.18 p.197). For this reason, these analogs are not suitable for the sequencing reaction or only to a very limited extent. A cleavable 3 'ester linkage (Canard et al. US Patent 5,798,210) is also not considered as the basis for a reversible termination of the synthesis. Most polymerases cleave when a next complementary NT 3 'OH ester compound is available, so that the label bound to the 3' OH group is released into the solution and can no longer act as a terminator (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v.18 p.1021, Canard et al. PNAS 1995 v.92 p.10859). In positions where a polymerase can insert several identical NTs * one after the other, this leads to an incorrect signal. In the final report of the BMBF joint project "Sequencing with Multiplex Dyes and Capillary electrophoresis "G. Sagner, 1999, reported that modifications to the 3 'position of nucleotides led to the abolition of their substrate properties for polymerases.
5 Die Schwierigkeiten bei der Entwicklung passender NT-Analoga für das Verfahren basieren auf folgenden Rahmenbedingungen: l)Die Reaktion muss so gesteuert werden, dass die Polymerase NT*s einzeln einbaut (Stop des weiteren Einbaus) . 2)NT*s müssen einen Farbstoff tragen, der den Anforderungen der 10 Detektion genügt. 3) Der Farbstoff muß unter milden Bedingungen abspaltbar sein, so dass weder die Genprodukt-Primer-Komplexe, noch einzelne5 The difficulties in developing suitable NT analogues for the process are based on the following general conditions: l) The reaction must be controlled in such a way that the polymerase incorporates NT * s individually (stop further installation). 2) NT * s must wear a dye that meets the requirements of detection. 3) The dye must be cleavable under mild conditions, so that neither the gene product-primer complexes nor individual
Komponenten des Systems beschädigt werden. 4) Die Abspaltung muss möglichst schnell und quantitativ erfolgen. 5.)5Der Stop des Einbaus muss reversibel sein und unter mildenComponents of the system are damaged. 4) The spin-off must take place as quickly and quantitatively. 5.) 5The stop of the installation must be reversible and under mild
Bedingungen aufgehoben werden können.Conditions can be lifted.
Bis jetzt wurde keine praktisch brauchbare Lösung für diese Probleme in der einschlägigen Literatur vorgestellt .So far, no practical solution to these problems has been presented in the relevant literature.
2020
Durch die vorliegende Erfindung werden nunmehr die im Stand der Technik bekannten Probleme erstmals gelöst. Erfindungsgemäß werden für die Sequenzierung NTs* mit einer sterisch anspruchsvollen Gruppe an der Base verwendet.The problems known in the prior art are now solved for the first time by the present invention. According to the invention, NTs * with a sterically demanding group on the base are used for sequencing.
2525
Eine an die Base gekoppelte sterisch anspruchsvolle Gruppe kann zur Behinderung der weiteren Synthese führen, wobei diese Behinderung in der Fachliteratur als unerwünschte Eigenschaft modifizierter NTs bei der Markierung von NukleinsäurenA sterically demanding group coupled to the base can lead to the hindrance of further synthesis, this hindrance in the specialist literature as an undesirable property of modified NTs in the labeling of nucleic acids
30 angesehen wurde. Biotin, Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine und Cy3-Farbstoff stellen30 was viewed. Biotin, digoxigenin and fluorescent dyes such as fluorescein, tetramethylrhodamine and Cy3 dye
Beispiele einer solchen sterisch anspruchsvollen Gruppe darExamples of such a sterically demanding group
(Zhu et al. Cytometry 1997, v.28, S.206, Zhu et al. NAR 1994, v.22, S.3418, Gebeyehu et al., NAR 1987, v.15, S.4513, Wiemann(Zhu et al. Cytometry 1997, v.28, p.206, Zhu et al. NAR 1994, v.22, p.3418, Gebeyehu et al., NAR 1987, v.15, p.4513, Wiemann
35 et al. Analytical Biochemistry 1996, v.234, S.166, Heer et al . BioTechniques 1994 v.16 S.54). Bei der Sequenzierungsreaktion im erfindungsgemäßen Verfahren werden markierte NTs* mit einer Polymerase und Nukleinsäureket- ten inkubiert. Die NTs* tragen dabei eine an die Base reversibel gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions- gemisch, das nur modifizierte NTs* enthält, in der Reaktion eingesetzt wird, dann kann die Polymerase nur ein einziges NT* einbauen. Der Einbau eines nächsten NT* wird sterisch gehemmt. Diese NTs* treten somit als Terminatoren der Synthese auf. Nach der Entfernung der sterisch anspruchsvollen Gruppe kann das nächste komplementäre NT* eingebaut werden. Weil diese NTs* kein absolutes Hindernis zur weiteren Synthese darstellen, sondern nur für den Einbau eines weiteren markierten NT*, werden sie als Semiterminatoren bezeichnet.35 et al. Analytical Biochemistry 1996, v.234, p.166, Heer et al. BioTechniques 1994 v.16 p.54). In the sequencing reaction in the method according to the invention, labeled NTs * are incubated with a polymerase and nucleic acid chains. The NTs * carry a sterically demanding group that is reversibly coupled to the base. If a reaction mixture containing only modified NTs * is used in the reaction, the polymerase can only incorporate a single NT * . The installation of a next NT * is sterically inhibited. These NTs * thus act as terminators of the synthesis. After removing the sterically demanding group, the next complementary NT * can be installed. Because these NTs * do not represent an absolute obstacle to further synthesis, but only for the installation of another marked NT * , they are called semiterminators.
4.4.2 Allgemeine Struktur des NT* 4.4.2 General structure of the NT *
Ihre gemeinsamen Merkmale sind in Fig. 6a,b,d dargestellt. Diese Struktur ist dadurch charakterisiert, dass an der Base über einen spaltbaren Linker (A-E) eine sterische Gruppe (D) und der Fluoreszenzmarker (F) gebunden sind.Their common features are shown in Fig. 6a, b, d. This structure is characterized in that a steric group (D) and the fluorescent marker (F) are bound to the base via a cleavable linker (A-E).
Als Grundlage für die NTs* dienen Deoxynukleosid-Triphosphate mit Adenosin (A) , Guanosin(G) , Cytidin (C) und Uridin (U) als Nukleosidrest . Anstelle von Guanosin kann Inosin verwendet werden. Deoxynucleoside triphosphates with adenosine (A), guanosine (G), cytidine (C) and uridine (U) serve as the basis for the NTs * . Inosine can be used instead of guanosine.
4.4.3 Marker, Fluorophore4.4.3 Markers, fluorophores
Jede Base ist mit einem für sie charakteristischen Marker (F) markiert (Fig. 6) . Der Marker ist ein fluoreszierender Farb- stoff. Mehrere Faktoren beeinflussen die Wahl des Fluoreszenz- farbstoffes. Die Wahl ist nicht eingeschränkt, sofern der Farbstoff folgenden Anforderungen genügt:Each base is marked with a marker (F) which is characteristic of it (FIG. 6). The marker is a fluorescent dye. Several factors influence the choice of the fluorescent dye. The choice is not restricted if the dye meets the following requirements:
a) Die verwendete Detektionsapparatur muß diesen Marker als einziges Molekül gebunden an DNA unter milden Bedingungen (vorzugsweise Reaktionsbedingungen) identifizieren können. Die Farbstoffe haben vorzugsweise große Photostabilität. Ihre Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich gequencht.a) The detection apparatus used must be able to identify this marker as the only molecule bound to DNA under mild conditions (preferably reaction conditions). The dyes preferably have great photostability. Their fluorescence is preferably not quenched by the DNA or only to a minor extent.
b) Der an das NT gebundene Farbstoff darf keine irreversible Störung der enzymatischen Reaktion verursachen.b) The dye bound to the NT must not cause an irreversible disturbance of the enzymatic reaction.
c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in die Nukleinsäurekette eingebaut werden.c) NTs * marked with the dye must be incorporated into the nucleic acid chain by the polymerase.
d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine beträchtlichen Überlappungen in ihren Emissionsspektren aufweisen.d) When labeled with different dyes, these dyes should not have any significant overlaps in their emission spectra.
Im Rahmen der vorliegenden Erfindung verwendbare Fluoreszenz- farbstoffe sind in "Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes mit Strukturformeln zusammengestellt. Erfindungsgemäß werden vorzugsweise folgende Farbstoffklassen als Marker eingesetzt: Cyanin-Farbstoffe und deren Abkömmlinge (z.B. Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), Rhodamine und deren Abkömmlinge (z.B. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes), Xanthene-Derivate (z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US-Patent 6.130.101). Diese Farbstoffe sind kommerziell erhältlich. Dabei kann man je nach spektralen Eigenschaften und vorhandener Apparatur entsprechende Farbstoffe auswählen. Die Farbstoffe werden an den Linker z.B. über Thiocyanat- oder Ester-Bindung gekoppelt ("Handbook of Fluorescent Probes und Research Chemi- cals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v.278 S.363, Waggoner Methods in Enzymology 1995 v.246 S.362), s. Beispiele 1 und 2.Fluorescent dyes which can be used in the context of the present invention are compiled with structural formulas in "Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes. According to the invention, the following dye classes are preferably used as markers: cyanine dyes and their derivatives (for example Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US Pat. No. 5,268,486), rhodamines and their derivatives (for example TAMRA, TRITC, RG6, R110 , ROX, Molecular Probes), xanthene derivatives (e.g. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US Pat. No. 6,130,101). These dyes are commercially available. Depending on the spectral properties and the equipment available, appropriate dyes can be selected. The dyes are coupled to the linker, for example via a thiocyanate or ester bond ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v.278 P.363, Waggoner Methods in Enzymology 1995 v.246 p.362), p. Examples 1 and 2.
4.4.4 Natur der sterisch anspruchsvollen Gruppe4.4.4 Nature of the sterically demanding group
Die Gruppe (D) (Fig. 6a,b,d) stellt ein Hindernis für den Einbau eines weiteren komplementären markierten NT* durch eine Polymerase dar.Group (D) (FIGS. 6a, b, d) represents an obstacle to the incorporation of a further complementary labeled NT * by a polymerase.
Biotin, Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine und Cy3-Farbstoff stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytome- try 1997, v.28, S.206, Zhu et al . NAR 1994, v.22, S.3418, Gebeyehu et al., NAR 1987, v.15, S.4513, Wiemann et al . Analytical Biochemistry 1996, v.234, S.166, Heer et al . BioTechniques 1994 v.16 S.54). Die chemische Struktur dieser Gruppe ist nicht eingeschränkt, sofern sie den Einbau des markierten NT*, an das sie geknüpft ist, nicht wesentlich stört und keine irreversible Störung der enzymatischen Reaktion verursacht.Biotin, digoxigenin and fluorescent dyes such as fluorescein, tetramethylrhodamine and Cy3 dye are examples of such a sterically demanding group (Zhu et al. Cytometry 1997, v.28, p.206, Zhu et al. NAR 1994, v.22, P.3418, Gebeyehu et al., NAR 1987, v.15, p.4513, Wiemann et al. Analytical Biochemistry 1996, v.234, p.166, Heer et al. BioTechniques 1994 v.16 p.54). The chemical structure of this group is not restricted provided that it does not significantly interfere with the incorporation of the labeled NT * to which it is attached and does not cause an irreversible disturbance in the enzymatic reaction.
Diese . Gruppe kann als selbständiger Teil im Linker (6a) auftreten oder mit dem Farbstoff (6b) oder der spaltbaren Gruppe (6d) identisch sein. Durch die Spaltung des Linkers wird diese sterisch anspruchsvolle Gruppe (D) nach der Detektion des Signals entfernt, so dass die Polymerase ein weiteres markiertes NT* einbauen kann. Bei einer Struktur wie in 6d wird die steri- sche Gruppe durch die Spaltung beseitigt.This . Group can appear as an independent part in the linker (6a) or can be identical to the dye (6b) or the cleavable group (6d). By cleaving the linker, this sterically demanding group (D) is removed after detection of the signal, so that the polymerase can incorporate another labeled NT * . With a structure as in 6d, the steric group is removed by the cleavage.
In einer bevorzugten Ausführungsform übernimmt der Fluoreszenz- farbstoff die Funktion einer solchen sterisch anspruchsvollen Gruppe, so dass ein markiertes Nukleotid eine in Fig. 6b,k,l dargestellte Struktur aufweist.In a preferred embodiment, the fluorescent dye takes over the function of such a sterically demanding group, so that a labeled nucleotide is one in FIG. 6b, k, l structure shown.
In einer anderen bevorzugten Ausführungsform übernimmt die photolabile spaltbare Gruppe die Funktion einer solchen sterisch anspruchsvollen Gruppe (Fig. 6d) .In another preferred embodiment, the photolabile cleavable group takes over the function of such a sterically demanding group (FIG. 6d).
4.4.5 Linker4.4.5 Left
Der Marker (Fluoreszenzfarbstoff) ist an die Base vorzugsweise über einen Abstandhalter unterschiedlicher Länge, einen sog. Linker, gebunden. Beispiele für Linker sind in Fig. 6e, f,g,h, i, j ,k, l,m gegeben. Beispiele der Ankoppelung eines Linkers an die Base können aus folgenden Quellen entnommen werden (Hobbs et al. US Patent 5.047.519, Khan et al . US Patent 5.821.356, Klevan et al. US Patent 4.828.979, Hanna M. Method in Enzymology 1996 v.274, S.403, Zhu et al. NAR 1994 v.22 S.3418, Herman et al . Methods in Enzymology 1990 v.184 S.584, J.L.Ruth et al. Molecular Pharmacology 1981 v.20 S.415, L. Ötvös et al. NAR 1987 v.15 S.1763, G.E.Wright et al . Pharmac Ther. 1990 v.47, S.447, „Nucleotide Analogs; Synthesis and Biological Function" K.H. Scheit 1980, Wiley-Interscience Publication, "Nucleic acid chemistry" Ed. L.B.Townsend, v.1-4, Wiley-Interscience Publication, "Chemistry of Nucleosides and Nucleotides" Ed. L.B.Townsend, v.1-3, Plenum Press).The marker (fluorescent dye) is preferably attached to the base via a spacer of different lengths, a so-called linker. Examples of linkers are given in Fig. 6e, f, g, h, i, j, k, l, m. Examples of coupling a linker to the base can be found in the following sources (Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356, Klevan et al. US Patent 4,828,979, Hanna M. Method in Enzymology 1996 v.274, p.403, Zhu et al. NAR 1994 v.22 p.3418, Herman et al. Methods in Enzymology 1990 v.184 p.584, JLRuth et al. Molecular Pharmacology 1981 v.20 p .415, L. Ötvös et al. NAR 1987 v.15 p.1763, GEWright et al. Pharmac Ther. 1990 v.47, p.447, "Nucleotide Analogs; Synthesis and Biological Function" KH Scheit 1980, Wiley- Interscience Publication, "Nucleic acid chemistry" Ed. LBTownsend, v.1-4, Wiley-Interscience Publication, "Chemistry of Nucleosides and Nucleotides" Ed. LBTownsend, v.1-3, Plenum Press).
Die gesamte Länge des Linkers kann variieren. Sie entspricht der Anzahl der Kohlenstoff-Atome in den Abschnitten A, C, E (Fig. 6a,b,d) und liegt vorzugsweise zwischen 3 und 20. Optimalerweise beträgt sie zwischen 4 und 10 Atomen. Die chemische Zusammensetzung des Linkers (Abschnitte A,C,E in Fig. 6a,b,d) ist nicht eingeschränkt, sofern sie unter Reaktionsbedingungen stabil bleibt und keine Störung der enzymatischen Reaktion verursacht.The total length of the linker can vary. It corresponds to the number of carbon atoms in sections A, C, E (FIGS. 6a, b, d) and is preferably between 3 and 20. Optimally, it is between 4 and 10 atoms. The chemical composition of the linker (sections A, C, E in FIGS. 6a, b, d) is not restricted, provided that it remains stable under reaction conditions and does not cause any disturbance in the enzymatic reaction.
4.4.6 Spaltbare Verbindung, Spaltung4.4.6 Fissile connection, splitting
Der Linker trägt eine spaltbare Verbindung oder spaltbare Gruppe (Abschnitt (B) in Fig. 6a,b,d und Abschnitt (C) in Fig. 6k, 1). Diese spaltbare Verbindung ermöglicht die Entfernung des Markers und des sterischen Hindernisses am Ende jedes Zyklus. Ihre Wahl ist nicht eingeschränkt, sofern sie unter den Bedin- gungen der enzymatischen Sequenzierungsreaktion stabil bleibt, keine irreversible Störung der Polymerase verursacht und unter milden Bedingungen abgespalten werden kann. Unter "milden Bedingungen" sind solche Bedingungen zu verstehen, die den Genprodukt-Primer-Komplex nicht zerstören, wobei z.B. der pH- Wert vorzugsweise zwischen 3 und 11 liegt, die Temperatur zwischen 0°C und einem Temperaturwert (x) . Dieser Temperaturwert (x) hängt von der Tm des Genprodukt-Primer-Komplexes (Tm ist "melting Point") und wird beispielsweise als Tm (Genprodukt- Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen eignen sich besonders Ester-, Thioester-, Disulfid-Verbindungen und photolabile Verbindungen als spaltbare Verbindungen) .The linker carries a fissile connection or fissile Group (section (B) in Fig. 6a, b, d and section (C) in Fig. 6k, 1). This fissile connection enables the marker and steric obstacle to be removed at the end of each cycle. Your choice is not restricted as long as it remains stable under the conditions of the enzymatic sequencing reaction, does not cause an irreversible disturbance of the polymerase and can be split off under mild conditions. “Mild conditions” are understood to mean those conditions which do not destroy the gene product-primer complex, the pH value, for example, preferably being between 3 and 11 and the temperature between 0 ° C. and a temperature value (x). This temperature value (x) depends on the Tm of the gene product-primer complex (Tm is "melting point") and is calculated, for example, as Tm (gene product-primer complex) minus 5 ° C (eg Tm is 47 ° C, then lies the maximum temperature at 42 ° C; under these conditions, ester, thioester, disulfide compounds and photolabile compounds are particularly suitable as cleavable compounds).
Vorzugsweise gehört die genannte Verbindung zu chemisch oder enzymatisch spaltbaren oder photolabilen Verbindungen. Als Beispiele von chemisch spaltbaren Gruppen sind Ester- , Thioester- und Disulfid-Verbindungen bevorzugt (Fig. 6k, 1) („Chemistry of protein conjugation and crosslinking" Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v.184 S.584, Lomant et al . J.Mol.Biol. 1976 v.104 243, "Chemistry of carboxylic acid and esters" S.Patai 1969 Interscience Publ . ) . Beispiele für photolabile Verbindungen (Fig. 6m) können in folgenden Literaturstellen gefunden werden: "Protective groups in organic synthesis" 1991 John Willey & Sons, Inc., V. Pillai Synthesis 1980 S.l, V. Pillai Org. Photochem. 1987 v.9 S.225, Dissertation „Neue photolabile Schutzgruppen für die lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, Konstanz, Dissertation „Neue photolabile Schutzgruppen für die lichtgesteuerte Oligonucleotidsynthese" S.M.Bühler, 1999, Konstanz) .The compound mentioned preferably belongs to chemically or enzymatically cleavable or photolabile compounds. As examples of chemically cleavable groups, ester, thioester and disulfide compounds are preferred (Fig. 6k, 1) ("Chemistry of protein conjugation and crosslinking" Shan S. Wong 1993 CRC Press Inc., Herman et al. Method in Enzymology 1990 v.184 p.584, Lomant et al. J. Mol.Biol. 1976 v.104 243, "Chemistry of carboxylic acid and esters" S.Patai 1969 Interscience Publ.). Examples of photolabile compounds (Fig. 6m) can be found in the following references: "Protective groups in organic synthesis" 1991 John Willey & Sons, Inc., V. Pillai Synthesis 1980 Sl, V. Pillai Org. Photochem. 1987 v.9 p.225, dissertation "Neue photolabile Schutzgruppen for light-controlled oligonucleotide synthesis "H. Giegrich, 1996, Konstanz, dissertation" New photolabile protective groups for light-controlled oligonucleotide synthesis "SMBühler, 1999, Konstanz).
Die Position der spaltbaren Verbindung/Gruppe im Linker ist vorzugsweise nicht weiter als 10 Atome von der Base entfernt, noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt liegt die spaltbare Verbindung oder Gruppe direkt an der Base.The position of the fissile link / group in the linker is preferably no more than 10 atoms from the base, more preferably no more than 3 atoms. The cleavable compound or group is particularly preferably located directly on the base.
Der Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vorhanden und muß unter milden Bedingungen (s.o.) verlaufen, so dass die Nukleinsäuren nicht beschädigt oder modifiziert werden.The cleavage and removal step is present in every cycle and must be carried out under mild conditions (see above) so that the nucleic acids are not damaged or modified.
Die Spaltung läuft bevorzugt chemisch (z.B. in milder saurer oder basischer Umgebung für eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittels, z.B. Dithiothreitol oder Mercaptoethanol (Sigma) bei der Spaltung einer Disulfid- Verbindung) , siehe Beispiel 1, oder physikalisch (z.B. durch Beleuchtung der Oberfläche mit Licht einer bestimmten Wellenlänge für die Spaltung einer photolabilen Gruppe, Dissertation „Neue photolabile Schutzgruppen für die lichtgesteuerte Oligonucleotidsynthese" H. Giegrich, 1996, Konstanz) ab.The cleavage preferably takes place chemically (for example in a mild acidic or basic environment for an ester compound or by adding a reducing agent, for example dithiothreitol or mercaptoethanol (Sigma) when cleaving a disulfide compound), see Example 1, or physically (for example by lighting the surface with light of a certain wavelength for the cleavage of a photolabile group, dissertation "New photolabile protective groups for light-controlled oligonucleotide synthesis" H. Giegrich, 1996, Constance).
Nach der Spaltung verbleibt an der Base ein Linkerrest (A)After cleavage, a linker residue remains on the base (A)
(Fig.6c). Falls die nach der Spaltung am Linkerrest frei gewordene Mercapto-Gruppe weitere Reaktionen stört, kann sie mit bekannten Mitteln chemisch modifiziert werden (wie z.B. durch Disulfid- oder Iodacetatverbindungen) .(6C). If the mercapto group released after the cleavage at the linker residue interferes with further reactions, it can be chemically modified with known means (such as, for example, using disulfide or iodoacetate compounds).
Die Synthese eines spaltbaren Linkers wird an Beispielen gezeigt (vgl. Beispiele 1 und 2) .The synthesis of a cleavable linker is shown using examples (cf. Examples 1 and 2).
4.4.7 Kombination von Polymerase und NT* 4.4.7 Combination of polymerase and NT *
Insgesamt spielen die Größe, die Ladung und die chemische Struktur des Markers, die Länge des spaltbaren Linkers und des Linker-Rests sowie auch die Wahl der Polymerase eine wichtige Rolle. Sie bestimmen gemeinsam, ob das markierte NT* durch die Polymerase in die wachsende Nukleinsäurekette eingebaut wird, und ob dadurch der Einbau des nächsten markierten NT* verhindert wird. Zwei Bedingungen sind dabei besonders zu berücksichtigen:Overall, the size, the charge and the chemical structure of the marker, the length of the cleavable linker and the linker residue and also the choice of polymerase play an important role. Together they determine whether the labeled NT * is incorporated into the growing nucleic acid chain by the polymerase and whether this prevents the incorporation of the next labeled NT * becomes. Two conditions are particularly important:
Einerseits ist es wichtig, dass die Polymerase die Nukleinsäurekette mit dem eingebauten modifizierten NT* nach der Spaltung des Linkers weiter verlängern kann. Es ist also wichtig, dass der Linkerrest "A" (Fig. 6c) nach der Spaltung keine wesentliche Störung für die weitere Synthese darstellt. Andererseits müssen eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es können viele für die Reaktion geeignete NTs* synthetisiert werden. Im einzelnen muß für jede Kombination aus Polymerase und NTs* eine Vorversuchsreihe durchgeführt werden, in der die Tauglichkeit eines bestimmten NT*-Typs für die Sequenzierung erprobt wird.On the one hand, it is important that the polymerase can further extend the nucleic acid chain with the built-in modified NT * after the linker has been cleaved. It is therefore important that the linker residue "A" (FIG. 6c) after cleavage does not represent a significant disturbance for the further synthesis. On the other hand, built-in, non-split NTs * must be an obstacle. Many NTs * suitable for the reaction can be synthesized. In particular, a preliminary test series must be carried out for each combination of polymerase and NTs * , in which the suitability of a particular NT * type for sequencing is tested.
Die Pufferbedingungen werden nach Angaben des Polymeraseherstellers gewählt . Die Reaktionstemperatur wird für nicht thermostabile Polymerasen nach Angaben des Herstellers gewählt (z.B. 37°C für Sequenase Version 2), für thermostabile Polymerasen (z.B. Taq-Polymerase) beträgt die Reaktionstemperatur maximal den Temperaturwert (x) . Dieser Temperaturwert (x) hängt von der Tm des Genprodukt-Primer- Komplexes und wird z.B. als Tm (Genprodukt-Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt die maximaleThe buffer conditions are chosen according to the polymerase manufacturer. The reaction temperature is selected for non-thermostable polymerases according to the manufacturer (e.g. 37 ° C for Sequenase version 2), for thermostable polymerases (e.g. Taq polymerase) the reaction temperature is at most the temperature value (x). This temperature value (x) depends on the Tm of the gene product-primer complex and is e.g. calculated as Tm (gene product primer complex) minus 5 ° C (e.g. Tm is 47 ° C, then the maximum is
Reaktionstemperatur bei 42°C) . Diese Pufferbedingungen und Reaktionstemperatur werden weiter als "optimale Puffer- und Temperaturbedingungen" bezeichnet .Reaction temperature at 42 ° C). These buffer conditions and reaction temperature are further referred to as "optimal buffer and temperature conditions".
Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in einem Zyklus) beträgt vorzugsweise weniger als eine Stunde, idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 min.The reaction time (corresponds to the duration of the installation step in one cycle) is preferably less than one hour, ideally the reaction time is between 10 seconds and 10 minutes.
Als Beispiele von geeigneten Kombinationen zwischen NT* und Polymerase sind folgende Kombinationen zu nennen:The following combinations may be mentioned as examples of suitable combinations between NT * and polymerase:
Falls DNA (z.B. cDNA) als Genprodukt in die Reaktion eingesetzt wird, können NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, Fig. 6e,h,i): dNTP-SS-TRITC (L7) , dNTP-SS-Cy3 (Lll) und / oder NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, Fig. 6f,g,j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase Version 2, Taq-Polymerase (GibcoBRL) , ProHA-DNA- 5 Polymerase (Eurogentec) oder Klenow Fragment der DNA-Polymerase I aus E.coli ohne 3 '-5' Exonukleaseaktivität (Amersham Pharmacia Biotech) eingesetzt werden.If DNA (eg cDNA) is used as a gene product in the reaction, NT * with a short linker residue (synthesis see Example 2, Fig. 6e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (Lll) and / or NT * with a long linker residue (synthesis see Example 1, Fig. 6f, g, j): dNTP-SS-TRITC (L14) in combination with Sequenase Version 2, Taq polymerase (GibcoBRL), ProHA-DNA- 5 polymerase (Eurogentec) or Klenow fragment of DNA polymerase I from E. coli without 3 '- 5 'exonuclease activity (Amersham Pharmacia Biotech) can be used.
Falls RNA (z.B. mRNA) als Genprodukt in die Reaktion eingesetzt 10 wird, können NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, Fig. 6e,h,i): dNTP-SS-TRITC (L7) , dNTP-SS-Cy3 (Lll) und / oder NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, Fig. 6f,g,j): dNTP-SS-TRITC (L14) in Kombination mit AMV-Reverse Transcriptase (Sigma) , M-MLV Reverse 15 Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNAse- Aktivität eingesetzt werden.If RNA (eg mRNA) is used as a gene product in the reaction, NT * with a short linker residue (synthesis see Example 2, Fig. 6e, h, i): dNTP-SS-TRITC (L7), dNTP-SS- Cy3 (III) and / or NT * with a long linker residue (synthesis see Example 1, Fig. 6f, g, j): dNTP-SS-TRITC (L14) in combination with AMV reverse transcriptase (Sigma), M-MLV Reverse 15 transcriptase (Sigma), HIV reverse transcriptase without RNAse activity can be used.
Die Tauglichkeit eines Lihkerrests an der Base (A) für die Reaktion wird in einem Testsystem geprüft. Dabei werdenThe suitability of a Lihker residue at base (A) for the reaction is checked in a test system. In doing so
20 gespaltene NTs* in eine Nukleinsäurekette nacheinander eingebaut . Man verwendet z.B. dUTP* mit dem gewünschten gespaltenen Linkerrest, poly-dA als Matrize für DNA-Polymerasen wie z.B. Sequenase Version 2, Taq-Polymerase, oder poly-A als Matrize für Reverse Transcriptasen wie z.B. AMV-Reverse20 cleaved NTs * built into a nucleic acid chain one after the other. One uses, for example, dUTP * with the desired cleaved linker residue, poly-dA as a template for DNA polymerases such as Sequenase version 2, Taq polymerase, or poly-A as a template for reverse transcriptases such as AMV reverse
25 Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , 01igo-dT20-Primer, die gewünschte Polymerase (s.o.) und führt unter für die jeweilige Polymerase geeigneten optimalen Pufferund Temperaturbedingungen eine Reaktion durch. Die NT*- Konzentration liegt vorzugsweise zwischen 5μmol/l und25 transcriptase (Sigma), M-MLV reverse transcriptase (Sigma), 01igo-dT20 primer, the desired polymerase (see above) and carries out a reaction under optimal buffer and temperature conditions suitable for the respective polymerase. The NT * concentration is preferably between 5 μmol / l and
30 200μmol/l. Nach der Reaktion wird die Anzahl der in die Nukleinsäurekette eingebauten NTs* analysiert, z.B. durch die Auftrennung der Länge nach in einem Gel . Für die Rückschlüsse auf die Tauglichkeit des Linkerrests kann man folgende Angaben verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kann,30 200μmol / l. After the reaction, the number of NTs * incorporated into the nucleic acid chain is analyzed, for example by lengthwise separation in a gel. The following information can be used to draw conclusions about the suitability of the linker residue: If the polymerase can incorporate more than 20 NTs * ,
35 so ist dieser Linkerrest für eine Sequenzierungsreaktion geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist diese Kombination aus NT* und Polymerase nicht optimal für die Sequenzierungsreaktion.35 this linker residue is suitable for a sequencing reaction. When installing fewer than 20 split NTs * , this combination of NT * and polymerase is not optimal for them Sequencing reaction.
Wenn ein passender Linkerrest feststeht, wird in einem weiteren Testsystem geprüft, ob die markierten, nicht gespaltenen NTs* als Semiterminatoren funktionieren. Das wird geprüft, indem die markierten NTs* unter für die Reaktion geeigneten optimalen Puffer- und Temperaturbedingungen mit der Polymerase und einer Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugsweise zwischen 5μmol/l und 200μmol/l. Die Matrize ist so zu wählen, dass der Einbau mehrerer NTs* nacheinander zu erwarten wäre, z.B. für dUTP* kann man polydA oder poly-A, wie im oben dargestellten Beispiel verwenden. Idealerweise baut die Polymerase nur ein einziges NT* ein.If a suitable link remnant has been determined, another test system checks whether the marked, non-split NTs * function as semiterminators. This is checked by incubating the labeled NTs * with the polymerase and a template under optimal buffer and temperature conditions suitable for the reaction. The NT * concentration is preferably between 5 μmol / l and 200 μmol / l. The matrix must be selected so that the installation of several NTs * would be expected one after the other, e.g. for dUTP * you can use polydA or poly-A, as in the example shown above. Ideally, the polymerase incorporates only a single NT * .
Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen durch eine Polymerase mehrere NTs* nacheinander eingebaut werden, kann man die Reaktionsparameter (z.B. NT*-Konzentration, Reaktionstemperatur) verändern und der jeweiligen Kombination aus Polymerase und NT* anpassen. Das wichtigste dabei ist, dass die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut. Erfindungsgemäß erfolgt diese Anpassung in einer Ausführungsform durch die Veränderung der Reaktionstemperatur. Die anderen Parameter der Reaktion werden dabei konstant gehalten.If several NTs * are installed one after the other under given optimal buffer and temperature conditions, one can change the reaction parameters (eg NT * concentration, reaction temperature) and adapt them to the respective combination of polymerase and NT * . The most important thing is that the polymerase does not incorporate a second NT * in the specified time (preferably between 10 sec and 10 min). According to the invention, this adaptation takes place in one embodiment by changing the reaction temperature. The other parameters of the reaction are kept constant.
Falls DNA als Genprodukt (z.B. cDNA) in die Sequenzierungs- reaktion eingesetzt wird, können als Polymerasen beipielsweise Polymerasen verwendet werden, die DNA-Polymerasen ohne 3' -5'- Exonukleaseaktivität sind, vorzugsweise aus der Gruppe bestehend aus viralen DNA-Polymerasen vom Sequenase-Typ, bakteriellen DNA-Polymerasen I, thermostabilen DNA-Polymerasen und deren Modifikationen. Insbesondere kommen Sequenase Version 2, Klenow Fragment der DNA-Polymerase I aus E.coli ohne 3' -5' Exonukleaseaktivität, Taq-Polymerase oder ProHA-DNA-Polymerase in Betracht. Falls RNA als Genprodukt (z.B. mRNA) in die Sequenzierungs- reaktion eingesetzt wird, können handelsübliche RNA-abhängige DNA-Polymerasen eingesetzt werden, z.B. AMV-Reverse Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNase-Aktivität .If DNA is used as a gene product (eg cDNA) in the sequencing reaction, polymerases can be used as polymerases, for example, polymerases which are DNA polymerases without 3 '-5' exonuclease activity, preferably from the group consisting of viral DNA polymerases from sequenase -Type, bacterial DNA polymerases I, thermostable DNA polymerases and their modifications. Sequenase version 2, Klenow fragment of DNA polymerase I from E. coli without 3 '-5' exonuclease activity, Taq polymerase or ProHA DNA polymerase are particularly suitable. If RNA is included as a gene product (e.g. mRNA) in the sequencing reaction is used, commercially available RNA-dependent DNA polymerases can be used, for example AMV reverse transcriptase (Sigma), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNase activity.
Die NT*-Konzentration liegt bei diesen Experimenten üblicherweise zwischen 5μmol/l und 200μmol/l, vorzugsweise zwischen 10μmol/l und 100μmol/l. Die Konzentration der Polymerase und die Pufferbedingungen werden nach Angaben vom Hersteller gewählt. Die Dauer der Reaktion kann variieren und liegt vorzugsweise zwischen 10 sec und 10 min, was der Dauer desIn these experiments, the NT * concentration is usually between 5 μmol / l and 200 μmol / l, preferably between 10 μmol / l and 100 μmol / l. The concentration of the polymerase and the buffer conditions are selected according to the manufacturer. The duration of the reaction can vary and is preferably between 10 sec and 10 min, which is the duration of the
Einbau-Schrittes (b) in einem Zyklus entsprechen würde. Bei nicht thermostabilen Polymerasen wie z.B. Sequenase Version 2Installation step (b) would correspond to one cycle. In the case of non-thermostable polymerases such as Sequenase version 2
(Amersham Pharmacia Biotech) , Klenow-Fragment der DNA Polymera- se I ohne 3' -5' Exonukleaseaktivität (Amersham Pharmacia Biotech) , AMV-Reverse Transcriptase (Sigma) , M-MLV Reverse Transcriptase (Sigma) , HIV-Reverse Transcriptase ohne RNase- Aktivität wird die Reaktionsthemperatur von konventionellen 37°C vorzugsweise auf 20°C bis 30°C reduziert. Bei thermostabilen Polymerasen wie z.B. Taq-Polymerase (GibcoBRL) , ProHA-DNA-(Amersham Pharmacia Biotech), Klenow fragment of DNA polymerase I without 3 '-5' exonuclease activity (Amersham Pharmacia Biotech), AMV reverse transcriptase (Sigma), M-MLV reverse transcriptase (Sigma), HIV reverse transcriptase without RNase activity, the reaction temperature is reduced from conventional 37 ° C, preferably to 20 ° C to 30 ° C. With thermostable polymerases such as Taq polymerase (GibcoBRL), ProHA DNA
Polymerase (Eurogentec) wird die Reaktionstemperatur von konventionellen 70-75°C vorzugsweise auf Werte reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen. Dieser Temperaturwert (x) hängt von der Tm des Genprodukt-Primer- Komplexes und wird als Tm (Genprodukt-Primer-Komplex) minus 5°C errechnet (z.B. Tm ist 47°C, dann liegt der Temperaturwert (x) bei 42°C) .Polymerase (Eurogentec) the reaction temperature from conventional 70-75 ° C is preferably reduced to values between 30 ° C and the temperature value (x). This temperature value (x) depends on the Tm of the gene product primer complex and is calculated as Tm (gene product primer complex) minus 5 ° C (eg Tm is 47 ° C, then the temperature value (x) is 42 ° C ).
In einer anderen bevorzugten Ausführungsform der Erfindung er- folgt die Anpassung der Reaktionsbedingungen durch die Verminderung der NT*-Konzentration auf unter 5μmol/l, die anderen Parameter der Reaktion (Pufferbedingungen, Temperaturbedingungen) werden konstant gehalten. Die Konzentration der NT*s liegt vorzugsweise bei dieser Anpassung zwischen 0.5 und 5μmol/l. Die Dauer der Reaktion liegt zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*- Konzentration ist, dass die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.In another preferred embodiment of the invention, the reaction conditions are adjusted by reducing the NT * concentration to below 5 μmol / l, the other parameters of the reaction (buffer conditions, temperature conditions) are kept constant. With this adaptation, the concentration of the NT * s is preferably between 0.5 and 5 μmol / l. The duration of the reaction is between 10 sec and 10 min. The most important thing when choosing the NT * - Concentration is that the polymerase does not incorporate a second NT * in the specified time (preferably between 10 sec and 10 min).
Nach Optimierung der Reaktionsbedingungen für den Einbau eines einzelnen NT* muß man die Reaktion mit gespaltenen NTs* wiederholen. Unter entsprechend geänderten Reaktionsparametern muß die Polymerase die gespaltenen NTs* nacheinander einbauen können.After optimizing the reaction conditions for the installation of a single NT * , the reaction must be repeated with split NTs * . If the reaction parameters are changed accordingly, the polymerase must be able to incorporate the cleaved NTs * one after the other.
Die Optimierungsreaktion korreliert mit dem Einbauschritt, Schritt (b) , in einem Zyklus. Die für die Optimierungsreaktion ermittelten Bedingungen die Temperatur, die Konzentration an NT*, die Pufferbedingungen und die Dauer der Reaktion werden für die Reaktion auf der Oberfläche übernommen.The optimization reaction correlates with the installation step, step (b), in one cycle. The conditions determined for the optimization reaction, the temperature, the concentration of NT * , the buffer conditions and the duration of the reaction are adopted for the reaction on the surface.
Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in die zu Genprodukten komplementären Stränge vorzugsweise so, dass an mehr als 50% der an der Sequenzierungsreaktion beteiligten Genprodukte (extensionsfähige Genprodukt-Primer- Komplexe) in einem Zyklus ein markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. Das hängt damit zusammen, dass an manchen Nukleinsäureketten die Reaktion sehr langsam abläuft. Ein Einbau der NTs* an jeder komplementären Position in jedem Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur die erfolgreichen Einbaureaktionen detektiert und ausgewertet werden; eine verzögerte Reaktion im Nachfolgenden Zyklus führt nicht zu einem Sequenzierungsfehler.Under these reaction conditions, the incorporation of NT * into the strands complementary to gene products preferably takes place in such a way that a labeled NT * is preferably incorporated in more than 50% of the gene products involved in the sequencing reaction (gene product-primer complexes which can be extended) in one cycle more than 90%. This is due to the fact that the reaction on some nucleic acid chains is very slow. An installation of the NTs * at every complementary position in each cycle is aimed for, but is not necessary because only the successful installation reactions are detected and evaluated; a delayed reaction in the subsequent cycle does not lead to a sequencing error.
Vorzugsweise wird für alle NTs* dieselbe Polymerase verwendet. Es können aber auch verschiedene Polymerasen für verschiedene NTs* eingesetzt werden. 4.4.8 Farbiges Kodierungsschema, Anzahl der FarbstoffeThe same polymerase is preferably used for all NTs * . However, different polymerases can also be used for different NTs * . 4.4.8 Color coding scheme, number of dyes
Einen Zyklus kann man durchführen mit:A cycle can be carried out with:
a) vier verschieden markierten NT*s b) zwei verschieden markierten NT*s c) einem markierten NT* d) zwei verschieden markierten NT*s und zwei unmarkierten NTs,a) four differently marked NT * s b) two differently marked NT * s c) one marked NT * d) two differently marked NT * s and two unmarked NTs,
d.h.i.e.
a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht man die Sequenzierung einer Nukleinsäurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe müssen in jedem Zyklus identifiziert werden.a) You can mark all 4 NTs with different dyes and use all 4 at the same time in the reaction. The sequencing of a nucleic acid chain is achieved with a minimal number of cycles. However, this variant of the invention places high demands on the detection system: 4 different dyes have to be identified in each cycle.
b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen gewählt werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden markiert sind, z.B. A und G tragen die Markierung "X", C und U tragen die Markierung "Y" . In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt, z.B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n+1) werden dann U* und G* zugegeben.b) To simplify the detection, a label with two dyes can be selected. Two pairs of NTs * are formed, each marked differently, eg A and G are marked "X", C and U are marked "Y". Two differently labeled NTs * are used simultaneously in the reaction in one cycle (s), for example C * in combination with A * , and U * and G * are then added in the subsequent cycle (n + 1).
c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NT* einsetzen.c) You can also use only a single dye to mark all 4 NTs * and use only one NT * per cycle.
d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s / 2NTs-Methode) . 4.5 Detektionsapparaturd) In a technically simplified embodiment, two differently marked NT * s are used per cycle and two unmarked NTs (so-called 2NT * s / 2NTs method). 4.5 detection apparatus
Einzelne Moleküle auf einer Oberfläche kann man mit verschiede- nen Methoden untersuchen. Es sind mehrere Verfahren bekannt: z.B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahfeld- Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR- Mikroskopie usw. (Science 1999 v.283 1667, Unger et al . BioTechniques 1999 v.27 S.1008, Ishijaima et al . Cell 1998 v.92 S.161, Dickson et al. Science 1996 v.274 S.966, Xie et al . Science 1994 v.265 S.361, Nie et al . Science 1994 v.266 S.1018, Betzig et al. Science 1993 v.262 S.1422).Individual molecules on a surface can be examined using various methods. Several methods are known: e.g. AtomForce microscopy, electron microscopy, near-field fluorescence microscopy, wide-field fluorescence microscopy, TIR microscopy etc. (Science 1999 v.283 1667, Unger et al. BioTechniques 1999 v.27 p.1008, Ishijaima et al. Cell 1998 v.92 p.161, Dickson et al. Science 1996 v.274 p.966, Xie et al. Science 1994 v.265 p.361, Nie et al. Science 1994 v.266 p.1018, Betzig et al. Science 1993 v.262 p. 1422).
Erfindungsgemäß werden Fluoreszenz-Signale einzelner in die Nukleinsäurekette eingebauter NTs* vorzugsweise mit einem Weitfeld-Fluoreszenz-Mikroskop (Epifluoreszenz) oder einem Laser-Scanning-Mikroskop oder einem TIRF-Microskop (Total Internal Reflection Fluorescence Microscope) (Weitfeld-Optik- Detektionssystem) .According to the invention, fluorescence signals of individual NTs * built into the nucleic acid chain are preferably measured using a wide-field fluorescence microscope (epifluorescence) or a laser scanning microscope or a TIRF microscope (Total Internal Reflection Fluorescence Microscope) (wide-field optical detection system).
Es sind verschiedene Varianten der Konstruktion einer solchen Apparatur möglich (Weston et al. J.Chem.Phys. 1998 v.109 S.7474, Trabesinger et al. Anal. Chem. 1999 v.71 S.279, Adachi et al. Journal of Microscopy 1999 v.195 S.125, Unger et al . BioTechniques 1999 v.27 S.1008, Ishijaima et al . Cell 1998 v.92 S.161, Dickson et al . Science 1996 v.274 S.966, Tokunaga et al . Bichem.Biophys.Res.Com. 1997 v.235 S.47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Pu- blishers, "New Techniques of optical microscopy and microspec- troscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press ) . Unterschiede in ihrem konkreten Aufbau ergeben sich aus der Variation ihrer Einzelteile. Die Vorrichtung für das Anregungslicht kann z.B. auf der Basis eines Lasers, einer Lampe oder von Dioden funktionieren. Für die Detektionsvor- richtung können sowohl CCD-Kameras als auch PMT dienen. Andere Beispiele für technische Details siehe ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Pu- blishers, "New Techniques of optical microscopy and microspec- troscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press) . Es ist nicht die Aufgabe dieser Erfindung, alle möglichen technischen Varianten einer Detektionsvorrichtung aufzuzählen. Der prinzipielle Aufbau einer geeigneten Apparatur wird in einem Schema Fig. 7 erläutert. Sie besteht aus folgenden Elementen:Various variants of the construction of such an apparatus are possible (Weston et al. J. Chem. Phys. 1998 v.109 p.7474, Trabesinger et al. Anal. Chem. 1999 v.71 p.279, Adachi et al. Journal of Microscopy 1999 v.195 p.125, Unger et al. BioTechniques 1999 v.27 p.1008, Ishijaima et al. Cell 1998 v.92 p.161, Dickson et al. Science 1996 v.274 p.966, Tokunaga et al. Bichem.Biophys.Res.Com. 1997 v.235 p.47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press). Differences in their concrete structure result from the variation of their individual parts. The device for the excitation light can function, for example, on the basis of a laser, a lamp or diodes. Both CCD cameras and PMT can be used for the detection device. Other For examples of technical details see ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press). It is not the object of this invention to list all possible technical variants of a detection device. The basic structure of a suitable apparatus is explained in a diagram in FIG. 7. It consists of the following elements:
Lichtquelle zur Anregung der Fluoreszenz (1) Lichtleitender Teil (2) Scantisch (3)Light source for exciting fluorescence (1) Light-guiding part (2) Scanning table (3)
Vorrichtung zur Selektion von Spektren (4)Spectra selection device (4)
Detektionsvorrichtung (5)Detection device (5)
Computer mit Steuerungs- und Analysefunktionen (6)Computers with control and analysis functions (6)
Diese Elemente der Apparatur können kommerziell erworben werden (Mikroskop-Firmen: Zeiss, Leica, Nikon, Olympus) .These elements of the apparatus can be purchased commercially (microscope companies: Zeiss, Leica, Nikon, Olympus).
Im folgenden soll beispielsweise eine für die Detektion einzelner Moleküle geeignete Kombination aus diesen Elementen vor- gestellt werden:In the following, for example, a combination of these elements suitable for the detection of individual molecules will be presented:
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit QuecksilberdampflampeAxioplan 2 (Zeiss) wide-field fluorescence microscope with mercury vapor lamp
Objektiv Planneofluar lOOx, NA 1.4 (Zeiss) Kamera SenSysTM (Photometrix) oder AxioCam (Zeiss) Computer mit Software zur Steuerung und AnalyseObjective Planneofluar lOOx, NA 1.4 (Zeiss) Camera SenSysTM (Photometrix) or AxioCam (Zeiss) Computer with software for control and analysis
Nachfolgend soll die Vorgehensweise bei der Detektion erläutert werden. Man beachte dabei die allgemeinen Regeln der Fluo- reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press) .The procedure for detection will be explained below. Note the general rules of fluorescence microscopy ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press).
Die Detektion umfaßt folgende Phasen:The detection comprises the following phases:
1) Vorbereitung zur Detektion1) Preparation for detection
2) Durchführung eines Detektionsschrittes in jedem Zyklus, wobei jeder Detektionsschritt als Scanvorgang abläuft und folgende Operationen umfaßt: a) Einstellung der Position des Objektivs (X, Y-Achse) , b) Einstellung der Fokusebene (Z-Achse) , c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen Genprodukt, d) Verschiebung zur nächsten Position auf der Oberfläche.2) Execution of a detection step in each cycle, each detection step running as a scanning process and comprising the following operations: a) adjusting the position of the lens (X, Y axis), b) adjusting the focal plane (Z axis), c) detecting the Signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective gene product, d) shift to the next position on the surface.
Die Signale von in die den Genprodukten komplementären Stränge eingebauten NTs* werden durch das Abscannen der Oberfläche registriert. Der Scanvorgang kann in verschiedener Weise ausgeführt werden ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J.Pawley Plenum Press) . Beispielsweise wird ein diskontinuierlicher Scanvorgang gewählt. Dabei wird das Objektiv schrittweise über die Oberfläche bewegt (Fig. 8a) , so dass von jeder Oberflächenposition ein zweidimensionales Bild (2D-Bild) entsteht (Fig. 8b, c), für Versuchsanordnung s. Beispiel 5 .The signals from NTs * built into the strands complementary to the gene products are registered by scanning the surface. The scanning process can be carried out in various ways ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R.Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pavley Plenum Press). For example, a discontinuous scanning process is selected. The objective is moved step by step over the surface (FIG. 8a), so that a two-dimensional image (2D image) is created from each surface position (FIG. 8b, c), for experimental arrangement see FIG. Example 5.
Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: z.B. durch den Laser-Scan einer Position des Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an einer Position (vgl. Handbücher der Mikroskopie). Als Beispiel wird die Detektion einzelner Moleküle mit einer CCD-Kamera beschrieben.This 2D image can be created using various methods: for example, by laser scanning a position of the microscope field (laser scanning microscopy) or by taking a camera image at a position (cf. microscopy manuals). One example is the detection of individual molecules with a CCD camera described.
1) Vorbereitung zur Detektion:1) Preparation for detection:
Am Anfang wird festgelegt, wie viele Kopien der Genprodukte zur Expressionsanalyse notwendig sind. Mehrere Faktoren spielen dabei eine Rolle. Die genaue Zahl hängt z.B. von der relativen Präsenz der Genprodukte im Ansatz und von der gewünschten Genauigkeit der Analyse ab. Die Anzahl der analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 10.000.000. Für stark exprimierte Gene kann die Anzahl der analysierten Genprodukte niedrig sein, z.B. 1000 bis 10.000. Bei der Analyse schwach exprimierter Gene muß sie erhöht werden, z.B. auf 100.000 oder noch weiter. Es werden bespielsweise 100.000 einzelne Genprodukte gleichzei- tig analysiert. Dabei werden auch schwach exprimierte Gene (mit z.B. ca.100 mRNA-Molekülen/Zelle, was ca. 0.02% Gesamt-mRNA entspricht) in der Reaktion mit durchschnittlich 20 identifizierten Genprodukten repräsentiert.At the beginning it is determined how many copies of the gene products are necessary for the expression analysis. Several factors play a role in this. The exact number depends e.g. on the relative presence of the gene products in the approach and on the desired accuracy of the analysis. The number of gene products analyzed is preferably between 1000 and 10,000,000. For highly expressed genes, the number of gene products analyzed can be low, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or even further. For example, 100,000 individual gene products are analyzed at the same time. Weakly expressed genes (e.g. with approx. 100 mRNA molecules / cell, which corresponds to approx. 0.02% total mRNA) are also represented in the reaction with an average of 20 identified gene products.
2) Durchführung eines Detektionsschrittes in jedem Zyklus2) Performing a detection step in every cycle
Zur Sequenzierung müssen die Positionen der Genprodukt-Primer- Komplexe bestimmt werden, damit man eine Grundlage für die Zuordnung der Signale hat. Die Kenntnis dieser Positionen erlaubt eine Aussage darüber, ob die Signale einzelner Moleküle von eingebauten NTs* stammen oder von zufällig an die Oberfläche gebundenen NTs*. Diese Positionen können mit verschiedenen Methoden identifiziert werden.The positions of the gene product-primer complexes must be determined for sequencing, so that one has a basis for the assignment of the signals. Knowing these positions allows a statement to be made as to whether the signals of individual molecules come from built-in NTs * or from randomly bound NTs * . These positions can be identified using various methods.
In einer bevorzugten Ausführungsform werden die Positionen immobilisierter Genprodukte während der Sequenzierung identifiziert. Dabei wird die Tatsache genutzt, dass die Signale von den in die Nukleinsäurekette eingebauten NTs* immer dieselben Koordinaten haben. Das ist durch die Fixierung der Nukleinsäureketten gewährleistet. Die unspezifisch gebundenen NTs* binden zufällig an verschieden Stellen der Oberfläche.In a preferred embodiment, the positions of immobilized gene products are identified during sequencing. This makes use of the fact that the signals from the NTs * built into the nucleic acid chain always have the same coordinates. This is ensured by fixing the nucleic acid chains. The non-specifically bound NTs * bind randomly at different points on the surface.
Zur Identifizierung der Positionen von fixierten Genprodukten werden die Signale auf Übereinstimmung ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen überprüft . Das kann z.B. am Anfang der Sequenzierung erfolgen. Die übereinstimmende Koordinaten werden als Koordinaten der Genprodukte bewertet und gespeichert .To identify the positions of fixed gene products the signals are checked for their coordinates from several successive cycles. This can be done, for example, at the beginning of the sequencing. The matching coordinates are evaluated and stored as coordinates of the gene products.
Das Scan-System muß reproduzierbar über mehrere Zyklen die Oberfläche abscannen können. X,Y und Z-Achsen-Einstellungen an jeder Oberflächenposition können von einem Computer kontrolliert werden. Stabilität und Reproduzierbarkeit der Einstellung von Objektivpositionen in jedem Scanvorgang entscheiden über die Qualität der Detektion und somit über die Identifizierung der Signale einzelner Moleküle.The scan system must be able to scan the surface reproducibly over several cycles. X, Y and Z axis settings at each surface position can be controlled by a computer. The stability and reproducibility of the setting of lens positions in each scanning process determine the quality of the detection and thus the identification of the signals of individual molecules.
a) Einstellung der Position des Objektivs (X,Y-Achse)a) Setting the position of the lens (X, Y axis)
Die mechanische Instabilität der kommerziell erhältlichen Scantische und die geringe Reproduzierbarkeit der wiederholten Einstellung derselben X,Y-Positionen machen eine präzise Analysen der Signale einzelner Moleküle über mehrere Zyklen schwierig. Es existieren viele Möglichkeiten, eine Übereinstimmung der Koordinaten bei wiederholten Einstellungen zu verbessern bzw. mögliche Abweichungen zu kontrollieren. Als Beispiel wird eine Kontrollmöglichkeit angeführt. Nach einer groben mechanischen Einstellung der Objektivposition wird ein Kontrollbild von einem mit der Oberfläche fest verbundenen Muster gemacht. Auch wenn die mechanische Einstellung nicht exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 μm sind durchaus möglich) , kann man mittels optischer Kontrolle eine Korrektur vornehmen. Das Kontrollbild vom Muster dient als Koordinatensystem für das Bild mit Signalen von eingebauten NTs*. Eine Voraussetzung für eine solche Korrektur ist, dass keine weiteren Bewegungen der Oberfläche zwischen diesen beiden Aufnahmen gemacht werden. Signale von einzelnen Molekülen werden in Relation zum Muster gesetzt, so dass eine X,Y- Abweichung in der Musterposition gleiche X,Y-Abweichung in der Position der Signale einzelner Moleküle bedeutet. Das Kontrollbild vom Muster kann vor, während oder nach der Detektion einzelner Moleküle gemacht werden. Ein solches Kontrollbild muß entsprechend bei jeder Einstellung auf einer neuen Oberflächenposition gemacht werden.The mechanical instability of the commercially available scanning tables and the low reproducibility of repeated adjustment of the same X, Y positions make it difficult to precisely analyze the signals of individual molecules over several cycles. There are many ways to improve the coincidence of the coordinates with repeated settings or to check possible deviations. A control option is given as an example. After a rough mechanical adjustment of the lens position, a control image is made of a pattern firmly attached to the surface. Even if the mechanical setting does not have exactly the same coordinates (deviations of up to 10 μm are quite possible), you can make a correction using an optical control. The control image from the sample serves as a coordinate system for the image with signals from built-in NTs * . A prerequisite for such a correction is that no further surface movements are made between these two images. Signals from individual molecules are placed in relation to the pattern, so that an X, Y deviation in the pattern position means the same X, Y deviation in the position of the signals of individual molecules. The A control picture of the pattern can be taken before, during or after the detection of individual molecules. Such a control picture must be made accordingly with each setting on a new surface position.
b) Einstellung der Fokusebene (Z-Achse)b) Setting the focus plane (Z axis)
Die Oberfläche ist nicht absolut flach und weist verschiedene Unebenheiten auf. Dadurch verändert sich der Oberfläche-Objek- tiv-Abstand beim abscannen benachbarter Stellen. Diese Unterschiede im Abstand können dazu führen, dass einzelne Moleküle die Fokusebene verlassen und so der Detektion entgehen.The surface is not absolutely flat and has various bumps. This changes the surface-lens distance when scanning neighboring locations. These differences in distance can lead to individual molecules leaving the focal plane and thus avoiding detection.
Aus diesem Grund ist es wichtig, dass beim Abscannen der Ober- fläche eine reproduzierbare Einstellung der Fokusebene an jeder Objektivposition erreicht wird.For this reason it is important that when scanning the surface a reproducible setting of the focal plane is achieved at every lens position.
Es gibt verschiedene Möglichkeiten, die Fokusebene reproduzierbar einzustellen. Beispielsweise kann folgende Methode angewen- det werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer Fluoreszenz führen kann, wird auf die Oberfläche ein Marker aufgebracht, der zur Einstellung der Fokusebene dient. Danach erfolgt die Detektion der Signale einzelner Moleküle. Der Marker kann beliebiger Natur sein (z.B. Farbstoff oder Muster) , darf aber die Detektion und die Reaktion nicht beeinträchtigen.There are various ways to reproducibly adjust the focus level. For example, the following method can be used: Since the excitation of individual molecules can lead to the extinction of their fluorescence, a marker is applied to the surface, which serves to adjust the focal plane. The signals of individual molecules are then detected. The marker can be of any nature (e.g. dye or pattern), but must not interfere with the detection and the reaction.
c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen Gen- produkt.c) Detection of the signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective gene product.
Das mit Hilfe des Detektionssystems erzeugte zweidimensionale Bild der Reaktionsoberfläche enthält die SignalInformationen von in die Genprodukte eingebauten NT*s . Diese müssen vor der weiteren Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit geeigneten Methoden extrahiert werden. Die dazu notwendigen Algorithmen zur Skalierung, Transformation und Filterung der Bildinformationen zählen zum Standardrepertoir der digitalen Bildverarbeitung und Mustererkennung (Haberäcker P. "Praxis der Digitalen Bildverarbeitung und Mustererkennung". Hanser-Verlag, München, Wien, 1995; Galbiati L.J. "Machine vision and digital image processing fundamentals" . Prentice Hall, Englewood Cliffs, New Jersey, 1990) . Die Signalextraktion erfolgt vorzugsweise über ein Grauwertbild, das die Helligkeitsverteilung der Reaktionsoberfläche für den jeweiligen Fluoreszenzkanal abbildet. Wenn bei der Sequenzierungsreaktion mehrere Nukleotide mit unterschiedlichen Fluoreszenz-Farbstoffen verwendet werden, kann zunächst für jedes verwendete fluoreszenzmarkierte Nukleotid (A,T,C,G oder U) ein separates Grauwert-Bild erzeugt werden. Dafür können prinzipiell 2 Verfahren angewendet werden:The two-dimensional image of the reaction surface generated with the aid of the detection system contains the signal information from NT * s built into the gene products. Before further processing, these must be extracted from the total amount of image information using suitable methods. The necessary algorithms for scaling, transformation and Filtering of image information is part of the standard repertoire of digital image processing and pattern recognition (Haberäcker P. "Practice of digital image processing and pattern recognition". Hanser-Verlag, Munich, Vienna, 1995; Galbiati LJ "Machine vision and digital image processing fundamentals". Prentice Hall, Englewood Cliffs, New Jersey, 1990). The signal extraction is preferably carried out via a gray value image, which depicts the brightness distribution of the reaction surface for the respective fluorescence channel. If several nucleotides with different fluorescent dyes are used in the sequencing reaction, a separate gray value image can first be generated for each fluorescence-labeled nucleotide (A, T, C, G or U). In principle, two methods can be used for this:
1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersätze) wird für jeden Fluoreszenzkanal ein Grauwertbild erzeugt.1. A gray value image is generated for each fluorescence channel by using suitable filters (Zeiss filter sets).
2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines geeigneten Algorithmus durch ein2. From a recorded multichannel color image are made using a suitable algorithm by
Bildverarbeitungsprogramm die relevanten Farbkanäle extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer Färb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt:Image processing program extracts the relevant color channels and processes them individually as gray-scale images. A channel-specific coloring threshold algorithm is used for channel extraction. Individual gray value images 1 to N are thus initially created from a multi-channel color image. These images are defined as follows:
GBN= (s(x,y)) einkanaliges Grauwertbild N={l, ... ,Anzahl der Fluoreszenzkanäle} . M={0, 1, ... , 255} GrauwertmengeGB N = (s (x, y)) single-channel gray value image N = {l, ..., number of fluorescence channels}. M = {0, 1, ..., 255} gray value set
S=(s(x,y)) Bildmatrix des Grauwertbildes x=0, 1, ... ,L-1 Bildzeilen y=0,l, ... ,R-1 Bildspalten (x,y) Ortskoordinaten eines Bildpunktes s(x,y)e M Grauwert des Bildpunktes.S = (s (x, y)) image matrix of the gray value image x = 0, 1, ..., L-1 image lines y = 0, l, ..., R-1 image columns (x, y) location coordinates of a pixel s (x, y) e M Gray value of the pixel.
Aus dieser Datenmenge wird nun durch ein geeignetes Programm die relevante Bildinformation extrahiert. Ein solches Programm sollte folgende Arbeitsschritte realisieren:A suitable program is now used to convert this amount of data the relevant image information is extracted. Such a program should implement the following steps:
Für GB! bis GBN durchführen:For GB ! up to GB N :
I. Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa durch Grauwertglättung.I. Preprocessing of the image, for example, if necessary, reducing the image noise caused by the digitization of the image information, for example by gray value smoothing.
II. Prüfung jedes Bildpunkt (x,y) des Grauwertbildes, ob dieser Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter anderem von der verwendeten Detektionsapparatur und der Auflösung des Grauwertbildes ab. Sie können beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der Bildsegmentierung reichen von einfachen Schwellwert- verfahren bis hin zur Verwendung neuronaler Netze.II. Checking each pixel (x, y) of the gray-scale image as to whether this point fulfills the properties of a fluorescence point in connection with the immediate and further distant neighboring pixels surrounding it. These properties depend, among other things, on the detection equipment used and the resolution of the gray-scale image. For example, you can display a typical distribution pattern of brightness intensity values over a matrix surrounding the pixel. The image segmentation methods that can be used for this range from simple threshold value methods to the use of neural networks.
Erfüllt ein Bildpunkt (x,y) diese Anforderungen, dann folgt ein Vergleich mit den Koordinaten von in bisher durchgeführten Sequenzierungszyklen identifizierten Genprodukte. Bei einer Übereinstimmung erfolgt die Zuordnung des Signals mit dem aus dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem Genprodukt. Signale mit nicht übereinstimmenden Koordinaten werden als Hintergrundsignale bewertet und verworfen. Die Analyse der Signale kann parallel zum Scanvorgang erfolgen.If an image point (x, y) fulfills these requirements, then a comparison with the coordinates of gene products identified in previous sequencing cycles follows. If there is a match, the signal is associated with the nucleotide emerging from the respective fluorescence channel to this gene product. Signals with mismatched coordinates are evaluated as background signals and rejected. The signals can be analyzed in parallel with the scanning process.
In einer beispielhaften Ausführung wurde ein acht-Bit-Grauwert- bild mit einer Auflösung von 1317 x 1035 Pixel verwendet. Um die durch die Digitalisierung entstandenen Veränderungen am Bild zu reduzieren, erfolgte zunächst eine Vorverarbeitung des Gesamtbildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung entsteht dadurch ein für einen Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt mit dem größten Helligkeitswert und Nachbarbildpunkten mit nach allen Seiten hin abfallenden Helligkeiten. Erfüllte ein Bildpunkt diese Kritierien und Überschritt der zentrifugale Helligkeitsabfall einen bestimmten Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte) , dann wurde dieser zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes gewertet.In an exemplary embodiment, an eight-bit gray-scale image with a resolution of 1317 x 1035 pixels was used. In order to reduce the changes in the image caused by digitization, the overall image was first preprocessed: the average value of the brightness of its 8 neighbors was assigned to each pixel. With the selected resolution, this creates one for a fluorescence point typical pattern of a central pixel with the greatest brightness value and neighboring pixels with brightness falling towards all sides. If a pixel met these criteria and the centrifugal drop in brightness exceeded a certain threshold value (to exclude fluorescence spots that were too weak), this central pixel was evaluated as the coordinate of a fluorescence spot.
d) Verschiebung des Objektivs zur nächsten Position auf der Oberfläche. Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer anderen Position der Oberfläche positioniert .d) Moving the lens to the next position on the surface. After detecting the signals of individual molecules, the lens is positioned over another position on the surface.
Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der X,Y-Position, der Einstellung der Fokusebene und mit der Detektion einzelner Moleküle bei jeder neuen Objektivposition gemacht werden. Diese Schritte können durch einen Computer gesteuert werden.Overall, for example, a sequence of recordings can be made with the control of the X, Y position, the adjustment of the focal plane and with the detection of individual molecules at each new lens position. These steps can be controlled by a computer.
4.6 Zeitlicher Ablauf der Verfahrensschritte4.6 Timing of the procedural steps
Der Scanvorgang sowie die biochemische Reaktion nehmen eine gewisse Zeit in Anspruch. Wenn man diese Vorgänge nacheinander schaltet, kann man eine optimale Leistung der Apparatur errei- chen. In einer bevorzugten Ausführung wird die Reaktion auf zwei getrennten Oberflächen durchgeführt (Fig. 9) .The scanning process and the biochemical reaction take a certain amount of time. If you switch these processes one after the other, you can achieve an optimal performance of the equipment. In a preferred embodiment, the reaction is carried out on two separate surfaces (FIG. 9).
Als Beispiel kann eine Oberfläche mit gebundenen Genprodukten in 2 räumlich isolierte Teile getrennt werden, so dass Reaktionen auf diesen beiden Teilen unabhängig voneinander ablaufen können. In einem anderen Beispiel können Genprodukte auch von vornherein auf 2 getrennten Oberflächen immobilisiert werden.As an example, a surface with bound gene products can be separated into two spatially isolated parts, so that reactions on these two parts can take place independently of one another. In another example, gene products can also be immobilized on two separate surfaces from the outset.
Danach wird die Reaktion gestartet. Das Prinzip dabei ist, dass während auf einem Teil der Oberfläche die Reaktions- und Waschschritte ablaufen, der zweite Teil abgescannt wird. Dadurch kann man einen kontinuierlichen Ablauf der Analyse erreichen und die Geschwindigkeit der Sequenzierung steigern.The reaction is then started. The principle is that while the reaction and washing steps take place on part of the surface, the second part is scanned. Thereby you can achieve a continuous flow of analysis and increase the speed of sequencing.
Die Anzahl der Oberflächen, auf denen die Reaktion abläuft, kann auch größer als 2 sein. Das erscheint dann sinnvoll, wenn die Reaktion als zeitlich limitierender Schritt auftritt, d.h. die Detektion der Signale auf der Oberfläche schneller als die Reaktions- und Waschschritte abläuft. Um die Gesamtdauer der Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne Schritt der Reaktion auf einer einzelnen Oberfläche mit einer zeitlichen Verzögerung im Vergleich zur nächsten Oberfläche ablaufen.The number of surfaces on which the reaction takes place can also be greater than 2. This makes sense if the reaction occurs as a time-limiting step, i.e. the detection of the signals on the surface is faster than the reaction and washing steps. In order to adapt the total duration of the reaction to the detection duration, each individual step of the reaction can take place on a single surface with a time delay compared to the next surface.
4.7 Analyse4.7 Analysis
Die gewonnenen Daten (kurze Sequenzen) werden mit Hilfe eines Programms mit bekannten Gensequenzen verglichen. Einem solchen Programm kann z.B. ein BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .The data obtained (short sequences) are compared using a program with known gene sequences. Such a program can e.g. based on a BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Durch die Wahl der Methode zur Materialvorbereitung wird unter anderem festgelegt, in welchen Abschnitten der Genprodukte die Sequenzen ermittelt werden und zu welchem Strang (sense oder antisense) sie gehören. Z.B. werden bei der Verwendung der polyA-Strecken als Primerbindungsstelle in mRNA Sequenzen aus NTRs (non-translating-regions) bestimmt. Bei der Verwendung der Methode mit antisense-cDNA als Matrize stammen die ermittelten Sequenzen unter anderem aus den proteinkodierenden Bereichen der Genprodukte.The choice of the method for material preparation determines, among other things, in which sections of the gene products the sequences are determined and to which strand (sense or antisense) they belong. For example, are determined when using the polyA stretches as primer binding sites in mRNA sequences from NTRs (non-translating regions). When using the method with antisense cDNA as a template, the sequences determined come, inter alia, from the protein-coding regions of the gene products.
Bei einer bevorzugten einfachen Variante der Erfindung wird die Genexpression nur qualitativ bestimmt. Dabei ist nur die Tatsache der Expression bestimmter Gene von Bedeutung.In a preferred simple variant of the invention, the gene expression is only determined qualitatively. Only the fact that certain genes are expressed is important.
Bei einer anderen bevorzugten Ausführungsform ist eine quantitative Bestimmung der Verhältnisse zwischen einzelnen Genprodukten im Ansatz von Interesse. Es ist bekannt, dass die Aktivität eines Gens in einer Zelle durch eine Population identischer mRNA-Moleküle repräsentiert ist. In einer Zelle sind viele Gene gleichzeitig aktiv und werden dabei unterschiedlich stark exprimiert, was zum Vorhandensein vieler verschiedener unterschiedlich stark repräsentierter mRNA- Populationen führt .In another preferred embodiment, one is quantitative determination of the relationships between individual gene products in the approach of interest. It is known that the activity of a gene in a cell is represented by a population of identical mRNA molecules. Many genes are active in a cell at the same time and are expressed to different extents, which leads to the presence of many different mRNA populations with different strengths.
Im folgenden wird auf die quantitative Analyse der Genexpression näher eingegangen:The quantitative analysis of gene expression is discussed in more detail below:
Für eine quantitative Analyse der Genexpression werden die Abundanzen (Häufigkeiten) einzelner Genprodukte in der Sequen- zierungsreaktion bestimmt. Dabei sind die Produkte stark exprimierter Gene in der Sequenzierungsreaktion häufiger vertreten als die schwach exprimierter Gene.The abundances (frequencies) of individual gene products in the sequencing reaction are determined for a quantitative analysis of the gene expression. The products of highly expressed genes are more frequently represented in the sequencing reaction than the poorly expressed genes.
Nach der Zuordnung der Sequenzen zu bestimmten Genen wird der Anteil bzw. die Anzahl der ermittelten Sequenzen für jedes einzelne Gen bzw. Genprodukt bestimmt. Gene mit starker Expression haben einen höheren Anteil an der Gesamtpopulation der Genprodukte als Gene mit schwacher Expression.After assigning the sequences to specific genes, the proportion or number of sequences determined for each individual gene or gene product is determined. Genes with strong expression have a higher proportion of the total population of gene products than genes with weak expression.
Die Anzahl der analysierten Genprodukte liegt vorzugsweise zwischen 1000 und 10.000.000. Die genaue Anzahl der zu analysierenden Genprodukte hängt von der Aufgabenstellung ab. Für stark exprimierte Gene kann sie niedrig sein, z.B. 1000 bis 10.000. Bei der Analyse schwach exprimierter Gene muß sie erhöht werden, z.B. auf 100.000 oder höher.The number of gene products analyzed is preferably between 1000 and 10,000,000. The exact number of gene products to be analyzed depends on the task. It can be low for highly expressed genes, e.g. 1000 to 10,000. When analyzing poorly expressed genes, it must be increased, e.g. to 100,000 or higher.
Werden bespielsweise 100.000 einzelne Genprodukte gleichzeitig analysiert, sind auch schwach exprimierte Gene, wie z.B. ca.100 mRNA-Moleküle/Zelle (was ca. 0.02% Gesamt-mRNA entspricht), in der Reaktion mit durchschnittlich 20 identifizierten Genproduk- ten repräsentiert. Als interne Kontrolle der Hybridisierung, der Immobilisation und der Sequenzierungsreaktion läßt sich folgende Methode verwenden:If, for example, 100,000 individual gene products are analyzed at the same time, weakly expressed genes, such as approx. 100 mRNA molecules / cell (which corresponds to approx. 0.02% total mRNA), are also represented in the reaction with an average of 20 identified gene products. The following method can be used as internal control of the hybridization, the immobilization and the sequencing reaction:
Es können eine oder mehrere Nukleinsäureketten mit bekannten Sequenzen als Kontrolle eingesetzt werden (quantitativer Marker) . Die Zusammensetzung dieser KontrollSequenzen ist nicht eingeschränkt, sofern sie die Identifizierung der Genprodukte nicht stören. Bei der Sequenzanalyse der mRNA-Proben werden RNA-Kontrollproben, bei der Analyse der cDNA-Proben entsprechend DNA-Kontrollproben eingesetzt. Diese Proben werden vorzugsweise bei allen Schritten mitgeführt. Sie können z.B. nach der mRNA-Isolation zugegeben werden. Im allgemeinen werden die Kontrollproben in gleicher Weise zur Sequenzanalyse vorbereitet wie die zu analysierenden Genprodukte.One or more nucleic acid chains with known sequences can be used as a control (quantitative marker). The composition of these control sequences is not restricted provided that they do not interfere with the identification of the gene products. RNA control samples are used in the sequence analysis of the mRNA samples, and corresponding DNA control samples are used in the analysis of the cDNA samples. These samples are preferably carried along in all steps. You can e.g. added after mRNA isolation. In general, the control samples are prepared for sequence analysis in the same way as the gene products to be analyzed.
Die Kontrollsequenzen werden in bekannten, fest eingestellten (vorbestimmten) Konzentrationen zu den zu analysierenden Genprodukten zugegeben. Konzentrationen der Kontrollproben können unterschiedlich sein, vorzugsweise liegen diese Konzentrationen (d.h. die Gesamtkonzentration der Kontrollsequenzen) zwischen 0.01% und 10% der Gesamtkonzentration der zu analysierenden Probe (100%) . Beträgt die Konzentration der mRNA beispielsweise lOng/μl, dann liegen die Konzentrationen von Kontrollproben zwischen lpg/μl und lng/μl.The control sequences are added to the gene products to be analyzed in known, fixed (predetermined) concentrations. Concentrations of the control samples can be different, preferably these concentrations (i.e. the total concentration of the control sequences) are between 0.01% and 10% of the total concentration of the sample to be analyzed (100%). For example, if the concentration of the mRNA is 10ng / μl, the concentrations of control samples are between 1pg / μl and 1ng / μl.
Bei der quantitativen Analyse der Genexpression muß auch die allgemeine metabolische Aktivität der Zellen berücksichtigt werden, insbesondere, wenn ein Vergleich der Expression bestimmter Gene bei verschiedenen äußeren Bedingungen angestrebt wird.In the quantitative analysis of gene expression, the general metabolic activity of the cells must also be taken into account, in particular when a comparison of the expression of certain genes under different external conditions is sought.
Die Veränderung im Expressionsniveau eines bestimmten Gens kann als Folge der Veränderung in der Transkriptionsrate dieses Gens oder als Folge einer globalen Veränderung der Genexpression in der Zelle auftreten. Zur Beobachtung der metabolischen Zustände in der Zelle kann man die Expression der sogenannten "House- keeping-Gene" analysieren. Beim Mangel an wichtigen Metaboliten ist beispielsweise das allgemeine Expressionsniveau in der Zelle niedrig, so dass auch konstitutiv exprimierte Gene ein niedriges Expressionsniveau haben.The change in the level of expression of a particular gene can occur as a result of the change in the transcription rate of that gene or as a result of a global change in gene expression in the cell. To observe the metabolic states in the cell, the expression of the so-called "house keeping genes ". If there is a lack of important metabolites, for example, the general level of expression in the cell is low, so that constitutively expressed genes also have a low level of expression.
Im Prinzip können alle konstitutiv exprimierten Gene als "House-keeping-Gene" dienen. Als Beispiele seien das Transferrin-Rezeptor-Gen oder das Beta-Aktin-Gen genannt. Die Expression dieser House-keeping-Gene dient somit als Bezugsgröße für die Analyse der Expression anderer Gene. Die Sequenzermittlung und Quantifizierung der Expression der House- keeping-Gene ist vorzugsweise ein Bestandteil des Analyse- Programms für die Genexpression.In principle, all constitutively expressed genes can serve as "house-keeping genes". Examples include the transferrin receptor gene or the beta actin gene. The expression of these house-keeping genes thus serves as a reference for the analysis of the expression of other genes. The sequence determination and quantification of the expression of the house keeping genes is preferably a component of the analysis program for gene expression.
Die Erfindung wird nachfolgend anhand von Beispielen verdeutlicht.The invention is illustrated below using examples.
BeispieleExamples
Beispiel 1:Example 1:
Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 6f- 1) Als Ausgangssubstanzen dienen 5- (3-Aminoallyl) -2 ' -deoxyuri- din- 5 ' -triphosphat, AA-dUTP, (Sigma) , 3 , 3 ' -Dithio-bis (pro- pionsäure- N-Nydroxysuccinimidester) , DTBP-NHS, (Sigma) , 2- Mercaptoethylamin, MEA, (Sigma) . Zu 100 μl 50mmol/l Lösung von AA-dUTP in 100mmol/l Borat-Puffer pH 8.5 werden 3 Äquivalente an DTBP-NHS in DMF (25 μl 0.4mol/l Lösung) zugegeben. Das Reak- tionsgemisch wird 4 Stunden bei RT. inkubiert. Anschließend wird konz . Ammoniumacetat-Lösung (pH 9) zugegeben bis die Gesamtkonzentration an CH3COONH4 in der Reaktionslösung 100mmol/l ist, und die Reaktion wird eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch 200 μl lmol/1 MEA- Lösung, pH 9, zugegeben und eine Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesättigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die Jodfarbe bestehen bleibt. Die modifizierten Nukleotide werden auf einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient (pH 8.5) von anderen Reaktionsprodukten abgetrennt. Isolierung des Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An diesen Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v.246, S.362, Jameson et al. Method in Enzymology 1997, v.278, S.363).Modified dUTP with a long cleavable linker (Fig. 6f-1) 5- (3-aminoallyl) -2 'deoxyuridine-5' triphosphate, AA-dUTP, (Sigma), 3, 3 '- serve as starting substances Dithio-bis (propionic acid-N-hydroxysuccinimide ester), DTBP-NHS, (Sigma), 2-mercaptoethylamine, MEA, (Sigma). To 100 ul 50mmol / l solution of AA-dUTP in 100mmol / l borate buffer pH 8.5, 3 equivalents of DTBP-NHS in DMF (25 ul 0.4mol / l solution) are added. The reaction mixture is 4 hours at RT. incubated. Then conc. Ammonium acetate solution (pH 9) is added until the total concentration of CH 3 COONH 4 in the reaction solution is 100 mmol / l, and the reaction is incubated for a further hour. Then 200 μl imol / 1 MEA solution, pH 9, are added and incubated at RT for one hour. A saturated solution of I 2 in 0.3M KI solution is then added dropwise to this mixture until the iodine color remains. The modified nucleotides are separated from other reaction products on a DEAE cellulose column in an ammonium carbonate gradient (pH 8.5). The nucleotide with the cleavable linker is isolated on RP-HPLC. Dyes can now be coupled to this linker using various methods ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v.246, p.362, Jameson et al. Method in Enzymology 1997, v.278, p.363).
Auch andere Nukleotidanaloga (z.B. nach Hobbs et al. US Patent 5,047,519, Khan et al . US Patent 5,821,356) können in die Reaktion eingesetzt werden, so dass Nukleotidanaloga mit Strukturen in Fig. 6f-2,3,4 und 6g-1,2 erzeugt werden können.Other nucleotide analogs (for example according to Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356) can also be used in the reaction, so that nucleotide analogs with structures in FIGS. 6f-2,3,4 and 6g-1,2 can be generated.
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5-isothiocyanat, Molecular Probes) angegeben (NT*-Struktur Fig. 6j ) :The coupling of TRITC (tetramethylrhodamine-5-isothiocyanate, Molecular Probes) is given as an example of the coupling of a dye to the linker (NT * structure, FIG. 6j):
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 μl 100mmol/l Natrium-Borat-Puffer, pH 9, aufgelöstThe dNTP (300 nmol) modified with the cleavable linker is dissolved in 30 μl 100 mmol / l sodium borate buffer, pH 9
(10mmol/l NT*) . Dazu werden 10 μl 10mmol/l TRITC in DMF gegeben und 4h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in Methanol-Wasser Gradient. In ähnlicher Weise können andere Farbstoffe an die Aminogruppe des Linkers gekoppelt werden.(10mmol / l NT * ). 10 μl of 10 mmol / l of TRITC are added to DMF and incubated at RT for 4 h. The NT * modified with the dye is cleaned using RP-HPLC in a methanol-water gradient. Similarly, other dyes can be coupled to the amino group of the linker.
Das so hergestellte NT* erfüllt die Anforderungen des Einbaus in den DNA-Strang, des Fluoreszenznachweises und Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, die für das Gelingen des erfindungsgemäßen Verfahrens notwendig sind.The NT * produced in this way fulfills the requirements for incorporation into the DNA strand, fluorescence detection and chain termination after the incorporation and removal of the inhibition, which are necessary for the success of the method according to the invention.
Beispiel der Spaltung von Disulfidverbindung im modifizierten NT*. Die Spaltung erfolgt durch eine Zugabe von 20 bis 50mmol/l DTT oder Mercaptoethanol (Sigma) Lösung pH 8 auf die Reaktionsoberfläche. Die Oberfläche wird 10 min. mit dieser Lösung inkubiert, danach wird die Lösung entfernt und die Oberfläche mit einer Pufferlösung zur Entfernung von DTT- bzw. Mercaptoethanol-Resten gewaschen.Example of cleavage of disulfide compound in modified NT * . The cleavage is carried out by adding 20 to 50 mmol / l DTT or mercaptoethanol (Sigma) solution pH 8 to the Reaction surface. The surface is 10 min. incubated with this solution, then the solution is removed and the surface is washed with a buffer solution to remove DTT or mercaptoethanol residues.
Beispiel 2 :Example 2:
Modifiziertes dUTP (dUTP-SS-CH2CH2NH2) mit einem kurzen spaltbaren Linker (Fig. 6e-l) . Als Ausgangssubstanzen dienen: Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, v.180, S.383), 2-Mercaptoethylamin, MEA, (Sigma).Modified dUTP (dUTP-SS-CH 2 CH 2 NH 2 ) with a short cleavable linker (Fig. 6e-l). The starting substances are: bis-dUTP, synthesized according to Hanna (Method in Enzymology 1989, v.180, p.383), 2-mercaptoethylamine, MEA, (Sigma).
Zu 400 μl 100mmol/l Bis-dUTP in 40mmol/l Boratpuffer pH 8.5 werden lOOμl 100mmol/l MEA-Lösung, pH 8.5, in H20 zugegeben und 1 Stunde bei RT inkubiert . Anschließend wird zu diesem Gemisch solange eine gesättigte Lösung an I2 in 0.3mol/l KI-Lösung zugetropft, bis die Jodfarbe bestehen bleibt. Die Nukleotide (Bis- dUTP und dUTP-SS-CH2CH2NH2) können z.B. durch eine Ethanol- Präzipitation oder auf einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient (pH 8.5) von anderen Reaktionsprodukten abgetrennt. Bis-dUTP stört bei der anschließenden Ankopplung eines Farbstoffs an die Aminogruppe des Linkers nicht, so dass die Abtrennung des dUTP-SS-CH2CH2NH2 von bis-dUTP im Endreinigungsschritt erfolgen kann.100 μl 100 mmol / l MEA solution, pH 8.5, in H 2 0 are added to 400 μl 100 mmol / l bis-dUTP in 40 mmol / l borate buffer pH 8.5 and incubated at RT for 1 hour. A saturated solution of I 2 in 0.3 mol / l KI solution is then added dropwise to this mixture until the iodine color remains. The nucleotides (Bis-dUTP and dUTP-SS-CH 2 CH 2 NH 2 ) can be separated from other reaction products, for example by ethanol precipitation or on a DEAE cellulose column in an ammonium carbonate gradient (pH 8.5). Bis-dUTP does not interfere with the subsequent coupling of a dye to the amino group of the linker, so that the dUTP-SS-CH 2 CH 2 NH 2 can be separated from bis-dUTP in the final cleaning step.
In einer ähnlichen Weise kann auch dCTP (Fig.6-e2) modifiziert werden, dabei dient Bis-dCTP als Ausgangssubstanz (synthetisiert nach Hanna et al. Nucleic Acid Research 1993, v.21, S.2073) .DCTP (Fig. 6-e2) can be modified in a similar way, bis-dCTP serving as the starting substance (synthesized according to Hanna et al. Nucleic Acid Research 1993, v.21, p.2073).
Weitere NT* (dUTP* und dCTP*) mit einem kurzen Linkerrest können in einer ähnlichen Weise synthetisiert werden, wobei NT* beispielsweise folgende Strukturen aufweisen können (Fig.6e): dUTP-SS- (CH2)n-NH2, Fig.6e-1, dCTP-SS- (CH2)n-NH2, Fig.6e-2, wo n zwischen 2 und 6 liegt, vorzugsweise zwischen 2 und 4, dUTP-SS-(CH2)n-X-CO-(CH2)m-Z, Fig.6e-3, dUTP-SS- (CH2)n-X-CO-Y-(CH2)m-Z, Fig.6e-4, dCTP-SS- (CH2)n-X-CO- (CH2)m-Z, Fig.6e-5, dCTP-SS-(CH2)n-X-CO-Y-(CH2)m-Z, Fig.6e-6, X = NH, O, SOther NT * (dUTP * and dCTP * ) with a short linker residue can be synthesized in a similar manner, NT * for example having the following structures (FIG. 6e): dUTP-SS- (CH 2 ) n -NH 2 , FIG .6e-1, dCTP-SS- (CH 2 ) n -NH 2 , Fig. 6e-2, where n is between 2 and 6, preferably between 2 and 4, dUTP-SS- (CH 2 ) n -X-CO- (CH 2 ) m -Z, Fig. 6e-3, dUTP-SS- (CH 2 ) n -X-CO-Y- (CH 2 ) m - Z, Fig. 6e-4, dCTP-SS- (CH 2 ) n -X-CO- (CH 2 ) m -Z, Fig. 6e-5, dCTP-SS- (CH 2 ) n -X-CO- Y- (CH 2 ) m -Z, Fig. 6e-6, X = NH, O, S
Y = NH, 0, SY = NH, 0, S
Z = NH2, OH, Farbstoff wo (n + m) zwischen 4 und 10 liegt, vorzugsweise zwischen 4 undZ = NH 2 , OH, dye where (n + m) is between 4 and 10, preferably between 4 and
6.6th
An den Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und ResearchDyes can now be coupled to the linker using various methods ("Handbook of Fluorescent Probes and Research
Chemicals" 6th ed. 1996, R.Haugland, Molecular Probes, WaggonerChemicals "6th ed. 1996, R.Haugland, Molecular Probes, Waggoner
Method in Enzymology 1995 v.246, S.362, Jameson et al . Method in Enzymology 1997, v.278, S.363).Method in Enzymology 1995 v.246, p.362, Jameson et al. Method in Enzymology 1997, v.278, p.363).
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung des FluoroLinkTM Cy3 monofunktional dye (Amersham Pharmacia biotech) (NT*-Struktur Fig. 6i) angegeben. Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstoff. Die Reaktion wird nach Angaben des Herstellers durchgeführt: Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 μl 100mmol/l Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird Farbstoff (300nmol) gegeben und lh bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.The coupling of the FluoroLinkTM Cy3 monofunctional dye (Amersham Pharmacia biotech) (NT * structure Fig. 6i) is given as an example of coupling a dye to the linker. It is a monofunctional NHS ester fluorescent dye. The reaction is carried out according to the manufacturer's instructions: The dNTP (300 nmol) modified with the cleavable linker is dissolved in 300 μl 100 mmol / l sodium borate buffer pH 8.5. For this, dye (300 nmol) is added and incubated for 1 h at RT. The NT * modified with the dye is cleaned by RP-HPLC in a methanol-water gradient.
Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5- isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC Fig.6h) .Another example of the coupling of a dye to the linker is the coupling of TRITC (tetramethylrhodamine-5-isothiocyanate, Molecular Probes) (dUTP-SS-TRITC Fig. 6h).
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 μl 100mmol/l Natrium-Borat-Puffer pH 9 aufgelöst (10mmol/l NT*) . Dazu werden 10 μl 10mmol/l TRITC in DMF gegeben und 4h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.The dNTP (300 nmol) modified with the cleavable linker is dissolved in 30 μl 100 mmol / l sodium borate buffer pH 9 (10 mmol / l NT * ). 10 μl of 10 mmol / l of TRITC are added to DMF and incubated at RT for 4 h. The NT * modified with the dye is cleaned by RP-HPLC in a methanol water Gradient.
Das so hergestellte NT* erfüllt die Anforderungen des Einbaus in den DNA-Strang, des Fluoreszenznachweises und Kettenabbruchs nach dem Einbau und der Aufhebung der Hemmung, die für das Gelingen des erfindungsgemäßen Verfahrens notwendig sind.The NT * produced in this way fulfills the requirements for incorporation into the DNA strand, fluorescence detection and chain termination after the incorporation and removal of the inhibition, which are necessary for the success of the method according to the invention.
Beispiel der Spaltung der Disulfidverbindung im modifizierten NT*. Die Spaltung erfolgt durch Zugabe von 20 bis 50mmol/l Dithiothreitol-Lösung (DTT) oder Mercaptoethanol-Lösung (Sigma) , pH 8, auf die Reaktionsoberfläche. Die Oberfläche wird 10 min. mit dieser Lösung inkubiert, danach wird die Lösung entfernt und die Oberfläche mit einer Pufferlösung zur Entfernung von DTT- bzw. Mercaptoethanol-Resten gewaschen.Example of cleavage of the disulfide compound in the modified NT * . The cleavage is carried out by adding 20 to 50 mmol / l dithiothreitol solution (DTT) or mercaptoethanol solution (Sigma), pH 8, to the reaction surface. The surface is 10 min. incubated with this solution, then the solution is removed and the surface is washed with a buffer solution to remove DTT or mercaptoethanol residues.
Weitere Beispiele für NT-Strukturen, die im erfindungsgemäßen Verfahren verwendet werden können sind in Fig. 6k,l,m abgebildet . Für die einzelnen Synthesenschritte siehe beispielsweise J.L.Ruth et al . Molecular Pharmacology 1981 v.20 S.415, L. Ötvös et al . NAR 1987 v.15 S.1763, G.E.Wright et al . Pharmac Ther. 1990 v.47, S.447, „Nucleotide Analogs; Synthesis and Biological Function" K.H. Scheit 1980, Wiley-Interscience Publication, "Nucleic acid chemistry" Ed. L.B.Townsend, v.1-4, Wiley-Interscience Publication, "Chemistry of Nucleosides and Nucleotides" Ed. L.B.Townsend, v.1-3, Plenum Press.Further examples of NT structures that can be used in the method according to the invention are shown in FIGS. 6k, 1, m. For the individual synthesis steps, see for example J.L. Ruth et al. Molecular Pharmacology 1981 v.20 p.415, L. Ötvös et al. NAR 1987 v.15 p.1763, G.E.right et al. Pharmac Ther. 1990 v.47, p.447, "Nucleotide Analogs; Synthesis and Biological Function "KH Scheit 1980, Wiley-Interscience Publication," Nucleic acid chemistry "Ed. LBTownsend, v.1-4, Wiley-Interscience Publication," Chemistry of Nucleosides and Nucleotides "Ed. LBTownsend, v.1 -3, Plenum Press.
Beispiel 3 :Example 3:
Sequenzanalyse mit 4 markierten NTs* Sequence analysis with 4 marked NTs *
Bei einer bevorzugten Ausführungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenz- farbstoffen markiert.In a preferred embodiment of the invention, all four NTs * used in the reaction are labeled with fluorescent dyes.
Dabei verwendet man eine der oben genannten farbigen Kodierungsschemata. Die Zahl der ermittelten NTs für jede Sequenz aus einem Genprodukt liegt zwischen 5 und 100, idealerweise zwischen 20 und 50. Diese ermittelten Sequenzen werden mit Hilfe eines Programms mit bekannten Sequenzen in Gen-Datenbanken verglichen und entsprechenden Genen zugeordnet . Einem solchen Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .One of the color coding schemes mentioned above is used. The number of NTs found for each Sequence from a gene product is between 5 and 100, ideally between 20 and 50. These sequences are compared with a known program in gene databases using a program and assigned to appropriate genes. Such a program can be based, for example, on the BLAST or FASTA algorithm ("Introduction to Computational Biology" 1995 MS Waterman Chapman & Hall).
Ein Zyklus hat folgende Schritte: a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten, b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen d) Detektion der Signale von einzelnen Molekülen, e) Entfernung der Markierung von den eingebauten Nukleotiden, f) Waschen.A cycle has the following steps: a) adding a solution with labeled nucleotides (NTs * ) and polymerase to immobilized nucleic acid chains, b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) Washing d) detection of signals from individual molecules, e) removal of the label from the built-in nucleotides, f) washing.
Beispiel 4 :Example 4:
Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs (2NTs* / 2NTs-Methode) .Sequence analysis with 2 marked NTs * and 2 unmarked NTs (2NTs * / 2NTs method).
In einer anderen Ausführungsform werden für die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs eingesetzt.In another embodiment, 2 modified NTs * and 2 unmodified NTs are used for the analysis of the sequences.
Diese Ausführungsform beruht auf dem Prinzip, dass eine Abfolge aus 2 Signalen (markierte NT*s) genügend Informationen zur Identifizierung einer Sequenz enthalten kann. Die ermittelte Sequenz wird mit der Referenzsequenz verglichen und einer bestimmten Position zugeordnet, z.B.:This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence. The determined sequence is compared with the reference sequence and assigned to a specific position, for example:
ACCAAAACACCC - ermittelte Sequenz (dCTP* und dATP* sind markiert) ATCATCGTTCGAAATATCGATCGCCTGATGCC - ReferenzsequenzACCAAAACACCC - determined sequence (dCTP * and dATP * are marked) ATCATCGTTCGAAATATCGATCGCCTGATGCC - reference sequence
A-C C-AAA-A-C-A-C-CC (zugeordnete ermittelte Sequenz) ATCATCGTTCGAAATATCGATCGCCTGATGCC (Referenzsequenz)A-C C-AAA-A-C-A-C-CC (assigned determined sequence) ATCATCGTTCGAAATATCGATCGCCTGATGCC (reference sequence)
Vorzugsweise werden die ermittelten Sequenzen mit Hilfe eines Programms der Referenzsequenz zugeordnet . Einem solchen Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall) .The sequences determined are preferably assigned to the reference sequence with the aid of a program. Such a program can e.g. based on the BLAST or FASTA algorithm ("Introduction to computational Biology" 1995 M.S. Waterman Chapman & Hall).
Die Genprodukte werden wie oben beschrieben zur Sequenzierung vorbereitet und mit 2NTs*/2NTs-Methode sequenziert. Man erhält Sequenzenabschnitte aus Genprodukten, wobei jede Sequenz eine Abfolge aus 2NTs* darstellt. Bekannte Gensequenzen dienen als ReferenzSequenzen. Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten Sequenzen mehr als 20 NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, ist die Gesamtlänge des synthetisierten komplementären Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 20 detektierten NTs* beträgt die Gesamtlänge z.B. durchschnittlich 40 NTs).The gene products are prepared for sequencing as described above and sequenced using the 2NTs * / 2NTs method. Sequence sections are obtained from gene products, each sequence representing a sequence of 2NTs * . Known gene sequences serve as reference sequences. In order to enable the determined sequence to be clearly assigned to a known reference sequence, this sequence must be long enough. The length of the sequences determined is preferably more than 20 NT * s. Since 2 marked NTs * represent only part of the sequence, the total length of the complementary strand synthesized is approximately twice as long as the sequence of the detected NTs * (with 20 detected NTs * , the total length is, for example, an average of 40 NTs).
Zur Synthese eines komplementären Stranges werden 4 Nukleotide benötigt. Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden Erfindung als Semiterminatoren auftreten, d.h. die Termination ausschließlich bei Verfügbarkeit modifi- zierter NTs* auftritt, müssen unmodifizierte NTs in einem zusätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue Position dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei ist, dass die markierten NTs* und die unmodifizierte NTs getrennt verwendet werden.4 nucleotides are required to synthesize a complementary strand. Since the NTs * marked with a fluorescent dye appear as semiterminators in the present invention, ie the termination occurs only when modified NTs * are available , unmodified NTs must be added to the reaction in an additional step in each cycle. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs are used separately.
Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgendermaßen aussehen: a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten Genprodukten b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind, c) Waschen d) Detektion der Signale von einzelnen, modifizierten und in die den Genprodukten komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülen e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotiden f) Waschen g) Zugabe von 2 unmodifizierten NTs und Polymerasen h) Waschen.A cycle in this embodiment may look as follows, for example: a) adding a solution with modified NTs * and polymerases to the surface with the gene products provided b) incubating the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT, c) washing d) detecting the signals from individual, modified NTs * molecules built into the newly synthesized strands complementary to the gene products e) removal of the label and the terminating group in the built-in nucleotides f) washing g) addition of 2 unmodified NTs and polymerases h) washing.
Beispiel 5:Example 5:
Die Vorbereitung und die Durchführung derThe preparation and implementation of the
Sequenzierungsreaktionsequencing reaction
Die Vorbereitung der Gel-Oberfläche:The preparation of the gel surface:
Das Polyacrylamid-Gel für die Analyse von Reaktionen mit einzelnen Molekülen wird nach allgemeinen Regeln der Gel- Vorbereitung für elektrophoretische Auftrennung erstellt („Electrophoresis" A.T. Andrews, Oxford science publications 1995) .The polyacrylamide gel for the analysis of reactions with individual molecules is prepared according to general rules of gel preparation for electrophoretic separation ("Electrophoresis" A.T. Andrews, Oxford science publications 1995).
Die Polymerisationsreaktion kann z.B. durch UV-Licht oder durch Radikalbildner durchgeführt werden. In diesem Beispiel wird Ammoniumpersulfat (APS) und TEMED (Tetramethylethylendiamin) zur Radikalreaktion verwendet, z.B. TEMED 0.01% v/v und APS 0.04% w/v. Die Komponentenzusammensetzung kann breit variieren, die Konzentrationen einzelner Komponenten liegen in folgenden Bereichen (errechnet für die gebrauchsfertige wässrige AA- bisAA-Lösung) :The polymerization reaction can e.g. be carried out by UV light or by radical formers. In this example ammonium persulfate (APS) and TEMED (tetramethylethylene diamine) are used for the radical reaction, e.g. TEMED 0.01% v / v and APS 0.04% w / v. The component composition can vary widely, the concentrations of individual components are in the following ranges (calculated for the ready-to-use aqueous AA to AA solution):
Acrylamid-Monomer (AA) von 3 bis 30%, idealerweise zwischen 10 und 20% Bis-Acrylamid (bis-AA) im Verhältnis zum Acrylamid-Monomer 1:10 bis 1:50, vorzugsweise 1:20.Acrylamide monomer (AA) from 3 to 30%, ideally between 10 and 20% Bis-acrylamide (bis-AA) in relation to the acrylamide monomer 1:10 to 1:50, preferably 1:20.
Zur Herstellung werden 2 saubere Glasplatten verwendet (mit Aceton und danach Wasser gewaschen) . Eine Glasplatte (Pl) wird vorzugsweise mit einem wasserabweisenden Reagenz vorbehandelt, z.B Repel-silan, Dimethyldichlorsilane-Lösung, Amersham Pharmacia-Biotech. P2 dient als fester Träger für das Gel und kann mit gelbindenden Reagenzien z.B. Bind-silan, Methacryloxypropyltrimethoxysilane, Amersham Pharmacia- Biotech, vorbehandelt werden, so dass es zu einer kovalenten Bindung zwischen dem Gel und der Glasoberfläche kommt. Die P2- Vorbehandlung mit gelbindenden Reagentien ist dann sinnvoll, wenn mehrere Reaktionen mit immobilisierten Molekülen durchgeführt werden müssen. Bei einer geringeren Anzahl an Reaktionen ist eine solche Vorbehandlung nicht notwendig. In diesen Fällen reicht, für P2 eine saubere Glas-Oberfläche aus, so dass das Gel allein durch adhäsive Kräfte an der Glasoberfläche haften bleibt.2 clean glass plates are used for the production (washed with acetone and then water). A glass plate (PI) is preferably pretreated with a water-repellent reagent, e.g. Repelsilane, dimethyldichlorosilane solution, Amersham Pharmacia-Biotech. P2 serves as a solid carrier for the gel and can be used with yellow-binding reagents e.g. Bind silane, methacryloxypropyltrimethoxysilane, Amersham Pharmacia-Biotech, are pretreated so that there is a covalent bond between the gel and the glass surface. P2 pretreatment with yellowing reagents is useful when several reactions with immobilized molecules have to be carried out. With a smaller number of reactions, such pretreatment is not necessary. In these cases, a clean glass surface is sufficient for P2 so that the gel adheres to the glass surface solely by adhesive forces.
Die fertige Polymerisationslösung (AA/bisAA-Lösung mit Radikalbildnern) wird zwischen Pl und P2 gegossen, so dass eine Schicht mit der Dicke von ca. 5 bis 30 μm resultiert. Die Dicke des Gels kann z.B. durch Abstandhalter kontrolliert werden. Nach Erhärtung wird Pl entfernt. Das Gel bleibt auf P2 haften. Es wird mit entionisiertem Wasser gewaschen.The finished polymerization solution (AA / bisAA solution with radical formers) is poured between P1 and P2, so that a layer with a thickness of approx. 5 to 30 μm results. The thickness of the gel can e.g. be checked by spacers. After hardening, Pl is removed. The gel sticks to P2. It is washed with deionized water.
Das Gel kann direkt weiter verwendet werden oder in verschiedenen Fertigungsstadien getrocknet und gelagert werden. Vor einer Reaktion mit markierten Molekülen wird das Gel normalerweise einige Minuten in der Reaktions-Pufferlösung aufgequollen und erst dann für die Reaktion eingesetzt.The gel can be used directly or can be dried and stored at various stages of manufacture. Before a reaction with labeled molecules, the gel is usually swollen in the reaction buffer solution for a few minutes and only then used for the reaction.
Auf eine so vorbereitete Gel-Oberfläche werden Nukleinsäureketten durch Austrocknen immobilisiert.Nucleic acid chains are immobilized on a gel surface prepared in this way by drying out.
Beispielsweise wurde eine Lösung (ca. lμl) einer Plasmid-DNA (mit Hind III linearisierte, durch Hitze in einzelsträngige Form überführte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang, Konzentration O.lμg/μl) auf ca. 10mm2 der Gel-Oberfläche aufgetropft und bei 90° C zum Trocknen gebracht. Die errechnete Dichte der immobilisierten Plasmid-Moleküle betrug ca. 1000 pro lμm2.For example, a solution (approximately 1 μl) of a plasmid DNA (linearized with Hind III) was converted into single-stranded by heat Form converted pMOS blue plasmid DNA about 3400 NT long, concentration O.lμg / μl) was dropped on about 10mm 2 of the gel surface and brought to dryness at 90.degree. The calculated density of the immobilized plasmid molecules was approximately 1000 per 1 μm 2 .
Als Primer wurde das Oligonukleotid 5' -AGTGAATTCGAGCTCGGTAC-3' verwendet. Die Primerbindungsstelle (nachfolgend fettgedruckt) zusammen mit der für die Analyse relevanten Verlängerung hat folgende Sequenz : 5' -ATCCCCGGGTACCGAGCTCGAATTCACT-3 'The oligonucleotide 5 '-AGTGAATTCGAGCTCGGTAC-3' was used as primer. The primer binding site (hereinafter bold) together with the extension relevant for the analysis has the following sequence: 5 '-ATCCCCGGGTACCGAGCTCGAATTCACT-3'
Eine Flow-Cell (Mikroflüssigkeitskanal, MFK) mit der Reaktionsoberfläche als Deckel wurde zusammengebaut. Ein solcher MFK erlaubt einen schnellen Flüssigkeitsaustausch unter der Geloberfläche.A flow cell (microfluidic channel, MFK) with the reaction surface as a lid was assembled. Such an MFK allows a rapid exchange of liquid under the gel surface.
Als Vorversuch wurde der Primer (errechnete Tm 45,3° C, 0.1μmol/l in 50mmol/l Tris-HCl pH 8,7) bei 45° C für 10 Minuten mit der Plasmid-DNA auf der Oberfläche hybridisiert (Annealing) . Nach einem Waschschritt wurde die Dichte der Plasmid-Primer-Komplexe kontrolliert. Die Kontrolle erfolgte durch den Einbau von dCTP-Cy3 (Amersham Pharmacia Biotech) unter Verwendung von Klenow-Fragment (2Units pro 50μl in 20mmol/l Tris-HCl-Puffer, pH 8,5, mit 5mmol/l MgCl2, 15 Minuten bei 30° C) . Dabei wird nur ein einzelnes dCMP-Cy3 in den wachsenden Strang eingebaut.As a preliminary test, the primer (calculated Tm 45.3 ° C, 0.1μmol / l in 50mmol / l Tris-HCl pH 8.7) was hybridized at 45 ° C for 10 minutes with the plasmid DNA on the surface (annealing). After a washing step, the density of the plasmid-primer complexes was checked. The control was carried out by incorporating dCTP-Cy3 (Amersham Pharmacia Biotech) using Klenow fragment (2 units per 50 μl in 20 mmol / l Tris-HCl buffer, pH 8.5, with 5 mmol / l MgCl 2 for 15 minutes 30 ° C). Only a single dCMP-Cy3 is built into the growing strand.
Als Detektionsapparatur diente Axioplan 2e (Zeiss) mit der CCD-Kamera AxioCam (Zeiss), Fig.7, 8. Die Signaldichte der einzelnen, eingebauten dCMP-Cy3 -Moleküle entspricht der Dichte der extensionsfähigen Plasmid-Primer- Komplexe. Unter den genannten Bedingungen betrug die Dichte der Plasmid-Primer-Komplexe durchschnittlich ca. 15 pro 100 μm2 und lag damit in der gewünschten Größenordnung (Fig. 8a-c) . Auf einer zweiten, in gleicher Weise vorbereiteten Oberfläche (mit Hind III linearisierte, durch Hitze in einzelsträngige Form überführte pMOS-Blue-Plasmid-DNA ca. 3400 NT lang, Konzentration O.lμg/μl mit hybridisierten Primern) wird eine zyklische Sequenzierungsreaktion durchgeführt. Dabei werden dUTP-SS-CH2CH2NH-R-Cy3 (dUTP*) und dCTP-SS-CH2CH2NH-R-Cy3 (dCTP*) (s. Beispiel 2) als reversible Terminatoren verwendet. Die Detektionsapparatur ist dieselbe wie im Vorversuch.Axioplan 2e (Zeiss) with the CCD camera AxioCam (Zeiss), Fig. 7, 8, served as the detection apparatus. The signal density of the individual built-in dCMP-Cy3 molecules corresponds to the density of the plasmid-primer complexes which can be extended. Under the conditions mentioned, the density of the plasmid-primer complexes averaged approximately 15 per 100 μm 2 and was thus of the desired order (FIGS. 8a-c). On a second surface prepared in the same way (pMOS blue plasmid DNA linearized with Hind III and converted into single-stranded form by heat for about 3400 NT, Concentration O.lμg / μl with hybridized primers), a cyclic sequencing reaction is carried out. In this case, dUTP-SS-CH 2 CH 2 NH-R-Cy3 (dUTP *) and dCTP-SS-CH 2 CH 2 NH-R-Cy3 (dCTP *) (see Example 2) are used as reversible terminators. The detection apparatus is the same as in the preliminary test.
Die für die zyklische Sequenzierungsreaktion verwendeten Lösungen setzen sich wie folgt zusammen:The solutions used for the cyclic sequencing reaction are composed as follows:
a) Reaktionslösung für die Einbaureaktion: 20 mmol/1 Tris-HCl- Puffer, pH 8.5, 5mmol/l MgCl2, 10% Glycerin, Klenow-Fragmenta) Reaction solution for the installation reaction: 20 mmol / 1 Tris-HCl buffer, pH 8.5, 5 mmol / l MgCl 2 , 10% glycerol, Klenow fragment
(Amersham Pharmacia-Biotech) 2U pro 50μl, dUTP* bzw. dCTP* , oder dATP und dGTP je 10 μmol/1. b) Waschlösung: 20 mmol/1 Tris-HCl pH 8.5, 0.01% Na-Azid c) Reaktionslösung für die Abspaltungsreaktion: 20 mmol/1 Tris-HCl, pH 8.5, 50mmol/l Mercaptoethanol.(Amersham Pharmacia-Biotech) 2U per 50μl, dUTP * or dCTP *, or dATP and dGTP each 10 μmol / 1. b) Wash solution: 20 mmol / 1 Tris-HCl pH 8.5, 0.01% Na-Azide c) Reaction solution for the cleavage reaction: 20 mmol / 1 Tris-HCl, pH 8.5, 50mmol / l mercaptoethanol.
Die Einbaureaktionen mit markierten NT*s wurden bei 30° C 15 Minuten durchgeführt .The installation reactions with marked NT * s were carried out at 30 ° C. for 15 minutes.
Im ersten Zyklus der Sequenzierungsreaktion wurde eine Reaktionslösung mit dCTP* zugegeben. Nach einem Waschschritt wurde ein Detektionsschritt durchgeführt, wobei Einzelmolekül- Signale mit den zugeordneten x,y-Koordinaten auf der Oberfläche registriert wurden (insgesamt ca. 11.200 Signale). Danach wurde die Markierung von den eingebauten NT*s abgespalten (Raumtemperatur, 10 Minuten) und die Oberfläche gewaschen.In the first cycle of the sequencing reaction, a reaction solution with dCTP * was added. After a washing step, a detection step was carried out, single-molecule signals with the assigned x, y coordinates being registered on the surface (a total of approximately 11,200 signals). The marker was then removed from the built-in NT * s (room temperature, 10 minutes) and the surface was washed.
Im zweiten Zyklus wurde eine Reaktionslösung mit dUTP* zugegeben und 15 Minuten lang bei 30° C inkubiert. Nach einem anschließenden Waschschritt wurden die Einzelmolekül-Signalen auf der Oberfläche detektiert (insgesamt ca. 200 Signale) .In the second cycle, a reaction solution with dUTP * was added and incubated for 15 minutes at 30 ° C. After a subsequent washing step, the single-molecule signals were detected on the surface (a total of approximately 200 signals).
Dies entspricht dem Hintergrundsignal, das durch eine unspezifische Bindung der NT*s an die Oberfläche entsteht. Die Markierung von den NT*s wurde abgespalten (Raumtemperatur, 10This corresponds to the background signal that arises from an unspecific binding of the NT * s to the surface. The marker from the NT * s was split off (room temperature, 10
Minuten) und die Oberfläche mit der Waschlösung gewaschen.Minutes) and the surface washed with the washing solution.
Im dritten Zyklus wurde eine Reaktionslösung mit dATP und dGTP zugegeben und 15 Minuten lang bei 30° C inkubiert. Anschließend wurde die Oberfläche gewaschen.In the third cycle, a reaction solution with dATP and dGTP added and incubated for 15 minutes at 30 ° C. The surface was then washed.
Die Zyklen 1 bis 3 wurden drei mal wiederholt, wobei insgesamt ca. 9900 CCU-Zielsequenzen ermittelt wurden. Diese Sequenzen können eindeutig dem Primer zugeordnet werden. Cycles 1 to 3 were repeated three times, with a total of approximately 9900 CCU target sequences being determined. These sequences can be clearly assigned to the primer.
Legenden zu Figuren 1 bis 9Legends for Figures 1 to 9
Legende zu Fig. 1Legend to Fig. 1
Schematische Darstellung der Analyse von mRNA-PopulationSchematic representation of the analysis of mRNA population
Der Analyse liegt die Sequenzierung kurzer Abschnitte von mRNA zugrunde .The analysis is based on the sequencing of short sections of mRNA.
1) mRNA - die zu analysierende mRNA-Population, in diesem Beispiel bestehend aus zwei unterschiedlichen mRNA-1) mRNA - the mRNA population to be analyzed, in this example consisting of two different mRNA
Molekülpopulationen (dünne und dicke Streifen repräsentieren mRNA-Mo1eküle)Molecular populations (thin and thick stripes represent mRNA molecules)
2) Immobilisierte mRNA - an die plane Oberfläche gebundene mRNA-Primer-Komplexe, in diesem Beispiel erfolgt die Bindung durch die Oligo-dT-Primer2) Immobilized mRNA - mRNA-primer complexes bound to the flat surface, in this example the binding is carried out by the oligo-dT primer
3) Zugabe einer Lösung mit Polymerasen und NT*s - der erste Schritt in einem Zyklus der Sequenzierungsreaktion3) Add a solution with polymerases and NT * s - the first step in a cycle of the sequencing reaction
4) Waschschritt - nach dem Einbauschritt wird die Oberfläche gewaschen4) Washing step - after the installation step, the surface is washed
5) Detektion - die Signale von einzelnen eingebauten NT*s werden detektiert5) Detection - the signals from individual built-in NT * s are detected
6) Entfernung der Markierung und der zur Termination führenden Gruppe - zur Fortsetzung der Sequenzierungsreaktion werden die Markierung und das sterische Hindernis entfernt6) Removal of the label and the group leading to the termination - the label and the steric obstacle are removed in order to continue the sequencing reaction
Legende zur Fig. 2Legend for Fig. 2
Beispiel für allgemeine Struktur von Genprodukt-Primer- KomplexenExample of the general structure of gene product-primer complexes
Fig. 2 In dieser Ausführungsform hat jedes Genprodukt eine einheitliche Primerbindungsstelle (PBS) an seinem 3 '-Ende, so dass an diese PBS ein einheitlicher Primer binden kann.Fig. 2 In this embodiment, each gene product has one uniform primer binding site (PBS) at its 3 'end, so that a uniform primer can bind to this PBS.
1) Primer1) primer
25} Primerbindungsstelle25} primer binding site
3) Einzelsträngiger Teil des Genprodukts, der analysiert wird3) Single-stranded part of the gene product that is analyzed
Legende zur Fig. 3Legend for Fig. 3
0 Ein Beispiel für die Erzeugung einer einheitlichen Primerbindungsstelle (PBS) .0 An example of the creation of a uniform primer binding site (PBS).
3a) In diesem Fall werden NTs an das 3 '-Ende der einzelsträngigen Genprodukte angekoppelt (ein so genanntes 5 „Tailing") . Durch Verwendung eines einheitlichen NT entsteht eine einheitliche PBS.3a) In this case, NTs are coupled to the 3 'end of the single-stranded gene products (a so-called 5 "tailing"). Using a uniform NT results in a uniform PBS.
3b) Nach Hybridisierung von Primern entstehen Genprodukt- Primer-Komplexe 03b) After hybridization of primers, gene product-primer complexes 0 are formed
Legende zur Fig. 4Legend for Fig. 4
Beispiel für die Bindung von Genprodukten an eine gelartige 5 Reaktionsoberfläche.Example of the binding of gene products to a gel-like reaction surface.
Auf einer festen Unterlage (1) haftet eine Gelschicht (2) , z.B. ein Polyacrylamidgel (Fig. 4a), oder haften viele Gelkügelchen (5), z.B. Agarosekügelchen (Fig. 4b). An die 0 Oberfläche des Gels sind Genprodukte (4) gebunden. Die Genprodukte tragen eine funktioneile Gruppe, z.B. Biotin, und sind an das Gel über Streptavidin oder Avidin (3) gebunden.A gel layer (2) adheres to a solid base (1), e.g. a polyacrylamide gel (Fig. 4a), or many gel beads (5), e.g. Agarose beads (Fig. 4b). Gene products (4) are bound to the surface of the gel. The gene products carry a functional group, e.g. Biotin, and are bound to the gel via streptavidin or avidin (3).
5 Legende zur Fig. 55 legend to FIG. 5
Beispiel für eine Durchflussvorrichtung Eine gelartige Reaktionsoberfläche (1) ist auf einer für dasExample of a flow device A gel-like reaction surface (1) is on one for the
Anregungs- und Fluoreszenzlicht durchlässigen festen UnterlageExcitation and fluorescent light permeable solid base
(2) befestigt. Sie bilden zusammen den Deckel der Flow-Cell. Die Flüssigkeiten in der Flow-Cell können kontrolliert ausgetauscht werden, wobei die Flow-Cell zusammen mit(2) attached. Together they form the lid of the flow cell. The liquids in the flow cell can be exchanged in a controlled manner, the flow cell together with
Vorratsbehälter (3) , Pumpe (4) und Ventil (5) eineStorage container (3), pump (4) and valve (5) one
DurchflussVorrichtung bilden. Auf der Reaktionsoberfläche sindForm flow device. Are on the reaction surface
Genprodukt-Primer-Komplexe gebunden (hier nicht abgebildet) . Die Signale der eingebauten NT*s werden mit derGene product-primer complexes bound (not shown here). The signals of the installed NT * s are with the
Detektionsapparatur (6) detektiert.Detection apparatus (6) detected.
Legende zur Fig. 6 Strukturen von 2 '-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt werden können.Legend for FIG. 6 structures of 2'-deoxynucleoside triphosphates which can be used in the process.
Fig. 6a - Schematische Darstellung der NT-Struktur, bei der die spaltbare Gruppe und die sterisch anspruchsvolle, zur Termination führende Gruppe Teile des Linkers bilden. Der Linker ist die Verbindung zwischen Nukleobase und Fluoreszenzfarbstoff .Fig. 6a - Schematic representation of the NT structure, in which the cleavable group and the sterically demanding group leading to the termination form parts of the linker. The linker is the connection between nucleobase and fluorescent dye.
A,B,C,D,E - Linker, A - der Linkerrest nach der Spaltung, B - spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination führende Gruppe, F - Fluoreszenzfarbstoff.A, B, C, D, E - linker, A - the linker residue after cleavage, B - cleavable group, D - sterically demanding group leading to termination, F - fluorescent dye.
Fig. 6b - Schematische Darstellung der NT-Struktur, wobei die spaltbare Gruppe ein Teil des Linkers ist und der Fluoreszenzfarbstoff gleichzeitig die sterisch anspruchsvolle, zur Termination führende Gruppe darstellt.Fig. 6b - Schematic representation of the NT structure, the cleavable group being part of the linker and the fluorescent dye simultaneously representing the sterically demanding group leading to the termination.
A,B,C - Linker, A - der Linkerrest nach der Spaltung, B - spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination führende Gruppe, F - Fluoreszenzfarbstoff.A, B, C - linker, A - the linker residue after cleavage, B - cleavable group, D - sterically demanding group leading to termination, F - fluorescent dye.
Fig. 6c - Schematische Darstellung der Struktur von eingebauten NT*s nach dem Abspaltungsschritt. Dargestellt sind zwei NT*s mit dem verbliebenen Linkerrest (A) . Fig. 6d - Schematische Darstellung der NT-Struktur, wobei die spaltbare Gruppe, die gleichzeitig die sterisch anspruchsvolle, zur Termination führende Gruppe ist, einen Teil des Linkers darstellt.Fig. 6c - Schematic representation of the structure of installed NT * s after the cleavage step. Two NT * s are shown with the remaining link remainder (A). Fig. 6d - Schematic representation of the NT structure, wherein the cleavable group, which is also the sterically demanding group leading to termination, is part of the linker.
A,B,C,D - Linker, A - der Linkerrest nach der Spaltung, B - spaltbare Gruppe, D - sterisch anspruchsvolle, zur Termination führende Gruppe, F - Fluoreszenzfarbstoff.A, B, C, D - linker, A - the linker residue after cleavage, B - cleavable group, D - sterically demanding group leading to termination, F - fluorescent dye.
Fig. 6e - Darstellung von bevorzugten NT-Strukturen, bei denen der Linker an die 5-Position im Pyrimidinring angekoppelt ist.Fig. 6e - representation of preferred NT structures in which the linker is coupled to the 5-position in the pyrimidine ring.
Fig. 6f - Darstellung anderer bevorzugter NT-Strukturen, bei denen der Linker an die 5-Position im Pyrimidinring angekoppe1t ist.6f - representation of other preferred NT structures in which the linker is coupled to the 5-position in the pyrimidine ring.
Fig. 6g - Darstellung von bevorzugten NT-Strukturen, bei denen der Linker an die 7-Position im Purinring angekoppelt ist.Fig. 6g - representation of preferred NT structures, in which the linker is coupled to the 7-position in the purine ring.
Fig. 6h,i,j - Beispiele für die Ankopplung von Farbstoffen an den Linker6h, i, j - examples for the coupling of dyes to the linker
Fig. 6k Strukturen von weiteren 2 '-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt werden können. Der Linker ist an die 5- Position des Pyrimidinrings gekoppelt.6k structures of further 2'-deoxynucleoside triphosphates which can be used in the process. The linker is coupled to the 5-position of the pyrimidine ring.
Die Substituenten Rι,2,3, sind wählbar und können unabhängig voneinander auftreten.The substituents R ι, 2,3, can be selected and can occur independently of one another.
Die Z-Gruppe stellt in einer Ausführungsform (6k-l) die Verbindung zwischen dem Linker und der Base dar. Sie ist wählbar und kann eine Amid- , Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder Aminogruppe sein.In one embodiment (6k-1), the Z group represents the connection between the linker and the base. It can be selected and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
Die E-Gruppe stellt in einer Ausführungsform (6k-l) einen internen Teil des Linkers dar. In einer anderen Ausführungsform (6k-2) stellt sie die Verbindung zwischen dem Linker und der Base dar. Diese Gruppe ist wählbar und kann eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von Kohlenstoffatomen, vorzugsweise zwischen 1 und 5, sein.In one embodiment (6k-1) the E group represents one internal part of the linker. In another embodiment (6k-2) it represents the connection between the linker and the base. This group is selectable and can be a straight-chain alkyl or alkenyl chain with a number of carbon atoms, preferably between 1 and 5 , his.
Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit einer internen Amid- , Carbalcoxy- (Ester), Sulfoxy-, Ether- , Thioether- oder Aminobindung sein.The E group can also be an alkyl or alkenyl chain with an internal amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino bond.
Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare Gruppe. In den Ausführungsformen (6k-1,2) stellt sie einen internen Teil des Linkers dar. In einer anderen Ausführungsform (6k-3) stellt sie die Verbindung zwischen dem Linker und der Base dar. Diese Gruppe ist wählbar und kann eine Ester-, Thioester- und Disulfidverbindung sein.In this example, the C group is a chemically cleavable group. In the embodiments (6k-1,2) it represents an internal part of the linker. In another embodiment (6k-3) it represents the connection between the linker and the base. This group is selectable and can be an ester, Be thioester and disulfide compound.
Die Y-Gruppe stellt einen internen Teil des Linkers dar, der die Verbindung zwischen der spaltbaren Gruppe (C) und dem Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wählbar und kann eine verzweigte oder unverzweigte Alkyl- oderThe Y group represents an internal part of the linker, which creates the connection between the cleavable group (C) and the fluorescent dye (F). This group is selectable and can be a branched or unbranched alkyl or
Alkenylkette oder auch eine substituierte oder unsubstituierteAlkenyl chain or a substituted or unsubstituted
Arylgruppe sein. Eine weitere mögliche Alternative ist eineBe an aryl group. Another possible alternative is one
Alkyl- oder Alkenylkette mit einer internen Amid- Carbalcoxy-Alkyl or alkenyl chain with an internal amide carbalcoxy
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung.(Ester), sulfoxy, ether, thioether or amino bond.
Die X-Gruppe ist die Verbindung zwischen dem Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) abgeleitet werden kann. Sie ist wählbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder Aminogruppe sein.The X group is the connection between the fluorescent dye and the linker, and this connection can be derived from both the linker and the fluorescent dye (F). It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
Fig. 6LFig. 6L
Strukturen von weiteren 2 '-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt werden können. Der Linker ist an die 7- Position des Purinrings gekoppelt. Die Substituenten R1#2,3,4 sind wählbar und können unabhängig voneinander auftreten.Structures of further 2'-deoxynucleoside triphosphates that can be used in the process. The linker is coupled to the 7-position of the purine ring. The substituents R 1 # 2,3,4 can be selected and can occur independently of one another.
Die Z-Gruppe stellt in einer Ausführungsform (6L-1) die Verbindung zwischen dem Linker und der Base dar. Sie ist wählbar und kann eine Amid-, Carbalcoxy- (Ester) , Sulfoxy-, Ether-, Thioether- oder Aminogruppe sein.In one embodiment (6L-1), the Z group represents the connection between the linker and the base. It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
Die E-Gruppe stellt in einer Ausführungsform (6L-1) einen internen Teil des Linkers dar. In einer anderen Ausführungsform (6L-2) stellt sie die Verbindung zwischen dem Linker und der Base dar. Diese Gruppe ist wählbar und kann eine unverzweigte Alkyl- oder Alkenylkette mit einer Zahl von Kohlenstoffatomen, vorzugsweise zwischen 1 und 5, sein. Die E-Gruppe kann aber auch eine Alkyl- oder Alkenylkette mit einer internen Amid-, Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder Aminobindung sein.In one embodiment (6L-1) the E group represents an internal part of the linker. In another embodiment (6L-2) it represents the connection between the linker and the base. This group is selectable and can be a straight-chain alkyl - Or alkenyl chain with a number of carbon atoms, preferably between 1 and 5. The E group can also be an alkyl or alkenyl chain with an internal amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino bond.
Die C-Gruppe ist in diesem Beispiel eine chemisch spaltbare Gruppe. In den Ausführungsformen (6L-1,2) stellt sie einen internen Teil des Linkers dar. In einer anderen Ausführungsform (6L-3) stellt sie die Verbindung zwischen dem Linker und der Base dar. Diese Gruppe ist wählbar und kann eine Ester-, Thioester- und Disulfidverbindung sein.In this example, the C group is a chemically cleavable group. In the embodiments (6L-1,2) it represents an internal part of the linker. In another embodiment (6L-3) it represents the connection between the linker and the base. This group is selectable and can be an ester, Be thioester and disulfide compound.
Die Y-Gruppe stellt einen internen Teil des Linkers dar, der die Verbindung zwischen der spaltbaren Gruppe (C) und dem Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wählbar und kann eine verzweigte oder unverzweigte Alkyl- oder Alkenylkette oder auch eine substituierte oder unsubstituierte Arylgruppe sein. Eine weitere mögliche Alternative ist eine Alkyl- oder Alkenylkette mit einer internen Amid-, Carbalcoxy- (Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung.The Y group represents an internal part of the linker, which creates the connection between the cleavable group (C) and the fluorescent dye (F). This group can be selected and can be a branched or unbranched alkyl or alkenyl chain or else a substituted or unsubstituted aryl group. Another possible alternative is an alkyl or alkenyl chain with an internal amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino bond.
Die X-Gruppe ist die Verbindung zwischen dem Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) abgeleitet werden kann. Sie ist wählbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder Aminogruppe sein.The X group is the connection between the fluorescent dye and the linker, this connection being formed by both the linker and the fluorescent dye (F) can be derived. It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
Fig. 6m6m
Weitere Beispiele für Strukturen vonMore examples of structures from
2'-Deoxynukleosidtriphosphaten, die im Verfahren eingesetzt werden können. Der Linker ist an die 5-Position des Pyrimidinrings gekoppelt .2'-deoxynucleoside triphosphates that can be used in the process. The linker is coupled to the 5-position of the pyrimidine ring.
Die Substituenten R1#2,3,4 sind wählbar und können unabhängig voneinander auftreten.The substituents R 1 # 2,3,4 can be selected and can occur independently of one another.
Die Y-Gruppe stellt einen internen Teil des Linkers dar, der die Verbindung zwischen der spaltbaren Gruppe (C) und demThe Y group represents an internal part of the linker, which is the connection between the cleavable group (C) and the
Fluoreszenzfarbstoff (F) herstellt. Diese Gruppe ist wählbar und kann eine verzweigte oder unverzweigte Alkyl- oderFluorescent dye (F) produces. This group is selectable and can be a branched or unbranched alkyl or
Alkenylkette oder auch eine substituierte oder unsubstituierteAlkenyl chain or a substituted or unsubstituted
Arylgruppe sein. Eine weitere mögliche Alternative ist eine Alkyl- oder Alkenylkette mit einer internen Amid-, Carbalcoxy-Be an aryl group. Another possible alternative is an alkyl or alkenyl chain with an internal amide, carbalcoxy
(Ester) , Sulfoxy-, Ether-, Thioether- oder Aminobindung.(Ester), sulfoxy, ether, thioether or amino bond.
Die X-Gruppe ist die Verbindung zwischen dem Fluoreszenzfarbstoff und dem Linker, wobei diese Verbindung sowohl vom Linker, als auch vom Fluoreszenzfarbstoff (F) abgeleitet werden kann. Sie ist wählbar und kann eine Amid-, Carbalcoxy- (Ester), Sulfoxy-, Ether-, Thioether- oder Aminogruppe sein.The X group is the connection between the fluorescent dye and the linker, and this connection can be derived from both the linker and the fluorescent dye (F). It is selectable and can be an amide, carbalcoxy (ester), sulfoxy, ether, thioether or amino group.
Legende zur Fig. 7Legend for Fig. 7
Beispiel für ein DetektionssystemExample of a detection system
Dargestellt ist ein Weitfeld-Optik-Detektionssystem. Nach dem Einbau von markierten NT*s wird die Oberfläche (7) abgescannt, wobei die Fluoreszenzsignale von einzelnen, an die NTs gekoppelten Farbstoffmolekülen detektiert werden.A wide-field optical detection system is shown. After the installation of marked NT * s, the surface (7) is scanned, the fluorescence signals from individual to the NTs coupled dye molecules can be detected.
Legende zur Fig. 8Legend for Fig. 8
Schematische Darstellung des ScannvorgangesSchematic representation of the scanning process
Fig. 8a Schematische Darstellung eines Abschnittes der Reaktionsoberfläche (grau) , der abgescannt wird. Die Kreise entsprechen jeweils der Aufnahme eines 2D-Bildes und repräsentieren die Flächen, von denen die Fluoreszenzsignale detektiert werden. Dabei werden pro Aufnahme mehrere SignaleFig. 8a Schematic representation of a portion of the reaction surface (gray) that is scanned. The circles each correspond to the recording of a 2D image and represent the areas from which the fluorescence signals are detected. There are several signals per recording
(beispielsweise 100 bis 10.000) von einzelnen Molekülen gleichzeitig registriert. Die Reaktionsoberfläche wird in jedem Zyklus abgescannt, wobei während des Scannvorganges mehrere Aufnahmen von unterschiedlichen Stellen der Oberfläche gemacht werden. Dabei können bis zu mehreren Millionen Signale von eingebauten NT*s aufgenommen werden. Die hohe Parallelität ist die Grundlage für die Geschwindigkeit des Verfahrens .(e.g. 100 to 10,000) of individual molecules registered simultaneously. The reaction surface is scanned in each cycle, several images being taken from different locations on the surface during the scanning process. Up to several million signals can be recorded by built-in NT * s. The high degree of parallelism is the basis for the speed of the process.
Fig. 8b Eine Aufnahme (ein 2D-Bild) mit Signalen von einzelnen, eingebauten NT*s. Zur Versuchsbeschreibung siehe Beispiel 5.Fig. 8b A recording (a 2D image) with signals from individual, built-in NT * s. See example 5 for a description of the experiment.
Fig. 8c Ausschnitt aus Abbildung 8b. Der Ausschnitt zeigt Signale von vier eingebauten NT*s. Jedes Signal besitzt charakteristische Eigenschaften der Einzelmolekülsignale (s. Beschreibung) und kann auf Grund dieser identifiziert werden (vorzugsweise mit Hilfe eines Computer-Programms) . Jedem der identifizierten Signale werden die entsprechenden X,Y- Koordinaten zugeordnet .Fig. 8c detail from Figure 8b. The section shows signals from four built-in NTs. Each signal has characteristic properties of the individual molecule signals (see description) and can be identified on the basis of these (preferably with the aid of a computer program). The corresponding X, Y coordinates are assigned to each of the identified signals.
Legende zur Fig. 9Legend for Fig. 9
Beispiel einer vorteilhaften Anordnung von Reaktionsoberflächen. Der Durchsatz wird durch Verwendung von zwei getrennten Flow-Cells (Mikroflussigkeitskanale, MFK) erhöht. Während in der einen Flow-Cell biochemische und chemische Reaktionen ablaufen, wird in der anderen die Detektion durchgeführt. Anschließend tauschen die Flow-Cells ihre Positionen. Example of an advantageous arrangement of reaction surfaces. The throughput is determined by using two separate flow cells (microfluidic channels, MFK) increased. While biochemical and chemical reactions take place in one flow cell, detection is carried out in the other. The flow cells then swap positions.

Claims

Patentansprüche:claims:
1. Verfahren zur parallelen Analyse der Genexpression bei dem man1. Method for parallel analysis of gene expression in which one
einzelsträngige Genprodukte bereitstellt, manprovides single-stranded gene products, one
die Genprodukte unter Verwendung eines einheitlichen oder mehrerer unterschiedlicher Primer in Form von Genprodukt- Primer-Komplexen auf einer Reaktionsoberfläche in einer zufälligen Anordnung bindet, manthe gene products are bound to a reaction surface in a random arrangement using one or more different primers in the form of gene product-primer complexes;
eine zyklische Aufbaureaktion des komplementären Stranges der Genprodukte unter Verwendung einer oder mehrerer Polymerasen durchführt, indem manperform a cyclic assembly reaction of the complementary strand of the gene products using one or more polymerases by
a) zu den auf der Oberfläche gebundenen Genprodukt- Primer-Komplexen eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte Nukleotide (NTs*) enthält, die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, dass sich die verwendeten NTs* durch Messung unterschiedlicher FluoreszenzSignale voneinander unterscheiden lassen, wobei die NTs* strukturell an der Base so modifiziert sind, dass die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist, mana) a solution is added to the gene product-primer complexes bound to the surface which contains one or more polymerases and one to four modified nucleotides (NTs * ) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * fluorescent dyes located on the NTs * are selected so that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * being structurally modified on the base in such a way that the polymerase after incorporating such an NT * into a growing complementary one Strand is unable to incorporate another NT * into the same strand, the fluorescent dye being cleavable and the structural modification being a cleavable, sterically demanding ligand
b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden, manb) the stationary phase obtained in stage a) below Incubated conditions that are suitable for extending the complementary strands, the complementary strands are each extended by an NT * , man
c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale auf der Reaktions- oberflache bestimmt, mand) the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface, man
e) zur Erzeugung unmarkierter, (NTs oder) Genprodukte die Fluoreszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, mane) to generate unlabelled (NTs or) gene products, the fluorescent dyes and the sterically demanding ligands are split off from the NTs * attached to the complementary strand, one
f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,stages a) to f) are repeated several times, if necessary,
wobei man die relative Position einzelner Genprodukt- Primer-Komplexe auf der Reaktionsoberfläche und die Sequenz dieser Genprodukte durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten Teilsequenzen die Identität der Genprodukte bestimmt.whereby the relative position of individual gene product-primer complexes on the reaction surface and the sequence of these gene products are determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs and the identity of the gene products is determined from the partial sequences determined certainly.
Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils ein markiertes NT* einsetzt.A method according to claim 1, characterized in that stages a) to f) of the cyclic reaction are repeated several times, only one marked NT * being used in each cycle.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* einsetzt.3. The method according to claim 1, characterized in that the steps a) to f) of the cyclic reaction are repeated several times, using two differently labeled NTs * in each cycle.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils vier unterschiedlich markierte NTs* einsetzt.4. The method according to claim 1, characterized in that steps a) to f) of the cyclic reaction are repeated several times, using four differently marked NTs * in each cycle.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass bereits bekannte Gene als Referenzsequenzen dienen und man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Identität der Genprodukte durch Vergleich der gewonnenen Sequenzen mit denen der Referenzsequenzen ermittelt .5. The method according to claim 1, characterized in that already known genes serve as reference sequences and steps a) to f) of the cyclic reaction are repeated several times, alternately using two differently labeled NTs * and two unlabeled NTs in the cycles and the identity of the gene products is determined by comparing the sequences obtained with those of the reference sequences.
6. Verfahren nach den Ansprüchen 1 bis 5, dadurch gekennzeichnet, dass man in die Genprodukte jeweils eine Primerbindungsstelle (PBS) einführt, wobei die Primerbindungs- stellen für alle Genprodukte jeweils gleiche oder verschiedene Sequenzen aufweisen.6. The method according to claims 1 to 5, characterized in that in each case a primer binding site (PBS) is introduced into the gene products, the primer binding sites each having the same or different sequences for all gene products.
7. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekennzeichnet, dass man die Genprodukte mit Primern in einer Lösung unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der Genprodukte geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen, und man die gebildeten Genprodukt-Primer- Komplexe anschließend auf der Reaktionsoberfläche bindet. 7. The method according to claims 1 to 6, characterized in that the gene products are brought into contact with primers in a solution under conditions which are suitable for hybridizing the primers to the primer binding sites (PBSs) of the gene products, the primers being identical to one another or have different sequences, and one then binds the gene product-primer complexes formed on the reaction surface.
8. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekennzeichnet, dass man die Genprodukte zunächst auf der Reaktionsoberfläche immobilisiert und erst anschließend mit Primern unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der Genprodukte geeignet sind, wobei Genprodukt- Primer-Komplexe gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.8. The method according to claims 1 to 6, characterized in that the gene products are first immobilized on the reaction surface and only then brought into contact with primers under conditions which are suitable for hybridizing the primers to the primer binding sites (PBSs) of the gene products, wherein Gene product-primer complexes are formed, the primers having the same or different sequences.
9. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekennzeichnet, dass man die Primer zunächst auf der Reaktions- oberfläche immobilisiert und erst anschließend mit Genprodukten unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der Genprodukte geeignet sind, wodurch Genprodukte an die Oberfläche gebunden und Genprodukt-Primer-Komplexe gebildet werden, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.9. The method according to claims 1 to 6, characterized in that the primers are first immobilized on the reaction surface and only then brought into contact with gene products under conditions which are suitable for hybridizing the primers to the primer binding sites (PBSs) of the gene products , whereby gene products are bound to the surface and gene product-primer complexes are formed, the primers having identical or different sequences to one another.
10. Verfahren nach den Ansprüchen 1 bis 9, dadurch gekennzeichnet, dass die Dichte der extensionsfähigen Genprodukt-Primer-Komplexe zwischen etwa 10 und 100 pro lOOμm2 liegt.10. The method according to claims 1 to 9, characterized in that the density of the extensible gene product-primer complexes is between about 10 and 100 per lOOμm 2 .
11. Verfahren nach den Ansprüchen 1 bis 10, dadurch gekennzeichnet, dass der zur strukturellen Modifikation verwendete sterisch anspruchsvolle Ligand der zur Markierung verwendete Fluoreszenzfarbstoff ist.11. The method according to claims 1 to 10, characterized in that the sterically demanding ligand used for structural modification is the fluorescent dye used for labeling.
12. Verfahren nach den Ansprüchen 1 bis 11, dadurch gekennzeichnet, dass die Reaktionsoberfläche aus der Gruppe bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.12. The method according to claims 1 to 11, characterized in that the reaction surface is selected from the group consisting of silicone, glass, ceramic, plastics, gels.
13. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass die Kunststoffe Polycarbonate oder Polystyrole oder Derivate derselben sind.13. The method according to claim 12, characterized in that the plastics are polycarbonates or polystyrenes or derivatives thereof.
14. Verfahren nach Anspruch 12, dadurch gekennzeichnet, dass die Gele Agarose- oder Polyacrylamidgele oder Derivate derselben sind.14. The method according to claim 12, characterized in that the gels are agarose or polyacrylamide gels or derivatives thereof.
15. Verfahren nach Anspruch 14, dadurch gekennzeichnet, dass die Gele 1 bis 2 % Agarose-Gele oder 5 bis 15 % Polyacrylamid-Gele sind.15. The method according to claim 14, characterized in that the gels are 1 to 2% agarose gels or 5 to 15% polyacrylamide gels.
16. Verfahren nach den Ansprüchen 1 bis 15, dadurch gekennzeichnet, dass die Polymerase eine Polymerase ohne 3'-5'- Exonukleaseaktivität ist.16. The method according to claims 1 to 15, characterized in that the polymerase is a polymerase without 3'-5'-exonuclease activity.
17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, dass die Polymerase aus der Gruppe bestehend aus thermolabilen viralen, bakteriellen DNA-Polymerasen, thermolabilen oder thermostabilen viralen Reversen Transcriptasen, thermostabilen DNA-Polymerasen oder deren Modifikationen ausgewählt ist.17. The method according to claim 16, characterized in that the polymerase is selected from the group consisting of thermolabile viral, bacterial DNA polymerases, thermolabile or thermostable viral reverse transcriptases, thermostable DNA polymerases or their modifications.
18. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase Sequenase Version 2 ist.18. The method according to claim 17, characterized in that the polymerase is Sequenase version 2.
19. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase Taq-Polymerase ist.19. The method according to claim 17, characterized in that the polymerase is Taq polymerase.
20. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase ProHa-DNA-Polymerase ist.20. The method according to claim 17, characterized in that the polymerase is ProHa DNA polymerase.
21. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase Klenow Fragment der DNA-Polymerase I aus E.coli ohne 3 '-5' Exonukleaseaktivität ist.21. The method according to claim 17, characterized in that the polymerase Klenow fragment of DNA polymerase I from E. coli is without 3 '-5' exonuclease activity.
22. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase AMV-Reverse Transcriptase ohne RNase- Aktivität ist .22. The method according to claim 17, characterized in that the polymerase AMV reverse transcriptase without RNase Activity is.
23. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase M-MLV Reverse Transcriptase ist.23. The method according to claim 17, characterized in that the polymerase is M-MLV reverse transcriptase.
24. Verfahren nach Anspruch 17, dadurch gekennzeichnet, dass die Polymerase HIV-Reverse Transcriptase ohne RNase- Aktivität ist.24. The method according to claim 17, characterized in that the polymerase is HIV reverse transcriptase without RNase activity.
25. Verfahren nach den Ansprüchen 1 bis 24, dadurch gekennzeichnet, dass die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten ausgewählt sind.25. The method according to claims 1 to 24, characterized in that the fluorescent dyes are selected from the group consisting of cyanine dyes, rhodamines, xanthenes and their derivatives.
26. Verfahren zur quantitativen Analyse der Genexpression, dadurch gekennzeichnet, dass man das Verfahren nach den Ansprüchen 1 bis 25 durchführt und man anschließend die Anzahl der ermittelten Sequenzen für jedes Genprodukt bestimmt.26. A method for the quantitative analysis of gene expression, characterized in that one carries out the method according to claims 1 to 25 and then determines the number of sequences determined for each gene product.
27. Verfahren nach Anspruch 26, dadurch gekennzeichnet, dass man zusätzlich zu den Genprodukten ferner ein oder mehrere Kontrollsequenzen in bekannten Konzentrationen verwendet, wobei die Gesamtkonzentration der KontrollSequenzen zwischen 0,01 und 10% der Gesamtkonzentration der zu analysierenden Probe liegt.27. The method according to claim 26, characterized in that, in addition to the gene products, one or more control sequences are used in known concentrations, the total concentration of the control sequences being between 0.01 and 10% of the total concentration of the sample to be analyzed.
28. Verfahren nach den Ansprüchen 1 bis 27, dadurch gekennzeichnet, daß man eine Sequenzanalyse von mindestens etwa 100.000 bis etwa 10.000.000 Genprodukt-Molekülen durchführt.28. The method according to claims 1 to 27, characterized in that one carries out a sequence analysis of at least about 100,000 to about 10,000,000 gene product molecules.
29. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 28, dadurch gekennzeichnet, dass auf seiner Oberfläche die Genprodukte in einer zufälligen Anordnung gebunden sind, wobei die Dichte der gebundenen Genprodukt-Moleküle zwischen 10 und 100 pro lOOμm2 liegt. 29. Carrier for performing the method according to claims 1 to 28, characterized in that the gene products are bound in a random arrangement on its surface, the density of the bound gene product molecules being between 10 and 100 per 100 μm 2 .
30. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 28, dadurch gekennzeichnet, dass auf seiner Oberfläche die Genprodukte in einer zufälligen Anordnung gebunden sind, wobei die Dichte der gebundenen Genprodukt-Moleküle zwischen 100 und 1.000.000 pro lOOμm2 liegt .30. Carrier for performing the method according to claims 1 to 28, characterized in that the gene products are bound in a random arrangement on its surface, the density of the bound gene product molecules being between 100 and 1,000,000 per 100 μm 2 .
31. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 28, dadurch gekennzeichnet, dass auf seiner Oberfläche die Primer in einer zufälligen Anordnung gebunden sind, wobei die Dichte der gebundenen Primer-Moleküle zwischen 10 und 100 pro lOOμm2 liegt.31. Carrier for carrying out the method according to claims 1 to 28, characterized in that the primers are bound in a random arrangement on its surface, the density of the bound primer molecules being between 10 and 100 per 100 μm 2 .
32. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 28, dadurch gekennzeichnet, dass auf seiner Oberfläche die Primer in einer zufälligen Anordnung gebunden sind, wobei die Dichte der gebundenen Primer-Moleküle zwischen 100 und 10.000 pro lOOμm2 liegt.32. Carrier for carrying out the method according to claims 1 to 28, characterized in that the primers are bound in a random arrangement on its surface, the density of the bound primer molecules being between 100 and 10,000 per 100 μm 2 .
33. Träger zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 28, dadurch gekennzeichnet, dass auf seiner Oberfläche die Primer in einer zufälligen Anordnung gebunden sind, wobei die Dichte der gebundenen Primer-Moleküle zwischen 10.000 und 1.000.000 pro lOOμm2 liegt.33. Carrier for carrying out the method according to claims 1 to 28, characterized in that the primers are bound in a random arrangement on its surface, the density of the bound primer molecules being between 10,000 and 1,000,000 per 100 μm 2 .
34. Kit zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 28, dadurch gekennzeichnet, dass es eine Reaktionsoberfläche (einen festen Träger) , zur Durchführung des Verfahrens erforderliche Reaktionslösungen, ein oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenz- farbstoffen markiert sind, wobei die markierten NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*) , dass die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Li- gand ist .34. Kit for carrying out the method according to claims 1 to 28, characterized in that it contains a reaction surface (a solid support), reaction solutions required for carrying out the method, one or more polymerases, and nucleotides (NTs), one of which is four are labeled with fluorescent dyes, the labeled NTs also being structurally modified (NT * or NTs * ) in such a way that the polymerase, after incorporating such an NT * into a growing complementary strand, is unable to to install another NT * in the same strand, the fluorescent dye being cleavable and the structural modification being a cleavable, sterically demanding ligand.
35. Kit nach Anspruch 34, dadurch gekennzeichnet, dass der zur strukturellen Modifikation verwendete sterisch anspruchsvolle Ligand der zur Markierung verwendete Fluoreszenzfarbstoff ist.35. Kit according to claim 34, characterized in that the sterically demanding ligand used for structural modification is the fluorescent dye used for labeling.
36. Kit nach Anspruch 34 oder 35, dadurch gekennzeichnet, dass es ferner Bestandteile enthält:36. Kit according to claim 34 or 35, characterized in that it further contains components:
a) Oligonukleotid-Primer, b) zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien, und/oder c) Waschlösungen.a) oligonucleotide primers, b) reagents required for cleaving off the fluorescent dyes and bulky ligands, and / or c) washing solutions.
37. Kit nach den Ansprüchen 34 bis 36, dadurch gekennzeichnet, dass die Reaktionsoberfläche aus der Gruppe bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.37. Kit according to claims 34 to 36, characterized in that the reaction surface is selected from the group consisting of silicone, glass, ceramic, plastics, gels.
38. Kit nach Anspruch 37, dadurch gekennzeichnet, dass die Kunststoffe Polycarbonate oder Polystyrole oder Derivate derselben sind.38. Kit according to claim 37, characterized in that the plastics are polycarbonates or polystyrenes or derivatives thereof.
39. Kit nach Anspruch 37, dadurch gekennzeichnet, dass die Gele Agarose- oder Polyacrylamidgele oder Derivate derselben sind.39. Kit according to claim 37, characterized in that the gels are agarose or polyacrylamide gels or derivatives thereof.
40. Kit nach Anspruch 39, dadurch gekennzeichnet, dass die Gele 1 bis 2% Agarose-Gele oder 5 bis 15% Polyacrylamid- Gele sind.40. Kit according to claim 39, characterized in that the gels are 1 to 2% agarose gels or 5 to 15% polyacrylamide gels.
41. Kit nach den Ansprüchen 34 bis 40, dadurch gekennzeichnet, daß die Reaktionsoberfläche ein Träger nach den Ansprüchen 29 bis 33 ist.41. Kit according to claims 34 to 40, characterized in that the reaction surface is a carrier according to claims 29 to 33.
42. Kit nach den Ansprüchen 34 bis 41, dadurch gekennzeichnet, dass die DNA-Polymerase eine DNA-Polymerase ohne 3' -5'- Exonukleaseaktivität ist .42. Kit according to claims 34 to 41, characterized in that the DNA polymerase is a DNA polymerase without 3 '-5' exonuclease activity.
43. Kit nach Anspruch 42, dadurch gekennzeichnet, dass die Polymerase aus der Gruppe bestehend aus viralen DNA- Polymerasen vom Sequenase-Typ, bakteriellen DNA- Polymerasen, Reversen Transcriptasen und thermostabilen DNA-Polymerasen ausgewählt ist.43. Kit according to claim 42, characterized in that the polymerase is selected from the group consisting of viral DNA polymerases of the sequenase type, bacterial DNA polymerases, reverse transcriptases and thermostable DNA polymerases.
44. Kit nach Anspruch 43, dadurch gekennzeichnet, dass die Polymerase Sequenase Version 2, Klenow Fragment der DNA- Polymerase I aus E.coli ohne 3 '-5' Exonukleaseaktivität, AMV-Reverse Transcriptase ohne RNase-Aktivität, M-MLV Reverse Transcriptase, HIV-Reverse Transcriptase ohne RNase- Aktivität, Taq-Polymerase oder ProHa-DNA-Polymerase ist.44. Kit according to claim 43, characterized in that the polymerase Sequenase version 2, Klenow fragment of DNA polymerase I from E. coli without 3 '-5' exonuclease activity, AMV reverse transcriptase without RNase activity, M-MLV reverse transcriptase , HIV reverse transcriptase without RNase activity, Taq polymerase or ProHa DNA polymerase.
45. Kit nach den Ansprüchen 34 bis 44, dadurch gekennzeichnet, dass die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten ausgewählt sind.45. Kit according to claims 34 to 44, characterized in that the fluorescent dyes are selected from the group consisting of cyanine dyes, rhodamines, xanthenes and their derivatives.
46. Nukleotide der Formel46. Nucleotides of the formula
6e-l)6e-l)
Figure imgf000080_0001
e-2)
Figure imgf000080_0001
e-2)
Figure imgf000081_0001
Figure imgf000081_0001
e-3)e-3)
Figure imgf000081_0002
Figure imgf000081_0002
X = NH, O, SX = NH, O, S
Z = NH2, OH, Farbstoff Z = NH 2 , OH, dye
e-4)e-4)
Figure imgf000082_0001
Figure imgf000082_0001
X = NH, O, S Y = NH, O, S Z = NH2, OHX = NH, O, SY = NH, O, SZ = NH 2 , OH
e-5)e-5)
Figure imgf000082_0002
Figure imgf000082_0002
X = NH, O, SX = NH, O, S
Z = NH2, OH, Farbstoff 6e-6)Z = NH 2 , OH, dye 6e-6)
Figure imgf000083_0001
Figure imgf000083_0001
X = NH, O, S X = NH, O, S Z = NH2, OHX = NH, O, SX = NH, O, SZ = NH 2 , OH
47. Nukleotide der Formel47. Nucleotides of the formula
6f-l)6f-l)
Figure imgf000083_0002
Figure imgf000083_0002
6f-2)6f-2)
Figure imgf000083_0003
6f-3)
Figure imgf000083_0003
6f-3)
Figure imgf000084_0001
Figure imgf000084_0001
6f-4)6f-4)
Figure imgf000084_0002
Figure imgf000084_0002
48. Nukleotide der Formel 6g-l)48. nucleotides of formula 6g-l)
Figure imgf000084_0003
6g-2)
Figure imgf000084_0003
6g-2)
Figure imgf000085_0001
Figure imgf000085_0001
49. Nukleotid nach Anspruch 46 bis 48, dadurch gekennzeichnet, dass an die terminale Aminogruppe ein Fluoreszenzfarbstoff angeheftet ist .49. Nucleotide according to claim 46 to 48, characterized in that a fluorescent dye is attached to the terminal amino group.
50. Nukleotid der Formel50th nucleotide of the formula
6h)6h)
Figure imgf000085_0002
Figure imgf000085_0002
Linker left
51 . Nukleotid der Formel51. Nucleotide of the formula
Figure imgf000086_0001
Figure imgf000086_0001
Linkerleft
52. Nukleotid der Formel52. Nucleotide of the formula
6j) dNTP-SS-TRTTC (L 14)6j) dNTP-SS-TRTTC (L 14)
Figure imgf000086_0002
Figure imgf000086_0002
Linkerleft
53. Verwendung eines Nukleotids nach den Ansprüchen 46 bis 52 als NT* in einem Verfahren nach den Ansprüchen 1 bis 28.53. Use of a nucleotide according to claims 46 to 52 as NT * in a method according to claims 1 to 28.
54. Verwendung eines Nukleotids entsprechend Fig. 6k, 6L, 6m, als NT* in einem Verfahren nach den Ansprüchen 1 bis 28. 54. Use of a nucleotide corresponding to FIG. 6k, 6L, 6m, as NT * in a method according to claims 1 to 28.
PCT/EP2002/004657 2001-04-27 2002-04-26 Method for determining gene expression WO2002088381A2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
AU2002312859A AU2002312859A1 (en) 2001-04-27 2002-04-26 Method for determining gene expression

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10120798.0 2001-04-27
DE10120798A DE10120798B4 (en) 2001-04-27 2001-04-27 Method for determining gene expression

Publications (2)

Publication Number Publication Date
WO2002088381A2 true WO2002088381A2 (en) 2002-11-07
WO2002088381A3 WO2002088381A3 (en) 2003-11-27

Family

ID=7683015

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2002/004657 WO2002088381A2 (en) 2001-04-27 2002-04-26 Method for determining gene expression

Country Status (3)

Country Link
AU (1) AU2002312859A1 (en)
DE (1) DE10120798B4 (en)
WO (1) WO2002088381A2 (en)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003031947A2 (en) * 2001-10-04 2003-04-17 Genovoxx Gmbh Device for sequencing nucleic acid molecules
WO2003072820A3 (en) * 2002-02-27 2004-04-08 Epigenomics Ag Method and nucleic acids for the analysis of colon cell proliferative disorders
US7427673B2 (en) 2001-12-04 2008-09-23 Illumina Cambridge Limited Labelled nucleotides
WO2009124255A2 (en) * 2008-04-04 2009-10-08 Helicos Biosciences Corporation Methods for transcript analysis
US7645596B2 (en) 1998-05-01 2010-01-12 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US7897345B2 (en) 2003-11-12 2011-03-01 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US7981604B2 (en) 2004-02-19 2011-07-19 California Institute Of Technology Methods and kits for analyzing polynucleotide sequences
US9051612B2 (en) 2006-09-28 2015-06-09 Illumina, Inc. Compositions and methods for nucleotide sequencing
US9096898B2 (en) 1998-05-01 2015-08-04 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
WO2016020691A1 (en) * 2014-08-08 2016-02-11 Illumina Cambridge Limited Modified nucleotide linkers
US9605310B2 (en) 2001-12-04 2017-03-28 Illumina Cambridge Limited Labelled nucleotides
US9670539B2 (en) 2007-10-19 2017-06-06 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US20170166961A1 (en) 2013-03-15 2017-06-15 Illumina Cambridge Limited Modified nucleosides or nucleotides
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9718852B2 (en) 2000-10-06 2017-08-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10260094B2 (en) 2007-10-19 2019-04-16 The Trustees Of Columbia University In The City Of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
US10487102B2 (en) 2002-08-23 2019-11-26 Illumina Cambridge Limited Labelled nucleotides
US10513731B2 (en) 2002-08-23 2019-12-24 Illumina Cambridge Limited Modified nucleotides
US10648026B2 (en) 2013-03-15 2020-05-12 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
US10995111B2 (en) 2003-08-22 2021-05-04 Illumina Cambridge Limited Labelled nucleotides
US11098353B2 (en) 2006-12-01 2021-08-24 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4772691A (en) * 1985-06-05 1988-09-20 The Medical College Of Wisconsin, Inc. Chemically cleavable nucleotides
WO1996017957A1 (en) * 1994-12-09 1996-06-13 Hyseq, Inc. Methods and apparatus for dna sequencing and dna identification
US5547839A (en) * 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5614617A (en) * 1990-07-27 1997-03-25 Isis Pharmaceuticals, Inc. Nuclease resistant, pyrimidine modified oligonucleotides that detect and modulate gene expression
WO1998051699A1 (en) * 1997-05-12 1998-11-19 Life Technologies, Inc. Methods for production and purification of nucleic acid molecules
WO2000070073A1 (en) * 1999-05-19 2000-11-23 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
WO2001016375A2 (en) * 1999-08-30 2001-03-08 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services High speed parallel molecular nucleic acid sequencing

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1163369B1 (en) * 1999-02-23 2011-05-04 Caliper Life Sciences, Inc. Sequencing by incorporation
US6309836B1 (en) * 1999-10-05 2001-10-30 Marek Kwiatkowski Compounds for protecting hydroxyls and methods for their use

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4772691A (en) * 1985-06-05 1988-09-20 The Medical College Of Wisconsin, Inc. Chemically cleavable nucleotides
US5547839A (en) * 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5614617A (en) * 1990-07-27 1997-03-25 Isis Pharmaceuticals, Inc. Nuclease resistant, pyrimidine modified oligonucleotides that detect and modulate gene expression
WO1996017957A1 (en) * 1994-12-09 1996-06-13 Hyseq, Inc. Methods and apparatus for dna sequencing and dna identification
WO1998051699A1 (en) * 1997-05-12 1998-11-19 Life Technologies, Inc. Methods for production and purification of nucleic acid molecules
WO2000070073A1 (en) * 1999-05-19 2000-11-23 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
WO2001016375A2 (en) * 1999-08-30 2001-03-08 The Government Of The United States Of America, As Represented By The Secretary, Department Of Health And Human Services High speed parallel molecular nucleic acid sequencing

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
AHMADIAN MOHAMMAD ET AL: "A comparative study of the thermal stability of oligodeoxyribonucleotides containing 5-substituted 2'-deoxyuridines." NUCLEIC ACIDS RESEARCH, vol. 26, no. 13, 1 July 1998 (1998-07-01), pages 3127-3135, XP002246216 ISSN: 0305-1048 *
HERMAN T M ET AL: "CHEMICALLY CLEAVABLE BIOTIN-LABELED NUCLEOTIDE ANALOGS" METHODS IN ENZYMOLOGY, 1990, pages 584-588, XP001152912 ISSN: 0076-6879 cited in the application *
LANGER P R ET AL: "ENZYMATIC SYNTHESIS OF BIOTIN-LABELED POLYNUCLEOTIDES: NOVEL NUCLEID ACID AFFINITY PROBES" PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES, NATIONAL ACADEMY OF SCIENCE, WASHINGTON, DC, US, vol. 78, no. 11, November 1981 (1981-11), pages 6633-6637, XP000892770 ISSN: 0027-8424 *
LOMANT A J ET AL: "Chemical probes of extended biological structures: synthesis and properties of the cleavable protein cross-linking reagent [35SÜdithiobis(succinimidyl propionate)." JOURNAL OF MOLECULAR BIOLOGY. ENGLAND 14 JUN 1976, vol. 104, no. 1, 14 June 1976 (1976-06-14), pages 243-261, XP009012241 ISSN: 0022-2836 cited in the application *
SHIMKUS M ET AL: "A chemically cleavable biotinylated nucleotide: usefulness in the recovery of protein-DNA complexes from avidin affinity columns." PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA. UNITED STATES MAY 1985, vol. 82, no. 9, May 1985 (1985-05), pages 2593-2597, XP009012256 ISSN: 0027-8424 *
SHIMKUS M L ET AL: "SYNTHESIS AND CHARACTERIZATION OF BIOTIN-LABELED NUCLEOTIDE ANALOGS" DNA (NEW YORK), vol. 5, no. 3, 1986, pages 247-256, XP009012255 ISSN: 0198-0238 *
SOUKUP G A ET AL: "Preparation of oligonucleotide-biotin conjugates with cleavable linkers." BIOCONJUGATE CHEMISTRY. UNITED STATES 1995 JAN-FEB, vol. 6, no. 1, January 1995 (1995-01), pages 135-138, XP002246344 ISSN: 1043-1802 *
UENO Y ET AL: "NUCLEOSIDES AND NUCLEOTIDES. 165. CHEMICAL LIGATION OF OLIGODEOXYNUCLEOTIDES HAVING A MERCAPTO GROUP AT THE 5-POSITION OF 2'-DEOXYURIDINE VIA A DISULFIDE BOND" NUCLEOSIDES & NUCLEOTIDES, MARCEL DEKKER, INC, US, vol. 17, no. 1-3, 1998, pages 283-289, XP001149079 ISSN: 0732-8311 *

Cited By (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9096898B2 (en) 1998-05-01 2015-08-04 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US10214774B2 (en) 1998-05-01 2019-02-26 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US10208341B2 (en) 1998-05-01 2019-02-19 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9957561B2 (en) 1998-05-01 2018-05-01 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9725764B2 (en) 1998-05-01 2017-08-08 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7645596B2 (en) 1998-05-01 2010-01-12 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9458500B2 (en) 1998-05-01 2016-10-04 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9212393B2 (en) 1998-05-01 2015-12-15 Life Technologies Corporation Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US9725480B2 (en) 2000-10-06 2017-08-08 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10435742B2 (en) 2000-10-06 2019-10-08 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10648028B2 (en) 2000-10-06 2020-05-12 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9868985B2 (en) 2000-10-06 2018-01-16 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10633700B2 (en) 2000-10-06 2020-04-28 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10577652B2 (en) 2000-10-06 2020-03-03 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10570446B2 (en) 2000-10-06 2020-02-25 The Trustee Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10407459B2 (en) 2000-10-06 2019-09-10 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10669582B2 (en) 2000-10-06 2020-06-02 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10662472B2 (en) 2000-10-06 2020-05-26 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10457984B2 (en) 2000-10-06 2019-10-29 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10407458B2 (en) 2000-10-06 2019-09-10 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10428380B2 (en) 2000-10-06 2019-10-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US10669577B2 (en) 2000-10-06 2020-06-02 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9718852B2 (en) 2000-10-06 2017-08-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
US9719139B2 (en) 2000-10-06 2017-08-01 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
WO2003031947A3 (en) * 2001-10-04 2003-12-04 Genovoxx Gmbh Device for sequencing nucleic acid molecules
WO2003031947A2 (en) * 2001-10-04 2003-04-17 Genovoxx Gmbh Device for sequencing nucleic acid molecules
US10480025B2 (en) 2001-12-04 2019-11-19 Illumina Cambridge Limited Labelled nucleotides
US9605310B2 (en) 2001-12-04 2017-03-28 Illumina Cambridge Limited Labelled nucleotides
US10519496B2 (en) 2001-12-04 2019-12-31 Illumina Cambridge Limited Labelled nucleotides
US7427673B2 (en) 2001-12-04 2008-09-23 Illumina Cambridge Limited Labelled nucleotides
US9988683B2 (en) 2002-02-27 2018-06-05 Epigenomics Ag Method and nucleic acids for the analysis of colon cell proliferative disorders
WO2003072820A3 (en) * 2002-02-27 2004-04-08 Epigenomics Ag Method and nucleic acids for the analysis of colon cell proliferative disorders
US10487102B2 (en) 2002-08-23 2019-11-26 Illumina Cambridge Limited Labelled nucleotides
US10513731B2 (en) 2002-08-23 2019-12-24 Illumina Cambridge Limited Modified nucleotides
US11008359B2 (en) 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
US10995111B2 (en) 2003-08-22 2021-05-04 Illumina Cambridge Limited Labelled nucleotides
US11028115B2 (en) 2003-08-22 2021-06-08 Illumina Cambridge Limited Labelled nucleotides
US11028116B2 (en) 2003-08-22 2021-06-08 Illumina Cambridge Limited Labelled nucleotides
US9012144B2 (en) 2003-11-12 2015-04-21 Fluidigm Corporation Short cycle methods for sequencing polynucleotides
US7897345B2 (en) 2003-11-12 2011-03-01 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
US9657344B2 (en) 2003-11-12 2017-05-23 Fluidigm Corporation Short cycle methods for sequencing polynucleotides
US7981604B2 (en) 2004-02-19 2011-07-19 California Institute Of Technology Methods and kits for analyzing polynucleotide sequences
US9868978B2 (en) 2005-08-26 2018-01-16 Fluidigm Corporation Single molecule sequencing of captured nucleic acids
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US9051612B2 (en) 2006-09-28 2015-06-09 Illumina, Inc. Compositions and methods for nucleotide sequencing
US11098353B2 (en) 2006-12-01 2021-08-24 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US11939631B2 (en) 2006-12-01 2024-03-26 The Trustees Of Columbia University In The City Of New York Four-color DNA sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US11242561B2 (en) 2007-10-19 2022-02-08 The Trustees Of Columbia University In The City Of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
US11208691B2 (en) 2007-10-19 2021-12-28 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US9670539B2 (en) 2007-10-19 2017-06-06 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US10144961B2 (en) 2007-10-19 2018-12-04 The Trustees Of Columbia University In The City Of New York Synthesis of cleavable fluorescent nucleotides as reversible terminators for DNA sequencing by synthesis
US10260094B2 (en) 2007-10-19 2019-04-16 The Trustees Of Columbia University In The City Of New York DNA sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators
WO2009124255A3 (en) * 2008-04-04 2010-01-14 Helicos Biosciences Corporation Methods for transcript analysis
WO2009124255A2 (en) * 2008-04-04 2009-10-08 Helicos Biosciences Corporation Methods for transcript analysis
US10648026B2 (en) 2013-03-15 2020-05-12 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
US10982277B2 (en) 2013-03-15 2021-04-20 Illumina Cambridge Limited Modified nucleosides or nucleotides
US20170166961A1 (en) 2013-03-15 2017-06-15 Illumina Cambridge Limited Modified nucleosides or nucleotides
US10407721B2 (en) 2013-03-15 2019-09-10 Illumina Cambridge Limited Modified nucleosides or nucleotides
JP2017525695A (en) * 2014-08-08 2017-09-07 イルミナ ケンブリッジ リミテッド Modified nucleotide linker
KR20210100205A (en) * 2014-08-08 2021-08-13 일루미나 케임브리지 리미티드 Modified nucleotide linkers
AU2018278843B2 (en) * 2014-08-08 2019-07-18 Illumina Cambridge Limited Modified Nucleotide Linkers
US10190157B2 (en) 2014-08-08 2019-01-29 Illumina Cambridge Limited Modified nucleotide linkers
AU2015298469B2 (en) * 2014-08-08 2018-12-06 Illumina Cambridge Limited Modified nucleotide linkers
CN106604926B (en) * 2014-08-08 2020-05-15 伊卢米纳剑桥有限公司 Modified nucleotide linkers
KR102287718B1 (en) * 2014-08-08 2021-08-09 일루미나 케임브리지 리미티드 Modified nucleotide linkers
CN111704643A (en) * 2014-08-08 2020-09-25 伊卢米纳剑桥有限公司 Modified nucleotide linkers
RU2699993C2 (en) * 2014-08-08 2019-09-12 Иллумина Кембридж Лимитед Modified nucleotide linkers
CN106604926A (en) * 2014-08-08 2017-04-26 伊卢米纳剑桥有限公司 Modified nucleotide linkers
JP2022000435A (en) * 2014-08-08 2022-01-04 イルミナ ケンブリッジ リミテッド Modified nucleotide linkers
US11230734B2 (en) 2014-08-08 2022-01-25 Illumina Cambridge Limited Modified nucleotide linkers
KR20170039743A (en) * 2014-08-08 2017-04-11 일루미나 케임브리지 리미티드 Modified nucleotide linkers
US11773438B2 (en) 2014-08-08 2023-10-03 Illumina Cambridge Limited Modified nucleotide linkers
WO2016020691A1 (en) * 2014-08-08 2016-02-11 Illumina Cambridge Limited Modified nucleotide linkers

Also Published As

Publication number Publication date
AU2002312859A1 (en) 2002-11-11
WO2002088381A3 (en) 2003-11-27
DE10120798A1 (en) 2002-12-19
DE10120798B4 (en) 2005-12-29

Similar Documents

Publication Publication Date Title
DE10120797B4 (en) Method for analyzing nucleic acid chains
WO2003020968A2 (en) Method for analyzing nucleic acid sequences and gene expression
WO2002088381A2 (en) Method for determining gene expression
DE10246005A1 (en) Automated nucleic acid sequencer, useful e.g. for analyzing gene expression, based on parallel incorporation of fluorescently labeled terminating nucleotides
DE69233458T2 (en) NUCLEIC ACIDIFYING BY POLYMERASE EXTENSION OF OLIGONUCLEOTIDES USING TERMINATOR MIXTURES
DE112007002932B4 (en) Four-color DNA sequencing by synthesis using cleavable, reversible, fluorescent nucleotide terminators
DE69928683T2 (en) PROCESS FOR THE AMPLIFICATION AND SEQUENCING OF NUCLEIC ACIDS
DE60208278T2 (en) System and method for testing nucleic acid molecules
DE10214395A1 (en) Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide
DE10149786B4 (en) Surface for studies of populations of single molecules
WO2002038806A2 (en) Detection of nucleic acid polymorphisms
DE102004025696A1 (en) Ultra-high parallel analysis process to analyse nucleic acid chains in which a sample solid is bound and substrate material
DE102004025744A1 (en) Surface of a solid support, useful for multiple parallel analysis of nucleic acids by optical methods, having low non-specific binding of labeled components
DE102004025695A1 (en) Optical fluorescent parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex
DE102004025694A1 (en) Optical fluorescent ultra-high parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex
DE102004025745A1 (en) Surface of solid phase, useful for parallel, optical analysis of many nucleic acids, has reduced non-specific binding of labeled components
EP2074133A2 (en) Components and method for enzymatic synthesis of nucleic acids
DE69924140T2 (en) DETERMINATION OF THE LENGTH OF REPETITIVE NUCLEIC ACID SEQUENCES BY A DISCONTINUOUS PRIMER EXTENSION
DE102004025746A1 (en) Parallel sequencing of nucleic acids by optical methods, by cyclic primer-matrix extension, using a solid phase with reduced non-specific binding of labeled components
DE102006014879B4 (en) RNA labeling method
DE60038109T2 (en) Method for analyzing AFLP reaction mixtures using primer extension techniques
DE60213002T2 (en) NORMALIZATION OF MICRO ARRANGEMENT DATA BASED ON HYBRIDIZATION WITH INTERNAL STANDARD
WO2008080629A2 (en) Improved molecular biological processing system
EP1458892B1 (en) Evanescence-based multiplex sequencing method
DE102006062089A1 (en) Molecular biology process system comprises a device for synthesis of receptor arrays, devices for performing fluidic steps, a detection unit and programmable control units

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SD SE SG SI SK SL TJ TM TN TR TT TZ UA UG US UZ VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

122 Ep: pct application non-entry in european phase
NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP