EP1492888A2 - Analysis of mixtures of nucleic acid fragments and of gene expression - Google Patents

Analysis of mixtures of nucleic acid fragments and of gene expression

Info

Publication number
EP1492888A2
EP1492888A2 EP03742963A EP03742963A EP1492888A2 EP 1492888 A2 EP1492888 A2 EP 1492888A2 EP 03742963 A EP03742963 A EP 03742963A EP 03742963 A EP03742963 A EP 03742963A EP 1492888 A2 EP1492888 A2 EP 1492888A2
Authority
EP
European Patent Office
Prior art keywords
nucleic acid
acid fragments
fragments
mixture
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP03742963A
Other languages
German (de)
French (fr)
Inventor
Achim Fischer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sygnis Pharma AG
Original Assignee
Axaron Bioscience AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axaron Bioscience AG filed Critical Axaron Bioscience AG
Publication of EP1492888A2 publication Critical patent/EP1492888A2/en
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]

Definitions

  • the invention relates to a method for analyzing nucleic acid fragment mixtures and the use of the method for gene expression analysis.
  • sequenced expressed sequence tag
  • sequenced expressed sequence tag
  • the abundance of a transcript is no longer represented by the frequency of an event, for example the frequency with which a clone representing this transcript occurs, but by the intensity of the respective band.
  • This largely eliminates the redundancy that characterizes the EST sequencing of the prior art, which is associated with a cost reduction.
  • the respective bands are isolated from the gel, reamplified by means of PCR and cloned. More modern variants of this method, as are described, for example, in EP 0 743 367, are based on fragment generation by means of restriction digestion of double-stranded cDNA, which significantly increases the reproducibility of the fragment patterns obtained.
  • fragment-specific information such as fragment length, partial nucleotide sequence, information about position and / or orientation of the fragment within the starting cDNA etc.
  • fragment-specific information such as fragment length, partial nucleotide sequence, information about position and / or orientation of the fragment within the starting cDNA etc.
  • bp long partial sequence which is known for each fragment, as well as the information about the distance of this sequence from the 3 'end of the fragment.
  • the method described has disadvantages which lead to the unreliability of said signatures: (1) the identification of 4 nucleotides of the 8 bp long sequence, which is carried out by “invasive” or “selective” amplification primers, is imprecise, since primers are often also incorporated whose selective portion, namely the nucleotides located at the 3 'end, are not perfectly complementary to the template, and (2) the determination of the fragment length via the electrophoretic mobility is inaccurate, since the mobility of a fragment in addition to the length of G / C content and the exact sequence of the fragment (cf. Forensic Sei. Int.
  • the fragments obtained are separated by gel electrophoresis , its length and therefrom the distance between the two restriction endonuclease recognition sites on which the formation of a fragment is based, and signatures are generated, consisting of the sequence of the first recognition site, the sequence of the second recognition site and the assumed distance between the two recognition sites (expressed in base pairs) Using these signatures, database searches are carried out in order to allocate the detected fragments to the genes from which the fragments are derived, which also shows that due to great uncertainties in the determination of fragment sizes on the basis of fragment mobilities, there is a high response Part of incorrect assignments of database entries to detected fragments occurs.
  • the object of the present invention is achieved by a method for analyzing nucleic acid fragments, comprising the steps:
  • step (b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site, (c) identification of one or more nucleotides of the cut nucleic acid fragments from (b), the identification being simultaneous for several or all nucleic acid fragments are carried out.
  • the object according to the invention is achieved by a method for analyzing nucleic acid fragments, comprising the steps:
  • step (a) Provision of a mixture of nucleic acid fragments which have at least one recognition site for a restriction endonuclease cutting outside their recognition site, (b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site and which creates overhanging ends of known position and length but unknown sequence,
  • the mixture of nucleic acid fragments is preferably, optionally amplified, restriction fragments of cDNA or genomic DNA.
  • the fragments or a part of the fragments can be flanked by sequence regions common to all or some fragments. These common sequence regions can be, for example, linkers or adapters attached to the fragments, that is to say double-stranded nucleic acid fragments which can be obtained by Hybridization of two essentially or at least partially complementary oligonucleotides are readily available.
  • adapters are characterized by a length between 5 and 200 nucleotides, preferably between 10 and 80 nucleotides, particularly preferably between 15 and 40 nucleotides.
  • the fragments preferably have a characteristic size distribution with a smallest occurring size, a largest occurring size and an average size, the size being influenced or determined by the positions and / or the frequency of the recognition site or sites for the restriction endonuclease or restriction endonucleases used for fragment generation of course, the length of any attached linker or adapter must also be taken into account.
  • a mixture of nucleic acid fragments preferably double-stranded cDNA, is cut with at least one restriction endonuclease, which preferably has a four-based recognition sequence.
  • restriction endonucleases are Alul, Bfal, Bst I, Chal, Csp6l, Cv JI, Cv / JI, Dpnl, Dpnll, Haelll, Hhal, HwPlI, Hpall, HpyCm IV, HpyCIl4 V, Mbol, Msel, Mspls, Nlalll , Sau3al, Tail, Taql, Tsp5091.
  • linker molecules are attached to one or both ends of the fragments thus obtained - generally via enzymatic ligation.
  • fragment ends and linker ends are compatible with one another, ie are smooth or have overhangs that are complementary to one another.
  • single-stranded fragment ends can be removed using a nuclease or, in the case of 5 'overhangs, filled in using a polymerase and thus converted into smooth ends if the attachment of linkers with smooth ends is intended.
  • Another example of post-treatment of fragment ends is partial filling, which can prevent, usually undesirable, ligation of two fragment ends to one another.
  • a palindromic and thus self-complementary overhang of the sequence 3'-CTAG-5 'generated by treatment with the restriction endonuclease Sau3al can be converted into a no longer self-complementary overhang of the sequence 5'-TAG-3' by treatment with a polymerase in the presence of dGTP , Only such linkers with an overhang 5 '-ATC-3' complementary to it could now be attached to such an overhang; ligation of two fragment ends with one another would no longer be possible.
  • an amplification with one or more PCR primers directed against the attached linkers or with one or more against the fragments is optionally carried out to display a desired subset of fragments attached linker directed PCR primer and in addition a PCR primer which is directed against a terminal region of the original nucleic acid fragments, preferably the starting cDNA molecules.
  • a PCR primer which is directed against a terminal region of the original nucleic acid fragments, preferably the starting cDNA molecules.
  • the region which was introduced by the cDNA primer used for cDNA synthesis or a region which is artificially attached to the 5 'end of the mRNA used for cDNA synthesis or to the 3' end of the first strand cDNA was added.
  • the cDNA primer used is preferably an oligo-dT primer which can have an extension by one or more nucleotides at its 3 'end and / or at its 5' end, at least some of which have no " If two or more restriction endonucleases which generate different ends are used for the fragment generation, different linkers can be used in the subsequent step, some of which attach to one type of end and another part to another type of end If these linkers differ not only in their ends and thus in their compatibility (ie, their attachability) to the fragment ends, but also in their remaining sequence, then in a subsequent PCR amplification, specific fragments can be targeted by suitable choice of the primers (those on the linker sequences of the selected primers under the set amplification conditions can be amplified), while certain other fragments (those to the linker sequences of which the selected primers cannot bind) remain unamplified.
  • a further possibility for the selective amplification of certain fragments is to use invasive primers which are extended at their 3 'end to the linker sequence common to all fragments by one or more additional selective bases (see for example EP 0 743 367).
  • a further possibility for selective isolation or amplification, which can be used in the course of the method according to the invention, is described in WO 94/01582.
  • Restriction endonucleases that cut outside their recognition site are those restriction endonucleases in which the partial sequence that triggers the enzyme activity (the recognition site), which is usually one of 4-8
  • Base pair of existing region of double-stranded DNA and on which the Enzyme binds to the DNA double strand, and the interface, that is to say the region of the DNA double strand in which the sugar phosphate backbone of the DNA strands is hydrolytically separated, is offset from one another on at least one of the two strands forming the double strand.
  • restriction endonucleases such as Fokl [cutting characteristic GGATG (9/13): the “upper” strand is cut 9 bases away from the recognition site GGATG, the “lower” strand 13 bases away from the recognition site] or Btsl [Cutting characteristic GCAGTG (2/0)] or the restriction endonuclease Bcgl [cutting characteristic (10/12) CGANNNNNNTGC (12/10): both strands are cut once in front of and once behind the recognition site].
  • Fokl cutting characteristic GGATG (9/13): the “upper” strand is cut 9 bases away from the recognition site GGATG, the “lower” strand 13 bases away from the recognition site] or Btsl [Cutting characteristic GCAGTG (2/0)] or the restriction endonuclease Bcgl [cutting characteristic (10/12) CGANNNNNNTGC (12/10): both strands are cut once in front of and once behind the recognition site].
  • restriction endonucleases Aarl, Acelll, Alol, Alw ⁇ , Bael, Bbr7l, Bbsl, Bbvl, BceA ⁇ , Beeil, BciYl, BfuAl, Bmrl, Bpli, Bpml, BpuEl, Bsal, BsaXl, BscAl, BseKIll, BseMIll , BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, Bst ⁇ 5l, Cjel, CjeVl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, HaelV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil PsrI, RleAl, Sapl, SfaNl, Sthl32l, Stsl, Taqll, TspOT I
  • restriction endonucleases which produce single-stranded overhangs, which can be both 3 'overhangs and 5' overhangs. If restriction endonucleases are to be used which produce smooth ends (for example Mlyl, cutting characteristic GAGTC (5/5), or SspO5 I, GGTGA (8/8)), the smooth ends can be converted into overhanging ends in an additional step.
  • T4 DNA polymerase incubation with T4 DNA polymerase in the presence of a selected nucleotide triphosphate; the exonuclease activity of the T4 DNA polymerase then degrades one of the two strands in the 3 '-' 5 'direction until the first "nucleotide of the same name" in the strand is reached (for example up to the first "G” if the nucleotide triphosphate dGTP used see Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons).
  • Another type of restriction endonucleases that cut outside their recognition site are enzymes in which the recognition site is interrupted by a sequence of any or largely any nucleotides.
  • enzymes such as Xcml (cutting characteristic CCANNNNN / NNNNTGG) or S / ZI (cutting characteristic GGCCNNNN / NGGCC).
  • Another special case to be considered outside of their recognition site of restriction endonucleases which are cutting is so-called "nicking endonucleases" which only cut one strand of a nucleic acid double strand.
  • Examples of such endonucleases are N.AlwI (GGATCNNN N) and N.BstNBI (GAGTCNNNN / N) the sense strand on the marked with "/" Cut position.
  • the recognition site for a restriction endonuclease that cuts outside of its recognition site in the nucleic acid fragments from the fragment mixture in (a) is preferably located within the terminal sequence regions common to many or all fragments of the mixture, in particular in the sequence regions of the adapters or linkers attached to the fragments.
  • the selection of the enzyme and the position of the recognition site are to be selected such that, when the restriction endonuclease or restriction endonucleases act, a "proximal" cut is made and the respective nucleic acid fragment is cut in the fragment-specific area which is outside the flanking linker common to all or many fragments
  • recognition sites for the restriction endonucleases to be used which are outside individual fragments and which lie outside the flanking linker areas common to all or many fragments are protected against recognition by the corresponding restriction endonuclease
  • recognition sites for certain restriction endonucleases can be achieved, for example, by incorporating methylated nucleotides such as methyl dCTP Protection against restriction endonucleolytic cleavage is also provided by using a methylase belonging to the selected restriction endonuclease.
  • the enzyme BamRl methylase converts recognition sites of the restriction endonuclease BamHl into their C-methylated form, which Bam ⁇ l no longer recognizes and cuts.
  • the enzyme CpG methylase methylates CG dinucleotides, for example preventing a cut of a DNA fragment containing the sequence CGTCTC with the restriction endonuclease BsmBl (cutting characteristic CGTCTC (1/5)).
  • the above measures ensure that each nucleic acid fragment present in the mixture in the course of a restriction induction only on exactly one predetermined position is cut.
  • nucleic acid molecules preferably cDNA or genomic DNA
  • restriction endonuclease from step (b)
  • linker molecules to the ends generated with the latter and to carry out a PCR amplification with primers which are directed against the terminal linker molecules.
  • One or more nucleotides of the cut nucleic acid fragments can be identified in several different ways. In particular, three preferred procedures are suitable for this, which should not, however, preclude further procedures:
  • the terminating nucleotides carry marking groups which can be used to detect incorporation
  • the four dideoxynucleotides carry four distinguishable labeling groups, in particular four different fluorophores, and it can then be recognized from the fluorescence activity which of the four
  • restriction endonucleases are particularly suitable: Aarl, Acelll, Alwl, Bbr7l, Bbsl, Bbvl, BceAl, Bce, BfuAl, Bsal, BscAl, BsmAl, BsmBl, Bsm ⁇ l, BspMl, Earl, Faul, Fokl, Hgä, Plel, S SfaNl, SM321, Stsl. Attachment of adapters with overhanging ends of suitable length and suitable type (3 'overhang or 5' overhang) to fragments having an overhanging end, the attachment being carried out in a sequence-specific manner.
  • the overhanging fragment ends can in particular have been generated using one of the following restriction endonucleases: Aarl, Acelll, Alol, Alwl, Bael, Bbr7l, Bbsl, Bbvl, BceAl, Bcett, Bcgl, BciVl, BfuAl, Bmrl, BpR, Bpml, BpuEl,
  • Sequencing adapter used, which differ in their overhang.
  • a sequential or a parallel procedure is of course also conceivable, in which different adapters are used in separate fastening reactions.
  • adapters bearing marking groups which differ both in their overhang and in their marking group.
  • the labeling groups are fluorophores, so that the fluorescence activity of the fastening products shows which adapter has been fastened to a given fragment end.
  • Mixture can be, for example, adapters of the general structure
  • adapter means the double-stranded portion of the adapter
  • X represents one of the four possible nucleotides in the form of a single-stranded overhang
  • F means a fluorophore which identifies the overhanging base X.
  • N is a mixture of all four possible nucleotides or a universal nucleotide such as inosine.
  • the first nucleotide of the dibasic fragment overhang would be determined by attaching the first adapter
  • the second nucleotide of the dibasic fragment overhang would be determined by attaching the second adapter.
  • the sequence of the overhanging end can be determined.
  • overhangs of a length of more than two nucleotides can also be sequenced.
  • marking groups which allow the simultaneous detection of more than four (namely usually an integer multiple of four) different markings.
  • the first four of the different markings could be used to identify a first base of fragment overhangs generated, the second four of the different markings for identification of a second base of the fragment overhangs generated, and possibly further sets of four different markings for further bases of the fragment overhangs generated , Such a “multiplexing” would result in a reduction in the number of experimental steps required.
  • so-called “quantum dots” could be considered as marker groups, of which numerous different ones can be detected in a common measurement without the measurement results influencing one another (Han et al., Nat. Biotechnol. 19, 631-5 [2001]).
  • Extension of selective oligonucleotide primers whose nucleotide or nucleotides located at the 3 'end can hybridize with the nucleotide or nucleotides to be sequenced, followed by the identification of those primers which were extended in the extension reaction. If necessary, the extension can be carried out by means of the polymerase chain reaction (PCR).
  • Linkers or adapters are preferably attached to the ends of the nucleic acid fragments to be sequenced, which can serve as primer binding sites common to all or many fragments.
  • the oligonucleotide primers are then designed in such a way that, after denaturing the nucleic acid fragments to be sequenced, they correspond to those at the 3 'end of the
  • Nucleic acid fragment strands can hybridize attached linker strand. It must be ensured here that the oligonucleotide primers hybridized in this way "overlap" by one or more nucleotides with the region of the nucleic acid fragment adjacent to the linker region, that is to say at their 3 'end they have nucleotides which correspond to the nucleotides of the
  • nucleic acid fragments if there is complementarity.
  • selective nucleotides which allow the primer to be extended by means of a polymerase if they have become part of a double strand as a result of said hybridization, but which at least largely prevent the primer from being extended if they do not
  • nucleotides are identified simultaneously for several or all nucleic acid fragments, preferably after the nucleic acid fragments contained in the mixture have been separated according to a fragment-specific property, in particular according to the size and / or mobility of the fragments, by electrophoretic separation.
  • the method of gel electrophoresis is particularly preferred, in which flat gels or gel-filled capillaries are used for the separation.
  • enzymatic reactions according to variants 1-3 are carried out in step (c) in such a way that one or two nucleotides of the fragments are identified in parallel batches, the nucleotides of the fragments to be identified in the parallel batches being in a defined position relative to one another , for example adjacent to each other.
  • One or two nucleotides of known position are then first determined in parallel separations of the said approaches for each of the separated fragments, which is preferably done by means of different marker groups which allow information about the nucleotides to be determined.
  • the determined nucleotides for individual or all of the separated fragments are then brought into the order in which they are present on the associated starting fragment from the mixture of nucleic acid fragments.
  • signatures in the form of short sequence sections which characterize the associated fragment are generated for the examined fragments.
  • the length of these sequence sections is preferably at least 14 bases, more preferably at least 16 bases, in particular at least 20 bases.
  • a signature can also contain other information characterizing a fragment, for example exact or approximate distances (specified in base pairs) between characteristic areas of the fragment, for example the distance between two known sequence sections estimated with the aid of an internal length standard based on the electrophoretic mobility, between a known sequence section and a fragment end, or between both fragment ends.
  • the length of the sequence sections is preferably at least 10 bases.
  • the information content of a signature is preferably large enough to allow the unambiguous identification and / or isolation of the associated fragment.
  • experience has shown that approximately 14-20 base pairs of sequence information without additional information about distances within the fragment in question are usually sufficient to recognize a transcript containing this sequence segment from a mixture of cDNA molecules and to identify the associated gene.
  • t ⁇ g sequencing such as SAGE (Velculescu et al., Science 270: 484-487 [1995], WO 00/53806) or MPSS (Brenner et al., Nature Biotechnol.
  • the information content of a signature identifying a fragment can be increased, among other things, by the following information:
  • an additional statement about the fragment to be identified or the associated transcripts or genes in question could be, for example, "3 'fragment double-stranded cDNA generated by the restriction endonuclease Rsal", whereby the identity of the sequence part of a signature with a 5' ⁇ 3 'direction is "above” (upstream) or "Before" the sequence region of a transcript located most towards the 3 'end of the fragment would be recognized as insignificant.
  • signatures whose sequence portion was in the wrong orientation with regard to the 5' -3 'preferred direction of an mRNA Sequence or the cDNA sequence derived from it is not recognized as significant.
  • additional information is given as to which molecular biological procedure the signatures were generated, which precludes the occurrence of certain partial sequences as a signature or part of a signature about genes in question could, for example, be "from the totality of all genes expressed in the leaf” if transcripts from leaf samples are to be identified by means of plant signatures generated, but for example genes which are only expressed in the root should not be taken into account.
  • the simultaneous identification of one or more nucleotides of the cut nucleic acid fragments takes place in step c) via the following individual steps: ca) identification of a first nucleotide of the cut nucleic acid fragments from b), the identification being carried out simultaneously for several or all nucleic acid fragments, cb) optionally identifying a further nucleotide of the cut nucleic acid fragments from b), the identification being carried out simultaneously for several or all nucleic acid fragments, cc) optionally repeating step (c b) until the desired number of
  • Nucleotides has been identified, cd) summarizing the sequence information obtained in steps (ca) to (cc) for a selected group or all nucleic acid fragments into fragment-specific signatures, a signature being able to contain further information about the respective fragment in addition to the sequence information, wherein the nucleotide identification in steps ca) to cc) optionally also includes the separation of the nucleic acid fragments of the mixture.
  • step a) At least a subset of the mixture of nucleic acid fragments provided in step a) is subjected to the following process steps aa) to ad):
  • aa separation of the mixture of nucleic acid fragments according to at least one fragment-specific property, ab) optionally detection of the relative frequency of some or all fragments in the separated mixture, ac) optionally comparing the information obtained in (aa) and / or (ab) about the composition of different mixtures of nucleic acid fragments according to step (a), ad) optionally registering nucleic acid detected in (ab) and / or (ac) Fragments which occur in different mixtures of nucleic acid fragments at different relative frequencies ⁇
  • III) is a mixture of nucleic acid fragments which is at least partially identical to I) or II).
  • At least one fragment of one of groups (I) to (III) is obtained in an additional process step.
  • the fragments of interest are preferably obtained by specific PCR amplification from a mixture of nucleic acid fragments, in which fragment-specific oligonucleotide primers are used, which are accessible and can be produced by the signatures determined in step (cd).
  • a further preferred embodiment relates to one of the above methods according to the invention, in which a mixture of nucleic acid fragments according to step a) or a subset of this mixture of nucleic acid fragments according to step a) is provided, which was produced by the following steps: i) flanking on both sides of the restriction fragments of the mixture with identical or different adapters ii) hybridizing the fragments from step (i) with different primers in each case, all of which have regions complementary to the adapters from step (i) and which have their respective 3 'ends have one or more nucleotides, which after
  • Hybridization of the primer with its target sequence protrude beyond the region complementary to the adapter and are complementary to the nucleotides opposite them in the double strand of a subset of the fragments from the nucleic acid mixture from (a). iii) sequence-specific extension of the primers from ii) and, if appropriate, subsequent PCR amplification of the nucleic acid fragments from the fragment mixture which had been extended in a sequence-specific manner in step ii).
  • Sequence-specific extension means that only those primers whose nucleotide or nucleotides at the 3 'end at step 3) are or are complementary to the opposite nucleotides of the fragment with which they hybridize a nucleic acid are hybridized - Have formed double strand.
  • a method for gene expression analysis comprising the following steps:
  • fragments of interest optionally obtained fragments of interest from the mixture of nucleic acid fragments from (al) or (b1), the fragments of interest being the fragments registered in (e), ml) optionally identifying the genes belonging to the nucleic acid fragments of interest, from which the nucleic acid fragments are derived by means of
  • the fragments of interest can be the fragments registered in (e).
  • steps (fl) to (i) are repeated, changing the position and / or sequence of the recognition site ensures that nucleotide positions of the fragments to be analyzed other than those previously examined are converted into single-stranded overhangs and thus further, previously unidentified Nucleotides can be identified.
  • a simultaneous approach in parallel approaches is of course also possible.
  • the procedure is as follows: At least one fragment mixture is provided in which many or all fragments have identical ends, for example smooth ends or overhanging ends of the same length and sequence. This mixture is aliquoted, for example in 10 substantially equal aliquots.
  • Each of the mixtures is mixed with one of a selection of different adapters (here one of 10 different adapters) and exposed to ligation conditions, with all adapters being distinguished by an end that is compatible with the fragment ends, that is to say attachable to them. Furthermore, all adapters have at least one recognition site for a restriction endonuclease that cuts outside their recognition sequence, for example Mmel.
  • the adapters differ from one another in that the recognition sequence is removed from the adapter end to be attached to the fragment ends.
  • two different adapters differ in this distance by an integer multiple of the length of the overhanging ends, which can be generated by said restriction endonuclease which cuts outside their recognition sequence.
  • the distance is accordingly 18 bp in some adapters, 16 bp in other adapters, 14 bp, 12 bp, 10 bp, 8 bp, 6 bp, 4 in the other adapters bp, 2 bp or 0 bp.
  • bases 19 and 20 are in the case of the first reaction, bases 17 and 18 in the second reaction, and bases 15 and 16, 13 in the remaining reactions and 14, 11 and 12, 9 and 10, 7 and 8, 5 and 6, 3 and 4 or 1 and 2 in the form of a single-stranded overhang.
  • the complete set of all 10 reactions thus allows the identification of a coherent, 20 base long partial sequence or signature for the fragments present in the fragment mixture.
  • recognition sites for restriction endonucleases cutting at different distances from their recognition sites at the same position.
  • an adapter could have one at its end to be attached to the fragment ends Detection point for Earl (cutting characteristic CTCTTC (l / 4)), a second adapter in the same position a detection point for SfaNl (cutting characteristic GCATC (5/9)) and a third adapter in the same position a detection point for Stsl (cutting characteristic GGATG (10/14 )), which made it possible to use the method according to the invention to identify 13 base partial sequences of the fragments.
  • Detection point for Earl cutting characteristic CTCTTC (l / 4)
  • a second adapter in the same position a detection point for SfaNl (cutting characteristic GCATC (5/9)
  • a third adapter in the same position a detection point for Stsl (cutting characteristic GGATG (10/14 )
  • a method for gene expression analysis comprising the following steps:
  • a2) provision of at least one mixture of nucleic acid fragments, in particular a mixture of cDNA fragments, having at least one recognition site for a restriction endonuclease that cuts outside of its recognition site and that is located on linkers attached to starting fragments, b2) incubation of the mixture of nucleic acid fragments from ( a2) with the restriction endonuclease or the restriction endonucleases from step (a2), c2) identification of a first nucleotide of the cut nucleic acid fragments from (b2), the identification being cut simultaneously for several or all nucleic acid fragments of the mixture and with separation of the mixture and for
  • Identification of the nucleotide of suitably treated nucleic acid fragments takes place according to at least one fragment-specific property, d2) optionally identification of a further nucleotide of the cut nucleic acid fragments from (b2) according to (c2), e2) optionally repetition of step (d2) until the desired number of Nucleotides has been identified, f2) optionally repeating steps (a2) to (e2) one or more times, the position and / or sequence of the recognition site being changed in such a way that the repetition or repetitions in each case the identification of previously unidentified nucleotides allow, g2) combining the sequence information obtained in steps (c2) to (f2) for a selected group or all nucleic acid fragments into fragment-specific ones Signatures, where a signature can contain further information about the respective fragment in addition to the sequence information, h2) assignment of the fragment-specific information obtained in the separation according to a fragment-specific property in (c2) to the signatures obtained in (g2) for the nucleic acid fragments, being the
  • information includes the relative or absolute mobility of the fragments and / or the apparent or actual fragment length determined on the basis of a length standard and the assignment can take place in tabular and / or computer-readable form, i2) if necessary, identification of the nucleic acid Fragments belonging to genes from which the nucleic acid fragments derive, by searching electronic databases for the signatures from (g2), j2) optionally providing at least one further mixture of nucleic acid fragments, in particular a mixture of cDNA fragments, obtained from analogue ones Way to the mixture of nucleic acid fragments from (a2), it being possible here to dispense with the addition of linkers having at least one recognition site for a restriction endonuclease that cuts outside its recognition site, k2) separation of the mixture or mixture the nucleic acid fragments from (i2) according to a fragment-specific property essentially under the conditions of the separation into (c2),
  • Separation of the fragments may include the relative or absolute mobility of the fragments and or the apparent or actual fragment length determined on the basis of a length standard and the assignment may be in tabular and / or computer-readable form, m2) if necessary, comparison of the relative or absolute frequencies of at least part of the fragments separated in (k2) with the relative or absolute frequencies of the respective homologous, that is to say completely or essentially sequence-identical fragments originating from different mixtures of nucleic acid fragments, n2) where appropriate, registration of those fragments whose relative or absolute frequency differ from the relative or absolute frequency of their homologous fragments of other mixtures of nucleic acid fragments by at least a preselected factor, o2) where appropriate, assigning the fragments registered in (n2) to those genes or Transcripts, from which said fragments are derived, using the results obtained in step (h2), p2) optionally obtaining the fragments registered in (n2) from the mixture of nucleic acid fragments from (a2) or (i2) and / or (j
  • steps (i2) to (n2) can also be carried out before steps (a2) to (h2).
  • nucleic acid fragments preferably mixtures of cDNA fragments
  • Mixtures of nucleic acid fragments can be produced by methods known from the prior art.
  • EP 0 743 describes
  • Fragment subpools obtained from RNA preparations are then separated by gel electrophoresis according to their size, and the bands obtained. Signal patterns are compared with each other. Bands or signals originating from homologous fragments, the intensity of which differs between different samples, represent genes that are in the compared ones
  • the fragment-specific property is a property, in particular a physical or physicochemical property, which can be realized by different molecules within a continuum or in the form of a larger number (for example at least 10 or at least 100) of different gradations or forms. It is particularly preferred to use different mobility of different nucleic acid fragments in separation systems, in particular different electrophoretic mobility in electrophoresis systems such as agarose or polyacrylamide gel electrophoresis. Mobility is usually influenced by the length of a fragment; however, it is not a strictly linear relationship, since the G / C content and conformation of a nucleic acid molecule also influence mobility. Therefore, the mobility of a nucleic acid molecule can usually only be used for approximate, but not for absolute size determination.
  • the fragment-specific property can be a specific partial sequence of n nucleotides, where n can be equal to or greater than 1.
  • Said partial sequence of a fragment preferably adjoins a linker attached to the end of the fragment, so that a mixture of different fragments according to this partial sequence can be separated by extension, optionally a repeated extension in the form of an amplification, of selective oligonucleotide primers.
  • extension optionally a repeated extension in the form of an amplification, of selective oligonucleotide primers.
  • separation of a fragment mixture means the production of mixtures of amplified fragments, each of which copies produced by amplification contains only a part of the fragments present in the starting mixture.
  • said partial sequence is at least partly in the form of a single-stranded one Overhang, and a mixture of different fragments after this partial sequence is separated by attaching adapters with compatible overhangs.
  • This process also called “categorization of nucleotide sequence populations”, is described in WO 94/01582. A combination of both measures is also conceivable and is described, for example, in WO 01/75180.
  • the relative frequency of some or all of the fragments is detected by measuring the signal strength obtained in the detection of individual nucleic acid fragments.
  • the nucleic acid fragments contain detectable labeling groups, the use of fluorophores as labeling groups being particularly preferred.
  • the relative frequency of a fragment as an area under the corresponding curve in the fluorogram (the plot of the measured fluorescence intensity as a function of the retention time) is readily available in the form of a numerical value.
  • a fragment here is to be understood as the entirety of all the sequence-identical nucleic acid molecules of a mixture, possibly plus the sequence of complementary nucleic acid molecules.
  • the numerical values obtained as the relative frequency of fragments are often stored in a computer-readable form.
  • nucleic acid fragments preferably cDNA fragments, of different relative frequencies
  • those fragments are identified which differ in their proportion between different biological samples or between different mixtures of cDNA fragments. If care is taken to generate cDNA fragments from the mRNA molecules present in the samples, the frequency distribution of which is similar or even equal to the frequency distribution of the different mRNA molecules, then cDNA fragments between mutually compared fragment mixtures of different frequencies also show mRNA -Molecules of different frequencies and thus differentially expressed genes.
  • a threshold value for frequency differences can optionally be set, so that, for example, only those cDNA fragments whose relative frequency between mutually compared fragment mixtures is at least the same are further investigated Factor two differs.
  • the simultaneous identification of a nucleotide or a plurality of nucleotides for several or all nucleic acid fragments is preferably carried out by, as described above, on the overhanging fragment ends generated by means of at least one restriction endonuclease cutting outside their recognition site for identity the characteristic process of the nucleotide to be identified is carried out, for which a mixture of several or all nucleic acid fragments is used and the result of which can preferably be observed by incorporating a label, in particular a fluorescent label.
  • the identified nucleotides lie in proximity to one another, that is to say that the information about the nucleotide identities thus obtained results in a coherent partial sequence of the respective nucleic acid fragment.
  • the “sequencing reaction” has expired, the products formed in the process are separated, in which case the separation can again take place according to the fragment-specific property from (b1) or (c2).
  • the nucleotide identity obtained for some positions is assigned to each or some of the separated nucleic acid molecules.
  • the information received about a fragment is called a signature.
  • the signature can also contain further information, for example sequence information obtained in another way or approximate fragment size obtained via fragment mobility.
  • fragment-specific signatures can be determined for all or part of the fragments contained in a fragment mixture.
  • signatures are determined in particular for those fragments which differ in their relative frequency between the fragment mixtures to be compared by at least one fixed factor. Otherwise, the sequence portion of a signature does not necessarily have to be a coherent sequence.
  • partial nucleotide sequences of both fragment ends of a given fragment are determined and combined to form a signature; it is of course also possible to include additional information in the signature, such as approximate fragment lengths.
  • the signature could be for a particular fragment
  • the fragment "begins” with the nucleotide sequence CTCA at the 5 'end, "ends” with the nucleotide sequence GGAT at the 3' end and in total, possibly plus terminal linker regions, approximately 200 bp ( 4 bp + 192 bp + 4 bp) is long.
  • the formulation "approximately” takes into account that the length determination of fragments based on the electrophoretic mobility, as stated above, is subject to a certain error.
  • Fragments of interest can be obtained from the mixture of nucleic acid fragments, preferably cDNA fragments, with the aid of the fragment-specific signatures determined, for example by means of PCR using gene-specific primers.
  • a mixture of 3'-cDNA fragments was obtained by means of the restriction endonuclease Rsal, followed by the ligation of linker to the (smooth) fragment ends, and if the above signature GTACAGTA was obtained for a selected fragment Fragment known that after the Rs 1 cut (removal of the first two nucleotides of the Rs ⁇ l recognition site, GT), the first nucleotides following the linker sequence are the sequence ACAGTA.
  • a primer is now used for PCR amplification which, following the linker sequence at its 3 'end, has precisely this nucleotide sequence ACAGTA
  • the associated fragment can be accessed directly by amplification from the fragment mixture, since said primer selectively promotes amplification of those fragments. with which it is sequence-identical (or complementary) over its entire length.
  • the fragment obtained in this way can then be subjected to a further analysis, for example sequencing, followed by a database query for entries which are identical or similar to sequences.
  • a prerequisite for this procedure is of course a sufficiently high information content of the signature, ie a sufficient length and thus specificity of the fragment-specific area of the amplification primer.
  • the primer used would therefore have to be extended at its 3 'end by further specific bases. It must also be taken into account here that the greater the distance from the 3 'end of the primer, the less the ability of polymerases to discriminate against the extension of primers hybridized with partial mismatch with the template strand are. If a primer is extended at its 3 'end to increase the specificity by further fragment-specific bases, a certain loss in the specificity of those bases which immediately follow the sequence section of the primer complementary to the respective linker sequence is to be expected.
  • the signatures obtained for nucleic acid fragments of interest are used to design fragment-specific oligonucleotide primers.
  • the genes belonging to the nucleic acid or cDNA fragments of interest can be identified by searching electronic databases if the information content of a signature is high enough to permit clear or largely unambiguous identification of a gene and if the database has corresponding entries. How high the information content of signatures of a biological species has to be in order to allow a clear assignment of a signature to the associated gene can be determined empirically and can even differ from gene to gene within a biological species; for example, a particular decamer (a 10-nucleotide signature) may be characteristic of a single gene, while another decamer appears in many different genes.
  • the signatures obtained for nucleic acid fragments of interest are used to identify the nucleic acid fragments in a database search.
  • the signatures obtained for nucleic acid fragments of interest are used to create EST banks.
  • the signatures obtained for the individual fragments obtained from a cDNA preparation are used in order to design fragment-specific oligonucleotide primers. These are then used to obtain the respective fragments by means of PCR amplification. The fragments obtained are finally sequenced and the sequences are recorded in a database.
  • EST banks generated in this way can also be referred to as normalized EST banks, since each fragment is generated only once, regardless of its abundance or the abundance of the mRNA or cDNA molecules it represents.
  • redundancy can be practically excluded; however, in contrast to normalized banks according to the prior art, the redundancy information of the individual fragments, clones and those transcripts from which they are derived is not lost. Rather, abundance information can be obtained from the respective separation, for example by means of capillary gel electrophoretic separation The signal strength of the individual fragments of an examined fragment mixture can be taken and added to each received EST sequence as additional information.
  • mixtures of genomic DNA or cDNA generated restriction fragments flanked on both sides by identical or different adapters are used as a mixture of nucleic acid fragments, the fragments flanked by the adapter first being amplified by means of their 3 'end via the complementary one to the adapter Be subjected to a range extended by one or more nucleotides of primers and the amplification products thus obtained are used to carry out the method.
  • fragments are used as a mixture of nucleic acid fragments which were generated by restriction digestion with at least some of the type IIs restriction endonucleases from genomic or cDNA and which are flanked on one or both sides by adapter sequences.
  • overhanging ends are produced from the type IIs restriction endonucleases used, the sequence of which is not determined directly by the restriction endonuclease, but by the nucleic acid sequence of the interface and which can consequently differ from fragment to fragment.
  • adapters can be used for attachment which can only be attached to certain overhanging ends, in particular those whose nucleotide sequence is complementary to the nucleotide sequence of the overhanging adapter ends.
  • the required enzymatic reaction batches are created using an automatic pipetting device.
  • the fluorograms obtained by means of gel electrophoresis are automatically evaluated.
  • a Signals of different fluorograms belonging to one another are assigned to the computer system, which (i) homologous fragments from different mixtures of nucleic acid fragments, (ii) fragments of a nucleic acid mixture and the reaction products which were obtained for the identification of one or more nucleotides of the fragments of this mixture, (iii) Reaction products, which were obtained for the identification of several nucleotides of the fragments of a mixture of nucleic acid fragments, represent.
  • Such an automatic assignment can take place, for example, according to the following instruction:
  • Fragment length and signal intensity of all previously assigned signals is compared, 4. Cancel the process if the differences from (2) a preselected one
  • the automatic evaluation carry out the steps (dl), (el), (gl), (hl), (il), oil), (kl), (ml), (c2), (d2) , (e2), (f2), (g2), (h2), (i2), (12), (m2), (n2) and / or (o2).
  • Fig. 4 the identification of a nucleotide for all fragments of a mixture of nucleic acid fragments
  • Fig. 5 the identification of four nucleotides for all fragments of a mixture of nucleic acid fragments.
  • Figure 2 shows sequencing of the second position of the overhanging ends. Sequencing of a nucleic acid fragment representing the 3 'end of a cDNA molecule is shown.
  • the one for sequencing The adapters used are distinguished by a different sequence of the overhanging ends and by different marker groups which code for the sequence of the respective overhanging end.
  • a marker group indicating the base A is indicated by a dotted adapter, a marker indicating a C by a hatched adapter, a marker indicating a G by a filled adapter and a marker indicating a T by a cross-hatched adapter.
  • a marker group attached to the fragment in (1) by ligation and indicating a T indicates that the first base of the overhang is the complementary base A.
  • a labeling group attached to the fragment in (2) by ligation and indicating a C indicates that the second base of the overhang is the base G complementary thereto.
  • FIG. 3 shows the generation of various overhanging ends by shortening a nucleic acid fragment
  • FIG. 3 shows the release of shortened overhanging fragment ends which, with respect to the double-stranded region of the starting fragment, positions -5 and -6 (left), -3 and -4 (middle) and -1 and -2 (right) in terminal single-stranded and thus contain sequencing accessible via adapter ligation.
  • a 3 'cDNA fragment obtained by means of the restriction endonuclease Mbol is shown here as the starting fragment.
  • Figure 5 shows the identification of four nucleotides for all fragments of a mixture of nucleic acid fragments (fragments 1-7).
  • sequence signatures result:
  • FIG. 6 shows the separation of a mixture of nucleic acid fragments by means of capillary gel electrophoresis.
  • cDNA fragments were generated from a suspension culture of Saccharomyces cerevisiae.
  • the signals obtained from a stationary phase (gray) and from a culture in the logarithmic phase (black) are shown.
  • the horizontal scale shows the fragment size, the vertical scale shows the fluorescence intensity.
  • E one of the fragments from a mixture of nucleic acid fragments, B1-B16, identification of the first to sixteenth base of the fragment, FAM, PET, VIC, NED, the respective fluorophore detected during the identification of a base, (G), (A ), (T), (C), the base identified by means of the respective fluorophore.
  • FAM the first to sixteenth base of the fragment
  • FAM the respective fluorophore detected during the identification of a base
  • G A
  • T the base identified by means of the respective fluorophore.
  • the bar at the top shows the fragment size, so it is a fragment with a size of approximately 140 bp.
  • FIG. 8 shows a list of some signatures obtained from a suspension culture of Saccharomyces cerevisiae.
  • the fragment size, the signatures determined according to the method according to the invention, the open reading frames (ORFs) identified by means of BLAST analysis and the signal intensity obtained by means of capillary gel electrophoresis are to be specified in each case.
  • FIG. 9 shows the identification of several nucleotides of four nucleic acid fragments of a mixture of nucleic acid fragments.
  • the fragments are approximately 75 bp, 77 bp, 78 bp and 79 bp in length.
  • F separated fragments of the mixture, B1-B6, identification of the first to sixth bases of the fragments, FAM, PET, VIC, NED, the respective fluorophore detected when identifying a base, (G), (A), T), ( C), the base identified by means of the respective fluorophore.
  • the signature TCATTG results for the fragment with a length of 75 bp, the signature ACTGGC for the fragment with a length of 77 bp, with the signature ATGCCT for the fragment with a length of 78 bp, and for the fragment with a length of 79 bp Signature TATGCT.
  • RNA from a suspension culture of Saccharomyces cerevisiae was precipitated with ethanol and dissolved in 15.5 ⁇ l of water.
  • 10 ⁇ M cDNA primer CP31V 5 -ACCTACGTGCAGATTTTTTTTTTTTTTTTTTTTV-3 ', SEQ ID NO: 1 were added, denatured for 5 minutes at 65 ° C. and placed on ice.
  • the mixture was mixed with 3 ul 100 mM dithiothreitol (Life Technologies GmbH, Düsseldorf), 6 ul 5x Superscript buffer (Life Technologies GmbH, Düsseldorf), 1.5 ul 10 mM dNTPs, 0.6 ul RNase inhibitor (40 U / ul ; Röche Molecular Biochemicals) and 1 ⁇ l Superscript II (200 U / ⁇ l, Life Technologies) and incubated at 42 ° C. for 1 hour for cDNA first strand synthesis.
  • the pellet was dissolved in a restriction mixture consisting of 15 ⁇ l 10X universal buffer, 1 ⁇ l Mbol and 84 ⁇ l H 2 O and the reaction was incubated at 37 ° C. for 1 hour. It was extracted with phenol, then with chloroform and precipitated with ethanol.
  • the pellet was prepared in a ligation mixture from 0.6 ⁇ l lOx ligation buffer (Röche Molecular Biochemicals), 1 ⁇ l 10 mM ATP (Röche Molecular Biochemicals), 1 ⁇ l linker ML2025 (produced by hybridization of oligonucleotides ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) and LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC-3 ', SEQ ID NO: 3)), 6.9 ⁇ l H 2 O and 0.5 ⁇ l T4 DNA ligase (1 U / ⁇ l; Röche Molecular Biochemicals) dissolved and the ligation performed overnight at 16 ° C.
  • ML2025 produced by hybridization of oligonucleotides ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) and LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC
  • the ligation reaction was made up to 100 ⁇ l with water, extracted with phenol, then with chloroform and, after addition of 1 ⁇ l glycogen (20 mg / ml, Röche Molecular Biochemicals), precipitated with 100 ⁇ l 28% 8000 polyethylene glycol (Promega) / 10 mM MgCl 2 , The pellet was washed with 70% ethanol and taken up in 40 ul water.
  • Example 2 Amplification of cDNA-3 'restriction fragments divided into subpools
  • PCR batches were prepared, containing 2 ⁇ l of the ligation reaction from example 1, 2 ⁇ l of 10 ⁇ PCR buffer (670 mM Tris-Cl, pH 8.8, 170 mM
  • Primer ML20 had a fluorescent label (selected from one of the dye sets 5'-FAM, 5 '-JOE, 5'-ROX and 5' -TAMRA [dye set 1] or 5'-FAM , 5'-VIC, 5'-NED and 5'-PET [dye set 2]; further processing of the samples according to Example 3), or ML20 was used unlabelled (further processing of the samples according to Example 4 or Example 5).
  • the fluorograms were displayed and evaluated using the GeneScan version 3.7 software for Windows NT (Applied Biosystems To identify differentially expressed genes, fluorograms obtained with RNA preparations from yeast cells in different growth stages, but with the same amplification primers of the first and the second round of amplification, were compared with one another.
  • the fluorograms were matched using GeneScan and visually detected differences in the For comparisons of this type, the GeneScan function "align data by size" was first used to ensure that "matching" fragments from RNA preparations of different growths (ie representing the same gene / transcript) were used stadiums could be assigned to each other. In the next step, the signal strengths were normalized by adapting the average height of the signals of a sample to the average signal strength of a sample to be compared therewith.
  • fragments of identical size and thus identical transcripts which occur in comparing samples, and whose intensities differ from one another after normalization by at least a preselected factor, including the signature determined, were tabulated; In some cases, the associated values for fragment length (determined using the internal length standard), the signal intensity and the information about the amplification primers used were also included. For general transcriptome analysis (ie an "inventory" of expressed genes), all the signatures determined were tabulated, regardless of relative signal strengths.
  • the pellets were taken up in 20 ⁇ l of a ligation batch, containing 1.2 ⁇ l lOx ligation buffer (Röche), 8 ⁇ l 0.5 ⁇ g / ⁇ l Eco57I linker and a linker selected from ECO 1/2 to ECO11 / 12; see. Table 1; Production of the linkers by hybridization of the respectively stated complementary oligonucleotides) and 1 ⁇ l T4 DNA ligase (1 U / ⁇ l, Röche). It was ligated at 16 ° C overnight.
  • Example 3 a fragment occurring in Example 3 and the associated products from Example 4 shortened by means of Eco57l and provided with a sequencing adapter) were assigned to one another and recorded in tabular form, with the respective fluorophore also being used to determine the respective one Base identity was identified.
  • Such a table can, for example, have the format given in Table 3.
  • the partial cDNA sequences (“signatures”) obtained in this way were used to identify the relevant genes for a BLAST search.
  • the cDNA signature GATCTAGACAACCAAA which can be seen in Table 3, was used to code the yeast gene KTR4 (ORF YBR199W), coding for a putative Alpha-1,2-mannosyltransferase, Figure 8 shows further examples of signatures obtained from yeast.
  • the numerical values of this example relate to the use of Eco57l, which generates two-base overhangs for the identification of two neighboring bases ("doublets"), and of sequencing adapters, which optionally identify the first or the second base of such an overhang.
  • doublets the recognition sites for Eco57I in the Eco57I linkers are each offset by two bases
  • reaction according to example 3 results from the known recognition site of Mbol (cf. example 1)
  • Example 5 Determination of terminal bases via ⁇ // - / «reaction
  • a linker was selected from BCE1 to BCE13; see. Table 1; Production of the linkers by hybridization of the respectively stated complementary oligonucleotides) and 2 ⁇ l of Quick T4 DNA ligase (New England Biolabs) dissolved and ligated for 1 h at room temperature.
  • 2 ⁇ l of the ligation with 2 ⁇ l of 10 ⁇ M amplification primer 2 (identical in sequence to that strand of the Bce AI linker whose 3 ′ end had been linked to the fragments cut with Mbol), 2 ⁇ l of 10 ⁇ M CP31, 5 ul 10X Advantage 2 buffer, 1 ul 10mM dNTPs, 37 ul water and 1 ul 50x Advantage 2 DNA Polymerase Mix were mixed and amplified under the following conditions: 2 min. 94 ° C initial denaturation, then 25 cycles consisting of 20 sec. 94 ° C denaturation, 30 sec. 65 ° C annealing, 2 min. 72 ° C extension.

Abstract

The invention relates to a method for analysing nucleic acid fragments, said method comprising the following steps: a) at least one mixture of nucleic acid fragments is prepared, said mixture having at least one recognition site for a restriction endonuclease cutting outside its recognition site, b) at least part of the mixture of nucleic acid fragments from step (a) is incubated with at least one restriction endonuclease having a cutting site outside its recognition site, and c) at least one nucleotide of the cut nucleic acid fragments from step (b) is identified, and optionally other fragment-specific characteristics of the cut nucleic acid fragments from step (b) are identified, said identification steps being simultaneously carried out for a plurality, or all, of the nucleic acid fragments.

Description

Analyse von Nukleinsäure-Fragmentmischungen Analysis of nucleic acid fragment mixtures
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäure-Fragmentmischungen sowie die Anwendung des Verfahrens zur Genexpressionsanalyse.The invention relates to a method for analyzing nucleic acid fragment mixtures and the use of the method for gene expression analysis.
Aus dem Stand der Technik sind Verfahren zur Sequenzierung von Nukleinsäuremischungen, wie sie etwa durch das „Umschreiben" (die reverse Transkription) von mR A-Molekülen in cDNA-Moleküle erhalten werden können, bekannt. Die beim Umschreiben zahlreicher verschiedener, aus einer Zelle oder einem Gewebe gewonnener mR A-Moleküle erhaltenen cDNA-Moleküle werden kloniert, meist in Plasmid- oder Phagenvektoren, und anschließend „klonweise" sequenziert (Sambrook, Maniatis, Fritsch. Molecular cloning: a laboratory manual, Cold Spring Harbor/NY 1989), wobei die Sequenzierung üblicherweise „strangaufbauend" nach dem Kettenabbruchprinzip von Sanger oder „kettenabbauend" bei der Sequenzierung nach Maxam und Gilbert erfolgt. In jedem Fall wird die Separation unterschiedlicher Moleküle also über eine Vereinzelung in Form von in bakterielle Zellen transformierten Plasmiden vorgenommen, gefolgt von einer Vermehrung der vereinzelten Moleküle zu identischen Kopien, so daß bei der Sequenzierung „reine" (also von identischen Molekülen stammende) Signale erhalten werden. Besagte Vorgehensweise eignet sich beispielsweise zur sogenannten „EST-Sequenzierung" (EST = expressed sequence tag), bei der zahlreiche auf beschriebene Weise erhaltene Klone partiell sequenziert („ansequenziert") werden und die erhaltenen Sequenzergebnisse aufgelistet werden. Je nachdem ob die sequenzierte Bank zuvor normalisiert wurde oder nicht, spiegelt die relative Häufigkeit, mit der eine bestimmte cDNA bzw. ein bestimmter EST sequenziert wurde, die Abundanz des zugehörigen Transkripts wieder. Somit kann die EST-Sequenzierung nicht nur zur Detektion exprimierter Gene, sondern auch zum Vergleich von Expressionsstärken zwischen verschiedenen biologischen Proben eingesetzt werden (vgl. etwa Lee et al., Proc. Natl. Acad. Sei. U.S.A. 92 (1995), 8303-8307). Das Verfahren der EST-Sequenzierung zur, gegebenenfalls vergleichenden, Expressionsprofilierung ist jedoch gerade aufgrund dieses Zusammenhangs zwischen der relativen Transkript- und der relativen Klonabundanz sehr aufwendig, da einige Transkripte (beispielsweise sog. housekeeping-Gene) eine sehr viel größere Häufigkeit haben als andere Transkripte und somit Klone solcher häufiger Transkripte unter Umständen einige hundert bis einige tausend Mal sequenziert werden müssen, um andererseits auch weniger abundante Transkripte erfassen zu können.Methods for sequencing nucleic acid mixtures, such as can be obtained, for example, by “rewriting” (reverse transcribing) mRA molecules into cDNA molecules, are known from the prior art. When rewriting numerous different ones from a cell or cDNA molecules obtained from a tissue obtained from mR A molecules are cloned, mostly in plasmid or phage vectors, and then sequenced "clonally" (Sambrook, Maniatis, Fritsch. Molecular cloning: a laboratory manual, Cold Spring Harbor / NY 1989), whereby sequencing is usually "strand-building" according to the Sanger chain termination principle or "chain-dismantling" in Maxam and Gilbert sequencing. In any case, the separation of different molecules is carried out by means of a separation in the form of plasmids transformed into bacterial cells, followed by an increase in the separated molecules to identical copies, so that “pure” (ie, originating from identical molecules) signals are obtained during the sequencing Said procedure is suitable, for example, for so-called “EST sequencing” (EST = expressed sequence tag), in which numerous clones obtained in the manner described are partially sequenced (“sequenced”) and the sequence results obtained are listed. Depending on whether the sequenced Bank has been normalized or not, the relative frequency with which a particular cDNA or EST was sequenced reflects the abundance of the associated transcript, so EST sequencing can be used not only to detect expressed genes but also to compare Expression levels between different biological samples can be used (cf. such as Lee et al., Proc. Natl. Acad. Be. USA 92: 8303-8307 (1995)). However, the process of EST sequencing for, if necessary, comparative expression profiling is very complex, precisely because of this relationship between the relative transcript and relative clone abundance, since some transcripts (for example, so-called housekeeping genes) have a much higher frequency than other transcripts and thus more often clones Transcripts may need to be sequenced a few hundred to a few thousand times to be able to capture less abundant transcripts.
In der Vergangenheit wurden mehrere alternative Verfahren beschrieben, bei welchen nicht vollständige cDNA-Moleküle analysiert werden, sondern lediglich Fragmente hiervon. Insbesondere sind zu nennen die Verfahren des RAP (RNA arbitrarily primed PCR; Welsh et al., Nucleic Acids Res. 20: 4965-70) und des Differential Display (Liang und Pardee, Science 257: 967-971), bei denen mittels PCR mit kurzen Primern zufallig ausgewählter Sequenz Transkriptfragmente amplifiziert werden. Diese Fragmente, deren Länge wiederum von Transkript zu Transkript stark variieren kann, werden mittels Gelelektrophorese ihrer Größe nach aufgetrennt und nachgewiesen. Hierbei wird, zumindest theoretisch, die Abundanz eines Transkripts nicht mehr durch die Häufigkeit eines Ereignisses, etwa der Häufigkeit, mit der ein dieses Transkript repräsentierender Klon auftritt, sondern durch die Intensität der jeweiligen Bande repräsentiert. Hierdurch wird die Redundanz, durch die sich die EST-Sequenzierung des Standes der Technik auszeichnet, weitgehend eliminiert, was mit einer Kostensenkung verbunden ist. Um eine Sequenzierung einzelner Fragmente zu ermöglichen, werden die jeweiligen Banden aus dem Gel isoliert, mittels PCR reamplifiziert und kloniert. Modernere Varianten dieses Verfahrens, wie sie etwa in der EP 0 743 367 beschrieben sind, basieren auf einer Fragmenterzeugung mittels Restriktionsverdau doppelsträngiger cDNA, wodurch die Reproduzierbarkeit der erhaltenen Fragmentmuster deutlich erhöht wird. Dennoch weisen Verfahren dieser Art noch den Nachteil auf, daß bei der Isolation von Banden aus einem Gel häufig durch andere, unerwünschte DNA-Fragmente verunreinigte Produkte erhalten werden. Weiterhin ist die Isolation und Klonierung einzelner Banden sehr arbeitsaufwendig, so daß eine Identifikation von Fragmenten ohne eine vorherige Isolation sehr wünschenswert wäre. Sutcliffe et al. (Proc. Natl. Acad. Sei. U.S.A. 97: 1976-1981) beschreiben ein „TOGA" genanntes Verfahren, mRNA-Moleküle in cDNA- Restriktionsfragmente zu überfuhren, welche mittels Kapillargelelektrophorese aufgetrennt werden. Für Fragmente von Interesse (welche im Vergleich verschiedener Präparationen durch Intensitätsunterschiede der betreffenden Banden differentiell exprimierte Gene anzeigen) wird eine Signatur (also eine Sammlung fragmentspezifischer Informationen wie beispielsweise Fragmentlänge, partielle Nukleotidsequenz, Information über Position und/oder Orientierung des Fragments innerhalb der Ausgangs-cDNA etc.) definiert, hier bestehend aus einer 8 bp langen Teilsequenz, welche für jedes Fragment bekannt ist, sowie der Information über die Distanz dieser Sequenz vom 3 '-Ende des Fragments. Mittels dieser Signatur lassen sich durch Durchsuchen von Sequenzdatenbanken Gene mit der gleichen Signatur identifizieren. Ist die erzeugte Signatur fehlerfrei, so können cDNA- Fragmenten die zugehörigen Gene zugeordnet werden, ohne daß die Fragmente isoliert und sequenziert werden müssen. Das beschriebene Verfahren ist allerdings mit Nachteilen behaftet, die zur Unzuverlässigkeit besagter Signaturen führen: (1) ist die Identifikation von 4 Nukleotiden der 8 bp langen Sequenz, welche durch „invasive" oder „selektive" Amplifikationsprimer erfolgt, ungenau, da oft auch Primer inkorporiert werden, deren selektiver Anteil, nämlich die am 3 '-Ende gelegenen Nukleotide, nicht perfekt komplementär zum Template sind, und (2) ist die Ermittlung der Fragmentlänge über die elektrophoretische Mobilität ungenau, da die Mobilität eines Fragments neben der Länge auch noch von G/C-Gehalt und der genauen Sequenz des Fragments abhängt (vgl. Forensic Sei. Int. 94, 155-6 [1998]; zum Begriff der Komplementarität vgl. die aus der Literatur bekannte Basenpaar-Regeln, etwa in Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons). Daher wird oft eine falsche Länge angenommen. Eine falsche Länge und/oder eine falsche Sequenz fuhren jedoch dazu, daß eine für ein gegebenes Fragment ermittelte Signatur nicht auf das zu identifizierende Gen hinweist, sondern die entsprechende Datenbanksuche entweder kein oder ein falsches Ergebnis zutage fördert. Ahnliche Einschränkungen gelten für ein vergleichbares, „GeneCalling" genanntes Verfahren, bei welchem cDNA Doppeldaus mit verschiedenen Kombinationen aus Restriktionsendonukleasen unterworfen wird (Shimkets et al., Natur e Biotechnol. 17, 798-803 [1999]). Die erhaltenen Fragmente werden gelelektrophoretisch aufgetrennt, ihre Länge und daraus der Abstand zwischen beiden der Bildung eines Fragments zugrundeliegenden Restriktionsendonuklease-Erkennungsstellen ermittelt, und es werden Signaturen erzeugt, bestehend aus der Sequenz der ersten Erkennungsstelle, der Sequenz der zweiten Erkennungsstelle und dem angenommenen Abstand beider Erkennungsstellen voneinander (ausgedrückt in Basenpaaren). Mittels dieser Signaturen werden Datenbanksuchen durchgeführt, um detektierte Fragmente den Genen zuzuordnen, von welchen sich die Fragmente ableiten. Auch hier zeigt sich, daß aufgrund großer Unsicherheiten bei der Bestimmung von Fragmentgrößen anhand von Fragmentmobilitäten ein hoher Anteil von Falsch-Zuordnungen von Datenbankeinträgen zu detektierten Fragmenten auftritt.Several alternative methods have been described in the past in which not complete cDNA molecules are analyzed, but only fragments thereof. In particular, the methods of RAP (RNA arbitrarily primed PCR; Welsh et al., Nucleic Acids Res. 20: 4965-70) and the differential display (Liang and Pardee, Science 257: 967-971), which use PCR transcript fragments are amplified with short primers of a randomly selected sequence. These fragments, the length of which in turn can vary greatly from transcript to transcript, are separated and detected according to their size by means of gel electrophoresis. Here, at least theoretically, the abundance of a transcript is no longer represented by the frequency of an event, for example the frequency with which a clone representing this transcript occurs, but by the intensity of the respective band. This largely eliminates the redundancy that characterizes the EST sequencing of the prior art, which is associated with a cost reduction. To enable sequencing of individual fragments, the respective bands are isolated from the gel, reamplified by means of PCR and cloned. More modern variants of this method, as are described, for example, in EP 0 743 367, are based on fragment generation by means of restriction digestion of double-stranded cDNA, which significantly increases the reproducibility of the fragment patterns obtained. However, processes of this type still have the disadvantage that when bands are isolated from a gel, products which are often contaminated by other, undesirable DNA fragments are obtained. Furthermore, the isolation and cloning of individual bands is very labor intensive, so that identification of fragments without prior isolation would be very desirable. Sutcliffe et al. (Proc. Natl. Acad. Sci. USA 97: 1976-1981) describe a method called "TOGA" to convert mRNA molecules into cDNA restriction fragments, which are separated by means of capillary gel electrophoresis. For fragments of interest (which are compared in different preparations a signal (i.e. a collection of fragment-specific information such as fragment length, partial nucleotide sequence, information about position and / or orientation of the fragment within the starting cDNA etc.) is defined, here consisting of an 8, by differences in intensity of the bands in question expressing differentially expressed genes) bp long partial sequence, which is known for each fragment, as well as the information about the distance of this sequence from the 3 'end of the fragment. Using this signature, genes with the identify the same signature. If the signature generated is error-free, the associated genes can be assigned to cDNA fragments without the fragments having to be isolated and sequenced. However, the method described has disadvantages which lead to the unreliability of said signatures: (1) the identification of 4 nucleotides of the 8 bp long sequence, which is carried out by “invasive” or “selective” amplification primers, is imprecise, since primers are often also incorporated whose selective portion, namely the nucleotides located at the 3 'end, are not perfectly complementary to the template, and (2) the determination of the fragment length via the electrophoretic mobility is inaccurate, since the mobility of a fragment in addition to the length of G / C content and the exact sequence of the fragment (cf. Forensic Sei. Int. 94, 155-6 [1998]; for the concept of complementarity see the base pair rules known from the literature, for example in Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons). Therefore, the wrong length is often assumed. However, an incorrect length and / or an incorrect sequence means that a signature determined for a given fragment does not indicate the gene to be identified, but rather the corresponding database search either yields no result or an incorrect result. Similar restrictions apply to a comparable method called "gene calling", in which cDNA is subjected to double doses with different combinations of restriction endonucleases (Shimkets et al., Natur e Biotechnol. 17, 798-803 [1999]). The fragments obtained are separated by gel electrophoresis , its length and therefrom the distance between the two restriction endonuclease recognition sites on which the formation of a fragment is based, and signatures are generated, consisting of the sequence of the first recognition site, the sequence of the second recognition site and the assumed distance between the two recognition sites (expressed in base pairs) Using these signatures, database searches are carried out in order to allocate the detected fragments to the genes from which the fragments are derived, which also shows that due to great uncertainties in the determination of fragment sizes on the basis of fragment mobilities, there is a high response Part of incorrect assignments of database entries to detected fragments occurs.
Daher war es Aufgabe der vorliegenden Erfindung, in einer Mischung vorliegenden Nukleinsaurefragmenten Signaturen zuzuordnen, die die Nachteile des Standes der Technik nicht aufweisen. Die erfindungsgemäße Aufgabe wird gelöst durch ein Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte:It was therefore the object of the present invention to assign signatures present in a mixture to nucleic acid fragments which do not have the disadvantages of the prior art. The object according to the invention is achieved by a method for analyzing nucleic acid fragments, comprising the steps:
(a) Bereitstellung einer Mischung von Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende(a) Provision of a mixture of nucleic acid fragments which has at least one recognition site for one which cuts outside its recognition site
Restriktionsendonuklease aufweisen,Have restriction endonuclease,
(b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt, (c) Identifikation jeweils eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt.(b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site, (c) identification of one or more nucleotides of the cut nucleic acid fragments from (b), the identification being simultaneous for several or all nucleic acid fragments are carried out.
Des weiteren wird die erfindungsgemäße Aufgabe gelöst durch ein Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte:Furthermore, the object according to the invention is achieved by a method for analyzing nucleic acid fragments, comprising the steps:
(a) Bereitstellung einer Mischung von Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen, (b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt und welche überhängende Enden bekannter Position und Länge, aber unbekannter Sequenz erzeugt,(a) Provision of a mixture of nucleic acid fragments which have at least one recognition site for a restriction endonuclease cutting outside their recognition site, (b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site and which creates overhanging ends of known position and length but unknown sequence,
(c) Identifikation jeweils eines oder mehrerer Nukleotide der überhängenden Enden der geschnittenen Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt.(c) Identification of one or more nucleotides of the overhanging ends of the cut nucleic acid fragments from (b), the identification being carried out simultaneously for several or all nucleic acid fragments.
Bei der Mischung von Nukleinsaurefragmenten handelt es sich bevorzugt um, gegebenenfalls amplifizierte, Restriktionsfragmente von cDNA oder genomischer DNA. Die Fragmente oder ein Teil der Fragmente können von allen oder einigen Fragmenten gemeinsamen Sequenzbereichen flankiert werden. Bei diesen gemeinsamen Sequenzbereichen kann es sich beispielsweise um an die Fragmente angefügte Linker oder Adapter handeln, also doppelsträngige Nukleinsaurefragmente, welche etwa durch Hybridisierung zweier zueinander im wesentlichen oder mindestens teilweise komplementärer Oligonukleotide leicht erhältlich sind. Typischerweise zeichnen sich Adapter durch eine Länge zwischen 5 und 200 Nukleotiden, bevorzugt zwischen 10 und 80 Nukleotiden, besonders bevorzugt zwischen 15 und 40 Nukleotiden aus. Vorzugsweise zeigen die Fragmente eine charakteristische Größenverteilung mit einer kleinsten vorkommenden Größe, einer größten vorkommenden Größe sowie einer Durchscnnittsgröße, wobei die Größe durch die Positionen und/oder die Häufigkeit der Erkennungsstelle oder Erkennungsstellen für die zur Fragmenterzeugung verwendete Restriktionsendonuklease oder Restriktionsendonukleasen beeinflußt oder bestimmt wird, wobei natürlich noch die Länge gegebenenfalls angefügter Linker bzw. Adapter berücksichtigt werden muß. In einer bevorzugten Ausführungsform wird eine Mischung aus Nukleinsaurefragmenten, vorzugsweise doppelsträngige cDNA, mit mindestens einer Restriktionsendonuklease geschnitten, welche vorzugsweise eine vierbasige Erkennungssequenz aufweist. Beispiele für geeignete Restriktionsendonukleasen sind Alul, Bfal, Bst I, Chal, Csp6l, Cv JI, Cv/JI, Dpnl, Dpnll, Haelll, Hhal, HwPlI, Hpall, HpyCm IV, HpyCIl4 V, Mbol, Msel, Mspl, Nlalll, Rsal, Sau3al, Tail, Taql, Tsp5091. Häufig werden an jeweils einem oder beiden Enden der so erhaltenen Fragmente Linkermoleküle - in der Regel über enzymatische Ligation - befestigt. Dies kann ohne Nachbehandlung der Fragmente geschehen, wenn Fragmentenden und Linkerenden zueinander kompatibel sind, also glatt sind oder zueinander komplementäre Überhänge aufweisen. Es ist aber auch möglich, die Fragmentenden nachzubehandeln, um Komplementarität zu erzielen. Beispielsweise können einzelsträngige Fragmentenden mittels einer Nuclease entfernt werden oder auch, im Falle von 5 '-Überhängen, mittels einer Polymerase aufgefüllt und somit in glatte Enden überführt werden, wenn die Befestigung von Linkern mit glatten Enden beabsichtigt ist. Ein anderes Beispiel für eine Nachbehandlung von Fragmentenden ist eine partielle Auffüllung, die eine, in der Regel unerwünschte, Ligation zweier Fragmentenden miteinander verhindern kann. Etwa kann ein durch Behandlung mit der Restriktionsendonuklease Sau3al erzeugter palindromischer und somit selbstkomplementärer Überhang der Sequenz 3'-CTAG-5' durch Behandlung mit einer Polymerase in Gegenwart von dGTP in einen nicht mehr selbstkomplementären Überhang der Sequenz 5'-TAG-3' überführt werden. An einem solchen Überhang ließen sich nunmehr ausschließlich Linker mit einem hierzu komplementären Überhang 5 '-ATC- 3 ' befestigen; eine Ligation zweier Fragmentenden miteinander wäre nicht mehr möglich. Nach Befestigung der Linker folgt gegebenenfalls zur Darstellung einer gewünschten Untergruppe von Fragmenten eine Amplifikation mit einem oder mehreren gegen die angefügten Linker gerichteten PCR-Primer oder mit einem oder mehreren gegen die angefügten Linker gerichteten PCR-Primer und zusätzlich einem PCR-Primer, welcher gegen eine terminale Region der ursprünglichen Nukleinsaurefragmente, vorzugsweise der Ausgangs-cDNA-Moleküle, gerichtet ist. Hierzu eignet sich beispielsweise diejenige Region, welche durch den zur cDNA-Synthese eingesetzten cDNA-Primer eingeführt wurde, oder eine Region, welche künstlich an das 5 '-Ende der zur cDNA-Synthese eingesetzten mRNA oder an das 3 '-Ende der Erststrang-cDNA angefügt wurde. Im ersten Fall werden „cDNA-interne" Fragmente amplifiziert, die also vor der Linkerbefestigung beidseitig durch Restriktionsschnitt erzeugte Enden aufwiesen, im zweiten Fall „terminale" Fragmente, die vor der Linkerbefestigung einseitig ein durch Restriktionsschnitt erzeugtes Ende aufwiesen und deren anderes Ende mit dem 3 '-Ende oder dem 5 '-Ende der ursprünglichen Nukleinsaurefragmente bzw. der Ausgangs-cDNA identisch ist. Als cDNA- Primer kommt bei dieser Ausfuhrungsform vorzugsweise ein Oligo-dT-Primer zur Anwendung, welcher an seinem 3'-Ende und/oder an seinem 5 '-Ende eine Extension um ein oder mehrere Nukleotide aufweisen kann, von denen mindestens einige kein „T" sind. Werden für die Fragmenterzeugung zwei oder mehr Restriktionsendonukleasen eingesetzt, welche unterschiedliche Enden erzeugen, so können im nachfolgenden Schritt verschiedene Linker eingesetzt werden, von denen sich ein Teil an einer Art von Enden und ein anderer Teil an einer anderen Art von Enden befestigen läßt. Sofern sich diese Linker nicht nur in ihren Enden und damit in ihrer Kompatibilität (d.h. ihrer Befestigbarkeit) zu den Fragmentenden, sondern auch in ihrer übrigen Sequenz voneinander unterscheiden, so können in einer nachfolgenden PCR-Amplifikation gezielt durch geeignete Wahl der Primer bestimmte Fragmente (diejenigen, an deren Linkersequenzen die gewählten Primer unter den eingestellten Amplifikationsbedingungen binden können) amplifiziert werden, während bestimmte andere Fragmente (diejenigen, an deren Linkersequenzen die gewählten Primer nicht binden können) unamplifiziert bleiben. Eine weitere Möglichkeit zur selektiven Amplifikation bestimmter Fragmente besteht im Einsatz invasiver, an ihrem 3 '-Ende gegenüber der allen Fragmenten gemeinsamen Linkersequenz um eine oder mehrere zusätzliche selektive Basen verlängerter Primer (siehe beispielsweise EP 0 743 367). Noch eine weitere Möglichkeit zur selektiven Isolation bzw. Amplifikation, welche im Zuge des erfindungsgemäßen Verfahrens zur Anwendung kommen kann, wird in der WO 94/01582 beschrieben.The mixture of nucleic acid fragments is preferably, optionally amplified, restriction fragments of cDNA or genomic DNA. The fragments or a part of the fragments can be flanked by sequence regions common to all or some fragments. These common sequence regions can be, for example, linkers or adapters attached to the fragments, that is to say double-stranded nucleic acid fragments which can be obtained by Hybridization of two essentially or at least partially complementary oligonucleotides are readily available. Typically, adapters are characterized by a length between 5 and 200 nucleotides, preferably between 10 and 80 nucleotides, particularly preferably between 15 and 40 nucleotides. The fragments preferably have a characteristic size distribution with a smallest occurring size, a largest occurring size and an average size, the size being influenced or determined by the positions and / or the frequency of the recognition site or sites for the restriction endonuclease or restriction endonucleases used for fragment generation of course, the length of any attached linker or adapter must also be taken into account. In a preferred embodiment, a mixture of nucleic acid fragments, preferably double-stranded cDNA, is cut with at least one restriction endonuclease, which preferably has a four-based recognition sequence. Examples of suitable restriction endonucleases are Alul, Bfal, Bst I, Chal, Csp6l, Cv JI, Cv / JI, Dpnl, Dpnll, Haelll, Hhal, HwPlI, Hpall, HpyCm IV, HpyCIl4 V, Mbol, Msel, Mspls, Nlalll , Sau3al, Tail, Taql, Tsp5091. Often linker molecules are attached to one or both ends of the fragments thus obtained - generally via enzymatic ligation. This can be done without post-treatment of the fragments if the fragment ends and linker ends are compatible with one another, ie are smooth or have overhangs that are complementary to one another. However, it is also possible to post-treat the fragment ends in order to achieve complementarity. For example, single-stranded fragment ends can be removed using a nuclease or, in the case of 5 'overhangs, filled in using a polymerase and thus converted into smooth ends if the attachment of linkers with smooth ends is intended. Another example of post-treatment of fragment ends is partial filling, which can prevent, usually undesirable, ligation of two fragment ends to one another. For example, a palindromic and thus self-complementary overhang of the sequence 3'-CTAG-5 'generated by treatment with the restriction endonuclease Sau3al can be converted into a no longer self-complementary overhang of the sequence 5'-TAG-3' by treatment with a polymerase in the presence of dGTP , Only such linkers with an overhang 5 '-ATC-3' complementary to it could now be attached to such an overhang; ligation of two fragment ends with one another would no longer be possible. After the linkers have been attached, an amplification with one or more PCR primers directed against the attached linkers or with one or more against the fragments is optionally carried out to display a desired subset of fragments attached linker directed PCR primer and in addition a PCR primer which is directed against a terminal region of the original nucleic acid fragments, preferably the starting cDNA molecules. For this purpose, for example, the region which was introduced by the cDNA primer used for cDNA synthesis or a region which is artificially attached to the 5 'end of the mRNA used for cDNA synthesis or to the 3' end of the first strand cDNA was added. In the first case, "cDNA-internal" fragments are amplified, which thus had ends produced by restriction cut on both sides before the linker attachment, in the second case "terminal" fragments which had one end generated by restriction cut on the one side before the linker attachment and the other end thereof with the third 'End or the 5' end of the original nucleic acid fragments or the starting cDNA is identical. In this embodiment, the cDNA primer used is preferably an oligo-dT primer which can have an extension by one or more nucleotides at its 3 'end and / or at its 5' end, at least some of which have no " If two or more restriction endonucleases which generate different ends are used for the fragment generation, different linkers can be used in the subsequent step, some of which attach to one type of end and another part to another type of end If these linkers differ not only in their ends and thus in their compatibility (ie, their attachability) to the fragment ends, but also in their remaining sequence, then in a subsequent PCR amplification, specific fragments can be targeted by suitable choice of the primers (those on the linker sequences of the selected primers under the set amplification conditions can be amplified), while certain other fragments (those to the linker sequences of which the selected primers cannot bind) remain unamplified. A further possibility for the selective amplification of certain fragments is to use invasive primers which are extended at their 3 'end to the linker sequence common to all fragments by one or more additional selective bases (see for example EP 0 743 367). A further possibility for selective isolation or amplification, which can be used in the course of the method according to the invention, is described in WO 94/01582.
Außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonukleasen sind solche Restriktionsendonukleasen, bei denen die die Enzymaktivität auslösende Teilsequenz (die Erkennungsstelle), bei welcher es sich meist um einen aus 4-8Restriction endonucleases that cut outside their recognition site are those restriction endonucleases in which the partial sequence that triggers the enzyme activity (the recognition site), which is usually one of 4-8
Basenpaaren bestehenden Bereich doppelsträngiger DNA handelt und an welcher das Enzym an den DNA-Doppelstrang bindet, und die Schnittstelle, also der Bereich des DNA- Doppelstrangs, in dem das Zuckerphosphat-Rückgrat der DNA-Stränge hydrolytisch durchtrennt wird, auf mindestens einem der beiden den Doppelstrang bildenden Stränge gegeneinander versetzt liegen. Beispiele hierfür sind Typ IIs-Restriktionsendonukleasen wie etwa Fokl [Schneidecharakteristik GGATG(9/13): der „obere" Strang wird in 9 Basen Entfernung von der Erkennungsstelle GGATG, der „untere" Strang in 13 Basen Entfernung von der Erkennungsstelle geschnitten] oder Btsl [Schneidecharakteristik GCAGTG(2/0)] oder die Restriktionsendonuklease Bcgl [Schneidecharakteristik (10/12)CGANNNNNNTGC (12/10): beide Stränge werden jeweils einmal vor und einmal hinter der Erkennungsstelle geschnitten]. Weitere Beispiele sind die Restriktionsendonukleasen Aarl, Acelll, Alol, Alwϊ, Bael, Bbr7l, Bbsl, Bbvl, BceAΪ, Beeil, BciYl, BfuAl, Bmrl, Bpli, Bpml, BpuEl, Bsal, BsaXl, BscAl, BseMϊl, BseKI, Bsgl, BsmAl, BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, BstΕ5l, Cjel, CjeVl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, HaelV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil, PsrI, RleAl, Sapl, SfaNl, Sthl32l, Stsl, Taqll, TspOT I, TspGΨ I, 7YM 1 HI. Zur Durchführung des erfindungsgemäßen Verfahrens werden vorzugsweise solche Restriktionsendonukleasen eingesetzt, die einzelsträngige Überhänge erzeugen, wobei es sich sowohl um 3 '-Überhänge als auch um 5 '-Überhänge handeln kann. Sollen Restriktionsendonukleasen eingesetzt werden, welche glatte Enden erzeugen (z.B. Mlyl, Schneidecharakteristik GAGTC(5/5), oder SspO5 I, GGTGA(8/8)), so können die glatten Enden in einem zusätzlichen Schritt in überhängende Enden überführt werden. Dies kann beispielsweise durch Inkubation mit T4 DNA-Polymerase in Gegenwart eines ausgewählten Nukleotidtriphosphats geschehen; die Exonukleaseaktivität der T4 DNA- Polymerase baut dann einen der beiden Stränge in 3 '- '5 '-Richtung ab, bis das erste „gleichnamige" Nukleotid im Strang erreicht ist (also beispielsweise bis zum ersten „G", wenn das eingesetzte Nukleotidtriphosphat dGTP war; siehe Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons). Ein anderer Typ von außerhalb ihrer Erkennungsstelle schneidenden Restriktionsendonukleasen sind Enzyme, bei welchen die Erkennungsstelle durch eine Abfolge beliebiger oder weitgehend beliebiger Nukleotide unterbrochen ist. Beispiel hierfür sind Enyzme wie Xcml (Schneidecharakteristik CCANNNNN/NNNNTGG) oder S/ZI (Schneidecharakteristik GGCCNNNN/NGGCC). Ein weiterhin zu berücksichtigender Sonderfall außerhalb ihrer Erkennungsstelle schneidender Restriktionsendonukleasen sind sogenannte „nicking Endonukleasen", die lediglich einen Strang eines Nukleinsäuredoppelstrangs durchtrennen. Beispiele für solche Endonukleasen sind N.AlwI (GGATCNNN N) und N.BstNBI (GAGTCNNN/N), welche jeweils nur den Sinn-Strang an der mit „/" gekennzeichneten Position schneiden. Ist der Einsatz solcher Endonukleasen zur Durchführung des erfindungsgemäßen Verfahrens beabsichtigt, so muß dafür Sorge getragen werden, daß die betreffenden Fragmente nach erfolgtem Schnitt in Fragmente überführt werden, welche einen einzelsträngigen Überhang aufweisen. Dies kann beispielsweise durch eine von folgenden zwei Maßnahmen geschehen: (1) „Abschmelzen" eines kurzen, an die Schnittstelle grenzenden Einzelstrangs durch alkalische oder Hitzedenaturierung, wobei das restliche Fragment doppelsträngig bleiben soll, (2) Inkubation mit einer weiteren Restriktionsendonuklease, welche auch den Gegenstrang zum mittels der „nicking Endonuklease" geschnittenen (oder noch zu schneidenden) Strang schneiden kann.Base pair of existing region of double-stranded DNA and on which the Enzyme binds to the DNA double strand, and the interface, that is to say the region of the DNA double strand in which the sugar phosphate backbone of the DNA strands is hydrolytically separated, is offset from one another on at least one of the two strands forming the double strand. Examples of this are type IIs restriction endonucleases such as Fokl [cutting characteristic GGATG (9/13): the “upper” strand is cut 9 bases away from the recognition site GGATG, the “lower” strand 13 bases away from the recognition site] or Btsl [Cutting characteristic GCAGTG (2/0)] or the restriction endonuclease Bcgl [cutting characteristic (10/12) CGANNNNNNTGC (12/10): both strands are cut once in front of and once behind the recognition site]. Further examples are the restriction endonucleases Aarl, Acelll, Alol, Alwϊ, Bael, Bbr7l, Bbsl, Bbvl, BceAΪ, Beeil, BciYl, BfuAl, Bmrl, Bpli, Bpml, BpuEl, Bsal, BsaXl, BscAl, BseKIll, BseMIll , BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, BstΕ5l, Cjel, CjeVl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, HaelV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil PsrI, RleAl, Sapl, SfaNl, Sthl32l, Stsl, Taqll, TspOT I, TspGΨ I, 7YM 1 HI. To carry out the method according to the invention, preference is given to using restriction endonucleases which produce single-stranded overhangs, which can be both 3 'overhangs and 5' overhangs. If restriction endonucleases are to be used which produce smooth ends (for example Mlyl, cutting characteristic GAGTC (5/5), or SspO5 I, GGTGA (8/8)), the smooth ends can be converted into overhanging ends in an additional step. This can be done, for example, by incubation with T4 DNA polymerase in the presence of a selected nucleotide triphosphate; the exonuclease activity of the T4 DNA polymerase then degrades one of the two strands in the 3 '-' 5 'direction until the first "nucleotide of the same name" in the strand is reached (for example up to the first "G" if the nucleotide triphosphate dGTP used see Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons). Another type of restriction endonucleases that cut outside their recognition site are enzymes in which the recognition site is interrupted by a sequence of any or largely any nucleotides. Examples of this are enzymes such as Xcml (cutting characteristic CCANNNNN / NNNNTGG) or S / ZI (cutting characteristic GGCCNNNN / NGGCC). Another special case to be considered outside of their recognition site of restriction endonucleases which are cutting is so-called "nicking endonucleases" which only cut one strand of a nucleic acid double strand. Examples of such endonucleases are N.AlwI (GGATCNNN N) and N.BstNBI (GAGTCNNNN / N) the sense strand on the marked with "/" Cut position. If the use of such endonucleases is intended for carrying out the method according to the invention, care must be taken to ensure that the fragments in question, after the cut has been made, are converted into fragments which have a single-stranded overhang. This can be done, for example, by one of the following two measures: (1) "Melting" a short single strand bordering on the interface by alkaline or heat denaturation, the remaining fragment being intended to remain double-stranded, (2) Incubation with a further restriction endonuclease, which also the Counter strand to the strand cut (or still to be cut) by means of the "nicking endonuclease".
Die in den Nukleinsaurefragmenten aus der Fragmentmischung in (a) auftretende Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease befindet sich vorzugsweise innerhalb der vielen oder allen Fragmenten der Mischung gemeinsamen endständigen Sequenzbereiche, so insbesondere in den Sequenzbereichen der an die Fragmente angefügten Adapter oder Linker. Hierbei sind die Auswahl des Enzyms und die Position der Erkennungsstelle derart zu wählen, daß bei Einwirkung der Restriktionsendonuklease oder Restriktionsendonukleasen ein „proximaler" Schnitt erfolgt und das jeweilige Nukleinsäurefragment im fragmentspezifischen Bereich geschnitten wird, welcher sich außerhalb der allen oder vielen Fragmenten gemeinsamen, flankierenden Linker-Bereiche befindet. In einer besonders bevorzugten Ausführungsform sind gegebenenfalls bei einzelnen Fragmenten vorhandene Erkennungsstellen für die einzusetzenden Restriktionsendonukleasen, welche außerhalb der allen oder vielen Fragmenten gemeinsamen, flankierenden Linker-Bereiche liegen, gegen eine Erkennung durch die entsprechende Restriktionsendonuklease geschützt. Ein solcher Schutz von bestimmten Erkennungsstellen für bestimmte Restriktionsendonukleasen kann nach dem Stand der Technik beispielsweise durch Einbau methylierter Nukleotide wie etwa Methyl-dCTP erreicht werden. Alternativ kann ein Schutz gegen restriktionsendonukleolytische Spaltung auch durch Einsatz einer zur ausgewählten Restriktionsendonuklease gehörigen Methylase erfolgen. Beispielsweise überführt das Enzym BamRl Methylase Erkennungsstellen der Restriktionsendonuklease BamHl in ihre C-methylierte Form, welche von BamΑl nicht mehr erkannt und geschnitten wird. Das Enzym CpG Methylase methyliert CG-Dinukleotide, wodurch beispielsweise ein Schnitt eines DNA-Fragments enthaltend die Sequenz CGTCTC mit der Restriktionsendonuklease BsmBl (Schneidecharakteristik CGTCTC(l/5)) verhindert wird. Jedenfalls stellen obige Maßnahmen sicher, daß jedes in der Mischung vorhandene Nukleinsäurefragment im Zuge eines Restriktionsdaus lediglich an genau einer vorbestimmten Position geschnitten wird. Weiterhin wäre es möglich, die zur Erzeugung der Nukleinsaurefragmente aus (a) eingesetzten Ausgangs-Nukleinsäuremoleküle (vorzugsweise cDNA oder genomische DNA) vorab mit der Restriktionsendonuklease aus Schritt (b) zu inkubieren, sodann wie oben beschrieben mit mindestens einer weiteren, in der Regel häufig schneidenden Restriktionsendonuklease zu behandeln, an den mit letzterer erzeugten Enden Linkermoleküle zu befestigen und eine PCR-Amplifikation mit Primern vorzunehmen, welche gegen die endständigen Linkermoleküle gerichtet sind. Diese Vorgehensweise stellt sicher, daß die Nukleinsaurefragmente in Schritt (b) ausschließlich an den gewünschten, durch die angefügten Linker determinierten Stellen geschnitten werden, da Fragmente mit einer "eigenen", fragmentinternen Erkennungsstelle für besagte Restriktionsendonuklease nach erfolgtem Schnitt nicht mehr amplifiziert werden können und somit in der Fragmentmischung gemäß (a) nicht auftreten.The recognition site for a restriction endonuclease that cuts outside of its recognition site in the nucleic acid fragments from the fragment mixture in (a) is preferably located within the terminal sequence regions common to many or all fragments of the mixture, in particular in the sequence regions of the adapters or linkers attached to the fragments. Here, the selection of the enzyme and the position of the recognition site are to be selected such that, when the restriction endonuclease or restriction endonucleases act, a "proximal" cut is made and the respective nucleic acid fragment is cut in the fragment-specific area which is outside the flanking linker common to all or many fragments In a particularly preferred embodiment, recognition sites for the restriction endonucleases to be used which are outside individual fragments and which lie outside the flanking linker areas common to all or many fragments are protected against recognition by the corresponding restriction endonuclease According to the prior art, recognition sites for certain restriction endonucleases can be achieved, for example, by incorporating methylated nucleotides such as methyl dCTP Protection against restriction endonucleolytic cleavage is also provided by using a methylase belonging to the selected restriction endonuclease. For example, the enzyme BamRl methylase converts recognition sites of the restriction endonuclease BamHl into their C-methylated form, which BamΑl no longer recognizes and cuts. The enzyme CpG methylase methylates CG dinucleotides, for example preventing a cut of a DNA fragment containing the sequence CGTCTC with the restriction endonuclease BsmBl (cutting characteristic CGTCTC (1/5)). In any case, the above measures ensure that each nucleic acid fragment present in the mixture in the course of a restriction induction only on exactly one predetermined position is cut. Furthermore, it would be possible to incubate the starting nucleic acid molecules (preferably cDNA or genomic DNA) used to generate the nucleic acid fragments from (a) in advance with the restriction endonuclease from step (b), then, as described above, with at least one further, usually frequently to treat cutting restriction endonuclease, to attach linker molecules to the ends generated with the latter and to carry out a PCR amplification with primers which are directed against the terminal linker molecules. This procedure ensures that the nucleic acid fragments in step (b) are cut only at the desired locations determined by the attached linker, since fragments with an "own", fragment-internal recognition site for said restriction endonuclease can no longer be amplified after the cut has been made and thus do not occur in the fragment mixture according to (a).
Die Identifikation jeweils eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente kann auf mehrere verschiedene Weisen erfolgen. Insbesondere eignen sich hierfür drei bevorzugte Vorgehensweisen, wodurch weitere Vorgehensweisen jedoch nicht ausgeschlossen werden sollen:One or more nucleotides of the cut nucleic acid fragments can be identified in several different ways. In particular, three preferred procedures are suitable for this, which should not, however, preclude further procedures:
1. Verlängerung zurückversetzter 3 '-Enden mit zur heute üblichen Sequenzierung nach Sanger verwendeten Didesoxynukleotid-Triphosphaten („ddNTPs") oder auch mit acyclischen Nukleotiden (also mit sogenannten „Abbruchnukleotiden" oder „Kettenterminatoren"), wobei jeder auffüllbare Strang um genau ein Nukleotid verlängert wird und die Kettenverlängerung hiernach abbricht, da keine freie 3'- OH-Gruppe mehr vorliegt. Da der Einbau sequenzspezifisch erfolgt, ist so das dem eingebauten Nukleotid im Doppelstrang gegenüberliegende Nukleotid eindeutig identifizierbar. Bevorzugterweise tragen die Abbruchnukleotide Markierungsgruppen, anhand derer ein Einbau nachweisbar ist. In einer besonders bevorzugten Ausführungsform tragen die vier Didesoxynukleotide vier unterscheidbare Markierungsgruppen, insbesondere vier verschiedene Fluorophore. Es ist dann anhand der Fluoreszenzaktivität erkennbar, welches der vier1. Extension of set-back 3 'ends with dideoxynucleotide triphosphates (“ddNTPs”) used for today's Sanger sequencing or also with acyclic nucleotides (ie with so-called “termination nucleotides” or “chain terminators”), each fillable strand being exactly one nucleotide is extended and the chain extension then terminates because there is no longer a free 3'-OH group. Since the incorporation takes place in a sequence-specific manner, the nucleotide opposite the incorporated nucleotide in the double strand can be clearly identified. Preferably, the terminating nucleotides carry marking groups which can be used to detect incorporation In a particularly preferred embodiment, the four dideoxynucleotides carry four distinguishable labeling groups, in particular four different fluorophores, and it can then be recognized from the fluorescence activity which of the four
Abbruchnukleotide eingebaut wurde und dementsprechend auch, welches Nukleotid auf dem jeweiligen Gegenstrang vorliegt. Die Durchführung dieser ersten Ausführungsform setzt natürlich voraus, daß die Nukleinsaurefragmente aus (c) zurückversetzte und daher mittels einer Polymerase auffüllbare 3 '-Enden aufweisen. Dies kann leicht durch geeignete Wahl der Restriktionsendonuklease aus (b) gewährleistet werden. Geeignet sind insbesondere folgende TypIIs- Restriktionsendonukleasen: Aarl, Acelll, Alwl, Bbr7l, Bbsl, Bbvl, BceAl, Bce , BfuAl, Bsal, BscAl, BsmAl, BsmBl, BsmΕl, BspMl, Earl, Faul, Fokl, Hgä , Plel, Sapl, SfaNl, SM321, Stsl. Befestigung von Adaptern mit überhängenden Enden geeigneter Länge und geeigneter Sorte (3 '-Überhang oder 5 '-Überhang) an ein überhängendes Ende aufweisenden Fragmenten, wobei die Befestigung sequenzspezifisch erfolgt. Die überhängenden Fragmentenden können insbesondere mittels einer der folgenden Restriktionsendonukleasen erzeugt worden sein: Aarl, Acelll, Alol, Alwl, Bael, Bbr7l, Bbsl, Bbvl, BceAl, Bcett, Bcgl, BciVl, BfuAl, Bmrl, BpR, Bpml, BpuEl,Abrupt nucleotides was inserted and accordingly which nucleotide is present on the respective counter strand. The implementation of this first embodiment naturally presupposes that the nucleic acid fragments from (c) are set back and therefore have 3 'ends which can be filled in by means of a polymerase. This can easily be done by appropriate selection of the restriction endonuclease from (b) can be guaranteed. The following type IIs restriction endonucleases are particularly suitable: Aarl, Acelll, Alwl, Bbr7l, Bbsl, Bbvl, BceAl, Bce, BfuAl, Bsal, BscAl, BsmAl, BsmBl, BsmΕl, BspMl, Earl, Faul, Fokl, Hgä, Plel, S SfaNl, SM321, Stsl. Attachment of adapters with overhanging ends of suitable length and suitable type (3 'overhang or 5' overhang) to fragments having an overhanging end, the attachment being carried out in a sequence-specific manner. The overhanging fragment ends can in particular have been generated using one of the following restriction endonucleases: Aarl, Acelll, Alol, Alwl, Bael, Bbr7l, Bbsl, Bbvl, BceAl, Bcett, Bcgl, BciVl, BfuAl, Bmrl, BpR, Bpml, BpuEl,
Bsal, BsaXl, BscAl, BseMll, BseRl, Bsgl, BsmAl, BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, BstF5l, Btsl, Cjel, CjeYl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, Fokl, HaeYV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil, Psrl, RleAl, Sapl, SfaNl, SM321, Stsl, Taqll, Tsp Υ I, TspGΨ I, 7ΪA111II. Vorzugsweise werden in der Befestigungsreaktion mehrere Adapter (sogenannteBsal, BsaXl, BscAl, BseMll, BseRl, Bsgl, BsmAl, BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, BstF5l, Btsl, Cjel, CjeYl, Earl, Ecil, Eco57l, Eco57MlVll, Fall, F , Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil, Psrl, RleAl, Sapl, SfaNl, SM321, Stsl, Taqll, Tsp Υ I, TspGΨ I, 7ΪA111II. Preferably, several adapters (so-called
Sequenzieradapter) eingesetzt, welche sich in ihrem Überhang unterscheiden. Dabei ist selbstverständlich auch eine sequenzielle oder eine parallele Vorgehensweise denkbar, bei der in separaten Befestigungsreaktionen verschiedene Adapter eingesetzt werden. Besonders bevorzugt ist der Einsatz von Markierungsgruppen tragenden Adaptern, welche sich sowohl in ihrem Überhang als auch in ihrer Markierungsgruppe unterscheiden. In einer Ausführungsform handelt es sich bei den Markierungsgruppen um Fluorophore, so daß anhand der Fluoreszenzaktivität der Befestigungsprodukte erkennbar ist, welcher Adapter an einem gegebenen Fragmentende befestigt worden ist. Zur Ermittlung der Identität der ein einbasiges überhängendes Ende bildenden Base eines Fragments in einerSequencing adapter) used, which differ in their overhang. A sequential or a parallel procedure is of course also conceivable, in which different adapters are used in separate fastening reactions. It is particularly preferred to use adapters bearing marking groups, which differ both in their overhang and in their marking group. In one embodiment, the labeling groups are fluorophores, so that the fluorescence activity of the fastening products shows which adapter has been fastened to a given fragment end. To determine the identity of the base of a fragment forming a single-base, overhanging end
Mischung können beispielsweise Adapter der allgemeinen StrukturMixture can be, for example, adapters of the general structure
F-Adapter-XF Adapter X
zur Anwendung kommen, wobei Adapter den doppelsträngigen Anteil des Adapters meint, X eines der vier möglichen Nukleotide in Form eines einzelsträngigen Überhangs darstellt und F ein Fluorophor meint, welches die überhängende Base X kennzeichnet. So könnte folgende Zuordnung getroffen werden: are used, where adapter means the double-stranded portion of the adapter, X represents one of the four possible nucleotides in the form of a single-stranded overhang and F means a fluorophore which identifies the overhanging base X. The following assignment could be made:
Somit läßt sich beispielsweise von einem bei der Auftrennung der Befestigungsprodukte mittels eines automatischen Nukleinsäure- Sequenzierungsgeräts erhaltenen ROX-Signal ableiten, daß an einem bestimmten Fragment der ein überhängendes G aufweisende Adapter befestigt wurde und daß es sich demnach bei der überhängenden Base des betreffenden Fragments um ein C gehandelt hatte.Thus, for example, from a ROX signal obtained when the attachment products are separated by means of an automatic nucleic acid sequencing device, it can be deduced that the adapter having an overhanging G has been attached to a certain fragment and that the overhanging base of the fragment in question is accordingly one C had acted.
Zur Identifikation von mehrbasigen Fragmentüberhängen wird meist „nukleotidweise" vorgegangen, für einen zweibasigen Überhang also folgendermaßen: Es werden in separaten Ansätzen zwei Adapter eingesetzt, welche folgende allgemeine Struktur aufweisen:The procedure for identifying polybasic fragment overhangs is usually “nucleotide-wise”, for a two-base overhang as follows: Two adapters are used in separate approaches, which have the following general structure:
(1) F-Adapter-NXj zur Identifikation des ersten Nukleotids bzw.(1) F adapter NXj for identification of the first nucleotide or
(2) F-Adapter-X2N zur Identifikation des zweiten Nukleotids,(2) F-adapter-X 2 N for identification of the second nucleotide,
wobei N eine Mischung aller vier möglichen Nukleotide oder auch ein universelles Nukleotid wie etwa Inosin darstellt. In einem ersten Ansatz würde dann durch Befestigung des ersten Adapters das erste Nukleotid des zweibasigen Fragmentüberhangs, in einem zweiten Ansatz durch Befestigung des zweiten Adapters das zweite Nukleotid des zweibasigen Fragmentüberhangs ermittelt werden. Wiederum ist bevorzugt, daß wie oben beschrieben eine eindeutige und bekannte Beziehung zwischen der Natur des Fluorophors F und dem der Sequenzierung dienenden spezifischen Nukleotid X, oder X2 besteht. Durch Identifikation desjenigen ersten und zweiten Adapters, welcher (in der Regel in zwei parallelen Ansätzen, wobei in einem Ansatz die Natur der ersten Base des Überhangs und im zweiten Ansatz die Natur der zweiten Base des Überhangs bestimmt wird) am überhängenden Ende befestigt wurde, läßt sich die Sequenz des überhängenden Endes bestimmen.where N is a mixture of all four possible nucleotides or a universal nucleotide such as inosine. In a first approach, the first nucleotide of the dibasic fragment overhang would be determined by attaching the first adapter, in a second approach, the second nucleotide of the dibasic fragment overhang would be determined by attaching the second adapter. Again, it is preferred that, as described above, there is a clear and known relationship between the nature of the fluorophore F and the specific nucleotide X, or X 2 used for sequencing. By identifying the first and second adapter, which (usually in two parallel approaches, whereby the nature of the first base of the overhang and in the second approach the nature of the second base of the overhang is determined) at the overhanging end, the sequence of the overhanging end can be determined.
In doppelsträngiger Darstellung erfolgt die Sequenzierung eines zweibasigen 3'- Überhangs Y1Y2 eines Fragments beispielsweise gemäß folgendem Schema:In a double-stranded representation, the sequencing of a double-based 3 ′ overhang Y 1 Y 2 of a fragment is carried out, for example, according to the following scheme:
Fragment Y2Yi -FragmentFragment Y 2 Yi fragment
+ F-Adapter-NXi F-Adapter-X2N Adapter Adapter + F-adapter-NXi F-adapter-X 2 N adapter adapter
F-Adapter-N X\ -Fragment F-Adapter-X2 N -FragmentF-adapter-N X \ fragment F-adapter-X 2 N fragment
Adapter- Y2Yt -Fragment Adapter- Y2 Yi -Fragment Adapter- Y 2 Y t fragment Adapter- Y 2 Yi fragment
uenz des Überhangs Yi Y2 kann dann folgender Tabelle entnommen werden: The following table shows the overhang Yi Y 2 :
Sinngemäß lassen sich so selbstverständlich auch Überhänge einer Länge von mehr als zwei Nukleotiden, also beispielsweise von drei oder vier Nukleotiden, sequenzieren. Weiterhin ist es möglich, zur Identifikation von mehr als einer Base der erzeugten Überhänge innerhalb eines einzigen Experiments, Markierungsgruppen einzusetzen, welche den simultanen Nachweis von mehr als vier (nämlich in der Regel einem ganzzahligen Vielfachen von vier) verschiedenen Markierungen zulassen. In diesem Fall könnten die ersten vier der verschiedenen Markierungen zur Identifikation einer ersten Base erzeugter Fragmentüberhänge eingesetzt werden, die zweiten vier der verschiedenen Markierungen zur Identifikation einer zweiten Base der erzeugten Fragmentüberhänge, und gegebenenfalls weitere Sätze von je vier verschiedenen Markierungen für weitere Basen der erzeugten Fragmentüberhänge. Ein derartiges „Multiplexing" hätte eine Reduktion der Anzahl erforderlicher experimenteller Schritte zur Folge. Als Markierungsgruppen, von denen zahlreiche verschiedene in einer gemeinsamen Messung detektiert werden können, ohne daß die Messergebnisse sich gegenseitig beeinflussen, kämen beispielsweise sogenannte „Quantum Dots" in Frage (Han et al., Nat. Biotechnol. 19, 631-5 [2001]). Extension selektiver Oligonukleotidprimer, deren am 3 '-Ende gelegenes Nukleotid oder Nukleotide mit dem oder den zu sequenzierenden Nukleotiden des Gegenstrangs hybridisieren können, gefolgt von der Identifikation derjenigen Primer, welche in der Extensionsreaktion verlängert wurden. Gegebenenfalls kann die Extension mittels der Polymerasekettenreaktion (PCR) erfolgen.It goes without saying that overhangs of a length of more than two nucleotides, for example of three or four nucleotides, can also be sequenced. Furthermore, it is possible to use more than one base of the generated overhangs within a single experiment to use marking groups which allow the simultaneous detection of more than four (namely usually an integer multiple of four) different markings. In this case, the first four of the different markings could be used to identify a first base of fragment overhangs generated, the second four of the different markings for identification of a second base of the fragment overhangs generated, and possibly further sets of four different markings for further bases of the fragment overhangs generated , Such a “multiplexing” would result in a reduction in the number of experimental steps required. For example, so-called “quantum dots” could be considered as marker groups, of which numerous different ones can be detected in a common measurement without the measurement results influencing one another (Han et al., Nat. Biotechnol. 19, 631-5 [2001]). Extension of selective oligonucleotide primers whose nucleotide or nucleotides located at the 3 'end can hybridize with the nucleotide or nucleotides to be sequenced, followed by the identification of those primers which were extended in the extension reaction. If necessary, the extension can be carried out by means of the polymerase chain reaction (PCR).
Bevorzugterweise werden an den Enden der zu sequenzierenden Nukleinsaurefragmente zunächst Linker bzw. Adapter befestigt, welche als allen oder vielen Fragmenten gemeinsame Primerbindungsstelle dienen können. Die Oligonukleotidprimer werden dann derart ausgestaltet, daß sie nach Denaturierung der zu sequenzierenden Nukleinsaurefragmente mit dem am 3 '-Ende derLinkers or adapters are preferably attached to the ends of the nucleic acid fragments to be sequenced, which can serve as primer binding sites common to all or many fragments. The oligonucleotide primers are then designed in such a way that, after denaturing the nucleic acid fragments to be sequenced, they correspond to those at the 3 'end of the
Nukleinsäurefragmentstränge befestigten Linkerstrang hybridisieren können. Hierbei ist dafür Sorge zu tragen, daß die dergestalt hybridisierten Oligonukleotidprimer um ein oder mehrere Nukleotide mit dem an die Linkerregion angrenzenden Bereich des Nukleinsäurefragments „überlappen", also an ihrem 3 '-Ende Nukleotide aufweisen, welche mit den Nukleotiden desNucleic acid fragment strands can hybridize attached linker strand. It must be ensured here that the oligonucleotide primers hybridized in this way "overlap" by one or more nucleotides with the region of the nucleic acid fragment adjacent to the linker region, that is to say at their 3 'end they have nucleotides which correspond to the nucleotides of the
Nukleinsäurefragments hybridisieren können, sofern eine Komplementarität gegeben ist. Es handelt sich also um „selektive Nukleotide", die eine Verlängerung des Primers mittels einer Polymerase zulassen, wenn sie durch besagte Hybridisierung Bestandteil eines Doppelstrangs geworden sind, die die Verlängerung des Primers aber mindestens weitgehend verhindern, wenn sie keineCan hybridize nucleic acid fragments if there is complementarity. These are "selective nucleotides" which allow the primer to be extended by means of a polymerase if they have become part of a double strand as a result of said hybridization, but which at least largely prevent the primer from being extended if they do not
Basenpaarung mit dem Gegenstrang ausbilden konnten.Base pairing with the counter strand could form.
Beispielsweise läßt sich in folgender Situation, in welcher der selektive Primer 5'-YYYYYYYYYN-3' an die Linkerregion XXXXXXXX des Fragments der Sequenz 5 -OOOOOOOOOOOOOOOOOOOOOOOMXXXXXXXX-3 ' hybridisiert vorliegt, eine effiziente Extension des hybridisierten Primers nur dann erreichen, wenn die selektive Base N des Primers komplementär ist zur letzten fragmentspezifϊschen Base M:For example, in the following situation, in which the selective primer 5'-YYYYYYYYYN-3 'is hybridized to the linker region XXXXXXXX of the fragment of the sequence 5 -OOOOOOOOOOOOOOOOOOOOOOOMXXXXXXXX-3', an efficient extension of the hybridized primer can only be achieved if the selective base N of the primer is complementary to the last fragment-specific base M:
5 '- YYYYYYYYYN5 '- YYYYYYYYYN
3 -XXXXXXXXXMOOOOOOOOOOOOOOOOOOOOOOO-5 ' Die für mehrere oder alle Nukleinsaurefragmente simultane Identifikation jeweils eines oder mehrerer Nukleotide erfolgt vorzugsweise nach Auftrennung der in der Mischung enthaltenen Nukleinsaurefragmente nach einer fragmentspezifischen Eigenschaft, insbesondere nach Größe und/oder Mobilität der Fragmente durch elektrophoretische Auftrennung. Besonders bevorzugt ist das Verfahren der Gelelektrophorese, bei der zur Auftrennung Flachgele oder gelgefüllte Kapillaren verwendet werden. In einer bevorzugten Ausführungsform werden in Schritt (c) enzymatische Umsetzungen gemäß Varianten 1-3 derart durchgeführt, daß in parallelen Ansätzen jeweils ein oder jeweils zwei Nukleotide der Fragmente identifiziert werden, wobei die in den parallelen Ansätzen zu identifizierenden Nukleotide der Fragmente in definierter Position zueinander, beispielsweise zueinander benachbart, liegen. Es werden dann zunächst in parallelen Auftrennungen der besagten Ansätze für jedes der aufgetrennten Fragmente ein oder zwei Nukleotide bekannter Position ermittelt, was vorzugsweise mittels verschiedener Markierungsgruppen geschieht, welche Aufschluß über die zu ermittelnden Nukleotide erlauben. In einem weiteren Schritt werden dann für einzelne oder alle der aufgetrennten Fragmente die ermittelten Nukleotide in diejenige Reihenfolge gebracht, in der sie auf dem zugehörigen Ausgangs-Fragment aus der Mischung von Nukleinsaurefragmenten vorliegen. Dabei kann die Reihenfolge dieser beiden Maßnahmen natürlich auch vertauscht werden. Jedenfalls werden auf diese Weise für die untersuchten Fragmente Signaturen in Form kurzer Sequenzabschnitte erzeugt, welche das zugehörige Fragment charakterisieren. Die Länge dieser Sequenzabschnitte beträgt vorzugsweise mindestens 14 Basen, stärker bevorzugt mindestens 16 Basen, insbesondere mindestens 20 Basen. Neben einem oder mehreren Sequenzabschnitten kann eine Signatur auch andere ein Fragment kennzeichnende Informationen enthalten, beispielsweise genaue oder ungefähre Distanzen (angegeben in Basenpaaren) zwischen charakteristischen Bereichen des Fragments, beispielsweise den unter Zuhilfenahme eines internen Längenstandards anhand der elektrophoretischen Mobilität geschätzten Abstand zwischen zwei bekannten Sequenzabschnitten, zwischen einem bekannten Sequenzabschnitt und einem Fragmentende, oder zwischen beiden Fragmentenden. In diesem Fall beträgt die Länge der Sequenzabschnitte vorzugsweise mindestens 10 Basen. Jedenfalls ist der Informationsgehalt einer Signatur vorzugsweise groß genug, um die eindeutige Identifikation und/oder Isolation des zugehörigen Fragments zu erlauben. Beispielsweise reichen erfahrungsgemäß ca. 14-20 Basenpaare Sequenzinformation ohne zusätzliche Information über Distanzen innerhalb des betreffenden Fragments meist aus, um ein diesen Sequenzabschnitt enthaltenes Transkript aus einer Mischung von cDNA- Molekülen zu erkennen und das zugehörige Gen zu identifizieren. Diese Tatsache nutzen beispielsweise Verfahren der „tαg-Sequenzierung" wie SAGE (Velculescu et al., Science 270: 484-487 [1995], WO 00/53806) oder MPSS (Brenner et al., Nature Biotechnol. 18: 630-634 [2000]) aus. Hierbei ist zu beachten, daß die Länge einer Teilsequenz für eine eindeutige Identifikation eines Transkripts im Transkriptom meist länger sein muß als der theoretischen Mindestlänge entspricht, da die Nukleotidsequenz in Genomen nicht rein zufallig ist und bestimmte Nukleotidsequenzen bevorzugt werden. Dementsprechend würde man mit einer aus einer Folge von 8 Nukleotiden bestehenden Signatur, die theoretisch für 48 = 65.536 verschiedene Transkripte codieren könnte, in der Praxis zahlreiche verschiedene menschliche cDNAs identifizieren, die sich alle durch besagte Signatur auszeichnen. Dem steht die derzeit geschätzte Zahl von lediglich ca. 30.000- 40.000 Genen beim Menschen gegenüber. Um also Eindeutigkeit zu gewährleisten, muß der Informationsgehalt einer Signatur hinreichend über dem theoretischen Minimum liegen. Dabei kann der Informationsgehalt einer ein Fragment kennzeichnenden Signatur unter anderem durch folgende Angaben erhöht werden:3 -XXXXXXXXXMOOOOOOOOOOOOOOOOOOOOOOO-5 ' One or more nucleotides are identified simultaneously for several or all nucleic acid fragments, preferably after the nucleic acid fragments contained in the mixture have been separated according to a fragment-specific property, in particular according to the size and / or mobility of the fragments, by electrophoretic separation. The method of gel electrophoresis is particularly preferred, in which flat gels or gel-filled capillaries are used for the separation. In a preferred embodiment, enzymatic reactions according to variants 1-3 are carried out in step (c) in such a way that one or two nucleotides of the fragments are identified in parallel batches, the nucleotides of the fragments to be identified in the parallel batches being in a defined position relative to one another , for example adjacent to each other. One or two nucleotides of known position are then first determined in parallel separations of the said approaches for each of the separated fragments, which is preferably done by means of different marker groups which allow information about the nucleotides to be determined. In a further step, the determined nucleotides for individual or all of the separated fragments are then brought into the order in which they are present on the associated starting fragment from the mixture of nucleic acid fragments. The order of these two measures can of course also be interchanged. In any case, signatures in the form of short sequence sections which characterize the associated fragment are generated for the examined fragments. The length of these sequence sections is preferably at least 14 bases, more preferably at least 16 bases, in particular at least 20 bases. In addition to one or more sequence sections, a signature can also contain other information characterizing a fragment, for example exact or approximate distances (specified in base pairs) between characteristic areas of the fragment, for example the distance between two known sequence sections estimated with the aid of an internal length standard based on the electrophoretic mobility, between a known sequence section and a fragment end, or between both fragment ends. In this case, the length of the sequence sections is preferably at least 10 bases. In any case, the information content of a signature is preferably large enough to allow the unambiguous identification and / or isolation of the associated fragment. For example, experience has shown that approximately 14-20 base pairs of sequence information without additional information about distances within the fragment in question are usually sufficient to recognize a transcript containing this sequence segment from a mixture of cDNA molecules and to identify the associated gene. Take advantage of this fact for example methods of "tαg sequencing" such as SAGE (Velculescu et al., Science 270: 484-487 [1995], WO 00/53806) or MPSS (Brenner et al., Nature Biotechnol. 18: 630-634 [2000] It should be noted here that the length of a partial sequence for a unique identification of a transcript in the transcriptome must usually be longer than the theoretical minimum length, since the nucleotide sequence in genomes is not purely random and certain nucleotide sequences are preferred In practice, a signature consisting of a sequence of 8 nucleotides, which could theoretically encode 4 8 = 65,536 different transcripts, identify numerous different human cDNAs, all of which are characterized by said signature, which is currently estimated at only around 30,000 - 40,000 genes in humans, so to ensure uniqueness, the information content of a signature must be sufficient he the theoretical minimum. The information content of a signature identifying a fragment can be increased, among other things, by the following information:
1. längere Sequenz,1. longer sequence,
2. Information über tatsächliche oder ungefähre Länge auch von Bereichen des Fragments, deren Sequenz unbekannt ist,2. Information about the actual or approximate length also of regions of the fragment whose sequence is unknown,
3. Vorauswahl möglicher Identitäten.3. Pre-selection of possible identities.
Bei der Vorauswahl möglicher Identitäten wird durch eine Zusatzaussage über das zu identifizierende Fragment oder der in Frage kommenden zugehörigen Transkripte oder Gene die Zahl bzw. die Wahrscheinlichkeit möglicher Fehlzuordnungen reduziert. Eine Zusatzaussage über das zu identifizierende Fragment könnte beispielsweise sein „mittels der Restriktionsendonuklease Rsal erzeugtes 3 '-Fragment doppelsträngiger cDNA", wodurch die Identität des Sequenzanteils einer Signatur mit einem in 5 '→3 '-Richtung gesehen „oberhalb" (upstream) bzw. „vor" der am meisten zum 3 '-Ende des Fragments hin gelegenen Ryαl-Erkennungsstelle gelegenen Sequenzbereich eines Transkripts als nicht signifikant erkannt würde. Weiterhin würden auch Signaturen, deren Sequenzanteil in falscher Orientierung hinsichtlich der 5 '-3 '-Vorzugsrichtung einer mRNA-Sequenz bzw. der von ihr abgeleiteten cDNA-Sequenz vorliegt, als nicht signifikant erkannt. Auch hier geht also als Zusatzinformation ein, auf welche molekularbiologische Vorgehensweise die Signaturen erzeugt wurden, was ein Auftreten bestimmter Teilsequenzen als Signatur bzw. Bestandteil einer Signatur ausschließt. Eine Zusatzaussage über in Frage kommende Gene könnte beispielsweise sein „aus der Gesamtheit aller im Blatt exprimierten Gene", wenn mittels erzeugter pflanzlicher Signaturen Transkripte aus Blattproben identifiziert werden sollen, beispielsweise aber Gene, die ausschließlich in der Wurzel exprimiert werden, keine Berücksichtigung erfahren sollen. In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens zur Analyse von Nukleinsaurefragmenten erfolgt die simultane Identifikation eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente in Schritt c) über die folgenden Einzelschritte: ca) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cb) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cc) gegebenenfalls Wiederholung von Schritt (cb), bis die gewünschte Anzahl vonWhen preselecting possible identities, the number or the probability of possible incorrect assignments is reduced by an additional statement about the fragment to be identified or the associated transcripts or genes in question. An additional statement about the fragment to be identified could be, for example, "3 'fragment double-stranded cDNA generated by the restriction endonuclease Rsal", whereby the identity of the sequence part of a signature with a 5' → 3 'direction is "above" (upstream) or "Before" the sequence region of a transcript located most towards the 3 'end of the fragment would be recognized as insignificant. Furthermore, signatures whose sequence portion was in the wrong orientation with regard to the 5' -3 'preferred direction of an mRNA Sequence or the cDNA sequence derived from it is not recognized as significant. Here, too, additional information is given as to which molecular biological procedure the signatures were generated, which precludes the occurrence of certain partial sequences as a signature or part of a signature about genes in question could, for example, be "from the totality of all genes expressed in the leaf" if transcripts from leaf samples are to be identified by means of plant signatures generated, but for example genes which are only expressed in the root should not be taken into account. In a preferred embodiment of the method according to the invention for the analysis of nucleic acid fragments, the simultaneous identification of one or more nucleotides of the cut nucleic acid fragments takes place in step c) via the following individual steps: ca) identification of a first nucleotide of the cut nucleic acid fragments from b), the identification being carried out simultaneously for several or all nucleic acid fragments, cb) optionally identifying a further nucleotide of the cut nucleic acid fragments from b), the identification being carried out simultaneously for several or all nucleic acid fragments, cc) optionally repeating step (c b) until the desired number of
Nukleotiden identifiziert worden ist, cd) Zusammenfassung der in den Schritten (ca) bis (cc) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, wobei die Nukleotididentifikation in den Schritten ca) bis cc) gegebenenfalls auch die Auftrennung der Nukleinsaurefragmente der Mischung mit umfaßt.Nucleotides has been identified, cd) summarizing the sequence information obtained in steps (ca) to (cc) for a selected group or all nucleic acid fragments into fragment-specific signatures, a signature being able to contain further information about the respective fragment in addition to the sequence information, wherein the nucleotide identification in steps ca) to cc) optionally also includes the separation of the nucleic acid fragments of the mixture.
In einer weiteren bevorzugten Ausführungsform wird mindestens eine Teilmenge der in Schritt a) bereitgestellten Mischung von Nukleinsaurefragmenten den folgenden Verfahrensschritten aa) bis ad) unterworfen:In a further preferred embodiment, at least a subset of the mixture of nucleic acid fragments provided in step a) is subjected to the following process steps aa) to ad):
aa) Auftrennung der Mischung von Nukleinsäure-Fragmenten nach mindestens einer fragmentspezifischen Eigenschaft, ab) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der aufgetrennten Mischung, ac) gegebenenfalls Vergleich der in (aa) und/oder (ab) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsäure-Fragmenten gemäß Schritt (a), ad) gegebenenfalls Registrierung von in (ab) und/oder (ac) detektierten Nukleinsäure- Fragmenten, welche in verschiedenen Mischungen von Nukleinsäure-Fragmenten in unterschiedlicher relativer Häufigkeit auftreten^ aa) separation of the mixture of nucleic acid fragments according to at least one fragment-specific property, ab) optionally detection of the relative frequency of some or all fragments in the separated mixture, ac) optionally comparing the information obtained in (aa) and / or (ab) about the composition of different mixtures of nucleic acid fragments according to step (a), ad) optionally registering nucleic acid detected in (ab) and / or (ac) Fragments which occur in different mixtures of nucleic acid fragments at different relative frequencies ^
während eine Fragmentmischung ausgewählt aus der Gruppe I) bis III) nach den Schritten b) und c) behandelt werden, wobei I) eine weitere Teilmenge der in Schritt a) bereitgestellten Mischung von Nukleinsaurefragmenten,while a fragment mixture selected from group I) to III) is treated according to steps b) and c), where I) a further subset of the mixture of nucleic acid fragments provided in step a),
II) eine Teilmenge der in Schritt a) bereitgestellten Mischung von Nukleinsaurefragmenten, die zuvor nach mindestens einer fragmentspezifischen Eigenschaft aufgetrennt worden ist, III) eine mit I) oder II) zumindest zum Teil identische Mischung von Nukleinsaurefragmenten, ist.II) a subset of the mixture of nucleic acid fragments provided in step a) which has previously been separated according to at least one fragment-specific property, III) is a mixture of nucleic acid fragments which is at least partially identical to I) or II).
Es ist weiterhin bevorzugt, daß in einem der vorstehenden erfindungsgemäßen Verfahren in einem zusätzlichen Verfahrensschritt mindestens ein interessierendes Fragment einer der Gruppen (I) bis (III) gewonnen wird.It is further preferred that in one of the above processes according to the invention, at least one fragment of one of groups (I) to (III) is obtained in an additional process step.
Die interessierenden Fragmente werden hierbei vorzugsweise durch spezifische PCR- Amplifikation aus einem Gemisch von Nukleinsaurefragmenten gewonnen, bei der fragmentspezifische Oligonukleotidprimer eingesetzt werden, welche durch die in Schritt (cd) ermittelten Signaturen zugänglich und herstellbar sind.The fragments of interest are preferably obtained by specific PCR amplification from a mixture of nucleic acid fragments, in which fragment-specific oligonucleotide primers are used, which are accessible and can be produced by the signatures determined in step (cd).
Eine weitere bevorzugte Ausführungsform betrifft eines der vorstehenden erfindungsgemäßen Verfahren, bei dem eine Mischung aus Nukleinsaurefragmenten gemäß Schritt a) oder eine Teilmenge dieser Mischung aus Nukleinsaurefragmenten gemäß Schritt a) bereitgestellt wird, die durch die folgenden Schritte hergestellt wurde: i) beidseitige Flankierung der Restriktionsfragmente der Mischung mit identischen oder verschiedenen Adaptern ii) Hybridisierung der Fragmente aus Schritt (i) mit jeweils unterschiedlichen Primern, die alle zu den Adaptern aus Schritt (i) komplementäre Bereiche aufweisen und die an ihrem 3 '-Ende jeweilig ein oder mehrere Nukleotide aufweisen, welche nachA further preferred embodiment relates to one of the above methods according to the invention, in which a mixture of nucleic acid fragments according to step a) or a subset of this mixture of nucleic acid fragments according to step a) is provided, which was produced by the following steps: i) flanking on both sides of the restriction fragments of the mixture with identical or different adapters ii) hybridizing the fragments from step (i) with different primers in each case, all of which have regions complementary to the adapters from step (i) and which have their respective 3 'ends have one or more nucleotides, which after
Hybridisierung des Primers mit seiner Zielsequenz über den zum Adapter komplementären Bereich hinausragen und komplementär zu den ihnen im Doppelstrang gegenüberliegenden Nukleotiden einer Teilmenge der Fragmente aus der Nukleinsäuremischung aus (a) sind. iii) sequenzspezifische Extension der Primer aus ii) und gegebenenfalls anschließende PCR-Amplifikation der Nukleinsaurefragmente aus der Fragmentmischung, die in Schritt ii) sequenzspezifisch verlängert worden waren.Hybridization of the primer with its target sequence protrude beyond the region complementary to the adapter and are complementary to the nucleotides opposite them in the double strand of a subset of the fragments from the nucleic acid mixture from (a). iii) sequence-specific extension of the primers from ii) and, if appropriate, subsequent PCR amplification of the nucleic acid fragments from the fragment mixture which had been extended in a sequence-specific manner in step ii).
Sequenzspezifische Extension bzw. Verlängerung heißt, daß nur oder zumindest vorrangig diejenigen Primer verlängert werden, deren am 3 '-Ende befindliches Nukleotid oder Nukleotide gemäß Schritt ii) komplementär zu den ihnen gegenüberliegenden Nukleotiden desjenigen Fragments ist oder sind, mit welchem sie unter Hybridisierung einen Nukleinsäure-Doppelstrang gebildet haben.Sequence-specific extension means that only those primers whose nucleotide or nucleotides at the 3 'end at step 3) are or are complementary to the opposite nucleotides of the fragment with which they hybridize a nucleic acid are hybridized - Have formed double strand.
In einer besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird ein Verfahren zur Genexpressionsanalyse bereitgestellt, umfassend die folgenden Schritte:In a particularly preferred embodiment of the method according to the invention, a method for gene expression analysis is provided, comprising the following steps:
al) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, insbesondere mindestens einer Mischung von cDNA-Fragmenten, bl) Auftrennung der Mischung von Nukleinsäure-Fragmenten nach mindestens einer fragmentspezifischen Eigenschaft, cl) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der aufgetrennten Mischung, dl) gegebenenfalls Vergleich der in (bl) und/oder (cl) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsäure-Fragmenten aus (al), el) gegebenenfalls Registrierung von in (dl) detektierten Nukleinsäure-Fragmenten, welche in verschiedenen Mischungen von Nukleinsäure-Fragmenten in unterschiedlicher relativer Häufigkeit auftreten, fl) Inkubation einer Mischung von Nukleinsaurefragmenten, ausgewählt aus der Gruppe I: eine Teilmenge der Mischung aus (al), der Gruppe II: die in (bl) aufgetrennte Mischung von cDNA-Fragmenten oder ein Teil hiervon, der Gruppe III: eine mit der Mischung aus (al) oder der aufgetrennten Mischung aus (bl) mindestens teilweise identische Mischung von Nukleinsaurefragmenten, jedoch zusätzlich aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, mit der oder den außerhalb ihrer Erkennungsstelle schneidenden Restriktionsendonuklease oder Restriktionsendonukleasen, gl) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, hl) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, il) gegebenenfalls Wiederholung von Schritt (hl), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, j l) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (fl) bis (il), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart verändert wurde, daß die Wiederholung oder Wiederholungen jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlauben, kl) Zusammenfassung der in den Schritten (gl) bis (j l) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann,al) providing at least one mixture of nucleic acid fragments, in particular at least one mixture of cDNA fragments, b1) separating the mixture of nucleic acid fragments according to at least one fragment-specific property, cl) optionally detecting the relative frequency of some or all of the fragments in the separated mixture , dl) optionally comparing the information obtained in (bl) and / or (cl) about the composition of different mixtures of nucleic acid fragments from (al), el) optionally registering nucleic acid fragments detected in (dl) which are in different mixtures of nucleic acid fragments occur in different relative frequencies, fl) incubation of a mixture of nucleic acid fragments, selected from Group I: a subset of the mixture of (al), Group II: the mixture of cDNA fragments separated in (bl) or a part thereof, Group III: one with the mixture of (al) or the separated mixture (bl) at least partially identical mixture of nucleic acid fragments, but additionally comprising at least one recognition site for a restriction endonuclease that cuts outside its recognition site, with the restriction endonuclease or restriction endonucleases that cut outside its recognition site, gl) identification of a first nucleotide of the cut nucleic acid fragment from where the identification is carried out simultaneously for several or all nucleic acid fragments, hl) if appropriate, identification of a further nucleotide of the cut nucleic acid fragments from (fl), the identification being carried out simultaneously for several or all nucleic acid fragments, il) optionally repeating step (hl) until the desired number of nucleotides has been identified, jl) optionally repeating steps (fl) to (il) one or more times, the position and / or sequence of the recognition site being changed in such a way that the repetition or repetitions in each case the identification beforehand Allow not yet identified nucleotides, kl) Summary of the sequence information obtained in steps (gl) to (jl) for a selected group or all nucleic acid fragments into fragment-specific signatures, wherein a signature can contain further information about the respective fragment in addition to the sequence information .
11) gegebenenfalls Gewinnung interessierender Fragmente aus der Mischung von Nukleinsäure-Fragmenten aus (al) oder (bl), wobei die interessierenden Fragmente die in (e) registrierten Fragmente sein können, ml) gegebenenfalls Identifikation der zu den interessierenden Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels11) optionally obtaining fragments of interest from the mixture of nucleic acid fragments from (al) or (b1), the fragments of interest being the fragments registered in (e), ml) optionally identifying the genes belonging to the nucleic acid fragments of interest, from which the nucleic acid fragments are derived by means of
Durchsuchen elektronischer Datenbanken, wobei die interessierenden Fragmente die in (e) registrierten Fragmente sein können. Bei der Wiederholung der Schritte (fl) bis (i) wird durch Veränderung von Position und/oder Sequenz der Erkennungsstelle dafür gesorgt, daß andere als die bisher untersuchten Nukleotidpositionen der zu analysierenden Fragmente in einzelsträngige Überhänge überführt werden und somit weitere, zuvor noch nicht identifizierte Nukleotide identifiziert werden können. Hierbei ist neben einer sequentiellen Vorgehensweise selbstverständlich auch ein gleichzeitiges Vorgehen in Parallelansätzen möglich. In einer bevorzugten Vorgehensweise wird folgendermaßen vorgegangen: Es wird mindestens eine Fragmentmischung bereitgestellt, in welcher viele oder alle Fragmente identische Enden aufweisen, beispielsweise glatte Enden oder überhängende Enden gleicher Länge und Sequenz. Diese Mischung wird aliquotiert, beispielsweise in 10 im wesentlichen gleichgroße Aliquots. Jede der Mischungen wird mit einem aus einer Auswahl verschiedener Adapter (hier also einem von 10 verschiedenen Adaptern) versetzt und Ligationsbedingungen ausgesetzt, wobei sich alle Adapter durch ein zu den Fragmentenden kompatibles, also hieran befestigbares, Ende auszeichnet. Weiterhin weisen alle Adapter mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungssequenz schneidende Restriktionsendonuklease, beispielsweise Mmel, auf. Dabei unterscheiden sich die Adapter durch die Entfernung der Erkennungssequenz von dem an den Fragmentenden zu befestigenden Adapterende voneinander. In einer besonders bevorzugten Ausführungsform unterscheiden sich zwei verschiedene Adapter in dieser Entfernung um ein ganzzahliges Vielfaches der Länge der überhängenden Enden, welche von besagter außerhalb ihrer Erkennungssequenz schneidenden Restriktionsendonuklease erzeugt werden können. Im Beispiel der Restriktionsendonuklease Mmel (Schneidecharakteristik TCCRAC(20/18)) beträgt die Distanz dementsprechend in manchen Adaptern 18 bp, in anderen Adaptern 16 bp, in den übrigen Adaptern 14 bp, 12 bp, 10 bp, 8 bp, 6 bp, 4 bp, 2 bp oder 0 bp. Werden nun alle 10 Adapterbefestigungsprodukte einer Inkubation mit der Restriktionsendonuklease, hier Mmel, ausgesetzt, so sind im Fall der ersten Reaktion die Basen 19 und 20, in der zweiten Reaktion die Basen 17 und 18, in den übrigen Reaktionen die Basen 15 und 16, 13 und 14, 11 und 12, 9 und 10, 7 und 8, 5 und 6, 3 und 4 bzw. 1 und 2 in Form eines einzelsträngigen Überhangs freigelegt. Somit erlaubt der vollständige Satz aller 10 Reaktionen die Identifikation einer zusammenhängenden, 20 Basen langen Teilsequenz bzw. Signatur für die in der Fragmentmischung vorhandenen Fragmente. Außer einer Veränderung der Position einer Schnittstelle wäre es natürlich ebenso denkbar, an ein und derselben Position verschiedener Adapter Erkennungsstellen für in verschiedener Distanz von ihren Erkennungsstellen schneidenden Restriktionsendonukleasen bereitzustellen. So könnte beispielsweise ein Adapter an seinem an den Fragmentenden zu befestigenden Ende eine Erkennungsstelle für Earl (Schneidecharakteristik CTCTTC(l/4)), ein zweiter Adapter an gleicher Position eine Erkennungsstelle für SfaNl (Schneidecharakteristik GCATC (5/9)) und ein dritter Adapter an gleicher Position eine Erkennungsstelle für Stsl (Schneidecharakteristik GGATG (10/14)) aufweisen, wodurch sich mittels des erfindungsgemäßen Verfahrens 13 Basen lange Teilsequenzen der Fragmente identifizieren ließen. Selbstverständlich ist eine Kombination beider Vorgehensweisen (Veränderung von Position und Sequenz) ebenso denkbar.Searching electronic databases, where the fragments of interest can be the fragments registered in (e). When steps (fl) to (i) are repeated, changing the position and / or sequence of the recognition site ensures that nucleotide positions of the fragments to be analyzed other than those previously examined are converted into single-stranded overhangs and thus further, previously unidentified Nucleotides can be identified. In addition to a sequential approach, a simultaneous approach in parallel approaches is of course also possible. In a preferred procedure, the procedure is as follows: At least one fragment mixture is provided in which many or all fragments have identical ends, for example smooth ends or overhanging ends of the same length and sequence. This mixture is aliquoted, for example in 10 substantially equal aliquots. Each of the mixtures is mixed with one of a selection of different adapters (here one of 10 different adapters) and exposed to ligation conditions, with all adapters being distinguished by an end that is compatible with the fragment ends, that is to say attachable to them. Furthermore, all adapters have at least one recognition site for a restriction endonuclease that cuts outside their recognition sequence, for example Mmel. The adapters differ from one another in that the recognition sequence is removed from the adapter end to be attached to the fragment ends. In a particularly preferred embodiment, two different adapters differ in this distance by an integer multiple of the length of the overhanging ends, which can be generated by said restriction endonuclease which cuts outside their recognition sequence. In the example of the restriction endonuclease Mmel (cutting characteristic TCCRAC (20/18)), the distance is accordingly 18 bp in some adapters, 16 bp in other adapters, 14 bp, 12 bp, 10 bp, 8 bp, 6 bp, 4 in the other adapters bp, 2 bp or 0 bp. If all 10 adapter attachment products are now subjected to an incubation with the restriction endonuclease, here Mmel, bases 19 and 20 are in the case of the first reaction, bases 17 and 18 in the second reaction, and bases 15 and 16, 13 in the remaining reactions and 14, 11 and 12, 9 and 10, 7 and 8, 5 and 6, 3 and 4 or 1 and 2 in the form of a single-stranded overhang. The complete set of all 10 reactions thus allows the identification of a coherent, 20 base long partial sequence or signature for the fragments present in the fragment mixture. In addition to changing the position of an interface, it would of course also be conceivable to provide recognition sites for restriction endonucleases cutting at different distances from their recognition sites at the same position. For example, an adapter could have one at its end to be attached to the fragment ends Detection point for Earl (cutting characteristic CTCTTC (l / 4)), a second adapter in the same position a detection point for SfaNl (cutting characteristic GCATC (5/9)) and a third adapter in the same position a detection point for Stsl (cutting characteristic GGATG (10/14 )), which made it possible to use the method according to the invention to identify 13 base partial sequences of the fragments. Of course, a combination of both approaches (changing position and sequence) is also conceivable.
In einer weiteren besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird ein Verfahren zur Genexpressionsanalyse bereitgestellt, umfassend die folgenden Schritte:In a further particularly preferred embodiment of the method according to the invention, a method for gene expression analysis is provided, comprising the following steps:
a2) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, insbesondere einer Mischung von cDNA-Fragmenten, aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, welche auf an Ausgangs-Fragmente angefügten Linkern liegt, b2) Inkubation der Mischung von Nukleinsaurefragmenten aus (a2) mit der Restriktionsendonuklease oder den Restriktionsendonukleasen aus Schritt (a2), c2) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente der Mischung sowie unter Auftrennung der Mischung geschnittener und auf zura2) provision of at least one mixture of nucleic acid fragments, in particular a mixture of cDNA fragments, having at least one recognition site for a restriction endonuclease that cuts outside of its recognition site and that is located on linkers attached to starting fragments, b2) incubation of the mixture of nucleic acid fragments from ( a2) with the restriction endonuclease or the restriction endonucleases from step (a2), c2) identification of a first nucleotide of the cut nucleic acid fragments from (b2), the identification being cut simultaneously for several or all nucleic acid fragments of the mixture and with separation of the mixture and for
Identifikation des Nukleotids geeignete Weise behandelter Nukleinsäure-Fragmente nach mindestens einer fragmentspezifischen Eigenschaft erfolgt, d2) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2) gemäß (c2), e2) gegebenenfalls Wiederholung von Schritt (d2), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, f2) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (a2) bis (e2), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart verändert wurde, daß die Wiederholung oder Wiederholungen jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlauben, g2) Zusammenfassung der in den Schritten (c2) bis (f2) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, h2) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in (c2) erhaltenen fragmentspezifischen Informationen zu den in (g2) für die Nukleinsäure-Fragmente erhaltenen Signaturen, wobei die fragmentspezifischenIdentification of the nucleotide of suitably treated nucleic acid fragments takes place according to at least one fragment-specific property, d2) optionally identification of a further nucleotide of the cut nucleic acid fragments from (b2) according to (c2), e2) optionally repetition of step (d2) until the desired number of Nucleotides has been identified, f2) optionally repeating steps (a2) to (e2) one or more times, the position and / or sequence of the recognition site being changed in such a way that the repetition or repetitions in each case the identification of previously unidentified nucleotides allow, g2) combining the sequence information obtained in steps (c2) to (f2) for a selected group or all nucleic acid fragments into fragment-specific ones Signatures, where a signature can contain further information about the respective fragment in addition to the sequence information, h2) assignment of the fragment-specific information obtained in the separation according to a fragment-specific property in (c2) to the signatures obtained in (g2) for the nucleic acid fragments, being the fragment specific
Informationen im Fall einer elektrophoretischen Auftrennung der Fragmente die relative oder absolute Mobilität der Fragmente und/oder die anhand eines Längenstandards ermittelte scheinbare oder tatsächliche Fragmentlänge umfassen und wobei die Zuordnung in tabellarischer und/oder computerlesbarer Form erfolgen kann, i2) gegebenenfalls Identifikation der zu den Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels Durchsuchen elektronischer Datenbanken nach den Signaturen aus (g2), j2) gegebenenfalls Bereitstellung mindestens einer weiteren Mischung von Nukleinsäure- Fragmenten, insbesondere einer Mischung von cDNA-Fragmenten, gewonnen auf analoge Weise zu der Mischung von Nukleinsäure-Fragmenten aus (a2), wobei hier auf die Anfügung von Linkern aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease verzichtet werden kann, k2) Auftrennung der Mischung oder Mischungen von Nukleinsäure-Fragmenten aus (i2) nach einer fragmentspezifischen Eigenschaft im wesentlichen unter den Bedingungen der Auftrennung in (c2),In the case of an electrophoretic separation of the fragments, information includes the relative or absolute mobility of the fragments and / or the apparent or actual fragment length determined on the basis of a length standard and the assignment can take place in tabular and / or computer-readable form, i2) if necessary, identification of the nucleic acid Fragments belonging to genes from which the nucleic acid fragments derive, by searching electronic databases for the signatures from (g2), j2) optionally providing at least one further mixture of nucleic acid fragments, in particular a mixture of cDNA fragments, obtained from analogue ones Way to the mixture of nucleic acid fragments from (a2), it being possible here to dispense with the addition of linkers having at least one recognition site for a restriction endonuclease that cuts outside its recognition site, k2) separation of the mixture or mixture the nucleic acid fragments from (i2) according to a fragment-specific property essentially under the conditions of the separation into (c2),
12) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in (k2) erhaltenen fragmentspezifischen Informationen zu den einzelnen aufgetrennten Fragmenten, wobei die fragmentspezifischen Informationen relative oder absolute Häufigkeit der einzelnen Fragmente sowie im Fall einer elektrophoretischen12) Assignment of the fragment-specific information obtained in the separation according to a fragment-specific property in (k2) to the individual separated fragments, the fragment-specific information being relative or absolute frequency of the individual fragments and in the case of an electrophoretic
Auftrennung der Fragmente die relative oder absolute Mobilität der Fragmente und oder die anhand eines Längenstandards ermittelte scheinbare oder tatsächliche Fragmentlänge umfassen kann und wobei die Zuordnung in tabellarischer und/oder computerlesbarer Form erfolgen kann, m2) gegebenenfalls Vergleich der relativen oder absoluten Häufigkeiten mindestens eines Teils der in (k2) aufgetrennten Fragmente mit den relativen oder absoluten Häufigkeiten der jeweils homologen, also ganz oder im wesentlichen sequenzidentischen, aus verschiedenen Mischungen von Nukleinsäure-Fragmenten stammenden Fragmente, n2) gegebenenfalls Registrierung derjenigen Fragmente, deren relative oder absolute Häufigkeit sich von der relativen oder absoluten Häufigkeit ihrer homologen Fragmente anderer Mischungen von Nukleinsäure-Fragmenten um mindestens einen vorgewählten Faktor unterscheiden, o2) gegebenenfalls Zuordnung der in (n2) registrierten Fragmente zu denjenigen Genen bzw. Transkripten, von denen sich besagte Fragmente herleiten, unter Verwendung der in Schritt (h2) erhaltenen Ergebnisse, p2) gegebenenfalls Gewinnung der in (n2) registrierten Fragmente aus der Mischung von Nukleinsäure-Fragmenten aus (a2) oder (i2) und/oder (j2),Separation of the fragments may include the relative or absolute mobility of the fragments and or the apparent or actual fragment length determined on the basis of a length standard and the assignment may be in tabular and / or computer-readable form, m2) if necessary, comparison of the relative or absolute frequencies of at least part of the fragments separated in (k2) with the relative or absolute frequencies of the respective homologous, that is to say completely or essentially sequence-identical fragments originating from different mixtures of nucleic acid fragments, n2) where appropriate, registration of those fragments whose relative or absolute frequency differ from the relative or absolute frequency of their homologous fragments of other mixtures of nucleic acid fragments by at least a preselected factor, o2) where appropriate, assigning the fragments registered in (n2) to those genes or Transcripts, from which said fragments are derived, using the results obtained in step (h2), p2) optionally obtaining the fragments registered in (n2) from the mixture of nucleic acid fragments from (a2) or (i2) and / or (j2),
wobei die Schritte (i2) bis (n2) auch vor den Schritten (a2) bis (h2) durchgeführt werden können.wherein steps (i2) to (n2) can also be carried out before steps (a2) to (h2).
Die Erzeugung von Mischungen von Nukleinsäure-Fragmenten, vorzugsweise von Mischungen von cDNA-Fragmenten kann nach aus dem Stand der Technik bekannten Verfahren vorgenommen werden. Beispielsweise beschreibt EP 0 743Mixtures of nucleic acid fragments, preferably mixtures of cDNA fragments, can be produced by methods known from the prior art. For example, EP 0 743 describes
367, auf welche hiermit vollinhaltlich Bezug genommen wird, die Erzeugung von mittels meist häufig schneidender Restriktionsendonukleasen gewonnener, die 3'- Enden von cDNA-Molekülen repräsentierender und auf einer Seite von Linkern flankierter Fragmente, welche mittels selektiver (an ihrem 3 '-Ende über die allen Primern eines Typs gemeinsame „universelle" Bindungsstelle hinaus um eine oder mehrere „selektive" Nukleotide verlängerter) PCR-Primer in Form mehrerer Untergruppen („Subpools") amplifiziert werden. Jede dieser Untergruppen besteht dann aus einer Teilmenge der zunächst erzeugten Gesamtheit aller cDNA-3'- Fragmente. Einander entsprechende (d.h. mit den gleichen selektiven Primern erzeugte), aus verschiedenen auf differentiell exprimierte Gene zu untersuchende367, to which reference is hereby made in full, the generation of fragments obtained by means of mostly frequently cutting restriction endonucleases, which represent the 3 'ends of cDNA molecules and which are flanked on one side by linkers and which are selected by means of selective (at their 3' end via the "universal" binding site common to all primers of a type are amplified by one or more "selective" nucleotides extended PCR primers in the form of several subgroups ("subpools"). Each of these subgroups then consists of a subset of the total of all cDNA initially generated -3'- Fragments: Corresponding (ie generated with the same selective primers) to be examined from different genes for differentially expressed genes
RNA-Präparationen gewonnene Fragment-Subpools werden dann gelelektrophoretisch nach ihrer Größe aufgetrennt, und die erhaltenen Bandenbzw. Signalmuster werden miteinander verglichen. Von homologen Fragmenten stammende Banden bzw. Signale, deren Intensität sich zwischen zwischen verschiedenen Proben unterscheidet, repräsentieren Gene, die in den verglichenenFragment subpools obtained from RNA preparations are then separated by gel electrophoresis according to their size, and the bands obtained. Signal patterns are compared with each other. Bands or signals originating from homologous fragments, the intensity of which differs between different samples, represent genes that are in the compared ones
Proben unterschiedlich stark exprimiert sind (vgl. beispielsweise Abb. 1 der EP 0 743 367). Aus dem Stand der Technik sind weitere alternative Verfahren zur Erzeugung von Mischungen von cDNA-Fragmenten zur Expressionsanalyse bekannt, vgl. beispielsweise Kato: Nucleic Acids Res. 23, 3685-3690 (1995), Ivanova et al., Nucleic Acids Res. 23, 2954-2958 (1995), Bachern et al, Plant J. 9, 745-753 (1996), Prashar et al., Proc. Natl. Acad. Sei. U. S. A. 93, 659-663 (1996), Shimkets et al., Nat. Biotechnol. 17, 798-803 (1999), Ke et al., Analyt. Biochem. 269, 201-204 (1999)., Jing et al., Analyt. Biochem. 287, 334-337 (2000), Sutcliffe et al., Proc. Natl. Acad. Sei. U. S. A. 97, 1976-1981 (2000), WO 99/42610, EP 0 981 609.Samples are expressed to different extents (see, for example, Fig. 1 of EP 0 743 367). Further alternative methods for producing mixtures of cDNA fragments for expression analysis are known from the prior art, cf. for example Kato: Nucleic Acids Res. 23, 3685-3690 (1995), Ivanova et al., Nucleic Acids Res. 23, 2954-2958 (1995), Bachern et al, Plant J. 9, 1996, 745-753, Prashar et al., Proc. Natl. Acad. Be. USA 93: 659-663 (1996), Shimkets et al., Nat. Biotechnol. 17: 798-803 (1999), Ke et al., Analyt. Biochem. 269: 201-204 (1999). Jing et al., Analyt. Biochem. 287: 334-337 (2000) Sutcliffe et al. Proc. Natl. Acad. Be. USA 97, 1976-1981 (2000), WO 99/42610, EP 0 981 609.
Bei der fragmentspezifischen Eigenschaft handelt es sich um eine, insbesondere physikalische oder physikochemische, Eigenschaft, welche von verschiedenen Molekülen innerhalb eines Kontinuums oder in Form einer größeren Anzahl (beispielsweise mindestens 10 oder mindestens 100) unterschiedlicher Abstufungen oder Ausprägungen verwirklicht sein kann. Besonders bevorzugt ist die Ausnutzung unterschiedlicher Mobilität verschiedener Nukleinsaurefragmente in Trennsystemen, insbesondere unterschiedlicher elektrophoretischer Mobilität in Elektrophoresesystemen wie Agarose- oder Polyacrylamidgelelektrophorese. Hierbei ist die Mobilität in der Regel von der Länge eines Fragments beeinflußt; allerdings handelt es sich um keine streng lineare Beziehung, da auch G/C-Gehalt und Konformation eines Nukleinsäuremoleküls die Mobilität beeinflussen. Daher kann die Mobilität eines Nukleinsäuremoleküls in der Regel lediglich zur ungefähren, nicht aber zur absoluten Größenbestimmung herangezogen werden. Weiterhin kann es sich bei der fragmentspezifischen Eigenschaft um eine bestimmte Teilsequenz von n Nukleotiden handeln, wobei n gleich oder größer 1 sein kann. Bevorzugterweise grenzt besagte Teilsequenz eines Fragments an einen am Ende des Fragments befestigten Linker an, so daß eine Auftrennung einer Mischung verschiedener Fragmente nach dieser Teilsequenz über Extension, gegebenenfalls eine wiederholte Extension in Form einer Amplifikation, selektiver Oligonukleotidprimer erfolgen kann. Eine derartige Vorgehensweise ist beispielsweise in der EP 0 743 367 beschrieben. In diesem Fall ist mit „Auftrennung einer Fragmentmischung" die Herstellung von Mischungen amplifizierter Fragmente gemeint, von denen jede durch Amplifikation erzeugte Kopien nur eines Teils der in der Ausgangsmischung vorhandenen Fragmente enthält. In einem anderen bevorzugten Fall liegt besagte Teilsequenz zumindest teilweise in Form eines einzelsträngigen Überhangs vor, und die Auftrennung einer Mischung verschiedener Fragmente nach dieser Teilsequenz erfolgt über Befestigung von Adaptern mit kompatiblen Überhängen. Dieser Vorgang, auch „Kategorisierung von Nukleotidsequenz-Populationen" genannt, ist in der WO 94/01582 beschrieben. Auch eine Kombination beider Maßnahmen ist denkbar und beispielsweise in der WO 01/75180 beschrieben. Die Detektion der relativen Häufigkeit einiger oder aller Fragmente erfolgt über Messung der bei der Detektion einzelner Nukleinsaurefragmente erhaltenen Signalstärke. In einer bevorzugten Ausführungsform enthalten die Nukleinsaurefragmente detektierbare Markierungsgruppen, wobei der Einsatz von Fluorophoren als Markierungsgruppen besonders bevorzugt ist. Wird zur Auftrennung und Detektion beispielsweise ein automatisches Sequenzierungsgerät verwendet, so ist die relative Häufigkeit eines Fragments als Fläche unter der entsprechenden Kurve im Fluorogramm (der Auftragung der gemessenen Fluoreszenzintensität in Abhängigkeit von der Retentionszeit) in Form eines Zahlenwerts leicht erhältlich. Unter einem Fragment ist hierbei die Gesamtheit aller sequenzidentischen Nukleinsäuremoleküle einer Mischung zu verstehen, gegebenenfalls zuzüglich der Nukleinsäuremoleküle hierzu komplementärer Sequenz. Oft werden die als relative Häufigkeit von Fragmenten erhaltenen Zahlenwerte in computerlesbarer Form gespeichert.The fragment-specific property is a property, in particular a physical or physicochemical property, which can be realized by different molecules within a continuum or in the form of a larger number (for example at least 10 or at least 100) of different gradations or forms. It is particularly preferred to use different mobility of different nucleic acid fragments in separation systems, in particular different electrophoretic mobility in electrophoresis systems such as agarose or polyacrylamide gel electrophoresis. Mobility is usually influenced by the length of a fragment; however, it is not a strictly linear relationship, since the G / C content and conformation of a nucleic acid molecule also influence mobility. Therefore, the mobility of a nucleic acid molecule can usually only be used for approximate, but not for absolute size determination. Furthermore, the fragment-specific property can be a specific partial sequence of n nucleotides, where n can be equal to or greater than 1. Said partial sequence of a fragment preferably adjoins a linker attached to the end of the fragment, so that a mixture of different fragments according to this partial sequence can be separated by extension, optionally a repeated extension in the form of an amplification, of selective oligonucleotide primers. Such a procedure is described for example in EP 0 743 367. In this case, “separation of a fragment mixture” means the production of mixtures of amplified fragments, each of which copies produced by amplification contains only a part of the fragments present in the starting mixture. In another preferred case, said partial sequence is at least partly in the form of a single-stranded one Overhang, and a mixture of different fragments after this partial sequence is separated by attaching adapters with compatible overhangs. This process, also called “categorization of nucleotide sequence populations”, is described in WO 94/01582. A combination of both measures is also conceivable and is described, for example, in WO 01/75180. The relative frequency of some or all of the fragments is detected by measuring the signal strength obtained in the detection of individual nucleic acid fragments. In a preferred embodiment, the nucleic acid fragments contain detectable labeling groups, the use of fluorophores as labeling groups being particularly preferred. If, for example, an automatic sequencing device is used for the separation and detection, the relative frequency of a fragment as an area under the corresponding curve in the fluorogram (the plot of the measured fluorescence intensity as a function of the retention time) is readily available in the form of a numerical value. A fragment here is to be understood as the entirety of all the sequence-identical nucleic acid molecules of a mixture, possibly plus the sequence of complementary nucleic acid molecules. The numerical values obtained as the relative frequency of fragments are often stored in a computer-readable form.
Im Schritt der Registrierung von Nukleinsäure-Fragmenten, vorzugsweise von cDNA- Fragmenten, unterschiedlicher relativer Häufigkeiten werden diejenigen Fragmente identifiziert, welche sich in ihrem Anteil zwischen verschiedenen biologischen Proben bzw. zwischen verschiedenen Mischungen von cDNA-Fragmenten unterscheiden. Wird dafür Sorge getragen, daß aus den in den Proben vorhandenen mRNA-Molekülen cDNA- Fragmente erzeugt werden, deren Häufigkeitsverteilung der Häufigkeitsverteilung der verschiedenen mRNA-Moleküle ähnlich ist oder ihr sogar gleicht, so zeigen cDNA- Fragmente zwischen miteinander verglichenen Fragmentmischungen unterschiedlicher Häufigkeit auch mRNA-Moleküle unterschiedlicher Häufigkeit und somit differentiell exprimierte Gene an. Um kleinere Schwankungen beispielsweise in der Effizienz der zuvor erfolgten enzymatischen Schritte oder der Detektion zu kompensieren, kann gegebenenfalls ein Schwellenwert für Häufigkeitsunterschiede festgelegt werden, so daß beispielsweise nur diejenigen cDNA-Fragmente weiter untersucht werden, deren relative Häufigkeit zwischen miteinander verglichenen Fragmentmischungen sich um mindestens den Faktor zwei unterscheidet.In the step of registering nucleic acid fragments, preferably cDNA fragments, of different relative frequencies, those fragments are identified which differ in their proportion between different biological samples or between different mixtures of cDNA fragments. If care is taken to generate cDNA fragments from the mRNA molecules present in the samples, the frequency distribution of which is similar or even equal to the frequency distribution of the different mRNA molecules, then cDNA fragments between mutually compared fragment mixtures of different frequencies also show mRNA -Molecules of different frequencies and thus differentially expressed genes. In order to compensate for minor fluctuations, for example in the efficiency of the enzymatic steps carried out beforehand or in the detection, a threshold value for frequency differences can optionally be set, so that, for example, only those cDNA fragments whose relative frequency between mutually compared fragment mixtures is at least the same are further investigated Factor two differs.
Die simultane Identifikation eines Nukleotids oder mehrerer Nukleotide für mehrere oder alle Nukleinsaurefragmente erfolgt vorzugsweise, indem wie oben beschrieben an mittels mindestens einer außerhalb ihrer Erkennungsstelle schneidenen Restriktionsendonuklease erzeugten überhängenden Fragmentenden ein für die Identität des jeweils zu identifizierenden Nukleotids charakteristischer Prozeß durchgeführt wird, für den eine Mischung aus mehreren oder allen Nukleinsaurefragmenten eingesetzt wird und dessen Ergebnis sich vorzugsweise über den Einbau einer Markierung, insbesondere m einer Fluoreszenzmarkierung, beobachten läßt. Hierbei ist bevorzugt, daß die identifizierten Nukleotide in Nachbarschaft zueinander liegen, die so erhaltenen Informationen über die Nukleotididentitäten also eine zusammenhängende Teilsequenz des jeweiligen Nukleinsäurefragments ergeben. In einer bevorzugten Ausführungsform wird nach Ablauf besagten Prozesses, der „Sequenzierungsreaktion", eine Auftrennung der im Prozeß entstandenen Produkte vorgenommen, wobei hier die Aufitrennung wiederum nach der fragmentspezifischen Eigenschaft aus (bl) bzw. (c2) erfolgen kann.The simultaneous identification of a nucleotide or a plurality of nucleotides for several or all nucleic acid fragments is preferably carried out by, as described above, on the overhanging fragment ends generated by means of at least one restriction endonuclease cutting outside their recognition site for identity the characteristic process of the nucleotide to be identified is carried out, for which a mixture of several or all nucleic acid fragments is used and the result of which can preferably be observed by incorporating a label, in particular a fluorescent label. It is preferred here that the identified nucleotides lie in proximity to one another, that is to say that the information about the nucleotide identities thus obtained results in a coherent partial sequence of the respective nucleic acid fragment. In a preferred embodiment, after the process, the “sequencing reaction”, has expired, the products formed in the process are separated, in which case the separation can again take place according to the fragment-specific property from (b1) or (c2).
Bei der Zusammenfassung der erhaltenen Sequenzinformationen zu fragmentspezifischen Signaturen wird jedem oder einigen der aufgetrennten Nukleinsäuremoleküle die für einige Positionen erhaltene Nukleotididentität zugeordnet. Die über ein Fragment erhaltene Information wird als Signatur bezeichnet. Hierbei kann die Signatur neben Sequenzinformation noch weitere Informationen enthalten, beispielsweise auf andere Weise erhaltene Sequenzinformation oder über die Fragmentmobilität erhaltene ungefähre Fragmentgröße. Werden beispielsweise gemäß o.g. EP 0 743 367 cDNA-3 '-Fragmente unter Verwendung der Restriktionsendonuklease Rsal (Erkennungssequenz GTAC) erzeugt und wird einem ausgewählten Fragment, von der Erkennungsstelle für Rsal aus gesehen, den in Schritten (gl) bis (jl) identifizierten Nukleotiden die Identität A (1. Nukleotid), G (2. Nukleotid), T (3. Nukleotid) sowie A (4. Nukleotid) zugewiesen, so läßt sich hieraus eine Sequenzsignatur der Nukleotidsequenz GTACAGTA erzeugen. Neben der ungefähren Fragmentgröße könnte als weitere Randinformation noch aufgenommen werden, daß sich (einen vollständigen Ablauf des Rsαl-Verdaus vorausgesetzt) zwischen der Teilsequenz GTAC und dem 3 '-Fragmentende naturgemäß keine weitere identische Teilsequenz befinden kann. Jedenfalls können fragmentspezifische Signaturen für alle oder einen Teil der in einer Fragmentmischung enthaltenen Fragmente ermittelt werden. Bei der Anwendung des erfindungsgemäßen Verfahrens zur vergleichenden Genexpressionsanalyse werden Signaturen insbesondere für diejenigen Fragmente ermittelt, welche sich in ihrer relativen Häufigkeit zwischen den zu vergleichenden Fragmentmischungen um mindestens einen festgelegten Faktor unterscheiden. Im übrigen muß es sich bei dem Sequenzanteil einer Signatur nicht notwendigerweise um eine zusammenhängende Sequenz handeln. So ist es beispielsweise denkbar, daß von einem gegebenen Fragment terminale Nukleotidteilsequenzen beider Fragmentenden bestimmt und zu einer Signatur zusammengefaßt werden; auch hierbei ist es selbstverständlich möglich, weitere Informationen wie z.B. ungefähre Fragmentlänge in die Signatur aufzunehmen. Beispielsweise könnte für ein bestimmtes Fragment die SignaturWhen the sequence information obtained is combined into fragment-specific signatures, the nucleotide identity obtained for some positions is assigned to each or some of the separated nucleic acid molecules. The information received about a fragment is called a signature. In addition to sequence information, the signature can also contain further information, for example sequence information obtained in another way or approximate fragment size obtained via fragment mobility. For example, according to the above-mentioned EP 0 743 367 cDNA-3 'fragments are generated using the restriction endonuclease Rsal (recognition sequence GTAC) and a selected fragment, as seen from the recognition site for Rsal, the nucleotides identified in steps (gl) to (jl) assigned the identity A (1st nucleotide), G (2nd nucleotide), T (3rd nucleotide) and A (4th nucleotide), a sequence signature of the nucleotide sequence GTACAGTA can be generated from this. In addition to the approximate fragment size, additional marginal information could be added that (assuming that the Rsαl digestion is complete) there can of course be no further identical partial sequence between the partial sequence GTAC and the 3 'fragment end. In any case, fragment-specific signatures can be determined for all or part of the fragments contained in a fragment mixture. When using the method according to the invention for comparative gene expression analysis, signatures are determined in particular for those fragments which differ in their relative frequency between the fragment mixtures to be compared by at least one fixed factor. Otherwise, the sequence portion of a signature does not necessarily have to be a coherent sequence. For example, it is conceivable that partial nucleotide sequences of both fragment ends of a given fragment are determined and combined to form a signature; it is of course also possible to include additional information in the signature, such as approximate fragment lengths. For example, the signature could be for a particular fragment
5'-CTCA{192}GGAT-3'5'-CTCA {192} GGAT-3 '
bedeuten, daß das Fragment mit der Nukleotidsequenz CTCA am 5 '-Ende „beginnt", mit der Nukleotidsequenz GGAT am 3 '-Ende „aufhört" und insgesamt, gegebenenfalls zuzüglich terminaler Linkerbereiche, ungefähr 200 bp (= 4 bp + 192 bp + 4 bp) lang ist. Hierbei berücksichtigt die Formulierung „ungefähr", daß die Längenbestimmung von Fragmenten anhand der elektrophoretischen Mobilität wie oben ausgeführt einem gewissen Fehler unterworfen ist.mean that the fragment "begins" with the nucleotide sequence CTCA at the 5 'end, "ends" with the nucleotide sequence GGAT at the 3' end and in total, possibly plus terminal linker regions, approximately 200 bp (= 4 bp + 192 bp + 4 bp) is long. Here, the formulation "approximately" takes into account that the length determination of fragments based on the electrophoretic mobility, as stated above, is subject to a certain error.
Die Gewinnung interessierender Fragmente aus der Mischung von Nukleinsäure- Fragmenten, vorzugsweise von cDNA-Fragmenten kann unter Zuhilfenahme der ermittelten fragmentspezifischen Signaturen beispielsweise mittels PCR mit Hilfe genspezifischer Primer erfolgen. Wurde etwa im oberen Beispiel eine Mischung von 3'- cDNA-Fragmenten mittels der Restriktionsendonuklease Rsal gewonnen, gefolgt von der Ligation von Linkem an die erzeugten (glatten) Fragmentenden, und wurde für ein ausgewähltes Fragment die obige Signatur GTACAGTA erhalten, so ist über das Fragment bekannt, daß nach erfolgtem Rs l-Schnitt (Entfernung u.a. der ersten beiden Nukleotide der Rsαl-Erkennungsstelle, GT) die ersten auf die Linkersequenz folgenden Nukleotide die Sequenz ACAGTA darstellen. Wird nun ein Primer zur PCR-Amplifikation eingesetzt, welcher auf die Linkersequenz an seinem 3 '-Ende folgend eben diese Nukleotidsequenz ACAGTA aufweist, so ist das zugehörige Fragment direkt durch Amplifikation aus der Fragmentmischung zugänglich, da besagter Primer selektiv eine Amplifikation derjenigen Fragmente begünstigt, mit denen er über seine volle Länge sequenzidentisch (bzw. komplementär hierzu) ist. Das so erhaltene Fragment kann dann einer weiteren Analyse unterzogen werden, beispielsweise einer Sequenzierung, gefolgt von einer Datenbankabfrage nach sequenzidentischen oder sequenzähnlichen Einträgen. Voraussetzung für diese Vorgehensweise ist selbstverständlich ein hinreichend hoher Informationsgehalt der Signatur, d.h. eine hinreichende Länge und damit Spezifität des fragmentspezifischen Bereichs des Amplifikationsprimers. Grenzte die Teilsequenz ACAGTA in mehr als einem der in der Mischung befindlichen Fragmente direkt an die Linkerregion, so würde sich unter Zuhilfenahme besagten Primers eine Mischung dieser Fragmente amplifizieren lassen. Um ein einzelnes interessierendes Fragment auf die beschriebene Weise zu gewinnen, müßte der eingesetzte Primer demnach an seinem 3'- Ende um weitere spezifische Basen verlängert werden. Hierbei ist auch in Rechnung zu stellen, daß die Diskriminierungsfahigkeit von Polymerasen gegen Verlängerung von unter partieller Fehlpaarung („mismatch") mit dem Matrizenstrang („template") hybridisierten Primern umso geringer ist, je weiter diese Fehlpaarungen vom 3 '-Ende des Primers entfernt sind. Wird also ein Primer an seinem 3 '-Ende zur Spezifitätserhöhung um weitere fragmentspezifische Basen verlängert, ist mit einem gewissen Verlust an Spezifität derjenigen Basen zu rechnen, welche unmittelbar auf den zur jeweiligen Linkersequenz komplementären Sequenzabschnitt des Primers folgen.Fragments of interest can be obtained from the mixture of nucleic acid fragments, preferably cDNA fragments, with the aid of the fragment-specific signatures determined, for example by means of PCR using gene-specific primers. For example, in the example above, a mixture of 3'-cDNA fragments was obtained by means of the restriction endonuclease Rsal, followed by the ligation of linker to the (smooth) fragment ends, and if the above signature GTACAGTA was obtained for a selected fragment Fragment known that after the Rs 1 cut (removal of the first two nucleotides of the Rsαl recognition site, GT), the first nucleotides following the linker sequence are the sequence ACAGTA. If a primer is now used for PCR amplification which, following the linker sequence at its 3 'end, has precisely this nucleotide sequence ACAGTA, the associated fragment can be accessed directly by amplification from the fragment mixture, since said primer selectively promotes amplification of those fragments. with which it is sequence-identical (or complementary) over its entire length. The fragment obtained in this way can then be subjected to a further analysis, for example sequencing, followed by a database query for entries which are identical or similar to sequences. A prerequisite for this procedure is of course a sufficiently high information content of the signature, ie a sufficient length and thus specificity of the fragment-specific area of the amplification primer. If the partial sequence ACAGTA bordered directly on the linker region in more than one of the fragments in the mixture, a mixture of these fragments could be amplified with the aid of said primer. In order to obtain a single fragment of interest in the manner described, the primer used would therefore have to be extended at its 3 'end by further specific bases. It must also be taken into account here that the greater the distance from the 3 'end of the primer, the less the ability of polymerases to discriminate against the extension of primers hybridized with partial mismatch with the template strand are. If a primer is extended at its 3 'end to increase the specificity by further fragment-specific bases, a certain loss in the specificity of those bases which immediately follow the sequence section of the primer complementary to the respective linker sequence is to be expected.
In einer bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden die für interessierende Nukleinsaurefragmente erhaltenen Signaturen eingesetzt, um fragmentspezifische Oligonukleotidprimer zu entwerfen. Bei dieser Anwendung ist weiterhin bevorzugt, die erhaltenen Oligonukleotidprimer zur Amplifikation ausgewählter Fragmente einzusetzen, wobei als Amplifikationstemplate in der Regel die Mischung von Nukleinsaurefragmenten oder eine Teilmenge hiervon eingesetzt wird.In a preferred application of the method according to the invention, the signatures obtained for nucleic acid fragments of interest are used to design fragment-specific oligonucleotide primers. In this application, it is further preferred to use the oligonucleotide primers obtained for the amplification of selected fragments, the mixture of nucleic acid fragments or a subset thereof being generally used as the amplification template.
Die Identifikation der zu den interessierenden Nukleinsäure- bzw. cDNA-Fragmenten gehörigen Gene mittels Durchsuchen elektronischer Datenbanken kann erfolgen, wenn der Informationsgehalt einer Signatur hoch genug ist, um eine eindeutige oder weitgehend eindeutige Identifikation eines Gens zuzulassen, und wenn die Datenbank entsprechende Einträge aufweist. Wie hoch der Informationsgehalt von Signaturen einer biologischen Spezies sein muß, um eine eindeutige Zuordenbarkeit einer Signatur zum zugehörigen Gen zu erlauben, ist empirisch zu ermitteln und kann selbst innerhalb einer biologischen Spezies von Gen zu Gen verschieden sein; so kann es etwa vorkommen, daß ein bestimmtes Decamer (eine aus 10 Nukleotiden bestehende Signatur) charakteristisch für ein einziges Gen ist, während ein anderes Decamer in zahlreichen verschiedenen Genen auftritt. In einer bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden die für interessierende Nukleinsaurefragmente erhaltenen Signaturen zur Identifizierung der Nukleinsaurefragmente in einer Datenbanksuche eingesetzt.The genes belonging to the nucleic acid or cDNA fragments of interest can be identified by searching electronic databases if the information content of a signature is high enough to permit clear or largely unambiguous identification of a gene and if the database has corresponding entries. How high the information content of signatures of a biological species has to be in order to allow a clear assignment of a signature to the associated gene can be determined empirically and can even differ from gene to gene within a biological species; for example, a particular decamer (a 10-nucleotide signature) may be characteristic of a single gene, while another decamer appears in many different genes. In a preferred application of the method according to the invention, the signatures obtained for nucleic acid fragments of interest are used to identify the nucleic acid fragments in a database search.
In einer weiteren bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden die für interessierende Nukleinsaurefragmente erhaltenen Signaturen eingesetzt, um EST- Banken zu erstellen. Hierzu werden die für die einzelnen, aus einer cDNA-Präparation gewonnenen, Fragmente erhaltenen Signaturen eingesetzt, um fragmentspezifische Oligonukleotidprimer zu entwerfen. Diese werden dann verwendet, um mittels PCR- Amplifikation die jeweiligen Fragmente zu gewinnen. Die gewonnenen Fragmente werden schließlich sequenziert und die Sequenzen werden in einer Datenbank erfaßt. Solchermaßen erzeugte EST-Banken können auch als normalisierte EST-Banken bezeichnet werden, da jedes Fragment, unabhängig von seiner Abundanz bzw. der Abundanz der von ihm repräsentierten mRNA- bzw. cDNA-Moleküle, lediglich ein einziges Mal erzeugt wird. Dies ist von großem Vorteil im Vergleich mit nach dem Stand der Technik erzeugten EST-Banken, die ein extrem hohes Maß an Redundanz zeigen (vgl. Lee et al., Proc. Natl. Acad. Sei. U.S.A. 92, 8303-8307 [1995]). Diese Redundanz auf traditionelle Weise hergestellter EST-Banken folgt daraus, daß abundante Transkripte (beispielsweise einer Abundanz von 1000 mRNA-Kopien pro Zelle) durch wesentlich mehr zur EST-Bank beitragende cDNA-Klone repräsentiert werden als weniger abundante Transkripte (beispielsweise einer Abundanz von 1 mRNA-Kopie pro Zelle - der Häufigkeitsunterschied von diese beiden Transkripte repräsentierenden Klonen betrüge in diesem Beispiel 1:1000). Aus dem Stand der Technik sind weiterhin Verfahren zur Normalisierung von cDNA-Banken bekannt, bei denen unter Ausnutzung der Reassoziationskinetik von Nukleinsäuren eine Konzentrationsangleichung abundanter und weniger abundanter Klone vorgenommen wird (Soares et al, Proc. Natl. Acad. Sei. U.S.A. 91, 9228-9232 [1994]). Solche normalisierte Banken zeichnen sich zwar durch eine Abreicherung besonders abundanter Klone aus, jedoch ist der Abundanzunterschied häufiger und weniger häufiger Klone immer noch beträchtlich und kann zwischen einer und zwei Größenordnungen betragen, was Herstellung und Analyse von Banken dieser Art sehr teuer macht. Bei der Herstellung von normalisierten Banken gemäß dem erfindungsgemäßen Verfahren kann eine Redundanz praktisch ausgeschlossen werden; dennoch geht im Gegensatz zu normalisierten Banken nach dem Stand der Technik Abundanzinformation der einzelnen Fragmente, Klone sowie derjenigen Transkripte, von denen diese sich ableiten, nicht verloren. Vielmehr kann Abundanzinformation der jeweiligen, beispielsweise mittels kapillargelelektrophoretischer Auftrennung erhaltenen Signalstärke der einzelnen Fragmente einer untersuchten Fragmentmischung entnommen und als Zusatzinformation einer jeden erhaltenen EST-Sequenz abrufbar beigefügt werden.In a further preferred application of the method according to the invention, the signatures obtained for nucleic acid fragments of interest are used to create EST banks. For this purpose, the signatures obtained for the individual fragments obtained from a cDNA preparation are used in order to design fragment-specific oligonucleotide primers. These are then used to obtain the respective fragments by means of PCR amplification. The fragments obtained are finally sequenced and the sequences are recorded in a database. EST banks generated in this way can also be referred to as normalized EST banks, since each fragment is generated only once, regardless of its abundance or the abundance of the mRNA or cDNA molecules it represents. This is of great advantage in comparison with EST banks produced according to the prior art, which show an extremely high level of redundancy (cf. Lee et al., Proc. Natl. Acad. Sei. USA 92, 8303-8307 [1995 ]). This redundancy in the traditional way of EST banks follows from the fact that abundant transcripts (e.g. an abundance of 1000 mRNA copies per cell) are represented by significantly more cDNA clones contributing to the EST bank than less abundant transcripts (e.g. an abundance of 1 mRNA copy per cell - the frequency difference of clones representing these two transcripts would be 1: 1000 in this example). Methods for the normalization of cDNA libraries are also known from the prior art, in which the concentration kinetics of abundant and less abundant clones are carried out using the reassociation kinetics of nucleic acids (Soares et al, Proc. Natl. Acad. Sei. USA 91, 9228 -9232 [1994]). Such normalized banks are characterized by a depletion of particularly abundant clones, but the difference in abundance between more and less frequent clones is still considerable and can be between one and two orders of magnitude, which makes the production and analysis of banks of this type very expensive. In the production of normalized banks according to the method according to the invention, redundancy can be practically excluded; however, in contrast to normalized banks according to the prior art, the redundancy information of the individual fragments, clones and those transcripts from which they are derived is not lost. Rather, abundance information can be obtained from the respective separation, for example by means of capillary gel electrophoretic separation The signal strength of the individual fragments of an examined fragment mixture can be taken and added to each received EST sequence as additional information.
In einer weiteren bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden als Mischung von Nukleinsaurefragmenten Mischungen aus genomischer DNA oder cDNA erzeugter, beidseitig von identischen oder verschiedenen Adaptern flankierter Restriktionsfragmente eingesetzt, wobei die adapterflankierten Fragmente zunächst einer Amplifikation mittels an ihrem 3 '-Ende über den zum Adapter komplementären Bereich hinaus um ein oder mehrere Nukleotide verlängerter Primer unterzogen werden und die so erhaltenen Amplifkationsprodukte zur Durchführung des Verfahrens eingesetzt werden.In a further preferred application of the method according to the invention, mixtures of genomic DNA or cDNA generated restriction fragments flanked on both sides by identical or different adapters are used as a mixture of nucleic acid fragments, the fragments flanked by the adapter first being amplified by means of their 3 'end via the complementary one to the adapter Be subjected to a range extended by one or more nucleotides of primers and the amplification products thus obtained are used to carry out the method.
In einer weiteren Ausführungsform des erfindungsgemäßen Verfahrens werden als Mischung von Nukleinsaurefragmenten solche Fragmente eingesetzt, welche durch Restriktionsverdau mit mindestens zum Teil dem Typ IIs angehörigen Restriktionsendonukleasen aus genomischer oder cDNA erzeugt wurden und welche einseitig oder beidseitig von Adaptersequenzen flankiert sind. Bei dieser Anwendung werden von der oder den eingesetzten Typ IIs-Restriktionsendonukleasen überhängende Enden erzeugt, deren Sequenz nicht unmittelbar durch die Restriktionsendonuklease, sondern durch die Nukleinsäuresequenz der Schnittstelle determiniert wird und die sich folglich von Fragment zu Fragment unterscheiden können. Gewünschtenfalls können zur Befestigung Adapter eingesetzt werden, welche sich lediglich an bestimmten überhängenden Enden befestigen lassen, insbesondere an solchen, deren Nukleotidsequenz komplementär ist zur Nukleotidsequenz der überhängenden Adapter-Enden. Auf diese Weise ist es möglich, bestimmte vorausgewählte Adapter lediglich an einem Teil aller Nukleinsaurefragmente zu befestigen und somit eine Teilmenge der eingesetzten Mischung von Nukleinsaurefragmenten zu erzeugen (sog. "molekulare Indexierung", vgl. Kato, Nucleic Acids Res. 1996, Jan. 15, 24 (2): 394-395, sowie WO 94/01582).In a further embodiment of the method according to the invention, fragments are used as a mixture of nucleic acid fragments which were generated by restriction digestion with at least some of the type IIs restriction endonucleases from genomic or cDNA and which are flanked on one or both sides by adapter sequences. In this application, overhanging ends are produced from the type IIs restriction endonucleases used, the sequence of which is not determined directly by the restriction endonuclease, but by the nucleic acid sequence of the interface and which can consequently differ from fragment to fragment. If desired, adapters can be used for attachment which can only be attached to certain overhanging ends, in particular those whose nucleotide sequence is complementary to the nucleotide sequence of the overhanging adapter ends. In this way it is possible to attach certain preselected adapters to only a part of all nucleic acid fragments and thus to generate a subset of the mixture of nucleic acid fragments used (so-called "molecular indexing", see Kato, Nucleic Acids Res. 1996, Jan. 15 , 24 (2): 394-395, and WO 94/01582).
In einer besonders bevorzugten Ausführungsform werden die erforderlichen enzymatischen Reaktionsansätze mittels eines Pipettierautomaten erstellt.In a particularly preferred embodiment, the required enzymatic reaction batches are created using an automatic pipetting device.
In einer weiteren besonders bevorzugten Ausführungsform werden die mittels Gelelektrophorese, vorzugsweise mittels Kapillargelelektrophorese, erhaltenen Fluorogramme automatisch ausgewertet. Bei dieser Auswertung werden mittels eines Computersystems zueinander gehörige Signale verschiedener Fluorogramme einander zugeordnet, die (i) homologe Fragmente aus verschiedenen Mischungen von Nukleinsäure- Fragmenten, (ii) Fragmente einer Nukleinsäuremischung und die Reaktionsprodukte, welche zur Identifikation eines oder mehrerer Nukleotide der Fragmente dieser Mischung erhalten wurden, (iii) Reaktionsprodukte, welche zur Identifikation mehrerer Nukleotide der Fragmente einer Mischung von Nukleinsäure-Fragmenten erhalten wurden, repräsentieren. Eine solche automatische Zuordnung kann beispielsweise nach folgender Anweisung erfolgen:In a further particularly preferred embodiment, the fluorograms obtained by means of gel electrophoresis, preferably by means of capillary gel electrophoresis, are automatically evaluated. In this evaluation, a Signals of different fluorograms belonging to one another are assigned to the computer system, which (i) homologous fragments from different mixtures of nucleic acid fragments, (ii) fragments of a nucleic acid mixture and the reaction products which were obtained for the identification of one or more nucleotides of the fragments of this mixture, (iii) Reaction products, which were obtained for the identification of several nucleotides of the fragments of a mixture of nucleic acid fragments, represent. Such an automatic assignment can take place, for example, according to the following instruction:
1. Wähle ein geeignetes Startsignal, das noch in keiner Zuordnung enthalten ist,1. Choose a suitable start signal that is not yet included in any assignment,
2. Suche nach dem hierzu am besten passenden Signal, wobei die Kriterien (a) möglichst geringer Unterschied der ermittelten Fragmentlänge und (b) möglichst geringer Unterschied in der Signalintensität sind und wobei diese beiden Kriterien in frei wählbarer Gewichtung eingehen können, 3. Wiederhole Schritt (2), wobei jedes zusätzliche Signal mit dem Mittelwert aus2. Search for the most suitable signal for this, the criteria being (a) the smallest possible difference in the determined fragment length and (b) the smallest possible difference in the signal intensity and where these two criteria can be freely weighted, 3. Repeat step (2), taking each additional signal with the mean
Fragmentlänge und Signalintensität aller bisher zugeordneten Signale verglichen wird, 4. Breche den Vorgang ab, wenn die Unterschiede aus (2) einen vorgewähltenFragment length and signal intensity of all previously assigned signals is compared, 4. Cancel the process if the differences from (2) a preselected one
Schwellenwert überschreiten. 5. Wiederhole Schritt (1) bis (3), bis alle Signale eines Satzes von einander zuzuordnenden Fluorogrammen einander zugeordnet worden sind oder als nicht einander zuordenbar erkannt worden sind.Exceed threshold. 5. Repeat steps (1) to (3) until all signals of a set of fluorograms to be assigned to one another have been assigned to one another or have been identified as being not assignable to one another.
Weiterhin ist bevorzugt, daß die automatische Auswertung die Durchführung der Schritte (dl), (el), (gl), (hl), (il), öl), (kl), (ml), (c2), (d2), (e2), (f2), (g2), (h2), (i2), (12), (m2), (n2) und/oder (o2) umfaßt.It is further preferred that the automatic evaluation carry out the steps (dl), (el), (gl), (hl), (il), oil), (kl), (ml), (c2), (d2) , (e2), (f2), (g2), (h2), (i2), (12), (m2), (n2) and / or (o2).
Nachfolgend wird die Erfindung durch die Zeichnungen näher erläutert. Es zeigenThe invention is explained in more detail below by the drawings. Show it
Fig. 1: die Erzeugung adapterflankierter Nukleinsaurefragmente,1: the generation of adapter-flanked nucleic acid fragments,
Fig. 2: die Sequenzierung überhängender Fragmentenden mittels Adapterligation, Fig. 3: die Erzeugung verschiedener überhängender Enden durch Verkürzung eines Nukleinsäurefragments,2: the sequencing of overhanging fragment ends by means of adapter ligation, 3: the generation of various overhanging ends by shortening a nucleic acid fragment,
Fig. 4: die Identifikation eines Nukleotidsfür alle Fragmente einer Mischung von Nukleinsaurefragmenten, Fig. 5: die Identifikation von vier Nukleotide für alle Fragmente einer Mischung von Nukleinsaurefragmenten.Fig. 4: the identification of a nucleotide for all fragments of a mixture of nucleic acid fragments, Fig. 5: the identification of four nucleotides for all fragments of a mixture of nucleic acid fragments.
Fig. 6: die Auftrennung einer Mischung von Nukleinsäure-Fragmenten mittels Kapillargelelektrophorese,6: the separation of a mixture of nucleic acid fragments by means of capillary gel electrophoresis,
Fig. 7: die Identifikation mehrerer Nukleotide eines Nukleinsäurefragments mittels Kapillargelelektrophorese,7: the identification of several nucleotides of a nucleic acid fragment by means of capillary gel electrophoresis,
Fig. 8: eine Auflistung einiger aus einer Suspensionskultur von Saccharomyces cerevisiae gewonnenen Signaturen.8: a list of some signatures obtained from a suspension culture of Saccharomyces cerevisiae.
Fig. 9: zeigt die Identifikation mehrerer Nukleotide von vier Nukleinsaurefragmenten einer Mischung von Nukleinsaurefragmenten.9: shows the identification of several nucleotides of four nucleic acid fragments of a mixture of nucleic acid fragments.
Fig. 1 zeigt die Erzeugung adapterflankierter Nukleinsaurefragmente, wobei 1 die Fragmentierung einer Nukleinsäurepräparation mittels zweier1 shows the generation of adapter-flanked nucleic acid fragments, 1 the fragmentation of a nucleic acid preparation by means of two
Restriktionsendonukleasen, undRestriction endonucleases, and
2 die Befestigung von Adaptern an den Fragmentenden darstellt.2 illustrates the attachment of adapters to the fragment ends.
Fig. 2 zeigt die Sequenzierung überhängender Fragmentenden mittels Adapterligation, wobei2 shows the sequencing of overhanging fragment ends by means of adapter ligation, wherein
1 die Sequenzierung der ersten Position der überhängenden Enden, und1 sequencing the first position of the overhanging ends, and
2 die Sequenzierung der zweiten Position der überhangenden Enden zeigt. Es ist die Sequenzierung eines das 3 '-Ende eines cDNA-Moleküls repräsentierenden Nukleinsäurefragments gezeigt. Die zur Sequenzierung eingesetzten Adapter zeichnen sich durch verschiedene Sequenz der überhängendenden Enden sowie durch verschiedene Markierungsgruppen aus, welche für die Sequenz des jeweiligen überhängenden Endes codieren. Eine die Base A anzeigende Markierungsgruppe wird durch einen gepunkteten Adapter, eine ein C anzeigende Markierung durch einen schraffierten Adapter, eine ein G anzeigende Markierung durch einen ausgefüllten Adapter und eine ein T anzeigende Markierung durch einen kreuzschraffierten Adapter angezeigt. Eine in (1) durch Ligation am Fragment befestigte, ein T anzeigende Markierungsgruppe zeigt an, daß es sich bei der ersten Base des Überhangs um die hierzu komplementäre Base A handelt. Eine in (2) durch Ligation am Fragment befestigte, ein C anzeigende Markierungsgruppe zeigt an, daß es sich bei der zweiten Base des Überhangs um die hierzu komplementäre Base G handelt.Figure 2 shows sequencing of the second position of the overhanging ends. Sequencing of a nucleic acid fragment representing the 3 'end of a cDNA molecule is shown. The one for sequencing The adapters used are distinguished by a different sequence of the overhanging ends and by different marker groups which code for the sequence of the respective overhanging end. A marker group indicating the base A is indicated by a dotted adapter, a marker indicating a C by a hatched adapter, a marker indicating a G by a filled adapter and a marker indicating a T by a cross-hatched adapter. A marker group attached to the fragment in (1) by ligation and indicating a T indicates that the first base of the overhang is the complementary base A. A labeling group attached to the fragment in (2) by ligation and indicating a C indicates that the second base of the overhang is the base G complementary thereto.
Fig. 3 stellt die Erzeugung verschiedener überhängender Enden durch Verkürzung eines Nukleinsäurefragments dar, wobeiFIG. 3 shows the generation of various overhanging ends by shortening a nucleic acid fragment, wherein
1 die Befestigung dreier verschiedener, jeweils an unterschiedlicher Position eine Erkennungsstelle (schraffierter Bereich) für eine Typ IIS- Restriktionsendonuklease enthaltender Adapter,1 the attachment of three different adapters, each with a recognition site (hatched area) at a different position, for a type IIS restriction endonuclease,
2 die Inkubation der Befestigungsprodukte mit besagter Typ IIS- Restriktionsendonuklease, und2 the incubation of the fastening products with said type IIS restriction endonuclease, and
3 die Freisetzung verkürzter überhängender Fragmentenden zeigt, welche in Bezug auf den doppelsträngigen Bereich des Ausgangsfragments die Positionen -5 und -6 (links), -3 und -4 (Mitte) sowie -1 und -2 (rechts) in terminal-einzelsträngiger und damit einer Sequenzierung über Adapterligation zugänglicher Form enthalten, zeigt. Als Ausgangsfragment ist hier ein mittels der Restriktionsendonuklease Mbol gewonnenes 3 '-cDNA-Fragment dargestellt.3 shows the release of shortened overhanging fragment ends which, with respect to the double-stranded region of the starting fragment, positions -5 and -6 (left), -3 and -4 (middle) and -1 and -2 (right) in terminal single-stranded and thus contain sequencing accessible via adapter ligation. A 3 'cDNA fragment obtained by means of the restriction endonuclease Mbol is shown here as the starting fragment.
Fig. 4 beschreibt die Identifikation einer Base für alle Fragmente einer Mischung von Nukleinsaurefragmenten. Die Fragmente werden mit fluoreszenten Markierungsgruppen versehen und mittels Kapillargelelektrophorese nach ihrer Mobilität aufgetrennt. Das resultierende Fluorogramm (oben dargestellt) wird zu einer Katalogisierung der Fragmente (Vergabe durchlaufender Nummern) eingesetzt. Danach werden für die zu bestimmende Position der Fragmente gemäß obiger Beschreibung die dort befindlichen Nukleotide identifiziert. Nach Durchführung der entsprechenden Reaktionen, bei denen die Identität besagter Nukleotide mittels Einführung nukleotidspezifischer Markierungsgruppen codiert wird, werden die Produkte ebenfalls mittels Kapillargelelektrophorese aufgetrennt, und die Identität der eingeführten Markierungsgruppen unter Berücksichtigung von Mobilität und gegebenenfalls Signalintensität ermittelt. Die Identifikation der interessierenden Base ergibt „G" für Fragment 3, „A" für Fragment 2, „T" für Fragmente 1 und 6, sowie „C" für die Fragmente 4, 5 und 7.4 describes the identification of a base for all fragments of a mixture of nucleic acid fragments. The fragments are provided with fluorescent labeling groups and separated according to their mobility by means of capillary gel electrophoresis. The resulting fluorogram (shown above) is used to catalog the fragments (assign consecutive numbers). Then the nucleotides located there for the position of the fragments to be determined, as described above identified. After carrying out the corresponding reactions, in which the identity of said nucleotides is coded by introducing nucleotide-specific labeling groups, the products are also separated by means of capillary gel electrophoresis, and the identity of the labeling groups introduced is determined taking mobility and signal intensity into account, if appropriate. The identification of the base of interest results in "G" for fragment 3, "A" for fragment 2, "T" for fragments 1 and 6, and "C" for fragments 4, 5 and 7.
Fig. 5 zeigt die Identifikation von vier Nukleotidenfür alle Fragmente einer Mischung von Nukleinsaurefragmenten (Fragmente 1-7). Im Falle der direkten Aufeinanderfolge der vier Nukleotide ergeben sich folgende Sequenzsignaturen:Figure 5 shows the identification of four nucleotides for all fragments of a mixture of nucleic acid fragments (fragments 1-7). In the case of a direct succession of the four nucleotides, the following sequence signatures result:
Fragment 1: TGT AFragment 2: ATGAFragment 1: TGT AFragment 2: ATGA
Fragment 3: GATGFragment 3: GATG
Fragment 4: CCGT Fragment 5: CACCFragment 4: CCGT Fragment 5: CACC
Fragment 6: TGATFragment 6: TGAT
Fragment 7: CTCCFragment 7: CTCC
Fig. 6 zeigt die Auftrennung einer Mischung von Nukleinsäure-Fragmenten mittels Kapillargelelektrophorese. Es wurden wie beschrieben cDNA-Fragmente aus einer Suspensionskultur von Saccharomyces cerevisiae erzeugt. Es sind die von einer stationären Phase (grau) sowie einer in der logarithmischen Phase (schwarz) befindlichen Kultur erhaltenen Signale gezeigt. Einige der Fragmente repräsentieren konstitutiv exprimierte Gene (mit „C" markierte Signale = constitutively expressed), andere in der stationären Phase herunterregulierte Gene (mit „D" markierte Signale = downregulated) und wieder andere in der stationären Phase heraufregulierte Gene (mit „U" markiertes Signal = upregulated). Die horizontale Skala zeigt die Fragmentgröße, die vertikale Skala gibt die Fluoreszenzintensität an.6 shows the separation of a mixture of nucleic acid fragments by means of capillary gel electrophoresis. As described, cDNA fragments were generated from a suspension culture of Saccharomyces cerevisiae. The signals obtained from a stationary phase (gray) and from a culture in the logarithmic phase (black) are shown. Some of the fragments represent constitutively expressed genes (signals marked with "C" = constitutively expressed), others genes downregulated in the stationary phase (signals marked with "D" = downregulated) and still others genes upregulated in the stationary phase (with "U" marked signal = upregulated) The horizontal scale shows the fragment size, the vertical scale shows the fluorescence intensity.
Fig. 7 zeigt die Identifikation mehrerer Nukleotide eines Nukleinsäurefragments mittels Kapillargelelektrophorese. E, eines der Fragmente aus einer Mischung von Nukleinsäure- Fragmenten, B1-B16, Identifikation der ersten bis sechzehnten Base des Fragments, FAM, PET, VIC, NED, das jeweilige bei der Identifikation einer Base detektierte Fluorophor, (G), (A), (T), (C), die mittels des jeweiligen Fluorophors identifizierte Base. Für das ausgewählte Fragment ergibt sich die Signatur GATCTCACAAATGGTT. Die Leiste am oberen Rand zeigt die Fragmentgröße, es handelt sich also um ein Fragment einer Größe von ungefähr 140 bp.7 shows the identification of several nucleotides of a nucleic acid fragment by means of capillary gel electrophoresis. E, one of the fragments from a mixture of nucleic acid fragments, B1-B16, identification of the first to sixteenth base of the fragment, FAM, PET, VIC, NED, the respective fluorophore detected during the identification of a base, (G), (A ), (T), (C), the base identified by means of the respective fluorophore. For the selected fragment results in the signature GATCTCACAAATGGTT. The bar at the top shows the fragment size, so it is a fragment with a size of approximately 140 bp.
Fig. 8 zeigt eine Auflistung einiger aus einer Suspensionskultur von Saccharomyces cerevisiae gewonnenen Signaturen. Angebeben sind jeweils die Fragmentgröße, die gemäß dem erfindungsgemäßen Verfahren ermittelten Signaturen, die mittels BLAST-Analyse identifizierten open reading frames (ORFs) sowie die mittels Kapillargelekektrophorese erhaltene Signalintensität.8 shows a list of some signatures obtained from a suspension culture of Saccharomyces cerevisiae. The fragment size, the signatures determined according to the method according to the invention, the open reading frames (ORFs) identified by means of BLAST analysis and the signal intensity obtained by means of capillary gel electrophoresis are to be specified in each case.
Fig. 9 zeigt die Identifikation mehrerer Nukleotide von vier Nukleinsaurefragmenten einer Mischung von Nukleinsaurefragmenten. Die Fragmente haben eine ungefähre Länge von 75 bp, 77 bp, 78 bp und 79 bp. F, aufgetrennte Fragmente der Mischung, B1-B6, Identifikation der ersten bis sechsten Base der Fragmente, FAM, PET, VIC, NED, das jeweilige bei der Identifikation einer Base detektierte Fluorophor, (G), (A), T), (C), die mittels des jeweiligen Fluorophors identifizierte Base. Für das Fragment der Länge 75 bp ergibt sich die Signatur TCATTG, für das Fragment der Länge 77 bp ergibt sich die Signatur ACTGGC, für das Fragment der Länge 78 bp ergibt sich die Signatur ATGCCT, und für das Fragment der Länge 79 bp ergibt sich die Signatur TATGCT. 9 shows the identification of several nucleotides of four nucleic acid fragments of a mixture of nucleic acid fragments. The fragments are approximately 75 bp, 77 bp, 78 bp and 79 bp in length. F, separated fragments of the mixture, B1-B6, identification of the first to sixth bases of the fragments, FAM, PET, VIC, NED, the respective fluorophore detected when identifying a base, (G), (A), T), ( C), the base identified by means of the respective fluorophore. The signature TCATTG results for the fragment with a length of 75 bp, the signature ACTGGC for the fragment with a length of 77 bp, with the signature ATGCCT for the fragment with a length of 78 bp, and for the fragment with a length of 79 bp Signature TATGCT.
Die Erfindung wird weiterhin durch die nachfolgenden Beispiele näher erläutert.The invention is further illustrated by the following examples.
Beispiel 1: Gewinnung von cDNA-3 '-RestriktionsfragmentenExample 1: Collection of cDNA 3 'restriction fragments
25 μg Gesamt-RNA aus einer Suspensionskultur von Saccharomyces cerevisiae wurde mit Ethanol gefallt und in 15,5 μl Wasser gelöst. Es wurden 0,5 μl 10 μM cDNA-Primer CP31V (5 -ACCTACGTGCAGATTTTTTTTTTTTTTTTTTV-3', SEQ ID NO: 1) hinzugegeben, 5 Minuten bei 65°C denaturiert und auf Eis gestellt. Die Mischung wurde mit 3 μl 100 mM Dithiothreitol (Life Technologies GmbH, Karlsruhe), 6 μl 5x Superscript-Puffer (Life Technologies GmbH, Karlsruhe), 1,5 μl 10 mM dNTPs, 0,6 μl RNase Inhibitor (40 U/μl; Röche Molecular Biochemicals) und 1 μl Superscript II (200 U/μl, Life Technologies) versetzt und zur cDNA-Erststrangsynthese 1 Stunde bei 42°C inkubiert. Zur Zweitstrangsynthese wurden 48 μl Zweitstrang-Puffer (vgl. Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons), 3,6 μl 10 mM dNTPs, 148,8 μl H2O, 1,2 μl RNaseH (1,5 U/μl, Promega) und 6 μl DNA Polymerase I (New England Biolabs GmbH, Schwalbach, 10 U/μl) hinzugefügt und die Reaktionen 2 Stunden bei 22°C inkubiert. Es wurde mit 100 μl Phenol, dann mit 100 μl Chloroform extrahiert und mit 0,1 Vol. Natriumacetat pH 5,2 und 2,5 Vol. Ethanol gefallt. Nach Zentrinigation für 20 Minuten bei 15.000 g und Waschen mit 70% Ethanol wurde das Pellet in einem Restriktionsansatz aus 15 μl lOx Universal buffer, 1 μl Mbol und 84 μl H2O gelöst und die Reaktion 1 Stunde bei 37°C inkubiert. Es wurde mit Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Das Pellet wurde in einem Ligationsansatz aus 0,6 μl lOx Ligationspuffer (Röche Molecular Biochemicals), 1 μl 10 mM ATP (Röche Molecular Biochemicals), 1 μl Linker ML2025 (hergestellt durch Hybridisierung von Oligonukleotiden ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) und LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC-3', SEQ ID NO: 3)), 6,9 μl H2O und 0,5 μl T4 DNA Ligase (1 U/μl; Röche Molecular Biochemicals) gelöst und die Ligation über Nacht bei 16°C durchgeführt. Die Ligationsreaktion wurde mit Wasser auf 100 μl aufgefüllt, mit Phenol, dann mit Chloroform extrahiert und nach Zugabe von 1 μl Glycogen (20 mg/ml, Röche Molecular Biochemicals) mit 100 μl 28% Polyethylenglycol 8000 (Promega)/10 mM MgCl2 gefällt. Das Pellet wurde mit 70% Ethanol gewaschen und in 40 μl Wasser aufgenommen. Beispiel 2: Amplifikation von cDNA-3 '-Restriktionsfragmenten unter Aufteilung in Subpools25 μg of total RNA from a suspension culture of Saccharomyces cerevisiae was precipitated with ethanol and dissolved in 15.5 μl of water. 0.5 μl of 10 μM cDNA primer CP31V (5 -ACCTACGTGCAGATTTTTTTTTTTTTTTTTTV-3 ', SEQ ID NO: 1) were added, denatured for 5 minutes at 65 ° C. and placed on ice. The mixture was mixed with 3 ul 100 mM dithiothreitol (Life Technologies GmbH, Karlsruhe), 6 ul 5x Superscript buffer (Life Technologies GmbH, Karlsruhe), 1.5 ul 10 mM dNTPs, 0.6 ul RNase inhibitor (40 U / ul ; Röche Molecular Biochemicals) and 1 μl Superscript II (200 U / μl, Life Technologies) and incubated at 42 ° C. for 1 hour for cDNA first strand synthesis. For the second strand synthesis, 48 μl of second strand buffer (see Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons), 3.6 μl of 10 mM dNTPs, 148.8 μl of H 2 O, 1.2 were used μl RNaseH (1.5 U / μl, Promega) and 6 μl DNA Polymerase I (New England Biolabs GmbH, Schwalbach, 10 U / μl) were added and the reactions were incubated at 22 ° C. for 2 hours. It was extracted with 100 μl phenol, then with 100 μl chloroform and precipitated with 0.1 vol. Sodium acetate pH 5.2 and 2.5 vol. Ethanol. After centrifugation for 20 minutes at 15,000 g and washing with 70% ethanol, the pellet was dissolved in a restriction mixture consisting of 15 μl 10X universal buffer, 1 μl Mbol and 84 μl H 2 O and the reaction was incubated at 37 ° C. for 1 hour. It was extracted with phenol, then with chloroform and precipitated with ethanol. The pellet was prepared in a ligation mixture from 0.6 μl lOx ligation buffer (Röche Molecular Biochemicals), 1 μl 10 mM ATP (Röche Molecular Biochemicals), 1 μl linker ML2025 (produced by hybridization of oligonucleotides ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) and LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC-3 ', SEQ ID NO: 3)), 6.9 μl H 2 O and 0.5 μl T4 DNA ligase (1 U / μl; Röche Molecular Biochemicals) dissolved and the ligation performed overnight at 16 ° C. The ligation reaction was made up to 100 μl with water, extracted with phenol, then with chloroform and, after addition of 1 μl glycogen (20 mg / ml, Röche Molecular Biochemicals), precipitated with 100 μl 28% 8000 polyethylene glycol (Promega) / 10 mM MgCl 2 , The pellet was washed with 70% ethanol and taken up in 40 ul water. Example 2: Amplification of cDNA-3 'restriction fragments divided into subpools
Zur ersten Runde Amplifikation wurden PCR-Ansätze hergestellt, enthaltend 2 μl gefällter Ligationsreaktion aus Beispiel 1, 2 μl lOx PCR-Puffer (670 mM Tris-Cl, pH 8,8, 170 mMFor the first round of amplification, PCR batches were prepared, containing 2 μl of the ligation reaction from example 1, 2 μl of 10 × PCR buffer (670 mM Tris-Cl, pH 8.8, 170 mM
(NHt)2SO4, 1% (v/v) Tween 20), 1,5 μl 20 mM MgCl2, 0,4 μl 10 mM dNTPs, 2 μl(NH t ) 2 SO 4 , 1% (v / v) Tween 20), 1.5 ul 20 mM MgCl 2 , 0.4 ul 10 mM dNTPs, 2 ul
RediLoad (Invitrogen GmbH, Karlsruhe), 0,2 μl Taq DNA Polymerase (Röche MolecularRediLoad (Invitrogen GmbH, Karlsruhe), 0.2 μl Taq DNA polymerase (Röche Molecular
Biochemicals), 1 μl 4 μM Oligonukleotidprimer CP31XiX2 (5'-ACCTACGTGCAGA ττττττττττττττττττχ χ2_3 , mit X] = Gj A oder Cj χ2 = Q, A, T oder C; SEQ ID NO: 4), 1 μl 4 μM Oligonukleotidprimer ML20 und 9,9 μl Wasser. Es wurden mit allen 12 Reaktionen ewe^s einen der 12 möglichen CP31X1X2-Primer enthaltend) 25 Amplifikationszyklen durchgeführt, bestehend je aus den Phasen Denaturierung (30 sec. 94°C), Annealing (30 sec. 65°C) und Extension (2 min. 72°C). Je 5 μl der Reaktionen wurden mittels Elektrophorese durch ein l,5%iges Agarosegel überprüft. Die Reaktionen wurden mit Wasser auf 100 μl verdünnt. Es wurden weitere PCR-Ansätze hergestellt, enthaltend 2 μl verdünnter Amplifikationsreaktion, 2 μl lOx PCR-Puffer, 1,5 μl 20 mM MgCl2, 0,4 μl 10 mM dNTPs, 2 μl RediLoad, 0,2 μl Taq DNA Polymerase, 1 μl 4 μM Oligonukleotidprimer CP31VNX3X4 (5'-ACCTACGTGCAGATTTTTTTTTTTTTTTTTT VNXs t-3 ' mit V = Mischung aus G, A und C, N = Mischung aus G, A, T und C, X3, X4 = G, A, T oder C; SEQ ID NO: 5), 1 μl 4 μM Oligonukleotidprimer ML20 und 9,9 μl Wasser. Je nach geplanter Weiterverarbeitung der Ansätze wies Primer ML20 eine Fluoreszenzmarkierung auf (ausgewählt aus einem der Farbstoff-Sets 5'-FAM, 5 '-JOE, 5'- ROX und 5 '-TAMRA [Farbstoff-Set 1] oder 5'-FAM, 5'-VIC, 5'-NED und 5'-PET [Farbstoff-Set 2]; Weiterverarbeitung der Proben gemäß Beispiel 3), oder ML20 wurde unmarkiert eingesetzt (Weiterverarbeitung der Proben gemäß Beispiel 4 bzw. Beispiel 5). Es wurden mit allen 2x192 Reaktionen öe eils eme der 12 möglichen verdünnten Amplifikationsreaktionen sowie einen der 16 möglichen CP31VNX3X4-Primer enthaltend; 12 x 16 = 192; ML20 jeweils markiert oder unmarkiert) 25 Amplifikationszyklen durchgeführt, bestehend je aus den Phasen Denaturierung (30 sec. 94°C), Annealing (30 sec. 65°C) und Extension (2 min. 72°C). Es wurden wiederum je 5 μl der Reaktionen mittels Agarosegelelektrophorese überprüft. Die restlichen Reaktionsansätze wurden mittels QiaQuick-Säulen (Qiagen AG, Hilden) gemäß Herstellerangaben gereinigt; die Elution erfolgte in je 50 μl Wasser. Es wurde eine photometrische Mengenbestimmung durchgeführt. Beispiel 3: Auftrennung und Darstellung der fluoreszenzmarkierten Amplifikations- produkte mittels KapillargelelektrophoreseBiochemicals), 1 μl 4 μM oligonucleotide primer CP31XiX 2 (5'-ACCTACGTGCAGA ττττττττττττττττττχ χ2 _ 3 , with X] = Gj A or Cj χ 2 = Q , A, T or C; SEQ ID NO: 4M , 1 μl Oligonucleotide primer ML20 and 9.9 μl water. There were 1 X 2 primer comprising performed with all 12 reactions ewe ^ s one of the 12 possible CP31X) 25 cycles of amplification consisting per sec from the phases of denaturation (30. 94 ° C), annealing (30 sec. 65 ° C) and Extension (2 min. 72 ° C). 5 μl each of the reactions were checked by electrophoresis through a 1.5% agarose gel. The reactions were diluted to 100 ul with water. Further PCR batches were prepared, containing 2 μl diluted amplification reaction, 2 μl 10 × PCR buffer, 1.5 μl 20 mM MgCl 2 , 0.4 μl 10 mM dNTPs, 2 μl RediLoad, 0.2 μl Taq DNA polymerase, 1 μl 4 μM oligonucleotide primer CP31VNX 3 X 4 (5'-ACCTACGTGCAGATTTTTTTTTTTTTTTTTT VNXs t -3 'with V = mixture of G, A and C, N = mixture of G, A, T and C, X 3 , X4 = G, A , T or C; SEQ ID NO: 5), 1 μl 4 μM oligonucleotide primer ML20 and 9.9 μl water. Depending on the planned further processing of the batches, Primer ML20 had a fluorescent label (selected from one of the dye sets 5'-FAM, 5 '-JOE, 5'-ROX and 5' -TAMRA [dye set 1] or 5'-FAM , 5'-VIC, 5'-NED and 5'-PET [dye set 2]; further processing of the samples according to Example 3), or ML20 was used unlabelled (further processing of the samples according to Example 4 or Example 5). There were ee ö with all 2x192 ils reactions of the 12 possible amplification reactions as well as a dilute the 16 possible CP31VNX 3 X eme 4 containing primers; 12 x 16 = 192; ML20 marked or unmarked) 25 amplification cycles were carried out, each consisting of the phases denaturation (30 sec. 94 ° C), annealing (30 sec. 65 ° C) and extension (2 min. 72 ° C). Again 5 μl of the reactions were checked by agarose gel electrophoresis. The remaining reaction batches were cleaned using QiaQuick columns (Qiagen AG, Hilden) in accordance with the manufacturer's instructions; elution was carried out in 50 μl water. A photometric determination of the amount was carried out. Example 3: Separation and display of the fluorescence-labeled amplification products by means of capillary gel electrophoresis
Je 2 μl der gereinigten fluoreszenzmarkierten Amplifikationsprodukte aus Beispiel 2 wurden mit 10 μl Wasser verdünnt und (im Fall der Verwendung von Farbstoff-Set 2 nach Zugabe von 0,5 μl GeneScan 500 LIZ Längenstandard [Applied Biosystems GmbH, Weiterstadt]) mittels eines ABI Prism 3100 Genetic Analyzers (Applied Biosystems) kapillargelelektrophoretisch aufgetrennt. Um durch „Multiplexing" einen höheren Durchsatz des Geräts zu erreichen, wurden in weiteren Ansätzen jeweils 1 μl FAM- markierter Amplifikationsprodukte, 1 μl VIC-markierter Amplifikationsprodukte, 1 μl NED-markierter Amplifikationsprodukte sowie 1 μl PET-markierter2 μl each of the purified fluorescence-labeled amplification products from Example 2 were diluted with 10 μl water and (in the case of using dye set 2 after adding 0.5 μl GeneScan 500 LIZ length standard [Applied Biosystems GmbH, Weiterstadt]) using an ABI prism 3100 Genetic Analyzers (Applied Biosystems) separated by capillary gel electrophoresis. In order to achieve a higher throughput of the device by “multiplexing”, 1 μl of FAM-labeled amplification products, 1 μl of VIC-labeled amplification products, 1 μl of NED-labeled amplification products and 1 μl of PET-labeled were used in further batches
Amplifikationsprodukte vermischt, mit 0,5 μl LIZ-Längenstandard sowie 7,5 μl Wasser versetzt und zur Elektrophorese eingesetzt. Ein „Multiplexing" unter Einsatz von Farbstoff-Set 1 erfolgte sinngemäß; hierbei wurden mit FAM, JOE oder TAMRA markierte Fragmente mit GeneScan 500 ROX-Längenstandard vermischt. Darstellung und Auswertung der Fluorogramme erfolgte mittels der Software GeneScan Version 3.7 für Windows NT (Applied Biosystems). Zur Identifikation differentiell exprimierter Gene wurden mit RNA-Präparationen von in verschiedenen Wachstumsstadien befindlichen Hefezellen, aber mit den gleichen Amplifikationsprimern der ersten sowie der zweiten Amplifikationsrunde erhaltene Fluorogramme miteinander verglichen. Hierzu wurden die Fluorogramme mittels GeneScan zur Deckung gebracht und visuell auf Unterschiede in den erhaltenen Signalmustern untersucht. Für Vergleiche dieser Art wurde zunächst mittels der GeneScan-Funktion „align data by size" dafür Sorge getragen, daß zueinander „passende" (also das gleiche Gen/Transkript repräsentierende) Fragmente aus RNA- Präparationen verschiedener Wachstumsstadien einander zugeordnet werden konnten. Im nächsten Schritt wurde eine Normalisierung der Signalstärken durchgeführt, indem die Signale einer Probe in ihrer durchschnittlichen Höhe der Durchschnittssignalstärke einer hiermit zu vergleichenden Probe angepaßt wurden. Zur Identifikation differentiell exprimierter Gene wurden in miteinander verglichenen Proben auftretende, Fragmente identischer Größe und somit identische Transkripte repräsentierende Signale, deren Intensitäten sich nach Normalisierung um mindestens einen vorgewählten Faktor voneinander unterschieden, einschließlich der ermittelten Signatur tabelliert; hierbei wurden in einigen Fällen auch die zugehörigen Werten für Fragmentlänge (anhand des internen Längenstandards bestimmt), die Signalintensität sowie die Information über die eingesetzten Amplifikationsprimer einbezogen. Zur allgemeinen Transkriptomanalyse (also einer „Bestandsaufnahme" exprimierter Gene) wurde eine Tabellierung aller ermittelten Signaturen, unabhängig von relativen Signalstärken, vorgenommen.Amplification products mixed, mixed with 0.5 μl LIZ length standard and 7.5 μl water and used for electrophoresis. Multiplexing using dye set 1 was carried out analogously; fragments labeled with FAM, JOE or TAMRA were mixed with the GeneScan 500 ROX length standard. The fluorograms were displayed and evaluated using the GeneScan version 3.7 software for Windows NT (Applied Biosystems To identify differentially expressed genes, fluorograms obtained with RNA preparations from yeast cells in different growth stages, but with the same amplification primers of the first and the second round of amplification, were compared with one another. For this purpose, the fluorograms were matched using GeneScan and visually detected differences in the For comparisons of this type, the GeneScan function "align data by size" was first used to ensure that "matching" fragments from RNA preparations of different growths (ie representing the same gene / transcript) were used stadiums could be assigned to each other. In the next step, the signal strengths were normalized by adapting the average height of the signals of a sample to the average signal strength of a sample to be compared therewith. To identify differentially expressed genes, fragments of identical size and thus identical transcripts, which occur in comparing samples, and whose intensities differ from one another after normalization by at least a preselected factor, including the signature determined, were tabulated; In some cases, the associated values for fragment length (determined using the internal length standard), the signal intensity and the information about the amplification primers used were also included. For general transcriptome analysis (ie an "inventory" of expressed genes), all the signatures determined were tabulated, regardless of relative signal strengths.
Beispiel 4: Ermittlung terminaler Basen über LigationExample 4: Determination of terminal bases via ligation
Je 1 μg der gereinigten nicht fluoreszenzmarkierten Amplifikationsprodukte aus Beispiel 2 wurden mit 5 μl lOx NEBuffer 3 versetzt und mit Wasser auf 49 μl aufgefüllt. Es wurde 1 μl Mbόl (5 U/μl, New England Biolabs) hinzugefügt und 1 h bei 37°C inkubiert; dann wurde für 20 min. bei 65°C hitzeinkubiert. Die Reaktionen wurden mit TE-gesättigtem Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Die Pellets wurden in 20 μl eines Ligationsansatzes aufgenommen, enthaltend 1,2 μl lOx Ligationspuffer (Röche), 8 μl 0,5 μg/μl Eco57I-Linker öe eils ein Linker, ausgewählt aus ECO 1/2 bis ECO11/12; vgl. Tabelle 1; Herstellung der Linker durch Hybridisierung der jeweils angegebenen zueinander komplementären Oligonukleotide), sowie 1 μl T4 DNA-Ligase (1 U/μl, Röche). Es wurde über Nacht bei 16°C ligiert. Zur Amplifikation der Ligationsprodukte wurden 2 μl des Ligationsansatzes mit 2 μl 10 μM Amplifikationsprimer 1 (sequenzidentisch mit jeweils demjenigen Strang des Eco57l- Linkers, dessen 3 '-Ende mit den mit Mbol geschnittenen Fragmenten verknüpft worden war), 2 μl 10 μM CP31V, 5 μl lOx Advantage 2 Puffer (Clontech/BD Biosciences Europe, Heidelberg), 1 μl 10 mM dNTPs, 37 μl Wasser und 1 μl 50x Advantage 2 DNA Polymerase Mix (Clontech) vermischt, und es wurde unter folgenden Bedingungen amplifiziert: 2 min. 94°C initiale Denaturierung, dann 25 Zyklen bestehend aus 20 sec. 94°C Denaturierung, 30 sec. 65°C Annealing, 2 min. 72°C Extension. Nach Überprüfung der Amplifikation mittels Agarosegelelektrophorese wurden 10 μl der Amplifikationsprodukte mit 2,5 μl Buffer G+ +SAM (Fermentas GmbH, St. Leon-Rot), 0,25 μl 10 mg/ml BSA, 10,65 μl Wasser und 1,6 μl Eco57I (5 U/μl) vermischt. Es wurde 1 h bei 37°C inkubiert, dann für 20 min. bei 65 °C denaturiert. 6,5 μl dieser Reaktion wurden mit 1 μl 20 mM ATP, 2 μl 0,5 μg/μl Sequenzieradapter SO15NX oder SO15XN (vgl. Tabelle 2; Herstellung der Linker durch Hybridisierung der jeweils angegebenen zueinander komplementären Oligonukleotide) und 0,5 μl T4 DNA-Ligase (1 U/μl; Röche) vermischt und über Nacht bei 16°C inkubiert. Die Reaktionen wurden mit Wasser auf 50 μl verdünnt und mittels QiaQuick-Säulen gereinigt. Es wurde in 25 μl Wasser eluiert. Je 2,5 μl der gereinigten Amplifikationsansätze aus Beispiel 2 wurden mit 9,5 μl Wasser verdünnt und nach Zugabe von 0,5 μl GeneScan 500 LIZ Längenstandard (Applied Biosystems GmbH, Weiterstadt) mittels des ABI 3100 kapillargelelektrophoretisch aufgetrennt. Zur Auswertung wurden die Fluorogramme aus Beispiel 3 mit den zugehörigen Fluorogrammen aus Beispiel 4 miteinander verglichen. Zur Identifikation von Signalen in miteinander verglichenen Fluorogrammen, die dieselbe Fragmentspezies repräsentieren, wurden (1) Korrekturen des Fluorophor-spezifischen Laufverhaltens'sowie (2) Korrekturen der von ermittelter Base zu ermittelter Base zunehmenden Fragmentverkürzung vorgenommen (indem beispielsweise die Länge eines Fragments, bei welchem von der ursprünglichen Λ &oI-Erkennungsstelle ausgehend Base 3 und 4 durch Eco57I-Schnitt in einen einzelsträngigen Überhang umgewandelt worden waren, rechnerisch um +4 Basen korrigiert wurde und die Länge eines Fragments, bei welchem von der ursprünglichen wl-Erkennungsstelle ausgehend Base 5 und 6 durch Eco57l- Schnitt in einen einzelsträngigen Überhang umgewandelt worden waren, rechnerisch um +6 Basen korrigiert wurde). Dann wurde für alle zu einer Fragmentspezies (also ein in Beispiel 3 auftretendes Fragment sowie die zugehörigen, mittels Eco57l verkürzten und mit einem Sequenzieradapter versehenen Produkte aus Beispiel 4) gehörigen Signale einander zugeordnet und tabellarisch erfaßt, wobei weiterhin anhand des jeweiligen Fluorophors die jeweilig zu ermittelnde Basenidentität identifiziert wurde. Eine solche Tabelle kann beispielsweise das in Tabelle 3 angegebene Format aufweisen.1 μg each of the purified, non-fluorescence-labeled amplification products from Example 2 were mixed with 5 μl 10 × NEBuffer 3 and made up to 49 μl with water. 1 ul Mbόl (5 U / ul, New England Biolabs) was added and incubated for 1 h at 37 ° C; then for 20 min. heat incubated at 65 ° C. The reactions were extracted with TE-saturated phenol, then with chloroform and precipitated with ethanol. The pellets were taken up in 20 μl of a ligation batch, containing 1.2 μl lOx ligation buffer (Röche), 8 μl 0.5 μg / μl Eco57I linker and a linker selected from ECO 1/2 to ECO11 / 12; see. Table 1; Production of the linkers by hybridization of the respectively stated complementary oligonucleotides) and 1 μl T4 DNA ligase (1 U / μl, Röche). It was ligated at 16 ° C overnight. To amplify the ligation products, 2 μl of the ligation mixture were mixed with 2 μl of 10 μM amplification primer 1 (identical to the sequence of the strand of the Eco57l linker whose 3 ′ end had been linked to the fragments cut with Mbol), 2 μl of 10 μM CP31V, 5 μl 10 Advantage 2 buffer (Clontech / BD Biosciences Europe, Heidelberg), 1 μl 10 mM dNTPs, 37 μl water and 1 μl 50x Advantage 2 DNA Polymerase Mix (Clontech) mixed, and it was amplified under the following conditions: 2 min. 94 ° C initial denaturation, then 25 cycles consisting of 20 sec. 94 ° C denaturation, 30 sec. 65 ° C annealing, 2 min. 72 ° C extension. After checking the amplification by means of agarose gel electrophoresis, 10 μl of the amplification products were mixed with 2.5 μl buffer G + + SAM (Fermentas GmbH, St. Leon-Rot), 0.25 μl 10 mg / ml BSA, 10.65 μl water and 1. 6 ul Eco57I (5 U / ul) mixed. It was incubated at 37 ° C for 1 h, then for 20 min. denatured at 65 ° C. 6.5 μl of this reaction were mixed with 1 μl 20 mM ATP, 2 μl 0.5 μg / μl sequencing adapter SO15NX or SO15XN (cf. Table 2; preparation of the linkers by hybridization of the respectively complementary oligonucleotides indicated) and 0.5 μl T4 DNA ligase (1 U / ul; tubes) mixed and incubated overnight at 16 ° C. The reactions were diluted to 50 μl with water and purified using QiaQuick columns. It was eluted in 25 ul water. 2.5 μl each of the purified amplification batches from Example 2 were diluted with 9.5 μl water and, after adding 0.5 μl GeneScan 500 LIZ length standard (Applied Biosystems GmbH, Weiterstadt), using the ABI 3100 capillary gel electrophoresis separated. For the evaluation, the fluorograms from Example 3 were compared with the associated fluorograms from Example 4. To identify signals in fluorograms compared with one another, which represent the same fragment species, (1) corrections to the fluorophore-specific running behavior and (2) corrections to the fragment shortening increasing from the base to the base determined (by, for example, the length of a fragment in which base 3 and 4 starting from the original Λ & oI recognition site had been converted into a single-stranded overhang by Eco57I cut, had been mathematically corrected by +4 bases and the length of a fragment in which base 5 and 6 starting from the original wl recognition site had been converted into a single-stranded overhang by Eco57l cut, was mathematically corrected by +6 bases). Then all signals belonging to a fragment species (i.e. a fragment occurring in Example 3 and the associated products from Example 4 shortened by means of Eco57l and provided with a sequencing adapter) were assigned to one another and recorded in tabular form, with the respective fluorophore also being used to determine the respective one Base identity was identified. Such a table can, for example, have the format given in Table 3.
Die auf diese Weise erhaltenen cDNA-Teilsequenzen („Signaturen") wurden zur Identifikation der jeweiligen zugehörigen Gene für eine BLAST-Suche eingesetzt. Mittels der Tabelle 3 entnehmbaren cDNA-Signatur GATCTAGACAACCAAA ließ sich das Hefegen KTR4 (ORF YBR199W), codierend für eine putative alpha-1,2- Mannosyltransferase, identifizieren. Weitere Beispiele aus Hefe erhaltener Signaturen sind Figur 8 zu entnehmen. The partial cDNA sequences (“signatures”) obtained in this way were used to identify the relevant genes for a BLAST search. The cDNA signature GATCTAGACAACCAAA, which can be seen in Table 3, was used to code the yeast gene KTR4 (ORF YBR199W), coding for a putative Alpha-1,2-mannosyltransferase, Figure 8 shows further examples of signatures obtained from yeast.
Tabelle 1: Table 1:
Tabelle 2: Table 2:
Tabelle 3: Table 3:
Doppelsträngiger Anteil des Fragments nach rechnerischer Entfernung des Linkers, um den Beitrag des Fluorophors zur elektrophoretischen Fragmentmobilität korrigiert. Die Zahlenwerte dieses Beispiels beziehen sich auf die Verwendung von Eco57l, welches zweibasige Überhänge zur Identifikation jeweils zweier benachbarter Basen („Dubletts") erzeugt, sowie von Sequenzieradaptern, welche wahlweise die erste oder die zweite Base eines solchen Überhangs identifizieren. Zur Identifikation mehrerer aufeinanderfolgender Dubletts sind die in den Eco57I- Linkern liegenden Erkennungsstellen für Eco57l jeweils um zwei Basen gegeneinander versetzt. Reaktion gemäß Beispiel 3 resultiert aus der bekannten Erkennungsstelle von Mbol (vgl. Beispiel 1) Beispiel 5: Ermittlung terminaler Basen über ^//-/«-ReaktionDouble-stranded portion of the fragment after arithmetic removal of the linker to correct the contribution of the fluorophore to the electrophoretic fragment mobility. The numerical values of this example relate to the use of Eco57l, which generates two-base overhangs for the identification of two neighboring bases ("doublets"), and of sequencing adapters, which optionally identify the first or the second base of such an overhang. To identify several successive doublets the recognition sites for Eco57I in the Eco57I linkers are each offset by two bases, reaction according to example 3 results from the known recognition site of Mbol (cf. example 1) Example 5: Determination of terminal bases via ^ // - / «reaction
Je 1 μg der gereinigten nicht fluoreszenzmarkierten Amplifikationsprodukte aus Beispiel 2 wurden mit 5 μl lOx NEBuffer 3 versetzt und mit Wasser auf 49 μl aufgefüllt. Es wurde 1 μl Mbol (5 U/μl, New England Biolabs) hinzugefügt und 1 h bei 37°C inkubiert; dann wurde für 20 min. bei 65 °C hitzeinkubiert. Die Reaktionen wurden mit TE-gesättigtem Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Die Pellets wurden in 50 μl Mung Bean Nuclease Buffer (New England Biolabs) aufgenommen. Nach Zugabe von 1 μl Mung Bean Nuclease (lU/μl, New England Biolabs) wurde für 30 min. bei 30°C inkubiert. Es wurde 1 μl 0,5 M EDTA hinzugefügt, mit Phenol, dann mit Chloroform extrahiert und mit Ethanol gefallt. Es wurde in einem Ligationsansatz aus 7,5 μl 2x Ligationspuffer (New England Biolabs), 6,5 μl 0,5 μg/μl RceAI-Linker öeweils ein Linker, ausgewählt aus BCE1 bis BCE13; vgl. Tabelle 1; Herstellung der Linker durch Hybridisierung der jeweils angegebenen zueinander komplementären Oligonukleotide), sowie 2 μl Quick T4 DNA Ligase (New England Biolabs) gelöst und 1 h bei Raumtemperatur ligiert. Zur Amplifikation der Ligationsprodukte wurden 2 μl der Ligation mit 2 μl 10 μM Amplifikationsprimer 2 (sequenzidentisch mit jeweils demjenigen Strang des Bce AI-Linkers, dessen 3 '-Ende mit den mit Mbol geschnittenen Fragmenten verknüpft worden war), 2 μl 10 μM CP31, 5 μl lOx Advantage 2 Puffer, 1 μl 10 mM dNTPs, 37 μl Wasser und 1 μl 50x Advantage 2 DNA Polymerase Mix vermischt, und es wurde unter folgenden Bedingungen amplifiziert: 2 min. 94°C initiale Denaturierung, dann 25 Zyklen bestehend aus 20 sec. 94°C Denaturierung, 30 sec. 65°C Annealing, 2 min. 72°C Extension. Nach Überprüfung der Amplifikation mittels Agarosegelelektrophorese wurden 10 μl der Amplifikationsprodukte mit 3 μl NEBuffer BceAl (New England Biolabs), 0,3 μl 10 mg/ml BSA, 13,7 μl Wasser und 3 μl BceAl (1 U/μl) vermischt. Es wurde 4 h bei 37°C inkubiert, dann für 20 min. bei 65°C denaturiert. 9 μl dieser Reaktion wurden mit 1 μl ddNTP-Mix (je 10 mM FAM-ddATP, JOE-ddTTP, ROX-ddATP und TAMRA-ddCTP, PerkinElmer Life Sciences Inc., Boston) und 0,5 μl Klenow-Polymerase (5 U/μl, New England Biolabs) vermischt und 5 min. bei 37°C inkubiert. Nach Abstoppen mit EDTA und Hitzedenaturierung für 20 min. bei 75°C wurde mit Wasser auf 50 μl verdünnt und mittels QiaQuick- Säulen gereinigt. Auftrennung, Auswertung und Analyse der Daten wurden analog Beispiel 4 durchgeführt. 1 μg each of the purified, non-fluorescence-labeled amplification products from Example 2 were mixed with 5 μl 10 × NEBuffer 3 and made up to 49 μl with water. 1 ul Mbol (5 U / ul, New England Biolabs) was added and incubated for 1 h at 37 ° C; then for 20 min. heat incubated at 65 ° C. The reactions were extracted with TE-saturated phenol, then with chloroform and precipitated with ethanol. The pellets were taken up in 50 ul Mung Bean Nuclease Buffer (New England Biolabs). After adding 1 .mu.l Mung Bean Nuclease (1U / ul, New England Biolabs) was for 30 min. incubated at 30 ° C. 1 μl of 0.5 M EDTA was added, extracted with phenol, then with chloroform and precipitated with ethanol. In a ligation mixture consisting of 7.5 μl 2x ligation buffer (New England Biolabs), 6.5 μl 0.5 μg / μl RceAI linker, a linker was selected from BCE1 to BCE13; see. Table 1; Production of the linkers by hybridization of the respectively stated complementary oligonucleotides) and 2 μl of Quick T4 DNA ligase (New England Biolabs) dissolved and ligated for 1 h at room temperature. For the amplification of the ligation products, 2 μl of the ligation with 2 μl of 10 μM amplification primer 2 (identical in sequence to that strand of the Bce AI linker whose 3 ′ end had been linked to the fragments cut with Mbol), 2 μl of 10 μM CP31, 5 ul 10X Advantage 2 buffer, 1 ul 10mM dNTPs, 37 ul water and 1 ul 50x Advantage 2 DNA Polymerase Mix were mixed and amplified under the following conditions: 2 min. 94 ° C initial denaturation, then 25 cycles consisting of 20 sec. 94 ° C denaturation, 30 sec. 65 ° C annealing, 2 min. 72 ° C extension. After checking the amplification by means of agarose gel electrophoresis, 10 μl of the amplification products were mixed with 3 μl NEBuffer BceAl (New England Biolabs), 0.3 μl 10 mg / ml BSA, 13.7 μl water and 3 μl BceAl (1 U / μl). It was incubated at 37 ° C. for 4 h, then for 20 min. denatured at 65 ° C. 9 μl of this reaction were mixed with 1 μl ddNTP mix (10 mM FAM-ddATP, JOE-ddTTP, ROX-ddATP and TAMRA-ddCTP, PerkinElmer Life Sciences Inc., Boston) and 0.5 μl Klenow polymerase (5 U / μl, New England Biolabs) mixed and 5 min. incubated at 37 ° C. After stopping with EDTA and heat denaturation for 20 min. at 75 ° C., the mixture was diluted to 50 μl with water and cleaned using QiaQuick columns. Separation, evaluation and analysis of the data were carried out analogously to Example 4.

Claims

Patentansprüche claims
Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte: a) Bereitstellung mindestens einer Mischung von solchen Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen, b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt, c) Identifikation eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) und gegebenenfalls Identifikation weiterer fragmentspezifischer Eigenschaften der geschnittenen Nukleinsaurefragmente aus (b), wobei diese Identifikation(en) simultan für mehrere oder für alle Nukleinsaurefragmente erfolgen.A method for analyzing nucleic acid fragments, comprising the steps of: a) providing at least one mixture of those nucleic acid fragments which have at least one recognition site for a restriction endonuclease that cuts outside their recognition site, b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one a restriction endonuclease whose interface lies outside its recognition site, c) identification of one or more nucleotides of the cut nucleic acid fragments from (b) and optionally identification of further fragment-specific properties of the cut nucleic acid fragments from (b), these identification (s) being carried out simultaneously for several or for all Nucleic acid fragments are made.
Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte:Method for analyzing nucleic acid fragments, comprising the steps:
(a) Bereitstellung einer Mischung von Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen,(a) providing a mixture of nucleic acid fragments which have at least one recognition site for a restriction endonuclease which cuts outside its recognition site,
(b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt und welche überhängende Enden bekannter Position und Länge, aber unbekannter Sequenz erzeugt, (c) Identifikation jeweils eines oder mehrerer Nukleotide der überhängenden Enden der geschnittenen Nukleinsaurefragmente aus (b) und gegebenenfalls Identifikation weiterer fragmentspezifischer Eigenschaften der geschnittenen(b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site and which produces overhanging ends of known position and length, but unknown sequence, (c) identification of one or more nucleotides in each case the overhanging ends of the cut nucleic acid fragments from (b) and optionally identifying further fragment-specific properties of the cut
Nukleinsaurefragmente aus (b), wobei diese Identifikation(en) simultan für mehrere oder für alle Nukleinsaurefragmente erfolgen.Nucleic acid fragments from (b), these identification (s) being carried out simultaneously for several or for all nucleic acid fragments.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß im Rahmen der Identifikation in Schritt (c) zusätzlich die Auftrennung der geschnittenen Nukleinsaurefragmente nach fragmentspezifischen Eigenschaften erfolgt. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Auftrennung der geschnittenen Nukleinsaurefragmente nach fragmentspezifischen Eigenschaften durch Gelelektrophorese erfolgt.Method according to Claim 1 or 2, characterized in that the cut nucleic acid fragments are additionally separated according to fragment-specific properties as part of the identification in step (c). Method according to Claim 3, characterized in that the cut nucleic acid fragments are separated according to fragment-specific properties by gel electrophoresis.
Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Auftrennung durch Kapillarelektrophorese erfolgt.A method according to claim 4, characterized in that the separation is carried out by capillary electrophoresis.
Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß der Verfahrensschritt (c) die folgenden Einzelschritte (ca) bis (cd) umfaßt:Method according to one of claims 1 to 5, characterized in that process step (c) comprises the following individual steps (ca) to (cd):
ca) Identifikation jeweils eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cb) gegebenenfalls Identifikation jeweils eines weiteren Nukleotids der geschnittenenca) identification of a first nucleotide of the cut nucleic acid fragments from (b), the identification being carried out simultaneously for several or all nucleic acid fragments, cb) optionally identification of a further nucleotide of the cut nucleic acid
Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cc) gegebenenfalls Wiederholung von Schritt (cb), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, cd) Zusammenfassung der in den Schritten (ca) bis (cc) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, wobei die Nukleotid-Identifikation in den Schritten (ca) bis (cc) gegebenenfalls auch die Auftrennung der Nukleinsaurefragmente der Mischung mit umfaßt.Nucleic acid fragments from (b), the identification being carried out simultaneously for several or all nucleic acid fragments, cc) optionally repeating step (cb) until the desired number of nucleotides has been identified, cd) summarizing the steps (ca) to (cc ) obtained sequence information for a selected group or all nucleic acid fragments for fragment-specific signatures, whereby a signature can contain further information about the respective fragment in addition to the sequence information, the nucleotide identification in steps (ca) to (cc) possibly also Separation of the nucleic acid fragments of the mixture includes.
Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß eine von der in Schritt (b) zu inkubierenden Teilmenge verschiedene Teilmenge der in Schritt (a) bereitgestellten Mischung von Nukleinsaurefragmenten den folgendenMethod according to one of Claims 1 to 6, characterized in that a subset of the mixture of nucleic acid fragments provided in step (a) which differs from the subset to be incubated in step (b) does the following
Verfahrensschritten (aa) bis (ad) unterworfen wird: aa) Auftrennung der Mischung von Nukleinsaurefragmenten nach mindestens einer fragmentspezifischen Eigenschaft, ab) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der in (aa) aufgetrennten Mischung, ac) gegebenenfalls Vergleich der in (aa) und/oder (ab) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsaurefragmenten aus Schritt (a), ad) gegebenenfalls Registrierung von in (ab) detektierten Nukleinsaurefragmenten, welche in verschiedenen Mischungen von Nukleinsaurefragmenten in unterschiedlicher relativer Häufigkeit auftreten,Process steps (aa) to (ad) are subjected to: aa) separation of the mixture of nucleic acid fragments according to at least one fragment-specific property, ab) optionally detection of the relative frequency of some or all fragments in the mixture separated in (aa), ac) optionally comparison of the information obtained in (aa) and / or (ab) via the composition of different mixtures of nucleic acid fragments from step (a), ad) optionally registration of nucleic acid fragments detected in (ab) which occur in different mixtures of nucleic acid fragments with different relative frequencies,
während eine andere Teilmenge ausgewählt aus der Gruppe (I) bis (III) nach den Schritten (b) und (c) behandelt wird, wobeiwhile another subset selected from group (I) to (III) is treated according to steps (b) and (c), wherein
I) eine weitere Teilmenge der in Schritt (a) bereitgestellten Mischung von Nukleinsaurefragmenten,I) a further subset of the mixture of nucleic acid fragments provided in step (a),
II) eine Teilmenge der in Schritt (a) bereitgestellten Mischung von Nukleinsaurefragmenten, die zuvor nach mindestens einer fragmentspezifischen Eigenschaft aufgetrennt worden ist,II) a subset of the mixture of nucleic acid fragments provided in step (a) which has previously been separated according to at least one fragment-specific property,
III) eine mit (I) oder (II) zumindest zum Teil identische Mischung von Nukleinsaurefragmenten, ist.III) is a mixture of nucleic acid fragments that is at least partially identical to (I) or (II).
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in einem zusätzlichen Verfahrensschritt mindestens ein interessierendes Fragment entweder aus der Mischung von Nukleinsäure-Fragmenten aus (a) oder aus einer Mischung von Nukleinsäure-Fragmenten aus (a), die zuvor nach einer fragmentspezifischen Eigenschaft aufgetrennt worden ist, isoliert wird. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß in einem zusätzlichen Verfahrensschritt mindestens ein interessierendes Fragment entweder aus der Mischung von Nukleinsäure-Fragmenten aus (a) oder „ aus einer Mischung von Nukleinsäure-Fragmenten aus (a), die zuvor nach einer fragmentspezifischen Eigenschaft aufgetrennt worden ist, isoliert wird.8. The method according to any one of claims 1 to 7, characterized in that in an additional process step at least one fragment of interest either from the mixture of nucleic acid fragments from (a) or from a mixture of nucleic acid fragments from (a), which previously has been separated according to a fragment-specific property, is isolated. A method according to claim 6, characterized in that in an additional process step at least one fragment of interest either from the mixture of nucleic acid fragments from (a) or "from a mixture of nucleic acid fragments from (a), which previously separated according to a fragment-specific property has been isolated.
Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß in dem zusätzlichenA method according to claim 9, characterized in that in the additional
Verfahrensschritt zur Isolierung von Fragmenten fragmentspezifische Oligonukleotidprimer unter Verwendung der in Schritt (cd) ermittelten Signaturen hergestellt und anschließend zur spezifischen Amplifikation dieser Fragmente mittelsMethod step for isolating fragments of fragment-specific oligonucleotide primers is produced using the signatures determined in step (cd) and then for the specific amplification of these fragments by means of
PCR aus dem Gemisch von Nukleinsaurefragmenten eingesetzt werden.PCR from the mixture of nucleic acid fragments can be used.
Verfahren nach einem der Ansprüche 6 bis 10, dadurch gekennzeichnet, daß die in Schritt (cd) erhaltenen Signaturen einzelner Nukleinsaurefragmente derMethod according to one of claims 6 to 10, characterized in that the signatures obtained in step (cd) of individual nucleic acid fragments of the
Fragmentmischung in einer Datenbanksuche zur Identifizierung dieser Fragmente eingesetzt werden.Fragment mixture can be used in a database search to identify these fragments.
Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die Mischung von Nukleinsaurefragmenten aus (a) eine Mischung von cDNA-Fragmenten oder eine Mischung von Fragmenten genomischer DNA ist.Method according to one of claims 1 to 11, characterized in that the mixture of nucleic acid fragments from (a) is a mixture of cDNA fragments or a mixture of fragments of genomic DNA.
Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, daß die Mischung von Nukleinsaurefragmenten aus (a) Restriktionsfragmente umfaßt, die aus der Inkubation eines Nukleinsäure-Gemisches mit mindestens einemMethod according to one of claims 1 to 12, characterized in that the mixture of nucleic acid fragments from (a) comprises restriction fragments resulting from the incubation of a nucleic acid mixture with at least one
Restriktionsenzym hervorgegangen sind.Restriction enzyme have emerged.
Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß als Mischung von Nukleinsaurefragmenten aus (a) mindestens eine weitere Teilmenge bereitgestellt wird, die durch die folgenden Schritte hergestellt wird:A method according to claim 13, characterized in that at least one further subset is provided as a mixture of nucleic acid fragments from (a), which is produced by the following steps:
beidseitige Flankierung der Restriktionsfragmente der Mischung mit identischen oder verschiedenen Adaptern ii) Hybridisierung der Fragmente aus Schritt (i) mit jeweils unterschiedlichen Primern, die alle zu den Adaptern aus Schritt (i) komplementäre Bereiche aufweisen und die an ihrem 3 '-Ende jeweilig ein oder mehrere Nukleotide aufweisen, welche über den zumflanking the restriction fragments of the mixture on both sides with identical or different adapters ii) Hybridization of the fragments from step (i) with in each case different primers, all of which have regions complementary to the adapters from step (i) and which each have at their 3 'end one or more nucleotides which are via the at
Adapter komplementären Bereich hinausragen und komplementär zu einer Teilmenge der Fragmente aus der Nukleinsäuremischung aus (a) sind. iii) sequenzspezifische Extension der Primer aus (ii) und gegebenenfalls anschließende PCR-Amplifikation der Nukleinsaurefragmente aus der Fragmentmischung, die in Schritt (ii) sequenzspezifisch verlängert worden waren.The adapters protrude from the complementary region and are complementary to a subset of the fragments from the nucleic acid mixture from (a). iii) sequence-specific extension of the primers from (ii) and, if appropriate, subsequent PCR amplification of the nucleic acid fragments from the fragment mixture which had been extended in a sequence-specific manner in step (ii).
15. Verfahren nach einem der Ansprüche 1 bis 14, wobei die Mischung aus Nukleinsaurefragmenten aus Schritt (a) dadurch bereitgestellt wird, daß die jeweiligen Nukleinsaurefragmente der zu analysierenden Fragmentmischung mit einem oder mehreren Linkern ligiert werden, die an mindestens einer spezifischen Position mindestens eine Erkennungsstelle für eine Restriktionsendonuklease besitzen, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt.15. The method according to any one of claims 1 to 14, wherein the mixture of nucleic acid fragments from step (a) is provided in that the respective nucleic acid fragments of the fragment mixture to be analyzed are ligated with one or more linkers which have at least one recognition site at at least one specific position for a restriction endonuclease whose interface is outside of its recognition site.
16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, daß die jeweiligen Nukleinsaurefragmente der zu analysierenden Fragmentmischung mit jeweils mehreren verschiedenen Linkern ligiert werden, die sich untereinander in der Position der Erkennungsstelle für eine Restriktionsendonuklease unterscheiden, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt.16. The method according to claim 15, characterized in that the respective nucleic acid fragments of the fragment mixture to be analyzed are each ligated with several different linkers which differ from one another in the position of the recognition site for a restriction endonuclease, the interface of which lies outside of its recognition site.
17. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die für mehrere oder alle Nukleinsaurefragmente simultane Identifikation einer oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) über das Auffüllen überhängender Enden mit Markierungsgruppen tragenden Abbruchnukleotiden nach der Sequenzierungsmethode nach Sanger durchgeführt wird.17. The method according to any one of claims 1 to 16, characterized in that the simultaneous identification of several or all nucleic acid fragments of one or more nucleotides of the cut nucleic acid fragments from (b) is carried out by filling in overhanging ends with terminating nucleotides carrying marker groups according to the Sanger sequencing method ,
18. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die in Schritt c) für mehrere oder alle Nukleinsaurefragmente simultane Identifikation einer oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) über die folgenden Schritte (cm) bis (cp) erfolgt:18. The method according to any one of claims 1 to 16, characterized in that in step c) for several or all nucleic acid fragments simultaneous identification of one or more nucleotides of the cut nucleic acid fragments from (b) via the following steps (cm) to (cp) :
cm)Hybridisierung jeweils eines Stranges der Nukleinsaurefragmente aus (b) mit selektiven Oligonukleotidprimern, deren am 3 '-Ende gelegenes Nukleotid oder Nukleotide mit dem oder den zu sequenzierenden Nukleotiden des jeweiligen Stranges hybridisieren können cn) Extension dieser selektiven Oligonukleotidprimer; cp) Identifikation derjenigen selektiven Oligonukleotidprimer, welche in Schritt (cn) verlängert wurden.cm) hybridization of one strand of the nucleic acid fragments from (b) with selective oligonucleotide primers, the nucleotide of which is located at the 3 'end or Nucleotides can hybridize with the nucleotide to be sequenced of the respective strand. Cn) Extension of this selective oligonucleotide primer; cp) identification of those selective oligonucleotide primers which were extended in step (cn).
19. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die parallele Identifikation einer oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) über die sequenzspezifische Befestigung von Adaptern mit überhängenden Enden geeigneter Länge und Sorte erfolgt, welche sich in ihrem19. The method according to any one of claims 1 to 16, characterized in that the parallel identification of one or more nucleotides of the cut nucleic acid fragments from (b) via the sequence-specific attachment of adapters with overhanging ends of suitable length and type, which is in their
Überhang voneinander unterscheiden.Differentiate overhang.
20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß die überhängenden Enden der eingesetzten Adapter einen degenerierten Anteil und einen Anteil mit definierter Sequenz umfassen.20. The method according to claim 19, characterized in that the overhanging ends of the adapter used comprise a degenerate portion and a portion with a defined sequence.
21. Verfahren nach Anspruch 19 oder 20, dadurch gekennzeichnet, daß die eingesetzten Adapter, deren überhängende Enden unterschiedliche Anteile mit definierter Sequenz umfassen, unterschiedlich markiert sind.21. The method according to claim 19 or 20, characterized in that the adapters used, the overhanging ends of which comprise different portions with a defined sequence, are marked differently.
22. Verfahren nach einem der Ansprüche 1 bis 21, dadurch gekennzeichnet, dass es zur Katalogisierung von Nukleinsäure-Signaturen eingesetzt wird.22. The method according to any one of claims 1 to 21, characterized in that it is used for cataloging nucleic acid signatures.
23. Verfahren nach einem der Ansprüche 1 bis 21, dadurch gekennzeichnet, dass es zur Erzeugung von EST-Banken eingesetzt wird.23. The method according to any one of claims 1 to 21, characterized in that it is used to generate EST banks.
24. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass es zur Identifikation von Genen eingesetzt wird, die in mindestens zwei biologischen Proben untereinander differentiell exprimiert sind.24. The method according to any one of claims 1 or 2, characterized in that it is used to identify genes which are differentially expressed in at least two biological samples.
25. Verfahren nach Anspruch 24, dadurch gekennzeichnet,25. The method according to claim 24, characterized in
daß Verfahrensschritt a) die folgenden Teilschritte al) bis el) umfaßt, wobei al) bis el) folgendermaßen lauten: al) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, insbesondere mindestens einer Mischung von cDNA-Fragmenten, bl) Auftrennung der Mischung von Nukleinsäure-Fragmenten aus al) nach mindestens einer fragmentspezifischen Eigenschaft, cl) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der aufgetrennten Mischung aus bl), dl) gegebenenfalls Vergleich der in (bl) und/oder (cl) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsäure-Fragmenten aus (al) el) gegebenenfalls Registrierung von in (dl) detektierten Nukleinsäure-Fragmenten, welche in verschiedenen Mischungen von Nukleinsäure-Fragmenten in unterschiedlicher relativer Häufigkeit auftreten;that process step a) comprises the following substeps al) to el), al) to el) being as follows: al) providing at least one mixture of nucleic acid fragments, in particular at least one mixture of cDNA fragments, b1) separating the mixture of nucleic acid fragments from al) according to at least one fragment-specific property, cl) optionally detecting the relative frequency of some or all of the fragments in the separated mixture of bl), dl) optionally comparing the information obtained in (bl) and / or (cl) about the composition of different mixtures of nucleic acid fragments from (al) el) optionally registering nucleic acid fragments detected in (dl) which occur in different mixtures of nucleic acid fragments at different relative frequencies;
daß Verfahrensschritt b) durch Verfahrensschritt fl) ersetzt wird, wobei fl) folgendermaßen lautet: fl) Inkubation einer Mischung von Nukleinsaurefragmenten, ausgewählt aus der Gruppe I: eine Teilmenge der Mischung aus (al), der Gruppe II: die in (bl) aufgetrennte Mischung von cDNA-Fragmenten oder ein Teil hiervon, der Gruppe III: eine mit der Mischung aus (al) oder der aufgetrennten Mischung aus (bl) mindestens teilweise identische Mischung von Nukleinsaurefragmenten, jedoch zusätzlich aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, mit mindestens einer außerhalb ihrer Erkennungsstelle schneidenden Restriktionsendonuklease;that process step b) is replaced by process step fl), where fl) is as follows: fl) incubation of a mixture of nucleic acid fragments, selected from group I: a subset of the mixture from (al), group II: that separated into (bl) Mixture of cDNA fragments or a part thereof, Group III: a mixture of nucleic acid fragments which is at least partially identical to the mixture from (a1) or the separated mixture from (b1), but additionally having at least one recognition site for a restriction endonuclease which cuts outside its recognition site , with at least one restriction endonuclease cutting outside its recognition site;
und daß Verfahrensschritt c) die folgenden Teilschritte gl) bis kl) umfaßt, wobei gl) bis kl) folgendermaßen lauten:and that process step c) comprises the following sub-steps gl) to kl), where gl) to kl) are as follows:
gl) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, hl) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, il) gegebenenfalls Wiederholung von Schritt (hl), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, jl) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (fl) bis (il), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart variiert wird, daß die Wiederholung der Schritte (fl) bis (il) jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlaubt, kl) Zusammenfassung der in den Schritten (gl) bis 1) erhaltenen Sequenzinformation für alle Nukleinsäure-Fragmente oder für eine ausgewählte Gruppe der Nukleinsäure- Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur gegebenenfalls neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthält;gl) identification of a first nucleotide of the cut nucleic acid fragments from (fl), the identification being carried out simultaneously for several or all nucleic acid fragments, hl) optionally identifying a further nucleotide of the cut nucleic acid fragments from (fl), the identification being carried out simultaneously for several or all nucleic acid fragments, il) optionally repeating step (hl) until the desired number of nucleotides has been identified, jl) optionally a - or repeated repetition of steps (fl) to (il), the position and / or sequence of the recognition site being varied such that the repetition of steps (fl) to (il) in each case allows the identification of previously unidentified nucleotides, kl) summary of the sequence information obtained in steps (e) to 1) for all nucleic acid fragments or for a selected group of the nucleic acid fragments to form fragment-specific signatures, a signature optionally containing, in addition to the sequence information, further information about the respective fragment;
und daß gegebenenfalls zusätzlich mindestens einer der optionalen Schritte 11) und ml) durchgeführt wird, wobei 11) und ml) folgendermaßen lauten:and that optionally at least one of the optional steps 11) and ml) is additionally carried out, 11) and ml) being as follows:
11) Gewinnung interessierender Fragmente aus der Mischung von Nukleinsäure- Fragmenten aus (al) oder (bl), wobei die interessierenden Fragmente vorzugsweise die in (el) registrierten Fragmente sind, ml) Identifikation der zu den interessierenden Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels Durchsuchen elektronischer Datenbanken, wobei die interessierenden Fragmente vorzugsweise die in (el) registrierten Fragmente sind.11) Obtaining fragments of interest from the mixture of nucleic acid fragments from (al) or (bl), the fragments of interest preferably being the fragments registered in (el), ml) Identification of the genes belonging to the nucleic acid fragments of interest, of which the nucleic acid fragments are derived by searching electronic databases, the fragments of interest preferably being the fragments registered in (el).
26. Verfahren nach Anspruch 24, dadurch gekennzeichnet,26. The method according to claim 24, characterized in
daß Verfahrensschritt a) durch den Verfahrensschritt a2) ersetzt wird, wobei a2) folgendermaßen lautet:that process step a) is replaced by process step a2), where a2) reads as follows:
a2) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, aufweisend einen Linker und, innehalb der Sequenz des Linkers, aufweisend mindestens eine Erkennungsstelle für mindestens eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, daß Verfahrensschritt b) durch den Verfahrensschritt b2) ersetzt wird, wobei b2) folgendermaßen lautet:a2) Provision of at least one mixture of nucleic acid fragments, having a linker and, within the sequence of the linker, having at least one Recognition site for at least one restriction endonuclease that cuts outside its recognition site, that process step b) is replaced by process step b2), b2) being as follows:
b2) Inkubation der Mischung von Nukleinsaurefragmenten aus (a2) mit der mindestens einen Restriktionsendonuklease aus Schritt (a2),b2) incubation of the mixture of nucleic acid fragments from (a2) with the at least one restriction endonuclease from step (a2),
daß Verfahrensschritt c) die Teilschritte c2) bis i2) umfaßt, wobei c2) bis i2) folgendermaßen lauten: c2) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente der Mischung, sowie unter Auftrennung der Mischung geschnittener Nukleinsäure- Fragmente nach mindestens einer fragmentspezifischen Eigenschaft erfolgt, d2) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2) gemäß Schritt (c2), e2) gegebenenfalls Wiederholung von Schritt (d2), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, f2) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (a2) bis (e2), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart verändert wurde, daß ihre Wiederholung jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlaubt, g2) Zusammenfassung der in den Schritten (c2) bis (f2) erhaltenen Sequenzinformation für alle Nukleinsäure-Fragmente oder für eine ausgewählte Gruppe der Nukleinsäure- Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben derthat process step c) comprises the sub-steps c2) to i2), where c2) to i2) are as follows: c2) identification of a first nucleotide of the cut nucleic acid fragments from (b2), the identification being carried out simultaneously for several or all nucleic acid fragments of the mixture and also under The mixture of cut nucleic acid fragments is separated according to at least one fragment-specific property, d2) optionally identifying a further nucleotide of the cut nucleic acid fragments from (b2) according to step (c2), e2) optionally repeating step (d2) until the desired number of nucleotides f2) repetition of steps (a2) to (e2), one or more times if necessary, the position and / or sequence of the recognition site being changed in such a way that its repetition in each case permits identification of previously unidentified nucleotides, g2 ) Summary of the steps (c2 ) to (f2) sequence information obtained for all nucleic acid fragments or for a selected group of the nucleic acid fragments to give fragment-specific signatures, a signature in addition to the
Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, h2) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft inSequence information can also contain further information about the respective fragment, h2) assignment of the fragmentation according to a specific property in
(c2) erhaltenen fragmentspezifischen Informationen zu den in (g2) für die Nukleinsäure-Fragmente erhaltenen Signaturen, wobei die fragmentspezifischen(c2) fragment-specific information obtained on the signatures obtained in (g2) for the nucleic acid fragments, the fragment-specific
Informationen im Fall einer elektrophoretischen Auftrennung der Fragmente die relative oder absolute Mobilität der Fragmente und/oder die anhand eines Längenstandards ermittelte scheinbare oder tatsächliche Fragmentlänge umfassen und wobei die Zuordnung in tabellarischer und/oder computerlesbarer Form erfolgen kann, i2) gegebenenfalls Identifikation der zu den Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels Durchsuchen elektronischer Datenbanken nach den Signaturen aus (g2);Information in the case of an electrophoretic separation of the fragments, the relative or absolute mobility of the fragments and / or based on a Apparent or actual fragment lengths determined in length standards, and the assignment can be made in tabular and / or computer-readable form, i2) optionally identifying the genes belonging to the nucleic acid fragments, from which the nucleic acid fragments are derived, by searching electronic databases for the signatures from (g2);
und daß zusätzlich mindestens einer der Schritte j2) bis p2) durchgeführt wird, wobei 11) und ml) folgendermaßen lauten: j2) gegebenenfalls Bereitstellung mindestens einer weiteren Mischung von Nukleinsäure- Fragmenten, gewonnen auf analoge Weise zu der Mischung von Nukleinsäure-and that in addition at least one of steps j2) to p2) is carried out, 11) and ml) being as follows: j2) optionally providing at least one further mixture of nucleic acid fragments, obtained in an analogous manner to the mixture of nucleic acid
Fragmenten aus (a2), wobei hier auf die Anfügung von Linkem aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease verzichtet werden kann, k2) Auftrennung der Mischung von Nukleinsäure-Fragmenten aus Q2) nach einer fragmentspezifischen Eigenschaft,Fragments from (a2), in which case the addition of linkers having at least one recognition site for a restriction endonuclease that cuts outside their recognition site can be omitted, k2) separation of the mixture of nucleic acid fragments from Q2) according to a fragment-specific property,
12) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in (k2) erhaltenen fragmentspezifischen Informationen zu den einzelnen aufgetrennten Fragmenten, m2) gegebenenfalls Vergleich der relativen oder absoluten Häufigkeiten mindestens eines Teils der in (k2) aufgetrennten Fragmente mit den relativen oder absoluten12) Assignment of the fragment-specific information obtained in the separation according to a fragment-specific property in (k2) to the individual separated fragments, m2) if necessary, comparison of the relative or absolute frequencies of at least some of the fragments separated in (k2) with the relative or absolute
Häufigkeiten der jeweils homologen, aus anderen Nukleinsäurefragment-Mischungen stammenden Fragmente, n2) gegebenenfalls Registrierung derjenigen Fragmente, deren relative oder absolute Häufigkeit sich von der relativen oder absoluten Häufigkeit ihrer homologen, aus anderen Nukleinsäurefragment-Mischungen stammenden Fragmente unterscheidet, o2) gegebenenfalls Zuordnung der in (n2) registrierten Fragmente zu denjenigen Genen bzw. Transkripten, von denen sich besagte registrierte Fragmente herleiten, p2) gegebenenfalls Gewinnung der in (n2) registrierten Fragmente aus der Mischung von Nukleinsäure-Fragmenten aus (a2) oder (i2) und/oder ), wobei die Schritte (i2) bis (n2) auch vor den Schritten (a2) bis (h2) durchgeführt werden können. Frequencies of the respective homologous fragments originating from other nucleic acid fragment mixtures, n2) optionally registering those fragments whose relative or absolute frequency differs from the relative or absolute frequency of their homologous fragments originating from other nucleic acid fragment mixtures, o2) optionally assigning the in (n2) registered fragments of those genes or transcripts from which said registered fragments are derived, p2) optionally obtaining the fragments registered in (n2) from the mixture of nucleic acid fragments from (a2) or (i2) and / or) , wherein steps (i2) to (n2) can also be carried out before steps (a2) to (h2).
EP03742963A 2002-02-27 2003-02-27 Analysis of mixtures of nucleic acid fragments and of gene expression Withdrawn EP1492888A2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE10208333A DE10208333A1 (en) 2002-02-27 2002-02-27 Analysis of nucleic acid fragment mixtures
DE10208333 2002-02-27
PCT/EP2003/002032 WO2003072819A2 (en) 2002-02-27 2003-02-27 Analysis of mixtures of nucleic acid fragments and of gene expression

Publications (1)

Publication Number Publication Date
EP1492888A2 true EP1492888A2 (en) 2005-01-05

Family

ID=27675015

Family Applications (1)

Application Number Title Priority Date Filing Date
EP03742963A Withdrawn EP1492888A2 (en) 2002-02-27 2003-02-27 Analysis of mixtures of nucleic acid fragments and of gene expression

Country Status (6)

Country Link
US (1) US20060029937A1 (en)
EP (1) EP1492888A2 (en)
AU (1) AU2003210377A1 (en)
CA (1) CA2480320A1 (en)
DE (1) DE10208333A1 (en)
WO (1) WO2003072819A2 (en)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6013445A (en) * 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
DE19518505A1 (en) * 1995-05-19 1996-11-21 Max Planck Gesellschaft Procedure for gene expression analysis
US6016445A (en) * 1996-04-16 2000-01-18 Cardiotronics Method and apparatus for electrode and transthoracic impedance estimation
US5858671A (en) * 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
US6461814B1 (en) * 1997-01-15 2002-10-08 Dominic G. Spinella Method of identifying gene transcription patterns
EP1124990B1 (en) * 1998-10-27 2006-01-18 Affymetrix, Inc. Complexity management and analysis of genomic dna
US6468749B1 (en) * 2000-03-30 2002-10-22 Quark Biotech, Inc. Sequence-dependent gene sorting techniques
AU2001279704B2 (en) * 2000-06-30 2005-12-15 Syngenta Participations Ag Method for identification, separation and quantitative measurement of nucleic acid fragments

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO03072819A2 *

Also Published As

Publication number Publication date
AU2003210377A1 (en) 2003-09-09
US20060029937A1 (en) 2006-02-09
AU2003210377A8 (en) 2003-09-09
DE10208333A1 (en) 2003-09-04
WO2003072819A2 (en) 2003-09-04
WO2003072819A3 (en) 2004-07-22
CA2480320A1 (en) 2003-09-04

Similar Documents

Publication Publication Date Title
EP0743367B2 (en) Gene expression analysis
DE69233719T2 (en) Primers, sets and restriction fragments and their use in selective restriction fragment amplification
DE102008025656B4 (en) Method for the quantitative analysis of nucleic acids, markers therefor and their use
DE69627768T2 (en) Series analysis method of gene expression
DE60025850T2 (en) PROCESS FOR THE PRODUCTION OF OLIGONUCLEOTIDES, IN PARTICULAR FOR THE DETECTION OF AMPLIFIED RESTRICTION FRAGMENTS OBTAINED BY AFLP
DE60219199T2 (en) ANALYSIS AND DETECTION OF MULTIPLE TARGET SEQUENCES USING CIRCULAR SAMPLES
DE10056802B4 (en) Method for the detection of methylation conditions for toxicological diagnostics
DE69937447T2 (en) METHOD FOR DETECTING NUCLEIC ACIDS
DE4129653A1 (en) PROCESS FOR DETECTION OF SIMILAR NUCLEIC ACIDS
DE60014067T2 (en) COMPOSITIONS AND METHODS FOR GENETIC ANALYSIS
DE10130800A1 (en) Method for the detection of cytosine methylation with high sensitivity
EP1238112A2 (en) Method for the parallel detection of the degree of methylation of genomic dna
EP1369493B1 (en) Quantitative determination method for the degree of methylation of cytosines in CpG positions
DE3901675A1 (en) CLEANING POLYMORPHER COMPONENTS COMPLEX GENOME
EP1228246B1 (en) Method for distinguishing 5-position methylation changes
DE19635347C1 (en) Oligo:nucleotide probes specific for fungal species
WO2003072819A2 (en) Analysis of mixtures of nucleic acid fragments and of gene expression
EP1055003A1 (en) METHODS FOR CHARACTERISING mRNA MOLECULES
DE10144132A1 (en) Generating and sequencing nucleic acid tags of uniform length, useful e.g. in expression analysis, by cutting double stranded DNA with restriction enzyme then concatamerization
DE602004008916T2 (en) METHOD FOR PRODUCING A GENE EXPRESSION PROFILE
DE60109002T2 (en) Method for the detection of transcribed genomic DNA sequences
WO2004033721A2 (en) Hybridization samples having a reduced complexity
EP3094745B1 (en) Method for deconvoluting nucleic acid containing compound compositions
DE60318315T2 (en) NUCLEIC ACID REPRODUCTIVE METHOD
DE10060827A1 (en) Methods of coding hybridization probes

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20040903

AK Designated contracting states

Kind code of ref document: A2

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LI LU MC NL PT SE SI SK TR

AX Request for extension of the european patent

Extension state: AL LT LV MK RO

17Q First examination report despatched

Effective date: 20080225

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20080708